ویرگول
ورودثبت نام
DataDays 2021
DataDays 2021سومین دورۀ DataDays، رویداد علوم دادۀ دانشگاه صنعتی شریف
DataDays 2021
DataDays 2021
خواندن ۳ دقیقه·۵ سال پیش

حرف‌های گوگل دربارۀ کرونا

سال 2006 گوگل محصولgoogle trends را منتشر کرد. این ابزار امکان دسترسی به داده‌های جست‌وجوهای انجام‌شده در گوگل را فراهم میکند. این داده‌ها در طول زمان و به تفکیک منطقۀ جغرافیایی ارائه می‌شوند و به کاربر این امکان را می‌دهند که میزان جست‌وجو دربارۀ یک عبارت یا موضوع خاص را بررسی کند.

روزانه افراد زیادی، قبل از مراجعه به پزشک و مراکز درمانی، دربارۀ موضوعات پزشکی مختلف که عموما با وضع سلامتی خود یا اطرافیانشان ارتباط دارد جست‌وجو میکنند. مثلا تعداد افرادی که دربارۀ موضوعی مربوط به از دست دادن بویایی جست‌وجو می‌کنند، ارتباط نزدیکی با میزان مبتلایان به کرونا در منطقۀ جغرافیایی آنها دارد. همان طور که نمودار زیر نشان می‌دهد، با توجه به داده‌هایی که در آوریل سال 2020 از داده‌های جست‌جو در آمریکا به دست آمده، میزان جست‌وجوها در یک ایالت برای عباراتی که به از دست دادن بویایی مربوط هستند ارتباط مستقیمی با تعداد مبتلایان آن ایالت به ویروس کرونا دارد.

رابطۀ نسبت مبتلایان در یک ایالت به جمعیت با جست‌وجو دربارۀ از دست دادن حس بویایی
رابطۀ نسبت مبتلایان در یک ایالت به جمعیت با جست‌وجو دربارۀ از دست دادن حس بویایی


علائم دیگر تایید شدۀ ویروس، مانند تنگی نفس و از دست دادن حس چشایی نیز رابطۀ مستقیمی با میزان ابتلا به ویروس دارند. از این اطلاعات می‌توان برای پیدا کردن نقاطی که در آیندۀ نزدیک امکان گسترش ویروس در آنها وجود دارد استفاده کرد. هم‌چنین میتوان با مقایسۀ آمار مبتلایان و آمار جست‌وجو در مناطق مختلف، آمارهای رسمی ارائه‌شده را صحت‌سنجی کرد.

مثلا در زمانی که بررسی‌ها انجام گرفته، میزان جست‌وجو برای از دست دادن بویایی در کشور اکوادور بیشترین مقدار را نسبت به بقیِ کشورها داشته اما طبق آمارهای رسمی میزان ابتلا به ویروس در این کشور از کشورهایی مثل آمریکا، ایران و کانادا کمتر بوده است. در این شرایط می‌توان حدس زد که تعداد مبتلایان در اکوادور بسیار بیشتر از آمار رسمی است.

بعد از انتشار خبری که به ارتباط ابتلا به ویروس و از دست دادن بویایی مربوط بود، ممکن است بسیاری از افراد بدون اینکه به ویروس مبتلا باشند در رابطه با علائم آن جست‌وجو کنند که این موضوع می‌تواند باعث ایجاد خطا در خروجی بررسی‌ها شود. تطابق تاریخ انتشار این خبر با داده‌های جست‌وجو نشان میدهد که حجم زیادی از جست‌وجوها قبل از منتشر شدن خبر وجود داشته‌اند و بعد از انتشار خبر نیز تغییر شدیدی در بسیاری از کشورها در میزان جست‌وجو دربارۀ علائم مختلف اتفاق نیفتاده‌است.

مثلا طبق داده‌های مربوط به ایران در اینجا که مربوط به جست‌وجوهای حدودا یک‌ماهۀ اول شیوع بیماری در کشور و قبل از انتشار ارتباط از دست دادن بویایی و مبتلا شدن است، میزان جست‌جوها دربارۀ از دست دادن بویایی بسیار نسبت به گذشته بسیار بیشتر شده‌است.

پژوهشی در سال 2016 نشان داد که میتوان با استفاده از داده‌های جست‌وجو و دیگر داده‌های به دست آمده از اینترنت، علائم سرطان پانکراس را پیش‌بینی کرد و تشخیص آن را پنج ماه زودتر انجام داد. به طور مشابه شاید بتوان با استفاده از داده‌های جست‌وجو دربارۀ علائم ناشناختۀ ویروس کرونا نیز تحقیق کرد. مثلا در بسیاری از کشورها مثل اسپانیا و ایتالیا جست‌وجو دربارۀ عباراتی که مربوط به درد گرفتن و سوزش چشم هستند بعد از شیوع بیماری افزایش داشته که میتواند به گسترش بیماری مربوط باشد.

در نوشتن این متن از مقالۀ نویسندۀ کتاب همه دروغ میگویند در سایت نیویورک تایمز استفاده شده است. کتاب سعی می‌کند مثال‌های جالبی از اطلاعاتی که داده‌ها میتوانند دربارۀ رفتار مردم نشان دهند ارائه کند. این مثال‌ها شامل رفتارهای مختلفی شامل موارد سیاسی یا اخلاقی می‌شوند. بسیاری این بررسی‌ها روی داده‌های جست‌وجوی گوگل و با استفاده از ابزار google trends انجام گرفته که نشان میدهد با ابزارهای در دسترس و نسبتا ساده میتوان بررسی‌های گسترده‌ای با استفاده از داده‌ها انجام داد.

منابع:

https://www.nytimes.com/2020/04/05/opinion/coronavirus-google-searches.html

https://trends.google.com/trends


دادهتحلیل دادهکرونا
۱
۰
DataDays 2021
DataDays 2021
سومین دورۀ DataDays، رویداد علوم دادۀ دانشگاه صنعتی شریف
شاید از این پست‌ها خوشتان بیاید