Як дані Google допомагають прогнозувати нові спалахи Covid-19
26.11.2020
Дослідники виявили зв’язок між пошуковими запитами користувачів та перебігом пандемії Covid-19.
Стрімке розповсюдження Covid-19 стало однією з найважливіших подій 2020 року. Цілком імовірно, воно впливатиме на життя людей в усьому світі щонайменше ще кілька років. Цей “чорний лебідь” кинув виклик дата-науковцям, які зараз намагаються прогнозувати перебіг пандемії. З урахуванням обсягу big data про активність користувачів інтернету та відносної доступності таких даних, вони стають цінним джерелом інформації для дослідників.
Зокрема, дата-аналітики виявили, що пошукові запити Google можуть стати у пригоді для координації зусиль у боротьбі з Covid-19. Про це заявили науковці з клініки Мейо, американської некомерційної організації, що проводять медичні дослідження. Вони стверджують, що дані Google Trends корелюють зі спалахами хвороби у різних частинах США. У деяких випадках сплеск популярності певних пошукових запитів спостерігався за 16 днів до виявлення перших хворих.
Як проводили аналіз?
У рамках дослідження дата-науковці відслідковували такі пошукові запити:
- “Covid симптоми”
- “Коронавірус симптоми”
- “Хворе горло”, “ускладнене дихання”, “слабкість” та “кашель”
- “Центр тестування на коронавірус”
- “Втрата запаху”
- “Lysol” (американський бренд дезінфекційних засобів)
- “Антитіла”
- “Маска на обличчя”
- “Вакцина від коронавірусу”
- “Податкові пільги Covid” (“Covid stimulus check”)
Сплески популярності більшості з цих запитів у певних регіонах продемонстрували помірну чи навіть сильну кореляцію з появою перших випадків захворювання на Covid-19. Зростання кількості запитів на певну тему передувало виявленню хворих. У подальшому кореляція також була присутня, хоч і слабша.
“Динаміка популярності усіх запитів так чи інакше корелювала з динамікою кількості хворих”, — стверджує доктор Мохамед Байдон, головний дослідник лабораторії нейроінформатики клініки Мейо.
Він припускає, що якби дата-науковці відслідкували ще більше запитів, то виявлені кореляції були б ще сильнішими. Із тим, як розгортається епідемія, користувачів цікавить вже дещо інша інформація, тому для більш точних результатів ключові слова теж слід коригувати, додає дослідник.
Швидше реагування
Словами Байдона, така аналітика даних допоможе data science командам, які намагаються прогнозувати спалахи та нові “гарячі точки” пандемії.
“Якщо чекати, поки новини про сплеск захворюваності з’являться у ЗМІ, буде вже надто пізно щось робити. Аналіз пошукових запитів — чудовий спосіб зрозуміти, де ситуація буде загострюватися, щоб реагувати на державному рівні”, — вважає дослідник.
Інші досягнення data science у боротьбі з Covid-19
Дата-аналітика відіграє важливу роль у відслідковуванні та діагностуванні нового вірусу SARS-CoV2. Зокрема, у липні про свій прорив заявила команда науковців з Оксфордського університету.
Дослідники розробили Curial AI — систему, яка використовує штучний інтелект для швидкої перевірки пацієнтів на симптоми Covid-19. Як показало попереднє тестування, ШІ зміг виявити хворих з вірусом на основі результатів лабораторних тестів, газового аналізу крові та аналізу життєво важливих показників у 115 тис. пацієнтів з відділень невідкладної допомоги та 72 тис. пацієнтів з лікарень.