В ООН пояснили, чому big data – ключовий тренд у статистиці
29.04.2021
Статистична спільнота дедалі частіше звертає свою увагу на нові джерела даних, незважаючи на численні юридичні, технологічні та фінансові проблеми, пишуть у своєму блозі фахівці ООН.
“Великі дані пронизують багато аспектів життя людей, починаючи від повсякденного спілкування та взаємодії, закінчуючи покупками та медичними процедурами. Big data також трансформують те, як люди та бізнес приймають рішення та вимірюють речі. Завдяки безцінному безперервному потоку цифрової інформації про діяльність та їх вплив на суспільство, економіку та навколишнє середовище, великі дані мають величезний потенціал для офіційної статистики”, пишуть спеціалісти підрозділу ООН, Економічної та соціальної комісії у Азії та Тихоокеанському регіоні, у своєму блозі.
Вони зазначають, що статистики дедалі частіше шукають та використовують нові джерела даних попри численні юридичні, технологічні та фінансові проблеми. Big data, зазначають автори, постійно збираються та генеруються, а також надають своєчасні, регулярні та детальні відомості – що є ключовим у критичних ситуаціях.
Як приклад, вони наводять використання big data та аналітики великих даних відразу після землетрусів у кількох країнах Азії та Тихоокеанського регіону, таких як Непал та Папуа-Нова Гвінея. Великі дані допомгли зрозуміти розподіл населення після катастрофи та отримати інформацію про ефективність гуманітарних акцій.
“Зовсім недавно, під час пандемії COVID-19, деякі країни покладалися на дані інтернет-компаній, такі як Індекс мобільності спільноти Google або Карти щільності населення Facebook”, – додають спеціалісти. Є й інші приклади. Примірок, такі країни, як Нова Зеландія, звернулися до даних операторів мобільних мереж, щоб зрозуміти схеми пересування людей під час карантину та інших обмежувальних заходів. Своєачасна та фахова аналітика великих даних допомогла уряду оцінити безпосередній вплив таких дій на суспільство та економіку.
Big data як рушій офіційної статистики
Аналітика великих даних може доповнити традиційну статистику з більшою деталізацією або, в деяких випадках, навіть замінити звичні методи збору даних, переконані фахівці. Наприклад, доступ до даних від магазинного сканера дозволив би отримати статистику цін під час пандемії COVID-19 та зменшити ризики впливу збирачів даних про ціни. Більше того, оскільки карантин призвів до буму е-комерції, дані про ціни в Інтернеті надавали своєчасну інформацію про зміни та структуру споживання.
Великі дані також можуть допомогти відстежувати показники Цілей сталого розвитку (ЦСР), особливо там, де відсутні традиційні дані. Наприклад, половина показників ЦСР не має достатньо інформації для оцінки прогресу в Азії та Тихоокеанському регіоні. Big data можуть усунути деякі важливі прогалини. Наприклад, 39 індикаторів ЦСР, здебільшого пов’язані з навколишнім середовищем, можуть отримати користь від геопросторової інформації.
Так, Китайська академія наук досліджувала потенціал даних спостереження за Землею для 19 показників ЦСР. Індонезійське статистичне відомство досліджує використання даних мобільних телефонів для чотирьох показників ЦСР. А Філіппінський статистичний орган співпрацює з громадянським суспільством та визначив 79 показників ЦСР, які можна оцінити завдяки громадським даним.
Великі дані також змінюють спосіб, яким формується офіційна статистика. Статистики не зобов’язані повторювати наявні методи та способи аналітики великих даних. На відміну від традиційних даних, які екстраполюються з точних зразків, зібраних через певні проміжки часу, великі дані постійно генеруються у дуже великих кількостях, зазначають автори.
Вони резюмують, що великі дані потребують нових аналітичних методів та інструментів. Відповідно, їхнє використання інтеграція вимагає переосмислення статистичних бізнес-процесів. “Національні статистичні управління повинні охоплювати великі дані, щоб залишатися актуальними та розширювати свій внесок у дані як суспільне благо”, – закликають фахівці.