Два важливі тренди Big Data та аналітики великих даних у 2021 році
11.03.2021
У кожного Ілона Маска, який продає безпілотну машину, або Джеффа Безоса з магазином без каси, є арсенал складних операцій великих даних та армія data scientists вчених, які втілили своє бачення в реальність.
Великі дані – термін, який став використовуватися для опису технологій та практики роботи з даними, які не лише великі за обсягом, але й швидкодоступні та мають різноманітну форму. Сам вислів “великі дані” може бути вже не таким “хайповим”. “Це виключно тому, що багато концепцій, які він втілює, були ґрунтовно вбудовані в навколишній світ”, – пише колумніст Forbes Бернард Марр.
Він зазначає, що навіть сьогодні більшість організацій намагаються отримати користь від великої кількості даних, до яких вони мають доступ. Утім, каже експерт, як бізнес-практика, big data ще перебуває на початковій стадії. У своєму дописі він окреслює чотири важливі тренди big data та аналітики великих даних, які матимуть значення у 2021 році.
Глибші інсайти та більш досконала автоматизація від ШІ
Штучний інтелект (ШІ) змінив правила гри в бізнес-аналітиці. Завдяки величезній кількості структурованих і неструктурованих даних, що генеруються компаніями та їхніми клієнтами, навіть автоматизовані форми аналітики вручну можуть лише отримати поверхневі висновки, а не глибинні інсайти, зазначає Марр.
“Для простого прикладу розглянемо проблему, яку сьогодні ми могли б вирішити за допомогою комп’ютера. Хто з наших клієнтів є для нас найціннішим?”, – пропонує автор.
Так, якщо ми маємо лише традиційні обчислювальні машини, що не навчаються, ми могли б просунутися, створивши базу даних, яка покаже нам, які клієнти витрачають найбільше грошей. Що буде, якщо з’явиться новий клієнт, який витратить 100 доларів у першій транзакції з нами? Чи буде він ціннішим за клієнта, який витрачав 10 доларів на місяць за останній рік? Щоб зрозуміти це глибше, пише Марр, нам потрібно набагато більше даних, зокрема, середня тривалість роботи з клієнтом, і, можливо, навіть особисті дані про самого замовника, такі як його вік, патерни витрат або рівень доходу.
Інтерпретація, розуміння та отримання інсайтів з усіх цих наборів даних є набагато складнішим завданням. ШІ тут корисний, оскільки він може спробувати інтерпретувати всі дані разом і запропонувати прогнози щодо того, яка потенційна цінність клієнта може базуватися на всьому, що ми знаємо про нього – незалежно від того, розуміємо ми самі ці зв’язки чи ні. “Важливим елементом цього є те, що ШІ не обов’язково придумує “правильні” або “неправильні” відповіді – він надає низку імовірностей, а потім уточнює свої результати залежно від того, наскільки ці прогнози виявляються такими”, – пояснює фахівець.
Нові способи дослідження та інтерпретації даних
Візуалізація даних – це “останній крок” бізнес-аналітики перед тим, як компанія вживатиме заходів на основі своїх висновків. Традиційно спілкування між машинами та людьми здійснюється за допомогою візуалізації у формі графіків, діаграм та інформаційних панелей, які висвітлюють ключові висновки та допомагають нам визначити, що треба зробити на основі даних.
“Проблема тут полягає в тому, що не всі люди чудово виявляють потенційно цінні інсайти, приховані в купі статистичних даних. Тому стає дедалі важливішим, щоб усі члени організації мали можливість діяти відповідно до інформації, керованої даними, адже постійно з’являються нові способи демонстрації цих висновків”, – пише Марр.
Як приклад, він наводить галузь, де були зроблені важливі досягнення, – використання природної мови. Інструменти аналітики, які дозволяють нам ставити запитання щодо даних та отримувати відповіді зрозумілою “людською” мовою, значно збільшать доступ до даних та покращать загальні можливості аналітики великих даних в організації. Ця галузь техніки відома як обробка природної мови (NLP).
Він згадує ще кілька технології, які дозволяють буквально побачити дані та зв’язки між ними. Зокрема, розширена реальність (XR) – термін, що включає віртуальну реальність (VR) та доповнену реальність (AR), – інновація у бізнес-аналітиці та аналітиці великих даних.
“Найближчим часом нам варто очікувати нових способів візуалізації або передачі даних, розширення доступу до аналітики та отримання інсайтів”, – очікує Марр.