Чому варто використовувати Small Data разом із Big Data
11.12.2020
Великі дані стали популярним терміном у організаціях. Обсяг big data, який заповнює компанію за дедалі більшим числом каналів, вражає. За останні два роки людство створило більше даних, ніж за всю попередню історію. Швидкість, з якою сьогодні рухається бізнес, в поєднанні з величезним обсягом даних, отриманих з “оцифрованого” світу, вимагає інших способів отримання цінності з інформації.
Концепти „великих даних” та „малих даних” (big data та small data відповідно) набули популярності протягом останніх п’яти-десяти років. Утім, не завжди ясно, що означають обидва ці терміни або як вони допомагають краще зрозуміти клієнтів.
У чому різниця? Big data – дані, отримані різними способами, наприклад, за допомогою транзакцій, кліків, зчитувачів радіочастотної ідентифікації (RFID), фінансових даних, сенсорів та дедалі більш розповсюджених IoT-пристроїв. Small data – також дані, але зібрані шляхом первинних досліджень. Вони не просто зібрані на основі якісних досліджень – опитувань інтернет-спільнот, фокус-груп тощо – на додачу до кількісних досліджень. Вони отримані тоді, коли ми легально просимо людей (або ж фіксуємо за ними) особливості їхнього способу мислення, переконь та цінностей.
Big Data
Визначення Gartner стало загальновизнаним. Великі дані – ресурси даних із великими обсягами, великою швидкістю та різноманітністю, які вимагають розумного та креативного підходу до обробки, щоб надати можливість покращити розуміння ситуації, спростити прийняття рішень та автоматизацію процесів.
Small Data
Щодо значення small data згоди менше. Аллен Бонд, який, певно, раніше за всіх використав цей термін, характеризує його як пов’язування людей із своєчасними, значущими інсайтами (отриманими з великих даних, а також із “місцевих” джерел), які організовані та згруповані, доступні, зрозумілі та варті уваги для звичайних завдань.
Мартін Ліндстрем описує їх як “дрібні фрагменти інформації, що виявляють величезні закономірності” у світлі спостережної інформації. А також – як дані досить малого обсягу, щоб людина могла їх зрозуміти.
Як поєднувати Big Data і Small Data
Великі та малі дані абсолютно відмінні за своїм визначенням та доступністю для розуміння. Незважаючи на це, кожен тип сам по собі безцінний, пише аналітикиня Прія Діалані для Analytics Insight. “Великі дані допомагають нам зрозуміти, що і як люди роблять. Наприклад, кліки на сайті, транзакції продажів тощо. З цього ми можемо отримати „Що”: що саме люди робили. Малі дані, знову ж таки, заохочують нас зрозуміти спосіб мислення, натхнення та почуття, що стоять за цією діяльністю. Історії та ситуації, що вказують на „Що”, приходять через великі дані. Малі дані допомагають нам зрозуміти “Чому”, – пише вона.
Окремий аналіз великих або малих даних може дати гідне розуміння досвіду вашого клієнта, зазначає дослідниця. Вона звертає увагу на те, що, об’єднавши два набори даних, ви зможете побачити досвід клієнта більш повно та деталізовано. Як зазначає Ліндстрем, “найкраща, найближча оцінка того, ким ми є, є змішанням наших “офлайн-” та “онлайн-Я”, а також поєднанням великих даних з малими даними”.
Візьмемо, до прикладу, Apple, велику компанію, яка зрештою прийшла до аналітики як великих, так і малих даних. Раніше, для Mac постійно використовували білий колір, як і для інших продуктів на кшталт iPod. Утім, білий часто асоціюється з пральними машинами та приладдям для ванних кімнат. Численні клієнти Apple та потенційні покупці не сприймали білий колір ґаджетів з психологічних чи естетичних міркувань. Численні клієнти просили зробити iPod або iPhone були інших кольорів. Перші кольорові девайси Apple отримали шалений успіх. Крім того, один із продуктів Apple – голосовий помічник Siri – побудований на машинному навчанні, також наслідкок використання великих даних.
Функції розпізнавання голосу Siri на “яблучних” ґаджетах стали популярними. Голосові дані, які вловлює машина, передаються на її платформи хмарної аналітики, які порівнюють їх з мільйонами інших команд, що вводяться користувачем, щоб допомогти їй покращити розпізнавання мовленнєвих шаблонів і тим точніше розуміти конкретного користувача. Так поєднання великих і малих даних дозволяє компанії забезпечувати інший рівень користувацького досвіду.