Big Data компанії повинні цінувати людей не менше, ніж штучний інтелект
27.08.2021
Спеціаліст по роботі з даними витрачає 80% свого робочого часу на впорядкування даних, а не на реальний аналіз або генерування ідей. Уявіть собі 30-хвилинну поїздку на автомобілі, яка через затори розтягнулася на дві з половиною години, і ви зрозумієте, про що йдеться.
Хоча переважна більшість фахівців з аналізу даних витрачає більше ніж 20% свого робочого часу на власне аналіз, їм все одно доводиться витрачати багато часу на впорядкування та підготовку даних до аналізу. Цей процес може включати видалення дублікатів, забезпечення правильного форматування та іншу підготовчу роботу.
Зазвичай цей етап займає близько 45% від загального часу, показало нещодавнє опитування Anaconda. У більш ранньому опитуванні CrowdFlower ця оцінка склала цілих 60%.
Ці факти не свідчать про те, що підготовка даних не важлива. У кращому випадку сценарій просто видасть помилку, попередивши, що він не може розрахувати середні витрати на клієнта, тому що запис для клієнта №1324 відформатована як текст, а не як цифра. У гіршому випадку компанія буде діяти на підставі даних, які мають мало спільного з реальністю.
У пошуках великих даних компанії часто витрачають робочий час працівників на збіп або обробку даних замість того, щоб просити їх займатися своїми звичайними обов’язками. Більша частина зібраних компаніями даних часто взагалі не використовується для аналізу і подальшої роботи, що свідчить про те, що час всіх, хто бере участь в зборі даних, марнується. У висновку це не приносить нічого, крім затримок в роботі та пов’язаних з цим матеріальних збитків.
З іншого боку, зібрані дані часто використовуються тільки спеціально призначеною командою фахівців з аналізу даних, яка й так занадто перевантажена роботою.
Всі описані тут проблеми пов’язані з тим, що, за винятком таких піонерів в області даних, як Google і Facebook, компанії все ще мізкують над тим, як переосмислити себе в епоху великих даних. Дані стікаються в величезні бази, і фахівцям залишається багато роботи з очищення. Проте зазвичай ці співробітники потім не дуже часто використовують ці дані в роботі.
Значний успіх технологічних гігантів, які поклали дані в основу своїх бізнес-моделей, запалив іскру, яка тільки починає розгоратися. І хоча результати поки неоднозначні, це ознака того, що компанії ще не навчилися мислити за допомогою даних.
Дані можуть поліпшити роботу практично будь-якого компонента в організаційній структурі бізнесу. Як би не було спокусливо думати про майбутнє, де для кожного бізнес-процесу існує модель машинного навчання, про це ще рано думати. Завдання будь-якої компанії, що прагне використовувати дані сьогодні — доставити їх з точки А в точку Б. Точка А — це частина робочого процесу, де збираються дані, а точка Б — це людина, якій ці дані потрібні для прийняття рішень.
Важливо зазначити, що точка Б необов’язково повинна бути фахівцем із дослідження даних. Це може бути менеджер, який намагається визначити оптимальну схему робочого процесу; інженер, який шукає недоліки в виробничому процесі; дизайнер користувальницького інтерфейсу, який проводить A / B-тестування певної функції. Усі ці співробітники постійно будуть мати під рукою необхідні їм дані, готові до обробки для отримання глибоких висновків.
Скептики можуть стверджувати, що великі дані — це ніщо інше, як занадто часто вживаний термін. Проте передові аналітичні можливості можуть підвищити підсумковий прибуток будь-якої компанії, якщо тільки вони супроводжуються чітким планом і відповідними очікуваннями. Перший крок — це зосередження на тому, щоб зробити дані доступними та простими у використанні, а не на тому, щоб зібрати якомога більше даних.