Колумніст Forbes назвав п’ять кроків до розвитку культури data science
10.07.2020
CEO компанії з аналітики даних 2predict дає поради бізнесам щодо того, як використовувати наявні у них масиви інформації.
Компанії створюють платформи, які користуються успіхом у клієнтів та дозволяють збирати чимало інформації про транзакції та користувацькі дані. Працює “сарафанне радіо” і про продукт дізнаються дедалі більше людей, які створюють попит на нові функції. Їх розробляють та імплементують – і компанія збирає ще більше даних.
Так Правін Мендел, CEO компанії сервісів з аналітики даних, у своєму дописі для Forbes описує умовний процес накопичення інформації у цифровій платформі. “У цих даних є неймовірна цінність. Утім, обмеженість думки може обмежувати вашу здатність шукати там важливі інсайти для покращення існуючого продукту чи навіть створення нового. Можливо, ви обмежуєтесь тим, що малюєте простенькі графіки, здатні виявляти помилки, чи інші нескладні правила для аналітики. Але з даними ви можете робити набагато більше”, – переконаний він. в
Data science фахівець нагадує, що нині вже є чимало способів просунутого машинного навчання. Вони допомагають компаніям та організаціям отримувати додаткову цінність від користувацьких даних. Тому Мендел пропонує п’ять кроків, які можуть змінити культуру використання даних.
Крок 1: прийміть, що ви знаєте не все
Нікуди не зрушиш, переконаний фахівець, якщо не прийняти “невідомі невідомі” – згадуючи слова Дональда Рамсфельда про те, що ми не знаємо, що саме не знаємо. Тобто, не знати все – нормально. Мендел радить довіритися даним та шукати, що може бути цінним.
Штучні обмеження для штучного інтелекту в аналітиці даних, пише він, можуть призводити до проблем: нерепрезентативних наборів даних, погано продумані функції та/чи результати дії алгоритмів. “Це може продукувати напрочуд помилкові, іноді навіть катастрофічні результати”.
Крок 2: вчіться розвитку розумної стратегії у data science експертів
Типова інженерна чи продуктова організація не створена як експерт у аналітиці даних – вона створює продукт. Data science навпаки – побудована на дослідженні та експериментах. За Менделом, розумна стратегія включає:
- збір та сортування даних, створення роудмепу (плану дій);
- пайплайн тренування для машинного навчання;
- тестування та валідація методологій;
- роудмеп обраної моделі;
- план використання ресурсів.
Ці кроки потребують навичок окрім продакт-менеджменту. Можливо, доведеться звернутися до зовнішніх експертів, пише фахівець. Вони можуть запропонувати кращі практики аналізу даних та мінімізувати ризики.
Крок 3: будьте готові до експериментів
Здатність збирати будь-які види даних, розвиток машинного навчання, доступність потужних обчислювальних ресурсів – усе це створює “ідеальний шторм” для просунутого дата-моделювання, зазначає Мендел.
“Уявіть сценарій, за якого у вас і гадки немає, для чого згодиться ваш дата-сет. Інженер з машинного навчання може експериментувати з різними техніками ієрархічної кластеризації: раптом з’являться цікаві патерни. Коли їх знайдуть, фахівці можуть використати ці кластери для розвитку навчальних моделей та робити передбачення на основі маркованих даних у кластерах. І це все можливо без попереднього знання чи гіпотез про потенційну цінність набору даних”, – пише він.
Крок 4: використовуйте “продуктизацію” як рушійну силу
Коли маєте достатньо впевненості після “експериментів”, можна переводити proof-of-concept в інженерний режим. “Продуктизуйте” свій проєкт для внутрішнього чи зовнішнього клієнта, аби вийти з режиму “дослідника” та сприяти осмисленим рішенням для покращення якості, швидкості чи інших вимірювальних метрик бізнесу, як-от ROI чи IRR.
Приклади “продуктизації”:
- інтеграція у поточні робочі процеси
- інтеграція у внутрішній інструмент прийняття рішень
- інтеграція моделі у продукт для клієнтів
Крок 5: мисліть стратегічно
Мендел зазначає, що створення нової моделі машинного навчання потребує постійного покращення, так само, як і нового продукту. “Це ітеративний процес, де поєднання покращуваних дата-сетів і поліпшення алгоритмів та моделі може призвести до напрочуд задовільних результатів”, – вказує він.
Data science може стати потужним інструментом розвитку бізнеса, нагадує фахівець. Утім, відповідну культуру необхідно плекати, але і результати будуть відповідними та допоможуть із конкурентними перевагами.