CEO Dataloop пояснив, як отримати користь з неструктурованих даних
29.01.2021
Еран Шломо, співзасновник та генеральний директор компанії аналітики даних Dataloop розбирається, чому неструктуровані дані так важливі для створення кращого ШІ і як організації можуть оптимізувати управління цими даними?
Оскільки бізнеси дедалі частіше звертаються до штучного інтелекту (ШІ), щоб відкрити доступ до створення нових ціннісних пропозицій, очікується, що світовий ринок ШІ зросте з 4,1 млрд доларів у 2016 році до 169,4 млрд доларів до 2025 року.
Утім, навіть коли чимало організацій застосовують ШІ, приголомшливі 96% підприємств борються з управлінням даними. Багато з них стикаються з проблемами загальної якості та маркування своїх даних. Не варто забувати, що моделі ШІ працюють настільки добре, наскільки якісними є вхідні дані, на яких вони побудовані.
Тож, робота з неструктурованими даними – серйозний виклик, яка постає як перед швидкозростаючим ринком ШІ, так і перед різноманітним набором галузей, які сподіваються отримати вигоду від технології ШІ, пише Еран Шломо, співзасновник та генеральний директор компанії аналітики даних Dataloop у своїй колонці для Inside Big Data.
Щоб бізнес отримував значущі інсайти завдяки ШІ, повинен існувати постійний цикл зворотного зв’язку з даними, який постійно вдосконалюється, зазначає фахівець. Адже ШІ має працювати із новими даними, щоб виявляти нові кейси, патерни та аномалії. Простіше кажучи, моделі штучного інтелекту добре працюють з урахуванням минулих даних. Утім, є потреба постійно оновлювати систему з урахуванням майбутніх даних.
“Чому неструктуровані дані настільки важливі для створення кращого ШІ? Як організації можуть оптимізувати управління цими даними?”, – ставить питання автор. Він пропонує кілька шляхів того, як поєднання найкращих результатів людського інтелекту та передових технологій може допомогти підприємствам усунути найбільші перешкоди, пов’язані з даними.
Розуміння неструктурованих даних
Широке розповсюдження цифрових послуг та застосунків створило безліч неструктурованих даних, на які зараз припадає до 90% усіх цифрової інформації. Їхнє використання для створення згуртованих, уніфікованих наборів big data є необхідним для підприємств, зокрема, для кращої бізнес-аналітики. “Як виявили багато організацій, це простіше сказати, ніж зробити”, – іронізує дописувач.
Шломо пояснює, що на відміну від структурованих даних, неструктуровані базуються на аналізі окремих фрагментів інформації, щоб виявити ключові особливості та закономірності. Виконання цього завдання вручну забирає багато часу та вимагає ресурсів – саме тому інструменти ШІ є життєво важливими. Вони допоможуть підприємствам належним чином управляти своїми неструктурованими даними та отримувати з них реальну цінність.
Наприклад, у роздрібній торгівлі, де більша кількість підприємств починає впроваджувати “самокаси” та рішення на основі ШІ для розпізнавання товарів та управління запасами. Магазини потребують динамічних інструментів, які дозволяють їхнім ШІ-системам йти в ногу з новими категоріями товарів, а також новою поведінкою споживачів (як-от носіння масок).
Він наводить й інший приклад – сферу охорони здоров’я. Клініки та інші медичні установи зберігають величезну кількість даних про пацієнтів, які можуть виявитися надзвичайно корисними, щоб удосконалити виявлення та діагностику для різних станів. Наприклад, технологія комп’ютерного зору може надати лікарям більш детальні та точні дані про знімки пацієнтів (як-от рентген чи томографію). Утім, такі рішення повинні бути чутливими до низки важливих факторів, включаючи демографічні та географічні характеристики.
Хоча отримання максимуму від ШІ вимагає скрупульозної підготовки та аналізу різнорідних джерел даних, хороша новина полягає в тому, що існують інструменти, які допомагають організаціям створювати порядок із своїх неструктурованих даних.
Як оптимізувати неструктуровані дані
Автор зазначає, що серед ШІ-рішень для осмислення неструктурованих даних є алгоритми розпізнавання шаблонів. Вони використовують машинне навчання для класифікації неструктурованих даних. Наприклад, ці алгоритми можуть швидко мітити та класифікувати велику кількість зображень – вручну такий процес триватиме чимало годин.
“Поєднання машинних та людських процесів покращує моделі ШІ, що дозволяє людям-модераторам виправляти помилки та запобігати погіршенню систем. Відповідно, підприємствам варто шукати інструменти, що поєднують найкращі людські та машинні можливості”, – наголошує Шломо.
ШІ та люди, які працюють разом, можуть впорядкувати неструктуровані дані, що спросить аналітику даних та дасть новий поштовх для бізнес-аналітики. Керівник Dataloop резюмує, що спільна робота людей та машин може перетворювати неструктуровані дані на життєво важливі інсайти для бізнесу.