decor
decor

Знаний дослідник перелічив виклики перед аналітиками великих даних

< Назад
Знаний дослідник перелічив виклики перед аналітиками великих даних

17.05.2020

Чи стануть дата-науковці зірками світу IT, чи їхня “хвилина слави” виявиться недовгою? Які виклики стоять перед тими, хто працює з Big Data?

Ентоні Скріффіньяно, Senior Vice President та Chief Data Scientist американської аналітичної компанії Dun&Bradstreet, у подкасті AI Today розповів про свій досвід роботи з великими даними, поділився думками щодо теперішнього та майбутнього науки про дані, а також розповів про виклики, які, на його думку, стоять перед аналітиками Big Data.

У компанії Скріффіньяно відповідає за інновації та технологічний розвиток. Він працює з “найбільшою у світі комерційною базою даних у своєму роді”. Ця база отримує інформацію мільйони рази на день з усіх країн світу за виключенням Північної Кореї та Куби.

Вона використовує усі мови та системи письма. По суті, каже аналітик, база даних складається з семи різних інтегрованих баз даних. Сукупна система дослідження цих Big Data, каже він, дозволяє отримувати глобальне розуміння сукупних ризиків та можливостей для бізнесу. Це джерело інформації можна використовувати для масштабного аналізу даних. Приміром, для виявлення аномалій у ланцюжках постачання чи змін у поведінці покупців. Саме наука про дані, наголошує Скріффіньяно, – ключ до отримання цінностей від величезного масиву даних.

Складнощі та виклики

Для аналітичних компаній на кшталт Dun&Bradstreet, розповідає дослідник, це пошук досвідчених дата-науковців, які мають як досвід роботи у галузі, так і фахову підготовку. Утім, визнає Скріффіньяно, ринок не встигає за попитом на спеціалістів з Big Data. Можливо, у майбутньому навички роботи зі штучним інтелектом стануть настільки поширеними, що компанії не потребуватимуть окремих фахівців. Утім нині ж, каже він, набір навичок дата-науковця набагато ширше і глибше, аніж просто уміння створювати моделі машинного навчання. За його словами, справжній професіоналізм у сфері Big Data – уміння створювати цінність з даних, тоді як чимало нинішніх дата-науковців по суті лише “інженери з машинного навчання”.

На думку Скріффіньяно, потрібно фокусуватися на науковому аспекті роботи дата-науковця. Він переконаний, що такі фахівці повинні вміти формулювати гіпотези чи теорії на основі отриманих даних, проводити тестування та експерименти, щоб перевірити припущення, та приходити до висновків. “Більшість сучасних дата-науковців просто використовують повторювані моделі”, – зазначає він та додає, що молодих аналітиків треба закликати до інновацій. Це, певен він, ключ до успіху.

Окрім отримання цінностей з великих масивів даних, каже Скріффіньяно, головними викликами науки про дані та штучний інтелект є питання регулювання та етики. Особливої важливості ці сфери набувають, коли йдеться про персональні дані. Як зробити так, щоб персональні дані використовувалися відповідально при побудові великих баз даних та створенні “розумних” моделей, які їх обробляють, запитує він.

Він вказує на дилему: з одного боку, споживачі хочуть більше моделей обробки даних та більше кастомізації, з іншого – не готові поступатися своєю приватністю. Приміром, хтось виграє від більш насичених даними моделей, які пропонують більш точні та надійні припущення. Але ж вони робляться, зокрема, за рахунок значних обсягів персональної інформації. Інші ж відмовляються ділитися приватними даними – і отримують менш надійні моделі та прогнози.

На думку експерта, урядам доведеться встигати за стрімким розвитком технологій, щоб гарантувати національну безпеку та оптимально працювати над захистом персональної інформації. Нині ж, каже він, Європа має більш етичний підхід, Китай – менш зацікавлений у приватності, США займає позицію десь посередині. Утім, наука про дані не зважає на географічні бар’єри, каже він. Тому питання, як регулювати моделі з різним ступенем використання приватних даних, залишається відкритим.

< Назад