Гід: як зробити data science готовою до віддаленої роботи
18.12.2020
З урахуванням пандемії, що триває, дискусії щодо повернення до офісу не скоро стануть актуальними. Дата-науковці, які змушені працювати вдома, стикаються з проблемами доступу до даних, падіння рівня співпраці та неадекватної інфраструктури, пише Флоріан Дуето, генеральний директор data science фірми Dataiku.
Щоб допомогти аналітикам даних працювати дистанційно, Дуето виклав кілька порад, які, за його словами, допоможуть науці про дані працювати у віддаленому режимі.
Централізоване сховище даних
Команди з питань аналітики даних, як правило, працюють над певними ad hoc проєктами. Через це зазвичай їхні доробки зберігаються локально. Якщо організовувати робочий процес на ходу, зрештою ви матимете воркфлоу, який складно відтворити, зазначає дописувач.
З іншого боку, централізоване місце розташування даних стимулює належне управління інформацією та практики співпраці, переконаний Дуето. Який результат? Співробітники з усієї організації можуть легко співпрацювати над проєктами data science та машинного навчання.
Єдина точка доступу
Успішна в “рімоуті” data science вимагає єдиної точки доступу для доступу до даних, щоб не було потрібно переміщувати їх для обробки. Це легше сказати, ніж зробити, зазначає Дуето. Утім, є різні опції для зберігання даних, вони можуть варіюватися від кластерів Hadoop, керованих хмарних баз даних, сховищ об’єктів або традиційної СУБД.
Завдяки центральній точці доступу, дата-аналітики можуть в одному місці знайти те, що їм потрібно, і мати миттєвий доступ до важливої інформації. Результат – послідовний та безпечний доступ до даних незалежно від того, звідки працюють працівники.
Співпраця
Незважаючи на те, що наука про дані раніше була сферою “для обраних”, це дедалі більше не відповідає реальності. Достеменне знання бізнесу відіграє життєво важливу роль у формулюванні правильних питань. А це означає, що доступ таких галузевих експертів, як бухгалтери або директори з продажу, стає ще важливішим.
Порівняно з висококваліфікованими вченими з даних, аналітики даних – “самоучки”, ймовірно, виграють від простішого доступу та спілкування зі своїми колегам. Утім, немає жодної причини, коли перші також не отримають вигоди від співпраці.
За словами Дуето, така співпраця має два аспекти. Горизонтальна співпраця між людьми, які працюють разом та мають подібні навички та підготовку. Та вертикальна співпраця між командами, що працюють разом, хоча і з різними ролями та обов’язками. Розвиток науки про дані, спрямований на віддалену роботу, має спростити співпрацю в обох сценаріях.
Готова до віддаленого режиму робота дата-науковців буде залишатися актуальною навіть після пандемії. По-перше, це може надати організаціям доступ до талантів, яких вони не могли б отримати в досить конкурентному середовищі. Більше того, підприємства можуть усунути перебої з проєктами в data science та ШІ, якщо офіс буде недоступний.