decor
decor

TechTalks: Зараз – кращий час стати data scientist у великій компанії

< Назад
TechTalks: Зараз – кращий час стати data scientist у великій компанії

16.12.2020

Одна із загальних характеристик компаній, які працюють давно та залишаються успішними в епоху постійної еволюції технологій, є правильне використання науки про дані, інженерії даних та машинного навчання, пише Бен Діксон, засновник блогу про технології та Data Science, Tech Talks. Доступність з’єднання з Мережею та досягнення в галузі штучного інтелекту (ШІ), переконаний він, надають організаціям безпрецедентний потенціал для створення цінних продуктів, дослідження та розробки рішень, які вирішують реальні проблеми.

Утім, цим організаціям потрібні талановиті фахівці з аналізу даних, дата-інженери та спеціалісти з машинного навчання та ШІ, щоб перетворити цей потенціал на реальні можливості. Своєю чергою, науковці даних можуть багато чому навчитися та вдосконалити свої навички, працюючи у великих компаніях, які мають інфраструктуру для побудови масштабних ШІ моделей, які перетворюють великі дані – Big Data – на реальні досягнення.

Наука про дані – у реальному житті

Як скаже вам будь-який досвідчений дослідник даних, є велика різниця між виконанням академічної та дослідницької роботи в університетах та навчальних закладах та роботою над реальними проєктами.

У перших випадках ви зазвичай навчаєте та тестуєте моделі машинного навчання на наборах даних, які були очищені та попередньо оброблені для навчальних та дослідницьких цілей. Ви вводите дані, щоб отримати максимально точні результати. Основна увага в цих кейсах спрямована на навчання та розширенні меж науки. Академічні дослідження в галузі машинного навчання лежать в основі багатьох програм, якими ми користуємося щодня.

Утім, коли йдеться про створення реальних застосунків, інструментів, які люди використовуватимуть у своєму повсякденному житті, виникають різні проблеми. Даних може бути мало, їх буває важко зібрати, вони можуть бути фрагментовані чи відсутні. Фахівцям з data science потрібна допомога кваліфікованих інженерів баз даних для створення консолідованих data-сховищ для навчання та тестування моделей машинного навчання.

З іншого боку, сама проблема може бути не особливо чітко сформульована. Алгоритми та моделі машинного навчання матимуть прямий вплив на життя людей або роботу вашої організації. Чи то допомога лікареві-рентгенологу з діагностикою за допомогою КТ, управління ланцюгами постачань та використання ШІ для кращого прогнозування та планування, дата-аналітики потребують допомоги експертів у цих галузях, щоб визначити правильні критерії та показники успіху та невдачі та відокремити зерна від полови.

Зрештою, моделі машинного навчання повинні бути інтегровані до застосунків, API, веб-порталів та широко розповсюджені для широкого кола користувачів у різних географічних регіонах. Усі ці виклики вимагають допомоги розробників програмного забезпечення, UI/UX дизайнерів, ІТ-експертів тощо.

Data science “у вакуумі” та в реальному житті є дуже корисною. Вона надає амбітним дата-науковцям унікальні можливості для ефективного використання власних навичок та талантів. “Але це також потрібно робити в правильній екосистемі та в потрібній компанії, а це те, що ви знайдете у великих компаніях, які мають необхідні ресурси”, – переконаний дописувач. 

Синергія та розширення

Наука про дані поступово інтегрується до багатьох цифрових та “фізичних” областей, починаючи з програмної інженерії. “Хоча наука про дані та розробка програм включають навички програмування, їх часто розглядають як дві незалежні дисципліни з різними напрямами діяльності”, – каже Лєна Яшке, консультантка з питань компетентності Центру передового програмного забезпечення Philips. “Для деяких програм це правда. Однак ми бачимо тенденцію до збільшення кількості синергії та кореляції між програмним забезпеченням та можливостями науки про дані”.

Яшке додає, що розробники програмного забезпечення дедалі вище оцінюють важливість навичок в галузі data science для забезпечення майбутніх потреб різних індустрій. Але переваги мають обидві сторони. “Дата-науковці можуть пришвидшити свою роботу, застосовуючи найбільш просунуте програмне забезпечення”, – пояснює вона.

Потужна цифрова інфраструктура, різноманітність талантів та широкий спектр дисциплін та видів діяльності у великих технологічних компаніях, пише автор, забезпечують ідеальне середовище для перспективних науковців та аналітиків даних. У них вони швидше зможуть розкрити весь свій потенціал та знайти нові можливості для продуктивного використання своїх навичок, переконаний він.

< Назад