decor
decor

Портрет Data Scientist очима роботодавця 2020

< Назад
Портрет Data Scientist очима роботодавця 2020

14.08.2020

Добре володіє Python/R та SQL, розуміється на технологіях глибинного навчання і аналізі big data, вміє працювати з хмарними платформами та візуалізувати дані, має 2+ роки досвіду — таким бачать роботодавці перспективного кандидата на посаду Data Scientist.

Сучасні компанії дедалі частіше звертаються до аналітики великих даних, а отже кар’єра у Data Science виглядає все більш привабливо. Але що саме потрібно знати та вміти data-науковець? Щоб знайти відповідь на це питання, Шаріф Шейк, data scientist з Індії, дослідив більше 1000 вакансій на посаду Data Scientist з популярного порталу для пошуку роботи у своїй країні.

Досвід роботи

Найбільш поширена вимога до досвіду — “5-10 років”. Водночас позиції, для яких потрібно не менше 2 років роботи в аналогічній сфері, теж зустрічаються досить часто. Це не означає, що початківцям неможливо влаштуватися на роботу, просто для досвідчених кандидатів відкриваються більше можливостей, пояснює Шейк. Компанії, як правило, не наймають людей без досвіду у data science через портали для пошуку роботи, вони відбирають їх серед студентів вишів, зазначає він. На думку дослідника, початківці можуть спочатку влаштуватися у стартапи, щоб відшліфувати свої знання та вміння у галузі big data.

Must-have навички

  1. Машинне навчання (Machine Learning) очікувано очолило список;
  2. Data mining та дата-аналітика також вважаються ключовими сферами, які має опанувати фахівець із data science; 
  3. Впевнене володіння статистичним моделюванням;
  4. Хороше знання глибинного навчання (deep learning), оскільки воно дає змогу використовувати сучасні методи обробки природної мови (NLP — Natural Language Processing) та комп’ютерним баченням (Computer Vision);
  5. Також роботодавці прагнуть, щоб кандидат був знайомий з технологіями аналізу великих даних, оскільки обсяг накопиченої інформації зростає з кожним днем. Ці навички точно стануть в нагоді для роботи з big data у режимі реального часу.

Мови програмування

Початківцям завжди складно вибрати, яку мову програмування слід вивчати. Хоча їх існує багато, основна конкуренція завжди була між Python та R, зазначає дослідник. За його даними, роботодавці найчастіше згадують:

  1. Python;
  2. SQL — хоча це не зовсім “мова програмування”, але її знання просто обов’язкове для data scientist, підкреслює Шейк; 
  3. R;
  4. SAS
  5. C++;
  6. Java.

Середовище для глибинного навчання (Deep learning Framework)

  1. Tensorflow міцно утримує симпатії індустрії;
  2. Keras також є популярним завдяки своїй простоті, зазначає дослідник;
  3. PyTorch опинився на третій позиції;

Хоча існує ще багато інших фреймворків — Caffe, Maxnet тощо — вони не надто часто згадуються у вимогах до кандидатів, принаймні в Індії, пише Шейк.

Технологія для роботи з big data

  1. Spark очолює список, зокрема можна ознайомитися з версією для Python —  PySpark;
  2. Hadoop на другому місці, але з зовсім незначним відставанням;
  3. Hive теж користується популярністю.

Хмарні провайдери

Тренування моделей для аналізу даних потребує значних обчислень, які можуть дорого коштувати. Компанії намагаються знайти спосіб зекономити і дедалі частіше використовують хмарні платформи. Дуже вірогідно, що ці технології відіграватимуть значну роль у розвитку Data science, прогнозує Шейк. Згідно з його підрахунками, найчастіше роботодавці хочуть, щоб кандидати вміли працювати з:

  1. AWS;
  2. Azure;
  3. Google Cloud.

Інструменти для візуалізації даних

  1. Tableau найчастіше згадували у вимогах до кандидатів;
  2. Power BI від Microsoft опинився на другому місці зі значним відставанням.

Чи треба відповідати усім згаданим вище вимогам, що отримати роботу в Data Science ?

Не обов’язково, деякі інструменти зі списку доволі легко опанувати, якщо у вас є міцна “база”, вважає аналітик. Однак можливість похвалитися згаданими скілами у резюме допоможе вам перейти до співбесіди.

Якщо у вас все в порядку з must-have частиною списку, найкраща стратегія — почати ходити на співбесіди, паралельно намагаючись заповнити “пробіли” і познайомитися з деякими інструментами, які б дали вам перевагу над іншими кандидатами.

< Назад