Українська програмістка пройшла data science стажування у NASA
24.07.2020
Робота з даними та спілкування з колегами з різних країн світу допомогло українці зрозуміти, що вона хоче розвиватися у напрямку data science.
Програмістка з 8-річним стажем Тамара Коляда 2018-го року опинилася серед 50 учасників з усього світу, які пройшли відбір до програми стажування NASA Datanauts. Вона присвячена підготовці математиків та програмістів у галузі data science. Нині ж Коляда курує в Києві спільноту Developer Circle – проєкт Facebook, який сприяє навчанню та обміну досвідом для розробників. В українських ЗМІ Коляда поділилася своїм досвідом та враженнями від стажування у Національній аерокосмічній агенції США.
Як потрапила в NASA
У доробку Тамари вже була участь в програмі AgTech Accelerators – там вона з командою розробляла проєкт на основі кліматичних даних. Вона саме влаштувалася в IT-компанію Ciklum – Коляда шукала цікаві хардверні проєкти, а компанія саме відкрила програму для науковців — Biolin Scientific.
На посаді Java Developer вона спочатку працювала на проєкті QSense, який працював над приладами для аналізу взаємодій між поверхнею та молекулами в режимі реального часу, побудована на основі технології мікробалансу кварцевого кристала з моніторингом розсіювання частинок (Quartz Crystal Microbalance with Dissipation monitoring) і наукової роботи українки-фізика Марини Войнової.
Згодом вона взялася і до інших проєктів в рамках Biolin Scientific, зокрема OneAttention (оптичні тензіометри) та KSV NIMA (виготовлення та характеристика тонких плівок). Науково-дослідні центри NASA були одними з покупців устаткування, яке коштувало від 250 тисяч до мільйона доларів за інструмент.
Того ж 2016 року вона взяла участь у NASA Space Apps Challenge у Каліфорнії. Цей конкурс пропонує розробляти проєкти на основі відкритих даних NASA. Переможці глобального відбору отримували змогу наживо спостерігати за стартом ракети в одному зі Space Centers у США.
Там Коляда познайомилася з кількома працівниками NASA, а також дівчиною із Сербії Анітою Кірковською, яка закінчила програму Datanauts. Ідея останньої — вступ до Data Science. Вона допомагає математикам і програмістам будувати кар’єру в цій галузі, а також популяризує використання даних NASA. Тамара також захотіла податися на NASA Datanauts. 2016 року вперше надіслала заявку, але не пройшла відбір. Наступного року знову спробувала – і знову невдача. Утім, фахівчиня вирішила спробувати втретє.
“Відбір на програму відбувався повністю онлайн, треба було заповнити заявку, написати мотиваційний лист, додати різні лінки на своє розробницьке портфоліо (GitHub, Stack Overflow тощо). Після подачі заявки з нами зв’язувалися, ставили уточнювальні питання: скільки маємо вільного часу для участі в програмі, де перебуваємо тощо. Третього разу мені пощастило: улітку 2018 року отримала лист про успішне зарахування та основні відомості про те, як буде проходити програма”, – згадує вона.
Чого data scientists навчають у NASA
Кожен набір NASA Datanauts налічував близько півсотні учасників. Тамара каже, що серед них є і професійні математики, які викладають у провідних університетах, і талановиті Full Stack та Back-end розробники. Більшість — зі США, але в її групі були люди з Японії, Китаю, Франції, Бразилії тощо.
У класі були люди, які легко розкладали різні поліноміальні функції, але, наприклад, не знали, що таке GitHub і як ним користуватися, вказує Коляда на цікаву особливість групи. Було і навпаки — програмісти, які не вміли правильно множити матриці. Тому на початку програми запровадили класну практику — “балачка біля кулера”.
Наприклад, з’ясувалося, що десятеро людей не вміють працювати з GitHub. Тоді створювали чат, в якому один зі студентів або хтось із випускників попередніх років, фахівець NASA чи співробітник іншої компанії проводив для інших воркшоп, як користуватись цією платформою, розповідав про базовий набір команд. Іншого дня темою могли бути матриці чи лінійні алгебра.
Більшу частину програми складає вступ до різних технологій. Але всі вони так чи інакше стосуються Data Science: Data Analytics and Visualization of ISS Crew, Using Nextjournal for collaborative open source development and publishing, Data injection to Neo4j with GraphXR, getting started with TensorFlow тощо. Крім того, йшлося про специфічні фреймворки з програмування. У “студентів” були власні онлайн-кабінети, де були треки, за якими вони займалися. Починали від простих задач до складніших.
На проєктах Datanauts Коляда багато працювала з даними: оцифрування, чистка тощо, займалася побудовою базових алгоритмів, моделей, робила візуалізацію даних, прогнозування. Наприклад, у неї був проєкт з даними щодо захворюваності на малярію та вірус денге і смертності від них у Венесуелі. Учасники мали звіти з 2004-го по 2014 рік. “А після цього у країні почалась революція — і дані не подавали. Ми намагалися відновлювати їх з 2014 року на основі тих, які були на руках, і різних гіпотез. Крім того, брали до уваги дані, що були відомі із сусідніх країн — Бразилії, Колумбії тощо”, – розповідає вона.
Коляда каже, что NASA Datanuts стало для неї поштовхом для розвитку в напрямку дата аналітики. “Дотепер продовжую спілкуватися з кількома співробітниками NASA з Ames Research Center”, – додає вона.