Питання та
відповіді
Програма
навчання
Записатися
на курс

Big Data Lab – це комплексний інтенсивний курс з підготовки data science спеціалістів, який передбачає вивчення фундаментальних математичних дисциплін, доменну експертизу і практику з реальними великими даними  Vodafone*.

*Знеособлений датасет від Vodafone
picture
6місяців
picture
240годин
picture
8дисциплін
picture
великий фінальний проект
decor

Переваги Big Data Lab

  • Унікальна доменна експертиза в різних областях: економіка, виробництво, послуги, фінанси, соціальна і гуманітарна сфери.
  • Практика на реальних* великих даних Vodafone (*знеособлених).
  • Команда викладачів світового рівня (в т.ч. професіоналів-практиків з досвідом роботи в сфері Big Data)
  • Курс розрахований на працюючих професіоналів, тож його можна поєднувати з роботою.
  • Інтенсивне навчання: вже через 6 місяців випускники отримують знання та практичні навички, необхідні для старту кар’єри у Data Science

Що отримає випускник:

  • Найбільш перспективну на сьогодні і в майбутньому професію.
  • Практичні знання для роботи з даними у будь-якій сфері.
  • Вміння застосовувати широкий спектр ефективних методів машинного навчання та нейронних мереж для аналізу великих даних, часових рядів та текстової інформації
  • Навички інженерії програмного забезпечення та побудови інфраструктури для збору, зберігання, та обробки даних.
decor

НОВИНИ

Аналітик закликав ІТ-фахівців боротися за етичне використання Big Data

Аналітика великих даних – значний виклик не лише з технологічної, але й з етичної точки зору. Наука про аналіз даних повинна враховувати потенційні вразливі місця >>>

Data Science: вчені запропонували структурований підхід до науки про дані

Використання data science інструментів для досліджень – новий бум в університетському середовищі. Дата-аналітика застосовується скрізь, від інженерних до гуманітарних студій. Утім, структурного підходу до data >>>

Мінздоров’я США відкрив доступ до великих даних для дослідників коронапандемії

Завдання інформаційної бази – дати дослідникам доступ до більшої кількості стандартизованих клінічних даних. Це має сприяти боротьбі з коронавірусною хворобою. Національний інститут охорони здоров'я (NIH) >>>

Колумніст Forbes назвав п'ять кроків до розвитку культури data science

CEO компанії з аналітики даних 2predict дає поради бізнесам щодо того, як використовувати наявні у них масиви інформації. Компанії створюють платформи, які користуються успіхом у >>>

Дослідження: лише 18% дата-науковців вчаться етиці ШІ

На тлі зростання критики технологій штучного інтелекту, яким закидають гендерну та расову упередженість, гіганти IT-ринку запускають власні етичні проєкти. Утім, їхня надійність також викликає сумніви.  >>>

Великі дані навчили передбачати швидкість бігуна під час марафону

Нещодавно опубліковане дослідження використовує дані з фітнес-застосунків на кшталт Strava, аби оцінити “критичну швидкість”. Остання може передбачити результати користувача під час забігу. Що таке “критична >>>

Велика Британія запускає Big Data проєкт задля покращення державних послуг

Служба цифрових послуг Великої Британії запускає проєкт Data Labs, аби посилити свою роботу інструментами на кшталт штучного інтелекту та обробки природної мови. Британська урядова Служба >>>

Південна Корея: фінансові гіганти ведуть "тиху війну" за переваги у великих даних

Поки пандемія штовхає світ до ще швидшої діджиталізації, провідні фінансові групи Південної Кореї ведуть “тиху війну” за домінування у світі великих даних. Глобальна епідемія пришвидшила >>>

Знаний дослідник перелічив виклики перед аналітиками великих даних

Чи стануть дата-науковці зірками світу IT, чи їхня “хвилина слави” виявиться недовгою? Які виклики стоять перед тими, хто працює з Big Data? Ентоні Скріффіньяно, Senior >>>

decor
decor

Програма навчання

Аналіз даних (математика та машинне навчання)
Інженерія програмного забезпечення для Data Science
Фінальний проект

Основи обчислень для Data Science

  • Основи математичного аналізу для DS
  • Основи лінійної алгебри для DS
  • Методи оптимізації
  • Основи теорії ймовірностей для DS
  • Основи математичної статистики для DS

Машинне навчання та аналіз даних

Supervised Learning:

  • дерева прийняття рішень, наївний баєсів класифікатор, логістична регресія, ансамблеві методи

Unsupervised Learning:

  • алгоритми кластеризації

Навчання з підкріпленням

Специфічні види машинного навчання:

  • навчання з гарантованою точністю (conformal learning), причинно-наслідкове навчання (causal learning)

Інтелектуальний аналіз даних:

  • зниження розмірності, пошук асоціативних правил

Нейронні мережі та глибоке навчання

  • Нейронні мережі з прямим розповсюдженням сигналу
  • Нейронні мережі, що навчаються шляхом безпосереднього запам’ятовування даних
  • Застосування нейронних мереж для розпізнавання кібератак.
  • Нейронні мережі, що самонавчаються
  • Глибокі нейронні мережі
  • Згорткові нейронні мережі
  • Рекурентні нейронні мережі
  • Глибокі рекурентні нейронні мережі
  • Нейромережеве розпізнавання диктора, та аналіз клавіатурного почерку
  • Проблематика розвитку нейромережих рішень

Прогнозний аналіз і часові ряди

  • Оцінювання і прогнозування поліноміального тренду.
  • Структурний аналіз часових рядів. Прогнозування циклічного тренду.
  • Дослідження методів згладжування і декомпозиції часових рядів.
  • Регресійні прогнозуючі моделі та авторегресійні прогнозуючі моделі.
  • Прогнозування на основі машинного навчання. 
  • Прогнозування на основі методу опорних векторів.
  • Нелінійні прогнозуючі моделі.
  • Розробка і дослідження прогнозуючих моделей, що навчаються.
  • Прогнозування коінтегрованих часових рядів.
  • Уточнення і розгортання прогнозних моделей.

Основи програмування та інженерії

  • Основи мови програмування Python
  • Бібліотеки Python для аналізу даних (pandas, numpy, matplotlib, scipy, scikit-learn, seaborn, tensorflow тощо)
  • Підготовка та попередня обробка даних
  • Знайомство з API бібліотек для будування моделей

Зберігання даних, їх аналіз та візуалізація

  • Основні положення
  • Моделі даних
  • Системи збору та зберігання даних
  • SQL як мова управління даними
  • Master Data Management
  • Рух даних в компанії (data pipeline)
  • Аналітика даних (business intelligence)
  • Візуалізація даних та data storytelling

Інфраструктура та технології великих даних для аналізу даних

  • Основи хмарних обчислень
  • Архітектура систем для великих даних
  • Платформа Hadoop для аналізу великих даних
  • Бази даних SQL і NoSQL
  • Програмування на Hive і Pig Latin для великих даних на платформі Hadoop
  • Потоки даних та потокова аналітика
  • Управління даними підприємств, організаційні ролі
  • Безпека великих даних та відповідність стандартам

Доменна предметна експертиза

  • Пропонується на вимогу, специфічний для групи та залежно від наявності доменних експертів
  • Можливі теми: Фінанси, CRM, Телекомунікації, Веб-реклама та маркетинг
  • Детальна інформація найближчим часом

Фінальний проект

Студент вибирає фінальний проект із пула задач, запропонованих DS-фахівцями Vodafone, і повинен пройти весь шлях до його реалізації:

  • Постановка задачі
  • Отримання дата-сету знеособлених даних від Vodafone
  • Додатковий збір даних (у разі потреби)
  • Вивчення і візуалізація даних
  • Препроцесинг
  • Вибір моделі та її тренуванняОцінка якості моделі

На випускному іспиті потрібно буде захистити проект перед комісією:

  • презентація
  • код
  • результат

Команда

team

Олег
Чертов

Професор, доктор технічних наук, завідувач кафедри прикладної математики НТУУ "КПІ"

Ініціатор першої освітньої програми з Data Science у вишах України.
Архітектор найбільшої OLAP-системи в Україні, яка й донині працює у Державній службі статистики України.
Консультант Світового банку та Фонду народонаселення ООН, координатор проектів Horizon 2020, NATO Science for Peace and Security, Volkswagen Foundation.
team

Юрій
Демченко

Старший науковий співробітник, викладач Амстердамського Університету. Інструктор-викладач дистанційного навчання Ліверпульського Університету. Викладач курсу по технології великих даних в НТУУ “КПІ”

Координатор і основний розробник Європейського проекту EDISON (Building Data Science Profession, 2015-2017), головним результатом якого стало створення EDISON Data Science Framework (EDSF), що складає базу для визначення професії спеціаліста по даним, відповідних компетенцій і широко використовується для розробки освітніх програм в області науки про даних.
team

Андрій
Ставицький

Доктор економічних наук, доцент кафедри економічної кібернетики економічного факультету Київського національного університету імені Тараса Шевченка

Національний експерт з реформування вищої освіти в рамках Болонського процесу, член Науково-методичної ради та координатор ECTS Київського національного університету імені Тараса Шевченка. Тьютор дисципліни “Економіка” (Единбурзька бізнес-школа), запрошений професор Вільнюського університету (Литва), Київської школи економіки.
team

Володимир
Рибалко

Керівник департаменту Customer Value Management (Big Data) Vodafone Ukraine

Більше 12 років досвіду в сфері цільового маркетингу на базі: предикативних моделей, аналізу Big Data та застосування систем Real Time Marketing.
team

Володимир
Кошель

Senior Data Scientist, Deep Learning Engineer. Vodafone Ukraine

Вже більше 15 років в науковій галузі і зараз отримує PhD з Computer Science.
Чотири роки досвіду роботи в сфері аналізу даних як Data Scientist, Machine Learning Engineer, Deep Learning Engineer.
team

Вероніка
Тамайо Флорес

Керівник проектів із запровадження технологій data science та business intelligence в Datascience.ua

Основна експертиза – бізнес аналіз, бізнес переклад (поєднання бізнесових та технічних навичок), ведення аналітичних проектів та розвиток бізнесу.
Випускник IE Business School (Іспанія) за спеціальністю Business Analytics and Big Data.
team

Вікторія
Рубан

Ініціатор і засновник проекту Big Data Lab

PR-директор компанії Vodafone Ukraine.
team

Сергій
Курсон

Координатор проекту

Експерт з зовнішніх відносин компанії Vodafone.
team

Ігор
Терейковський

Професор, доктор технічних наук, професор кафедри системного програмування та спеціалізованих комп’ютерних систем факультету прикладної математики НТУУ “КПІ”

Автор більш ніж 200 наукових та науково-методичних робіт, в тому числі 4 монографій, пов’язаних із застосуванням
нейронних мереж в області захисту інформації та розпізнавання біометричних образів.
team

Леонід
Любчик

Професор, доктор технічних наук, Академік АН Вищої школи України, завідувач кафедри комп’ютерної математики і аналізу даних НТУ «ХПІ»

Лауреат Державної премії України.
Член Міжнародного наукового товариства IEEE, запрошений професор Wuppertal University, Germany та CINVESTAV, Mexico.
Член Науково-методичної ради МОН України у 2017-2019 рр., координатор розробки Стандартів вищої освіти в галузі знань «Інформаційні технології».

Умови навчання

icon
Старт навчання
Вересень 2020
icon
Формат
Вебінар, доступні записи лекцій
icon
Розмір групи
20
icon
Тривалість
6 місяців
240 лекційних годин
240 годин практики,
60 годин консультацій
icon
Розклад
Вт. Чт. 19:00-22:00
Сб. 10:00-17:00
icon
Вартість
40 000 грн.
icon
Залишилось місць
20
icon
Старт навчання
визначається
icon
Формат
Аудиторія
(Лейпцизька 15)
icon
Розмір групи
20
icon
Тривалість
6 місяців,
240 лекційних годин,
240 годин практики,
онлайн консультації
icon
Розклад
Вт. Чт. 19:00-22:00
Сб. 10:00-17:00
icon
Вартість
визначається
icon
Залишилось місць
20
Early Birds Deadline
07-10 Липня
35 000 грн
Deadline I
11-31 Липня
37 000 грн
Deadline II
01-31 Серпня
39 000 грн
Last Minute Deadline
01-14 Вересня
40 000 грн

Вимоги:

  • Бажання розібратися у новій перспективній галузі Data Science
  • Можливість виділяти на протязі півроку щотижня по 12 годин на аудиторні заняття і не менше часу на самостійну роботу
  • Логічно-раціональне, алгоритмічне мислення
  • Знання (можливо, забуте) основ лінійної алгебри та теорії ймовірності
  • Вміння програмувати будь-якою мовою програмування
  • Наявність ноутбука, щоб виконувати лабораторні роботи та працювати на практичних заняттях
decor
decor

Про нас

Історія Big Data Lab розпочалася в листопаді 2017, коли був запущений безпрецедентний експеримент під однойменною назвою. Його метою було показати можливості Big Data analytics, покласти початок формуванню ринку Big Data analytics в Україні, який перебував у зародковому стані, а також допомогти фахівцям визначитися з однією з найперспективніших і затребуваних професій майбутнього.

Vodafone об’єднав у проекті бізнес, академічну науку, розробників, інвесторів, муніципальні та державні установи. Проект дав поштовх створенню в Україні екосистеми дата-аналітики як основи для трансформації бізнесу і суспільства, і водночас проявив гострий брак Data Science фахівців. Тож логічним розвитком проекту стала школа Big Data Lab.

2017
2018
2020
picture

Big Data Lab 2017

Big Data Lab – унікальний експеримент, для реалізації якого у 2017 р. Vodafone надав масив реальних даних, знеособлених та змінених, для розробки рішень для бізнеса, міст, суспільства, людей. Проект включав в себе кілька модулів: навчання, хакатон, бізнес-акселератор і захист проектів, розроблених в ході акселератора, перед потенційними інвесторами.

Для участі у проекті зареєструвались понад 1500 розробників і дата аналітиків з різних міст України та інших країн.

Понад 600 фахівців з них отримали доступ до даних після конкурсного відбору.

Їм було надано гігантський масив даних – 120 млн подій, кожна з яких мала 20 параметрів.

3 місяці учасники Big Data Lab працювали з даними.Було створено понад 40 інноваційних ідей. Кращі рішення за участі data-аналітиків Vodafone були доопрацьовані та представлені потенційним клієнтам та інвесторам.

picture

Big Data Lab
Challenge 2018

Big Data Lab Challenge – двотижневе онлайн-змагання на базі платформи Kaggle. Учасники отримали доступ до даних Vodafone для вирішення актуальних для бізнеса завдань: визначення віку абонента по знеособленим даними та точне визначення потенційних користувачів однієї з послуг Vodafone.

У змаганні взяли участь 356 розробників з 30 міст України, було також кілька представників Німеччини.

38 команд працювали над визначенням віку абонента, best score 0.52009.

57 команд розробляли алгоритм визначення схильності абонентів до підключення послуги Vodafone Music, best score 0.83405.

Переможці вибороли приз у розмірі $3000, а Vodafone отримав чотири ефективні прогностичні моделі, які використав у своїй діяльності.

Big Data Lab Challenge продемонстрував велику зацікавленість у доменній експертизі та можливості працювати над конкретними завданнями, актуальними для бізнеса.

picture

Big Data Lab
School 2020

Досвід проведення Big Data Lab 2017 та Big Data Lab Challenge 2018 підштовхнув до створення першого в Україні курсу Data Science, який би поєднав теоретичні знання з унікальною доменною експертизою і реальними великими даними.

Big Data Lab School – це піврічний інтенсив з підготовки кваліфікованих Data Science спеціалістів, який надасть знання та практичні навички, необхідні для старту кар’єри у Data Science.

Ми розробили унікальну програму навчання, яка спирається як на фундаментальні математичні дисципліни, так і на роботу з реальними великими даними і експертизу аналізу даних у різних доменних сферах (телеком, банки, промисловість, Smart City, тощо).

decor

Про Data Science

В ході розвику четвертої промислової революції, яку очолює прогрес у технологіях великих даних та штучного інтелекту, людство знову стикається з великими змінами на ринку праці.

За прогнозами аналітиків, вже зараз аналітика великих даних (Big Data Analytics) стає одним з найбільш затребуваних завдань в сучасному бізнесі.
За оцінками компанії Frost & Sullivan, в 2021 році загальний обсяг світового ринку аналітики великих даних збільшиться в порівнянні з показниками 2016 року більш ніж в 2,5 рази і складе $ 67,2 млрд, при щорічних темпах зростання (CAGR) на рівні 35,9%

Вже сьогодні обсяги згенерованих людством даних перевищують 30 Зетабайт*, а до 2025 року очікується вже 400 зетабайт.
*1 Зетабайт – 63 мільйони років перегляду 4K відео.

Coursera визнає Data Science одним з трьох найбільш перспективних напрямків освіти, а LinkedIn визнає професію Data Scientist однією з найбільш перспективних сучасних професій з більш ніж 10.000 вакансій і річним темпом зростання попиту на 37%.

Саме час для старту кар'єри у Data Science!
decor
decor

Поширені запитання

Що таке Big Data Lab?

Big Data Lab – це комплексний інтенсивний курс з підготовки data science спеціалістів в онлайн-форматі, який передбачає вивчення фундаментальних математичних дисциплін, доменну експертизу і практику з реальними великими даними Vodafone.

На кого розрахований курс?

Перед усім, на дата аналітиків, бізнес аналітиків, IT спеціалістів, та ентузіастів з сильною математичною підготовкою та знанням будь якої мови програмування.

Наскільки знання, які отримають студенти Big Data Lab, актуальні в Україні, у світі?

Попит на кваліфікованих data science спеціалістів щодня зростає як в Україні, так і за її межами.
Coursera визнає Data Science одним з трьох найбільш перспективних напрямків освіти у світі, а LinkedIn визнає професію Data Scientist однією з найбільш перспективних сучасних професій з більш ніж 10.000 вакансій і річним темпом зростання попиту на 37%.

Чим Big Data Lab відрізняється від інших подібних шкіл чи онлайн курсів?

– Унікальним онлайн-форматом лекцій, який максимально наблизить онлайн-навчання до традиційного очного формату навчання.
– До викладання залучені кращі практикуючі фахівці України та світу.
– Унікальна інтенсивна програма навчання, яка спирається як на фундаментальні математичні дисципліни, так і на роботу з реальними великими даними і експертизу аналізу даних у різних доменних сферах (телеком, банки, промисловість, Smart City, тощо).

Що собою представляє “онлайн-формат” навчання?

Лекції викладачів будуть записуватись та транслюватись за розкладом занять у прямому ефірі онлайн. Під час заняття слухачі будуть мати можливість задавати питання викладачу, так як це б відбувалося при очному навчанні.
Студенти будуть мати можливість консультуватись з викладачами і у позалекційний час за допомогою LMS системи та месенджеру Slack.
Студенти, які не змогли бути присутніми на лекції, зможуть отримати відеозапис лекції після її обробки.

За яким принципом обиралася команда Big Data Lab?

Найважливіші критерії:
– вміння та бажання передавати знання і навчити,
– досвід викладацької роботи на міжнародному рівні,
– досвід роботи з великими даними.

Якою мовою буде вестись викладання?

Академічні математичні дисципліни: лекції та презентації українською.
Інженерія та програмування: лекції українською, іноді російською.
Презентації англійською.

Які базові знання та навички необхідні студенту для ефективного навчання на курсі?

Знання основ лінійної алгебри та теорії ймовірності
Навички програмувати будь-якою мовою програмування

Коли почнеться реєстрація на курс та розгляд заявок?

Реєструватися можна вже зараз. Розгляд заявок розпочнеться 07.07.2020

Яка процедура реєстрації на курс?

Реєстрація на курс потребує певної послідовності дій:
– Натиснути кнопку «Записатися на курс» на сайті bigdatalab.com.ua і повідомити нам ваші контактні дані.
– Отримати і заповнити розширену анкету з невеликим тестуванням знань, що дасть як студентам, так і школі уявлення – чи буде рівень вашої підготовки достатнім для сприйняття і засвоєння лекційних та практичних матеріалів (навчання буде непростим).
– Отримати лист від школи про проходження відбору з описом подальших кроків: підписання договору і оплати навчання.
– Заплатити за курс навчання не пізніше трьох днів після отримання запрошення.

Коли початок курсу та скільки триватиме навчання у школі?

Початок навчання заплановано на 15 вересня 2020 року. Тривалість навчання: 6 місяців (5 місяців начитка + 1 місяць фінальний проект)*.
*Графік і обсяг занять може змінюватись протягом навчального процесу.

За яким розкладом буде проходити навчання?

Навчання проходитиме у вівторок та четверг з 19:00 до 22:00. Та у суботу з 10:00 до 17:00.
Ми плануємо коригувати розклад у процесі навчання, враховуючи навантаження на студентів та святкові дні (розслабитись не дамо, але й не плануємо виснажити).

Окрім відеолекцій - які навчальні матеріали передбачені?

Студентам буде надано доступ до презентацій лекцій та рекомендовану літературу для саморозвитку.

Чи зможуть жителі інших міст України пройти курс?

Курс можна буде проходити з різних куточків України. Головне, щоб був доступ до Інтернету та розуміння української та англійської мови.

Що я отримаю після закінчення курсу?

– Знання та практичні навички, достатні для старту кар’єри у Data Science.
– Фінальний проект, який прикрасить ваше професійне портфоліо і стане підтвердженням ваших професійних навичок для майбутнього роботодавця
– Найкращі студенти отримають дипломи та зможуть отримати запрошення на роботу у Vodafone – одну з найбільших світових телекомунікаційних компаній*.
*при наявності вакантних місць

Ким я зможу працювати після Big Data Lab?

Після закінчення курсу і успішно виконаного фінального проекту, випускники зможуть претендувати на такі позиції в IT: Junior Data Scientist, Junior Analyst, Junior Data Analyst, Junior User Acquisition Analyst тощо.

Чому саме Vodafone, мобільний оператор, розпочинає цей курс?

Vodafone це найбільший у світі міжнародний оператор зв’язку, який щодня отримує та обробляє великі масиви даних.
Компанія має велику експертизу і досвід у роботі з великими даними та готова розвивати ринок big data продуктів в Україні.

Які основні умови для отримання Early Birds?

1. Подача заявки і отримання анкети для перевірки знань з 07.07 по 10.07 включно та подальше дотримання термінів проходження відбору (35 000 грн).
2. Подача заявки і отримання анкети для перевірки знань з 11.07 по 31.07 включно та подальше дотримання термінів проходження відбору (37 000 грн).
3. Подача заявки і отримання анкети для перевірки знань з 01.08 по 31.08 включно та подальше дотримання термінів проходження відбору (39 000 грн).
4. Подача заявки і отримання анкети для перевірки знань з 01.09 по 14.09 включно та подальше дотримання термінів проходження відбору (40 000 грн).

Зворотній зв`язок