План на курса
Седмица 1 Big Data концепции
- Дефиниция на VVVV (скорост, обем, разнообразие, достоверност) Ограничения на традиционния капацитет за обработка на данни Разпределена обработка Статистически анализ Машинно обучение Видове анализи Визуализация на данни Разпределена обработка (напр. map-reduce) Въведение в използваните езици Интензивен курс на R език Python интензивен курс
Седмици 2 и 3 Изпълнение Data Analysis
- Статистически анализ Описателен Statistics в набори от големи данни (напр. изчисляване на средна стойност) Инференциален Statistics (оценка) Прогнозиране с модели на корелация и регресия Анализ на времеви редове Основи на машинното обучение Учене под надзор срещу неконтролирано обучение Класификация и клъстериране Оценка на разходите за специфични методи Филтър
Седмица 4 Обработка на естествен език
- Обработка на текст Разбиране на смисъла на текста Автоматично генериране на текст Анализ на настроение/тема Computer Vision
Седмица 5 и 6 Концепция за инструменти
- Решение за съхранение на данни (SQL, NoSQL, йерархично, обектно ориентирано, ориентирано към документи) MySQL, Cassandra, MongoDB, Elasticsearch, HDFS и др...) Избор на правилното решение на проблема Разпределена обработка Spark Machine Learning с Spark (MLLib) Spark SQL Мащабируемост Публичен облак (AWS, Google и т.н...) Частен облак (OpenStack, облачна леярна) Автоматично мащабируемост
Седмица 7 Soft Skills
- Консултантски и Leadership умения Оказване на въздействие: разказване на истории, основано на данни Разбиране на вашата аудитория Ефективно представяне на данни – предаване на вашето послание Ефективност на влиянието и промяна на лидерството Справяне с трудни ситуации
Изпит
- Краен изпит по програмата
Изисквания
Участниците трябва да имат добри познания по математика, най-малко средно ниво.
Въпреки че не са необходими умения за програмиране, всякакви умения по програмиране ще бъдат полезни.
Участниците ще бъдат оценени и интервюирани преди участие в тази програма за обучение.
Oтзиви от потребители (4)
Understanding big data beter
Shaune Dennis - Vodacom
Курс - Big Data Business Intelligence for Telecom and Communication Service Providers
Subject presentation knowledge timing
Aly Saleh - FAB banak Egypt
Курс - Introduction to Data Science and AI (using Python)
It is great to have the course custom made to the key areas that I have highlighted in the pre-course questionnaire. This really helps to address the questions that I have with the subject matter and to align with my learning goals.
Winnie Chan - Statistics Canada
Курс - Jupyter for Data Science Teams
The example and training material were sufficient and made it easy to understand what you are doing.