План на курса
Въведение
- Apache Spark срещу Hadoop MapReduce
Преглед на Apache Spark функции и архитектура
Избор на Programming език
Настройка Apache Spark
Създаване на примерно приложение
Избор на набор от данни
Изпълнение на Data Analysis върху данните
Обработка на структурирани данни с Spark SQL
Обработка на поточни данни с Spark Streaming
Интегриране на Apache Spark с инструменти 3-та част Machine Learning.
Използване на Apache Spark за обработка на графики
Оптимизиране Apache Spark
Отстраняване на неизправности
Обобщение и заключение
Изисквания
- Опит с командния ред на Linux
- Общо разбиране за обработка на данни
- Опит в програмирането с Java, Scala, Python или R
Публика
- Разработчици
Oтзиви от потребители (5)
Много практически примери, различни начини за подход към един и същ проблем и понякога не толкова очевидни трикове как да се подобри текущото решение
Rafal - Nordea
Курс - Apache Spark MLlib
Машинен превод
The live examples
Ahmet Bolat - Accenture Industrial SS
Курс - Python, Spark, and Hadoop for Big Data
very interactive...
Richard Langford
Курс - SMACK Stack for Data Science
Sufficient hands on, trainer is knowledgable
Chris Tan
Курс - A Practical Introduction to Stream Processing
Get to learn spark streaming , databricks and aws redshift