План на курса
Въведение
Преглед на подходите за достъп до данни (Hive, бази данни и др.)
Преглед на характеристиките и архитектурата на Spark
Инсталиране и конфигуриране на Spark
Разбиране на Dataframes в Spark
Дефиниране на таблици и импортиране на набори от данни
Запитване на рамки с данни с помощта на SQL
Извършване на агрегиране, JOIN и вложени заявки
Качване и Accessкачване на данни
Запитване за различни типове данни
- JSON, Parquet и др.
Запитване на езера с данни с SQL
Отстраняване на неизправности
Обобщение и заключение
Изисквания
- Опит с SQL заявки
- Опит в програмирането на всеки език
Публика
- Анализатори на данни
- Учени по данни
- Инженери по данни
Oтзиви от потребители (5)
Много практически примери, различни начини за подход към един и същ проблем и понякога не толкова очевидни трикове как да се подобри текущото решение
Rafal - Nordea
Курс - Apache Spark MLlib
Машинен превод
very interactive...
Richard Langford
Курс - SMACK Stack for Data Science
Sufficient hands on, trainer is knowledgable
Chris Tan
Курс - A Practical Introduction to Stream Processing
Get to learn spark streaming , databricks and aws redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Курс - Apache Spark in the Cloud
practice tasks