План на курса
- Scala primer Бързо въведение в Scala Labs : Запознаване със Scala Spark Basics Предистория и история Spark и Hadoop Spark концепции и архитектура Spark eco system (ядро, spark sql, mlib, стрийминг) Labs : Инсталиране и стартиране на Spark Първи поглед върху Spark Работещ Spark в локален режим Spark web UI Spark shell Анализиране на набор от данни – част 1 Инспектиране на RDDs Labs: Spark shell изследване на RDD RDDs концепции Разделения RDD Операции / трансформации RDD типове двойка ключ-стойност RDD MapReduce на RDD Лабораторни работи за кеширане и постоянство: създаване и проверка на RDD; Кеширане на RDD Програмиране на Spark API Въведение в Spark API / RDD API Изпращане на първата програма в Spark Отстраняване на грешки / регистриране Свойства на конфигурацията Лабораторни работи: Програмиране в Spark API, Подаване на задания Поддръжка на Spark SQL SQL в Spark Dataframes Дефиниране на таблици и импортиране на набори от данни Запитване на данни рамки, използващи SQL Формати за съхранение: JSON / Parquet Labs: Създаване и запитване на рамки с данни; оценяване на формати на данни MLlib MLlib въведение MLlib алгоритми Лабораторни упражнения: Писане на MLib приложения GraphX GraphX преглед на библиотеката GraphX APIs Лабораторни дейности: Обработка на графични данни с помощта на Spark Spark Streaming Общ преглед на поточно предаване Оценяване на платформи за поточно предаване Операции за поточно предаване Операции с плъзгащи се прозорци Лабораторни дейности: Писане на приложения за стрийминг на spark Spark и Hadoop Hadoop Intro ( HDFS / YARN) Hadoop + Spark архитектура Изпълнение на Spark на Hadoop YARN Обработка на HDFS файлове с помощта на Spark Spark Производителност и настройка Излъчване на променливи Акумулатори Управление на паметта и кеширане Операции на Spark Внедряване на Spark в производство Примерни шаблони за внедряване Конфигурации Мониторинг Отстраняване на неизправности
Изисквания
ПРЕДПОСТАВКИ
запознаване с езика Java / Scala / Python (нашите лаборатории в Scala и Python) основно разбиране на средата за разработка на Linux (навигация в командния ред / редактиране на файлове с помощта на VI или nano)
Oтзиви от потребители (6)
Doing similar exercises different ways really help understanding what each component (Hadoop/Spark, standalone/cluster) can do on its own and together. It gave me ideas on how I should test my application on my local machine when I develop vs when it is deployed on a cluster.
Thomas Carcaud - IT Frankfurt GmbH
Курс - Spark for Developers
Ajay was very friendly, helpful and also knowledgable about the topic he was discussing.
Biniam Guulay - ICE International Copyright Enterprise Germany GmbH
Курс - Spark for Developers
Ernesto did a great job explaining the high level concepts of using Spark and its various modules.
Michael Nemerouf
Курс - Spark for Developers
The trainer made the class interesting and entertaining which helps quite a bit with all day training.
Ryan Speelman
Курс - Spark for Developers
We know a lot more about the whole environment.
John Kidd
Курс - Spark for Developers
Richard is very calm and methodical, with an analytic insight - exactly the qualities needed to present this sort of course.