Благодарим ви, че изпратихте вашето запитване! Един от членовете на нашия екип ще се свърже с вас скоро.
Благодарим ви, че направихте своята резервация! Един от членовете на нашия екип ще се свърже с вас скоро.
План на курса
Въведение:
- Apache Spark в Hadoop екосистема Кратко въведение за python, scala
Основи (теория):
- Архитектура RDD Трансформация и Етап на действия, Задача, Зависимости
Използвайки Databricks среда, разберете основите (практическа работилница):
- Упражнения с използване на RDD API Основни функции за действие и трансформация PairRDD Стратегии за кеширане на присъединяване Упражнения с използване на DataFrame API SparkSQL DataFrame: избиране, филтриране, групиране, сортиране на UDF (дефинирана от потребителя функция) Търсене в DataSet API Streaming
Използване на AWS среда разбиране на внедряването (практически семинар):
- Основи на AWS Glue Разберете разликите между AWS EMR и AWS Glue Примерни задачи в двете среди Разберете плюсовете и минусите
Екстра:
- Въведение в Apache Airflow оркестрацията
Изисквания
Умения за програмиране (за предпочитане python, scala)
SQL основи
21 Часа
Oтзиви от потребители (3)
Having hands on session / assignments
Poornima Chenthamarakshan - Intelligent Medical Objects
Курс - Apache Spark in the Cloud
1. Right balance between high level concepts and technical details. 2. Andras is very knowledgeable about his teaching. 3. Exercise
Steven Wu - Intelligent Medical Objects
Курс - Apache Spark in the Cloud
Get to learn spark streaming , databricks and aws redshift