План на курса

Въведение

  • Apache Beam срещу MapReduce, Spark Streaming, Kafka Streaming, Storm и Flink

Инсталиране и конфигуриране Apache Beam

Преглед на Apache Beam функции и архитектура

  • Beam Model, SDKs, Beam Pipeline Runners
  • Бекенд за разпределена обработка

Разбиране на модела Apache Beam Programming.

  • Как се изпълнява тръбопровод

Изпълнение на примерен конвейер

  • Подготовка на конвейер WordCount
  • Локално изпълнение на тръбопровода

Проектиране на тръбопровод

  • Планиране на структурата, избор на трансформации и определяне на входните и изходните методи

Създаване на тръбопровода

  • Писане на драйверната програма и дефиниране на конвейера
  • Използване на Apache Beam класове
  • Набори от данни, трансформации, I/O, кодиране на данни и др.

Изпълнение на тръбопровода

  • Изпълнение на тръбопровода локално, на отдалечени машини и в публичен облак
  • Избор на бегач
  • Конфигурации, специфични за бегача

Тестване и отстраняване на грешки Apache Beam

  • Използване на съвети за тип за емулиране на статично въвеждане
  • Управление на Python зависимости от тръбопроводи

Обработка на ограничени и неограничени набори от данни

  • Прозорци и тригери

Направете вашите тръбопроводи годни за многократна употреба и поддръжка

Създайте нови източници на данни и приемници

  • Apache Beam API за източник и приемник

Интегриране на Apache Beam с други Big Data системи

  • Apache Hadoop, Apache Spark, Apache Kafka

Отстраняване на неизправности

Обобщение и заключение

Изисквания

  • Опит с Python Programming.
  • Опит с командния ред Linux.

Публика

  • Разработчици
 14 Часа

Брой участници


Цена за участник

Предстоящи Курсове

Свързани Kатегории