План на курса

Въведение

Преглед на Spark Streaming функции и архитектура

  • Поддържани източници на данни
  • Основни API

Подготовка на околната среда

  • Зависимости
  • Искра и стрийминг контекст
  • Свързване с Кафка

Обработка на съобщения

  • Анализиране на входящи съобщения като JSON
  • ETL процеси
  • Стартиране на поточния контекст

Изпълнение на Windowed Stream Processing

  • Интервал на слайдове
  • Конфигурация за доставка на контролна точка
  • Стартиране на средата

Създаване на прототип на кода за обработка

  • Свързване с тема на Кафка
  • Извличане на JSON от източник на данни с помощта на Paw
  • Вариации и допълнителна обработка

Поточно предаване на кода

  • Променливи за контрол на работата
  • Определяне на стойности за съвпадение
  • Функции и условия

Придобиване на поточен изход

  • Броячи
  • Кафка изход (съвпадащи и несъвпадащи)

Отстраняване на неизправности

Обобщение и заключение

Изисквания

  • Опит с Python и Apache Kafka
  • Познаване на платформи за обработка на потоци

Публика

  • Инженери по данни
  • Учени по данни
  • Програмисти
 7 Часа

Брой участници


Цена за участник

Oтзиви от потребители (5)

Предстоящи Курсове

Свързани Kатегории