План на курса

Въведение в Google Colab и Apache Spark

  • Общ преглед на Google Colab
  • Въведение в Apache Spark
  • Настройване на Spark в Google Colab

Обработка на данни с Apache Spark

  • Работа с RDD и DataFrames
  • Зареждане и обработка на големи набори от данни
  • Използване на Spark SQL за запитване към структурирани данни

Разширен анализ със Spark

  • Машинно обучение със Spark MLlib
  • Извършване на анализ на данни в реално време
  • Разпределено изчисление със Spark

Визуализация и Collaboration в Google Colab

  • Интегриране на Colab с популярни библиотеки за визуализация
  • Съвместни работни процеси с преносими компютри Colab
  • Споделяне и експортиране на резултати

Оптимизиране Big Data на работните процеси

  • Тунинг Spark за производителност
  • Оптимизиране на използването на паметта и съхранението
  • Мащабиране на работни потоци за големи набори от данни

Big Data в облака

  • Интегриране на Google Colab с инструменти, базирани на облак
  • Използване на облачно хранилище за големи данни
  • Работа със Spark в разпределени облачни среди

Казуси и най-добри практики

  • Преглед на реални приложения за големи данни
  • Казуси с използване на Apache Spark и Colab
  • Най-добри практики за анализ на големи данни

Обобщение и следващи стъпки

Изисквания

  • Основни познания за концепциите за науката за данни
  • Познаване на Apache Spark
  • Python умения за програмиране

Публика

  • Учени по данни
  • Инженери по данни
  • Изследователи, работещи с големи данни
 14 Часа

Брой участници


Цена за участник

Oтзиви от потребители (5)

Предстоящи Курсове

Свързани Kатегории