План на курса

Big Data Общ преглед:

  • Какво е Big Data
  • Защо Big Data набира популярност
  • Big Data Казуси от практиката
  • Big Data Характеристики
  • Решения за работа върху Big Data.

Hadoop и неговите компоненти:

  • Какво е Hadoop и какви са неговите компоненти.
  • Hadoop Архитектура и нейните характеристики на данни, които може да обработва /процес.
  • Кратко за Hadoop История, компании, които го използват и защо са започнали да го използват.
  • Hadoop Рамка и нейните компоненти – обяснени подробно.
  • Какво е HDFS и чете -записва в Hadoop разпределена файлова система.
  • Как да настроите Hadoop клъстер в различни режими - самостоятелен/псевдо/клъстер с множество възли.

(Това включва настройка на Hadoop клъстер във VirtualBox/KVM/VMware, мрежови конфигурации, които трябва да бъдат внимателно разгледани, стартиране на Hadoop демони и тестване на клъстера).

  • Какво е Map Reduce frame work и как работи.
  • Изпълнение на карта Намалете заданията на Hadoop клъстер.
  • Разбиране на репликацията, огледалото и Rack информираността в контекста на Hadoop клъстери.

Hadoop Клъстерно планиране:

  • Как да планирате вашия hadoop клъстер.
  • Разбиране на хардуер-софтуер за планиране на вашия hadoop клъстер.
  • Разбиране на работните натоварвания и планиране на клъстера, за да се избегнат неуспехи и да се изпълнява оптимално.

Какво е MapR и защо MapR:

  • Преглед на MapR и неговата архитектура.
  • Разбиране и работа на MapR Control System, MapR Volumes, моментни снимки и Mirrors.
  • Планиране на клъстер в контекста на MapR.
  • Сравнение на MapR с други дистрибуции и Apache Hadoop.
  • Инсталиране на MapR и внедряване на клъстер.

Настройка и администриране на клъстер:

  • Управление на услуги, възли, моментни снимки, огледални томове и отдалечени клъстери.
  • Разбиране и управление на възли.
  • Разбиране на Hadoop компонента, Инсталиране на Hadoop компонента заедно с MapR Services.
  • AccessИзвеждане на данни в клъстер, включително чрез NFS Управление на услуги и възли.
  • Управление на данни чрез използване на обеми, управление на потребители и групи, управление и присвояване на роли на възли, пускане в експлоатация, извеждане от експлоатация на възли, администриране на клъстери и наблюдение на производителността, конфигуриране/анализиране и наблюдение на показатели за наблюдение на производителността, конфигуриране и администриране на сигурността на MapR.
  • Разбиране и работа с M7 - собствено хранилище за MapR таблици.
  • Конфигурация и настройка на клъстера за оптимална производителност.

Надстройка на клъстера и интеграция с други настройки:

  • Надграждане на софтуерна версия на MapR и видове надстройки.
  • Конфигуриране на Mapr клъстер за достъп до HDFS клъстер.
  • Настройване на MapR клъстер на Amazon Elastic Mapreduce.

Всички горепосочени теми включват демонстрации и практически сесии за учащите, за да придобият практически опит с технологията.

Изисквания

  • Основни познания по Linux FS
  • Основен Java
  • Познаване на Apache Hadoop (препоръчително)
 28 Часа

Брой участници


Цена за участник

Oтзиви от потребители (1)

Предстоящи Курсове

Свързани Kатегории