План на курса

Въведение в Large Language Models (LLMs)

  • Преглед на LLMs
  • Определение и значение
  • Приложения в AI днес

Трансформаторна архитектура

  • Какво е трансформатор и как работи?
  • Основни компоненти и характеристики
  • Вграждане и позиционно кодиране
  • Многостранно внимание
  • Предаваща невронна мрежа
  • Нормализация и остатъчни връзки

Модели трансформатори

  • Механизъм за самовнимание
  • Архитектура енкодер-декодер
  • Позиционни вграждания
  • BERT (Двупосочни енкодерни представяния от трансформатори)
  • GPT (генеративен предварително обучен трансформатор)

Оптимизация на производителността и клопки

  • Дължина на контекста
  • Mamba и модели на пространство на състояния
  • Светкавично внимание
  • Редки трансформатори
  • Визуални трансформатори
  • Значение на квантуване

Подобряване на Трансформърс

  • Генериране на разширен текст за извличане
  • Смес от модели
  • Дърво на мислите

Фина настройка

  • Теория на адаптацията от нисък ранг
  • Фина настройка с QLora

Закони за мащабиране и оптимизация в LLM

  • Значение на законите за мащабиране за LLM
  • Мащабиране на размера на данните и модела
  • Изчислително мащабиране
  • Скалиране на ефективността на параметъра

Оптимизация

  • Връзка между размера на модела, размера на данните, изчислителния бюджет и изискванията за изводи
  • Оптимизиране на производителността и ефективността на LLM
  • Най-добри практики и инструменти за обучение и фина настройка на LLM

Обучение и фина настройка на LLM

  • Стъпки и предизвикателства при обучението на LLM от нулата
  • Събиране и поддръжка на данни
  • Изисквания за мащабни данни, процесор и памет
  • Предизвикателства за оптимизация
  • Пейзаж на LLMs с отворен код

Основи на Reinforcement Learning (RL)

  • Въведение в Reinforcement Learning
  • Учене чрез положително подсилване
  • Дефиниция и основни понятия
  • Марков процес на вземане на решения (MDP)
  • Динамично програмиране
  • Методи Монте Карло
  • Обучение по времева разлика

дълбоко Reinforcement Learning

  • Дълбоки Q-мрежи (DQN)
  • Оптимизация на проксималната политика (PPO)
  • Elements от Reinforcement Learning

Интегриране на LLM и Reinforcement Learning

  • Комбиниране на LLM с Reinforcement Learning
  • Как RL се използва в LLM
  • Reinforcement Learning с човешка обратна връзка (RLHF)
  • Алтернативи на RLHF

Казуси и приложения

  • Приложения от реалния свят
  • Истории на успеха и предизвикателства

Разширени теми

  • Разширени техники
  • Разширени методи за оптимизация
  • Авангардни изследвания и разработки

Обобщение и следващи стъпки

Изисквания

  • Основно разбиране на Machine Learning

Публика

  • Учени по данни
  • Софтуерни инженери
 21 Часа

Брой участници


Цена за участник

Предстоящи Курсове

Свързани Kатегории