План на курса

Въведение

  • Какво са Large Language Models (LLMs)?
  • LLM срещу традиционни модели на НЛП
  • Преглед на функциите и архитектурата на LLMs
  • Предизвикателства и ограничения на LLM

Разбиране на LLMs

  • Жизненият цикъл на LLM
  • Как работят LLMs
  • Основните компоненти на LLM: енкодер, декодер, внимание, вграждания и др.

Първи стъпки

  • Създаване на среда за разработка
  • Инсталиране на LLM като инструмент за разработка, напр. Google Colab, Hugging Face

Работа с LLMs

  • Проучване на наличните опции за LLM
  • Създаване и използване на LLM
  • Фина настройка на LLM върху персонализиран набор от данни

Резюмиране на текст

  • Разбиране на задачата за обобщаване на текст и нейните приложения
  • Използване на LLM за екстрактивно и абстрактно обобщаване на текст
  • Оценяване на качеството на генерираните обобщения с помощта на показатели като ROUGE, BLEU и др.

Отговаряне на въпроси

  • Разбиране на задачата за отговаряне на въпроси и нейните приложения
  • Използване на LLM за отговор на въпроси от отворен и затворен домейн
  • Оценяване на точността на генерираните отговори с помощта на показатели като F1, EM и др.

Генериране на текст

  • Разбиране на задачата за генериране на текст и нейните приложения
  • Използване на LLM за условно и безусловно генериране на текст
  • Контролиране на стила, тона и съдържанието на генерираните текстове с помощта на параметри като температура, top-k, top-p и др.

Интегриране на LLM с други рамки и платформи

  • Използване на LLM с PyTorch или TensorFlow
  • Използване на LLM с Flask или Streamlit
  • Използване на LLM с Google Cloud или AWS

Отстраняване на неизправности

  • Разбиране на често срещаните грешки и грешки в LLM
  • Използване на TensorBoard за наблюдение и визуализиране на тренировъчния процес
  • Използване на PyTorch Lightning за опростяване на кода за обучение и подобряване на производителността
  • Използване на Hugging Face набори от данни за зареждане и предварителна обработка на данните

Обобщение и следващи стъпки

Изисквания

  • Разбиране на обработката на естествения език и дълбокото обучение
  • Опит с Python и PyTorch или TensorFlow
  • Основен опит в програмирането

Публика

  • Разработчици
  • НЛП ентусиасти
  • Учени по данни
 14 Часа

Брой участници


Цена за участник

Предстоящи Курсове

Свързани Kатегории