Благодарим ви, че изпратихте вашето запитване! Един от членовете на нашия екип ще се свърже с вас скоро.
Благодарим ви, че направихте своята резервация! Един от членовете на нашия екип ще се свърже с вас скоро.
План на курса
Въведение в Large Language Models (LLMs)
- Преглед на LLMs
- Определение и значение
- Приложения в AI днес
Трансформаторна архитектура
- Какво е трансформатор и как работи?
- Основни компоненти и характеристики
- Вграждане и позиционно кодиране
- Многостранно внимание
- Предаваща невронна мрежа
- Нормализация и остатъчни връзки
Модели трансформатори
- Механизъм за самовнимание
- Архитектура енкодер-декодер
- Позиционни вграждания
- BERT (Двупосочни енкодерни представяния от трансформатори)
- GPT (генеративен предварително обучен трансформатор)
Оптимизация на производителността и клопки
- Дължина на контекста
- Mamba и модели на пространство на състояния
- Светкавично внимание
- Редки трансформатори
- Визуални трансформатори
- Значение на квантуване
Подобряване на Трансформърс
- Генериране на разширен текст за извличане
- Смес от модели
- Дърво на мислите
Фина настройка
- Теория на адаптацията от нисък ранг
- Фина настройка с QLora
Закони за мащабиране и оптимизация в LLM
- Значение на законите за мащабиране за LLM
- Мащабиране на размера на данните и модела
- Изчислително мащабиране
- Скалиране на ефективността на параметъра
Оптимизация
- Връзка между размера на модела, размера на данните, изчислителния бюджет и изискванията за изводи
- Оптимизиране на производителността и ефективността на LLM
- Най-добри практики и инструменти за обучение и фина настройка на LLM
Обучение и фина настройка на LLM
- Стъпки и предизвикателства при обучението на LLM от нулата
- Събиране и поддръжка на данни
- Изисквания за мащабни данни, процесор и памет
- Предизвикателства за оптимизация
- Пейзаж на LLMs с отворен код
Основи на Reinforcement Learning (RL)
- Въведение в Reinforcement Learning
- Учене чрез положително подсилване
- Дефиниция и основни понятия
- Марков процес на вземане на решения (MDP)
- Динамично програмиране
- Методи Монте Карло
- Обучение по времева разлика
дълбоко Reinforcement Learning
- Дълбоки Q-мрежи (DQN)
- Оптимизация на проксималната политика (PPO)
- Elements от Reinforcement Learning
Интегриране на LLM и Reinforcement Learning
- Комбиниране на LLM с Reinforcement Learning
- Как RL се използва в LLM
- Reinforcement Learning с човешка обратна връзка (RLHF)
- Алтернативи на RLHF
Казуси и приложения
- Приложения от реалния свят
- Истории на успеха и предизвикателства
Разширени теми
- Разширени техники
- Разширени методи за оптимизация
- Авангардни изследвания и разработки
Обобщение и следващи стъпки
Изисквания
- Основно разбиране на Machine Learning
Публика
- Учени по данни
- Софтуерни инженери
21 Часа