План на курса

Въведение в Reinforcement Learning

  • Какво е обучение с подсилване?
  • Ключови понятия: агент, среда, състояния, действия и награди
  • Предизвикателства при обучението за засилване

Проучване и експлоатация

  • Балансиране на проучване и експлоатация в RL модели
  • Стратегии за проучване: epsilon-greedy, softmax и други

Q-обучение и дълбоки Q-мрежи (DQNs)

  • Въведение в Q-обучението
  • Внедряване на DQN с помощта на TensorFlow
  • Оптимизиране на Q-обучението с повторение на опита и целеви мрежи

Методи, базирани на политики

  • Политически градиентни алгоритми
  • REINFORCE алгоритъм и неговата реализация
  • Актьорско-критични методи

Работа с OpenAI Фитнес зала

  • Създаване на среда в OpenAI Фитнес зала
  • Симулиращи агенти в динамични среди
  • Оценяване на работата на агента

Напреднали Reinforcement Learning техники

  • Мултиагентно подсилващо обучение
  • Дълбок детерминистичен градиент на политиката (DDPG)
  • Оптимизация на проксималната политика (PPO)

Внедряване на Reinforcement Learning модели

  • Реални приложения на учене с подсилване
  • Интегриране на RL модели в производствени среди

Обобщение и следващи стъпки

Изисквания

  • Опит с Python програмиране
  • Основно разбиране на концепциите за дълбоко обучение и машинно обучение
  • Познаване на алгоритми и математически концепции, използвани в обучението за засилване

Публика

  • Учени по данни
  • Практици машинно обучение
  • Изследователи на AI
 28 Часа

Брой участници


Цена за участник

Oтзиви от потребители (4)

Предстоящи Курсове

Свързани Kатегории