[Питер] Глубокое обучение с подкреплением. AlphaGo и другие технологии (Лапан Максим)

Groot · 22 сен 2020

Эта книга ─ подробное руководство по новейшим инструментам DL и их ограничениям. Вы оцените на практике такие методы, как кросс-энтропия и градиенты по стратегиям, а затем научитесь применять их. Поупражняетесь и с коллекцией виртуальных игр от Atari, и с современными фаворитами, например Connect4. Максим Лапан подготовил прекрасное введение в тему RL, чтобы вы научились программировать интеллектуальные самообучающиеся агенты, способные решать колоссальное множество прикладных задач.
Начните внедрять Q-обучение в средах класса grid world, обучите вашего агента торговать на бирже, узнайте, как модели обработки естественного языка привели к взрывному распространению чат-ботов.

В этой книге
• Вы узнаете, какое место в контексте DL занимают методы RL, реализуете сложные модели глубокого обучения
• Освоите базовый уровень RL: марковские процессы принятия решений
• Оцените различные методы RL, в частности кросс-энтропию, DQN, модель актора-критика, TRPO, PPO, DDPG, D4PG и др.
• Узнаете, как работать с дискретными и непрерывными пространствами действий в различных средах
• Научитесь побеждать в аркадных играх Atari, используя обучение с подкреплением
• Создадите собственную среду по модели OpenAI Gym для обучения биржевого агента
• Научите вашего агента играть в Connect4, воспользовавшись методом AlphaGo Zero
• Познакомитесь с новейшими исследованиями в области глубокого обучения, касающимися разработки чат-ботов

Сайт:

Скрытый текст. Доступен только зарегистрированным пользователям.
Нажмите, чтобы раскрыть...

[Питер] Глубокое обучение с подкреплением. AlphaGo и другие технологии (Лапан Максим)

Другие складчины раздела

[Аудиокнига] Жесткий тайм-менеджмент. Возьмите свою жизнь под контроль (Дэн Кеннеди)

Путеводитель по космосу. Потрясающе весёлый гид по Вселенной [Clever]

[shop-rehau] Оконная камасутра (Анастасия Бычкова)

Эйдетическая азбука. С элементами арттерапии (Анастасия Невзорова)

Самоучитель CorelDraw X8 (Нина Комолова, Елена Яковлева)

Глубокое обучение с подкреплением на Python. OpenAI Gym и TensorFlow для профи(Судхарсан Равичанди)

Глубокое обучение (Гудфеллоу)

[МИФ] Основы глубокого обучения (Нихиль Будума, Николас Локашо)

Глубокое обучение на Python (Франсуа Шолле)

Библиотека Keras — инструмент глубокого обучения (Антонио Джулли)

Введение в глубокое обучение (Евгений Черняк)