Завершено

[Питер] Глубокое обучение с подкреплением. AlphaGo и другие технологии (Лапан Максим)

Тема в разделе "Книги", создана пользователем Groot, 22 сен 2020.

Тема найдена по тегам:
Цена:
1393р.
Взнос:
102р.

Список участников складчины:

1. Groot 2. МИУ
Тип: Стандартная складчина
  1. 22 сен 2020
    #1
    Groot
    Groot Организатор
    [Питер] Глубокое обучение с подкреплением. AlphaGo и другие технологии (Лапан Максим)
    [​IMG]

    Эта книга ─ подробное руководство по новейшим инструментам DL и их ограничениям. Вы оцените на практике такие методы, как кросс-энтропия и градиенты по стратегиям, а затем научитесь применять их. Поупражняетесь и с коллекцией виртуальных игр от Atari, и с современными фаворитами, например Connect4. Максим Лапан подготовил прекрасное введение в тему RL, чтобы вы научились программировать интеллектуальные самообучающиеся агенты, способные решать колоссальное множество прикладных задач.
    Начните внедрять Q-обучение в средах класса grid world, обучите вашего агента торговать на бирже, узнайте, как модели обработки естественного языка привели к взрывному распространению чат-ботов.

    В этой книге
    • Вы узнаете, какое место в контексте DL занимают методы RL, реализуете сложные модели глубокого обучения
    • Освоите базовый уровень RL: марковские процессы принятия решений
    • Оцените различные методы RL, в частности кросс-энтропию, DQN, модель актора-критика, TRPO, PPO, DDPG, D4PG и др.
    • Узнаете, как работать с дискретными и непрерывными пространствами действий в различных средах
    • Научитесь побеждать в аркадных играх Atari, используя обучение с подкреплением
    • Создадите собственную среду по модели OpenAI Gym для обучения биржевого агента
    • Научите вашего агента играть в Connect4, воспользовавшись методом AlphaGo Zero
    • Познакомитесь с новейшими исследованиями в области глубокого обучения, касающимися разработки чат-ботов

    Сайт:
     
    22 сен 2020