ISBN 9784798159928
現場で使える!Python深層強化学習入門 強化学習と深層学習による探索と制御
注目の最新AI技術!深層強化学習の開発手法がわかる! 第一線で活躍する著者陣の書下ろしによる待望の1冊! 【本書の目的】 AlphaGo(アルファ碁)でも利用されている深層強化学習。 AIサービスのみならずロボティクス分野でもその応用が期待されています。 本書は、AI開発に携わる第一線の著者陣が深層強化学習の開発手法について書き下ろした注目の1冊です。 【本書の特徴】 第1部では、まず、深層強化学習の概要について説明します。 次いで、強化学習の基礎(Q学習、方策勾配法、Actor-Critic法)と深層学習の基礎(CNN、RNN、LSTM)を解説します。 さらに、簡単な例題として倒立振子制御を取り上げ、DQNとActor-Critic法による実装例を紹介します。 第2部では、具体的な応用例として3つのアプローチを実装込みで解説します。 1つ目は、連続動作制御です。ヒューマノイドシミュレータの2足歩行制御を試みます。 2つ目は、パズル問題の解法です。巡回セールスマン問題(TSP)やルービックキューブの解探索について説明します。 3つ目は、系列データ生成です。文書生成(SeqGAN)やニューラルネットワークのアーキテクチャ探索(ENAS)を解説します。 全体を通して、行動の制御を担うエージェントのモデル化と、方策ベースの強化学習によるエージェントの学習法について学ぶことができます。 【読者が得られること】 深層強化学習による開発手法を学ぶことができます。 【対象読者】 深層強化学習を学びたい理工学生・エンジニア ■Part 1 基礎編 CHAPTER 1 強化学習の有用性 1.1 機械学習の分類 1.2 強化学習でできること 1.3 深層強化学習とは CHAPTER 2 強化学習のアルゴリズム 2.1 強化学習の基本概念 2.2 マルコフ決定過程とベルマン方程式 2.3 ベルマン方程式の解法 2.4 モデルフリーな制御 CHAPTER 3 深層学習による特徴抽出 3.1 深層学習 3.2 畳み込みニューラルネットワーク(CNN) 3.3 再帰型ニューラルネットワーク(RNN) CHAPTER 4 深層強化学習の実装 4.1 深層強化学習の発展 4.2 行動価値関数のネットワーク表現 4.3 方策関数のネットワーク表現 ■Part 2 応用編 CHAPTER 5 連続制御問題への応用 5.1 方策勾配法による連続制御 5.2 学習アルゴリズムと方策モデル 5.3 連続動作シミュレータ 5.4 アルゴリズムの実装 5.5 学習結果と予測制御 CHAPTER 6 組合せ最適化への応用 6.1 組合せ最適化への応用について 6.2 巡回セールスマン問題 6.3 ルービックキューブ問題 6.4 まとめ CHAPTER 7 系列データ生成への応用 7.1 SeqGANによる文章生成 7.2 ネットワークアーキテクチャの探索 APPENDIX 開発環境の構築 AP1 ColaboratoryによるGPUの環境構築 AP2 DockerによるWindowsでの環境構築
この本がどの学習段階で役立つかは、 関連する ロードマップ から確認できます。