強化学習入門

このロードマップの全体像

対象読者

教師あり学習は触ったが、強化学習には未着手の機械学習エンジニア
報酬・方策・価値関数の用語で会話できるようになりたい研究開発者
ロボティクスやゲーム AI、制御系への応用を視野に入れているエンジニア

5 冊で到達する状態

マルコフ決定過程・ベルマン方程式・TD 学習を自分の言葉で説明できる
Q 学習と方策勾配、価値ベースと方策ベースの違いを実装レベルで区別できる
DQN / A2C / Actor-Critic など代表的な深層強化学習アルゴリズムのコードを読み解ける
Sutton & Barto の用語体系で最新論文の abstract を追える下地が整う
シミュレーション環境を自作し、報酬設計とハイパーパラメータを調整できる

進め方のヒント

1 冊目で全体像と語彙を掴み、2 冊目で Python 実装に手を動かしてから理論書に戻る
3 冊目で深層強化学習を写経し、NN を通した勾配の流れを体で覚える
4 冊目の Sutton & Barto は通読より辞書的に参照する使い方が現実的
5 冊目で現場応用の設計パターンと運用上の落とし穴を確認する

この道で読む 5 冊（購入）

読む順に並べています。まずは1冊目から始めましょう。

まず読む1冊

「強化学習」を学びたい人が最初に読む本

強化学習の目的と基本アルゴリズムを図解中心で俯瞰する入口。ここで報酬・方策・価値関数の語彙を揃え、以降の学習路を描く。

楽天ブックス → Amazon 紙版 → Kindle → 紀伊國屋書店 → honto →

Amazonアソシエイトおよび楽天アフィリエイト等の広告リンクを含みます。Amazonのアソシエイトとして tech-book.net は適格販売により収入を得ています。詳細

続けて読む

2
Python 実装で基礎アルゴリズムを手に馴染ませる機械学習スタートアップシリーズ　Pythonで学ぶ強化学習　［改訂第2版］　入門から実践まで

楽天ブックス → Amazon 紙版 → Kindle → 紀伊國屋書店 → honto →
Amazonアソシエイトおよび楽天アフィリエイト等の広告リンクを含みます。Amazonのアソシエイトとして tech-book.net は適格販売により収入を得ています。詳細
3
外部ライブラリなしで深層強化学習を自作ゼロから作る Deep Learning ❹ : 強化学習編

楽天ブックス → Amazon 紙版 → 紀伊國屋書店 → honto →
Amazonアソシエイトおよび楽天アフィリエイト等の広告リンクを含みます。Amazonのアソシエイトとして tech-book.net は適格販売により収入を得ています。詳細
4
Sutton & Barto による体系の決定版強化学習(第2版)

楽天ブックス → Amazon 紙版 → 紀伊國屋書店 → honto →
Amazonアソシエイトおよび楽天アフィリエイト等の広告リンクを含みます。Amazonのアソシエイトとして tech-book.net は適格販売により収入を得ています。詳細
5
現場適用を見据えた深層強化学習の設計指針現場で使える！Python深層強化学習入門強化学習と深層学習による探索と制御

楽天ブックス → Amazon 紙版 → Kindle → 紀伊國屋書店 → honto →
Amazonアソシエイトおよび楽天アフィリエイト等の広告リンクを含みます。Amazonのアソシエイトとして tech-book.net は適格販売により収入を得ています。詳細

対象読者

5 冊で到達する状態

進め方のヒント

5 つのステップで読み進める

最初の 1 冊として選ぶ全体像ガイド

最初の 1 冊として選ぶ全体像ガイド

Python 実装で基礎アルゴリズムを手に馴染ませる

外部ライブラリなしで深層強化学習を自作

Sutton & Barto による体系の決定版

現場適用を見据えた深層強化学習の設計指針

この道で読む 5 冊（購入）

続けて読む

強化学習入門

対象読者

5 冊で到達する状態

進め方のヒント

最初の 1 冊として選ぶ全体像ガイド

最初の 1 冊として選ぶ全体像ガイド

Python 実装で基礎アルゴリズムを手に馴染ませる

外部ライブラリなしで深層強化学習を自作

Sutton & Barto による体系の決定版

現場適用を見据えた深層強化学習の設計指針

この道で読む 5 冊（購入）

続けて読む

次に読むロードマップ

深層学習入門

実践 NLP(自然言語処理)

Transformer と BERT を理解する

pandas / NumPy 完全活用

アルゴリズムとデータ構造

データ可視化のすすめ