Transformer と BERT を理解する

このロードマップの全体像

対象読者

Python と行列計算の基礎があり、ニューラルネットを「なんとなく」使っている実務者
Attention や Transformer の論文・解説を読んでも、図と数式が結びつかないエンジニア
BERT / GPT 系を fine-tune するだけでなく、内部構造と学習プロセスを説明できるようになりたい人

5 冊で到達する状態

順伝播・逆伝播・最適化を数式とコードの両面で追える
word2vec / RNN / LSTM / Seq2Seq / Attention の系譜を一本の線でつなげて語れる
PyTorch で学習ループ・損失・デバイスを自力で書き、Hugging Face 的な抽象の内側を理解できる
Self-Attention、Multi-Head、Positional Encoding、LayerNorm など Transformer 構成要素を役割ベースで説明できる
BERT の MLM / NSP、GPT の自己回帰、prompt / fine-tune / LoRA など LLM 時代の選択肢を俯瞰できる

進め方のヒント

1 冊目で NumPy ベースにスクラッチ実装し、誤差逆伝播まで手を動かしてから 2 冊目へ進む
2 冊目の Attention 章は論文 "Attention Is All You Need" と並走すると理解が一段深まる
3 冊目以降は必ずコードを手元で動かし、テンソル形状を print しながらモデル構造を追う
5 冊目は最新の LLM 動向が濃いため、1〜4 冊目の基礎が固まってから読むと情報の密度に耐えやすい

この道で読む 5 冊（購入）

読む順に並べています。まずは1冊目から始めましょう。

まず読む1冊

ゼロから作るDeep Learning : Pythonで学ぶディープラーニングの理論と実装

順伝播・逆伝播・勾配降下を外部ライブラリなしで書き切る入り口。Transformer 以前の NN の骨格をコードで腹落ちさせるための起点。

楽天ブックス → Amazon 紙版 → 紀伊國屋書店 → honto →

Amazonアソシエイトおよび楽天アフィリエイト等の広告リンクを含みます。Amazonのアソシエイトとして tech-book.net は適格販売により収入を得ています。詳細

続けて読む

2
word2vec から Attention まで一気通貫ゼロから作るDeep Learning 2 : 自然言語処理編

楽天ブックス → Amazon 紙版 → 紀伊國屋書店 → honto →
Amazonアソシエイトおよび楽天アフィリエイト等の広告リンクを含みます。Amazonのアソシエイトとして tech-book.net は適格販売により収入を得ています。詳細
3
Transformer/BERT を実装で習得機械学習エンジニアのためのTransformers : 最先端の自然言語処理ライブラリによるモデル開発

楽天ブックス → Amazon 紙版 → 紀伊國屋書店 → honto →
Amazonアソシエイトおよび楽天アフィリエイト等の広告リンクを含みます。Amazonのアソシエイトとして tech-book.net は適格販売により収入を得ています。詳細
4
ニューラルネット内部の謎に踏み込むディープラーニングを支える技術〈2〉 --ニューラルネットワーク最大の謎

楽天ブックス → Amazon 紙版 → Kindle → 紀伊國屋書店 → honto →
Amazonアソシエイトおよび楽天アフィリエイト等の広告リンクを含みます。Amazonのアソシエイトとして tech-book.net は適格販売により収入を得ています。詳細
5
Transformer と LLM の到達点を掴む Pythonによるディープラーニングと生成AI・LLM

楽天ブックス → Amazon 紙版 → Kindle → 紀伊國屋書店 → honto →
Amazonアソシエイトおよび楽天アフィリエイト等の広告リンクを含みます。Amazonのアソシエイトとして tech-book.net は適格販売により収入を得ています。詳細

対象読者

5 冊で到達する状態

進め方のヒント

5 つのステップで読み進める

スクラッチ実装で NN の土台を作る

スクラッチ実装で NN の土台を作る

word2vec から Attention まで一気通貫

3. Transformer/BERT を実装で習得

ニューラルネット内部の謎に踏み込む

Transformer と LLM の到達点を掴む

この道で読む 5 冊（購入）

続けて読む

Transformer と BERT を理解する

対象読者

5 冊で到達する状態

進め方のヒント

スクラッチ実装で NN の土台を作る

スクラッチ実装で NN の土台を作る

word2vec から Attention まで一気通貫

3. Transformer/BERT を実装で習得

ニューラルネット内部の謎に踏み込む

Transformer と LLM の到達点を掴む

この道で読む 5 冊（購入）

続けて読む

次に読むロードマップ

深層学習入門

Django で Web アプリ開発

FastAPI で高速 API 開発

実践 NLP(自然言語処理)

Python 基礎から実務まで

強化学習入門