学習ロードマップ

Transformer と BERT を理解する

NN 基礎から word2vec・RNN・Attention を経て Transformer / BERT / GPT の構造と学習を読み解けるまでを 5 冊で構築する。

ゼロから作るDeep Learning : Pythonで学ぶディープラーニングの理論と実装 ゼロから作るDeep Learning 2 : 自然言語処理編 PyTorch実践入門 : ディープラーニングの基礎から実装へ ディープラーニングを支える技術〈2〉 --ニューラルネットワーク最大の謎 Pythonによるディープラーニングと生成AI・LLM
SCROLL TO BEGIN

このロードマップが扱うもの

- Python 使 - Attention Transformer - BERT / GPT fine-tune

このロードマップの全体像

対象読者

  • Python と行列計算の基礎があり、ニューラルネットを「なんとなく」使っている実務者
  • Attention や Transformer の論文・解説を読んでも、図と数式が結びつかないエンジニア
  • BERT / GPT 系を fine-tune するだけでなく、内部構造と学習プロセスを説明できるようになりたい人

5 冊で到達する状態

  • 順伝播・逆伝播・最適化を数式とコードの両面で追える
  • word2vec / RNN / LSTM / Seq2Seq / Attention の系譜を一本の線でつなげて語れる
  • PyTorch で学習ループ・損失・デバイスを自力で書き、Hugging Face 的な抽象の内側を理解できる
  • Self-Attention、Multi-Head、Positional Encoding、LayerNorm など Transformer 構成要素を役割ベースで説明できる
  • BERT の MLM / NSP、GPT の自己回帰、prompt / fine-tune / LoRA など LLM 時代の選択肢を俯瞰できる

進め方のヒント

  • 1 冊目で NumPy ベースにスクラッチ実装し、誤差逆伝播まで手を動かしてから 2 冊目へ進む
  • 2 冊目の Attention 章は論文 "Attention Is All You Need" と並走すると理解が一段深まる
  • 3 冊目以降は必ずコードを手元で動かし、テンソル形状を print しながらモデル構造を追う
  • 5 冊目は最新の LLM 動向が濃いため、1〜4 冊目の基礎が固まってから読むと情報の密度に耐えやすい

ロードマップ

5 つのステップで読み進める

  1. 01
    ステップ 01 スクラッチ実装で NN の土台を作る
    ゼロから作るDeep Learning : Pythonで学ぶディープラーニングの理論と実装
  2. 02
    ステップ 02 word2vec から Attention まで一気通貫
    ゼロから作るDeep Learning 2 : 自然言語処理編
  3. 03
    ステップ 03 PyTorch で学習ループを書ききる
    PyTorch実践入門 : ディープラーニングの基礎から実装へ
  4. 04
    ステップ 04 ニューラルネット内部の謎に踏み込む
    ディープラーニングを支える技術〈2〉 --ニューラルネットワーク最大の謎
  5. 05
    ステップ 05 Transformer と LLM の到達点を掴む
    Pythonによるディープラーニングと生成AI・LLM

第 1 章

スクラッチ実装で NN の土台を作る

  1. スクラッチ実装で NN の土台を作る

    順伝播・逆伝播・勾配降下を外部ライブラリなしで書き切る入り口。Transformer 以前の NN の骨格をコードで腹落ちさせるための起点。

    ゼロから作るDeep Learning : Pythonで学ぶディープラーニングの理論と実装
    この章の 1 冊 ゼロから作るDeep Learning : Pythonで学ぶディープラーニングの理論と実装

    Python でゼロから実装しながらディープラーニングの原理を体得する

    この本で身につくこと
    • 誤差逆伝播法を計算グラフで可視化し、NumPy だけで実装して勾配の流れをステップごとに追える
    • 畳み込みニューラルネットワーク(CNN)の im2col 変換を含む仕組みをゼロから実装できる
    • Batch Normalization・Dropout・Adam を『なぜ効くのか』の理解と実装をセットで習得できる
    • ハイパーパラメータ(学習率・重み初期値)の選択が学習曲線に与える影響を実験ベースで確認できる

    読み終えると Before(読む前): フレームワークのチュートリアルをこなせても、バックプロパゲーションや Conv の内部動作を人に説明できず、ハイパーパラメータ調整の根拠を言語化できなかった After(読み終えた後): ニューラルネットワークの順伝播・逆伝播をゼロから実装でき、Batch Normalization や学習率の選択が学習結果に与える影響を計算レベルで説明できる

    想定読者: Python の基礎構文を身につけており、ディープラーニングの仕組みをフレームワークに頼らず実装レベルで理解したい入門者・学習者。機械学習エンジニアへの転向を目指す社会人にも適合する

    前提知識: Python の基礎構文(クラス・リスト内包表記・ファイル I/O) / NumPy の配列操作の基礎(スライシング・ブロードキャスト・行列積) / 高校数学レベルの微分(合成関数の微分・偏微分の概念)

    本の詳細を見る →
  2. word2vec から Attention まで一気通貫

    自然言語処理編として word2vec / RNN / LSTM / Seq2Seq / Attention を実装で繋ぐ。Transformer 到達前の NLP 系譜をここで一本化する。

    ゼロから作るDeep Learning 2 : 自然言語処理編
    この章の 1 冊 ゼロから作るDeep Learning 2 : 自然言語処理編

    自然言語処理のニューラルネットをゼロ実装で体得する

    この本で身につくこと
    • CBOW・スキップグラムの学習アルゴリズムをNumPyで一から実装できる
    • 勾配消失の観点からLSTMのゲート構造の必要性を理論と実装の両面で説明できる
    • GRUがLSTMを簡略化した設計であることを実装差分から確認できる
    • seq2seqモデルを構築し、文章翻訳・会話応答タスクに適用する流れを把握できる

    想定読者: 前作(ゼロから作るDeep Learning)を読み終え、NLP・時系列処理の仕組みを実装レベルで理解したい学習者

    前提知識: 『ゼロから作るDeep Learning』(1巻)を通読し、バックプロパゲーションの実装まで完了していること / NumPyの基本的な行列演算(dot・reshape・sum・transpose)の操作感 / 高校数学レベルの微分と合成関数の連鎖律の概念理解

    本の詳細を見る →
  3. PyTorch で学習ループを書ききる

    テンソル操作・自動微分・学習ループ・デプロイまでを PyTorch で体得する実装書。以降の論文実装・BERT 写経の足腰として据える。

    PyTorch実践入門 : ディープラーニングの基礎から実装へ
    この章の 1 冊 PyTorch実践入門 : ディープラーニングの基礎から実装へ

    PyTorchを使ったディープラーニング実装を基礎から本番デプロイまで習得する

    この本で身につくこと
    • PyTorchのテンソル操作とautogradの仕組みを実装レベルで理解する
    • 畳み込みニューラルネットワーク(CNN)を用いた画像分類モデルを一から構築できる
    • 医療CT画像を実データとしたエンドツーエンドのAIプロジェクトを完遂できる
    • セグメンテーションと分類を組み合わせた多段パイプラインを設計できる

    想定読者: Pythonの基礎があり、ディープラーニングを実務レベルで実装したいエンジニアおよびデータサイエンティスト

    前提知識: PythonとNumPy配列操作の基礎(スライシング・ブロードキャスト・型変換) / 機械学習の基本概念(訓練・検証・テスト分割、損失関数、最適化の大まかな流れ) / 高校数学レベルの微分(連鎖律)と行列計算の概念的理解

    本の詳細を見る →
  4. ニューラルネット内部の謎に踏み込む

    正則化・最適化・汎化など「なぜ学習が進むか」を掘り下げる応用書。Transformer の設計判断を読み解く理論視点をここで獲得する。

    ディープラーニングを支える技術〈2〉 --ニューラルネットワーク最大の謎
    この章の 1 冊 ディープラーニングを支える技術〈2〉 --ニューラルネットワーク最大の謎

    ニューラルネットワークの学習原理・生成モデル・深層強化学習を体系的に理解する

    この本で身につくこと
    • ニューラルネットワークが学習できる理由を最適化の観点(損失曲面・学習率の役割)から説明できる
    • 汎化とはどういう現象かを、過学習・正則化・データ量の関係で論理的に整理できる
    • VAE・GAN・正規化フロー・拡散モデルの各生成モデルの原理と位置付けを比較して説明できる
    • 深層強化学習(方策勾配法・価値推定・DQN・AlphaGo 系)の全体像を把握できる

    想定読者: 前作でディープラーニングの基礎を習得し、なぜ学習できるのか・なぜ汎化するのかという原理的な問いに踏み込みたい読者。機械学習の実装経験があり、理論的裏付けを固めたいエンジニア・研究者。

    本の詳細を見る →
  5. Transformer と LLM の到達点を掴む

    Transformer / 生成 AI / LLM を Keras 3・PyTorch・JAX 横断で解説する応用書。BERT・GPT 系の構造と学習を実装レベルで締めくくる。

    Pythonによるディープラーニングと生成AI・LLM
    この章の 1 冊 Pythonによるディープラーニングと生成AI・LLM

    Keras開発者が基礎から生成AI・LLMの実装を段階的に習得させる

    この本で身につくこと
    • ConvNetアーキテクチャ(画像分類・セグメンテーション・物体検出)をKeras 3で段階的に構築できる
    • TransformerとGPTライクなLLMの内部構造を理解し、実装レベルで説明できる
    • 拡散モデルを用いた画像生成の仕組みをコードと対応させて解説できる
    • Keras 3のマルチバックエンド(TensorFlow/PyTorch/JAX)を目的に応じて選択・切り替えできる

    想定読者: Pythonの基礎を持ち、ディープラーニングの原理から生成AI・LLM実装まで体系的に学びたいエンジニアや研究者

    前提知識: PythonとNumPyによる多次元配列操作の基礎経験 / 微積分(偏微分・連鎖律)と線形代数(行列演算)の基礎概念 / 機械学習の基本概念(訓練・検証・テスト分割、過学習の意味)があれば5〜6章の吸収が速い

    本の詳細を見る →