学習ロードマップ
ETL / パイプライン / DWH / レイクハウスまで、データ基盤の全体像と実装勘所を 5 冊で押さえる。
このロードマップが扱うもの
- SQL と Python は書けるが、データ基盤の全体像が見えていないアナリスト / ソフトウェアエンジニア - 分析クエリは叩けるものの、収集・蓄積・加工の裏側を体系立てて説明できない実務者 - 既存の ETL 運用に疲弊し、モダンなデータスタックや Lakehouse へ舵を切りたいチームリード
このロードマップの全体像
ロードマップ
第 1 章
収集・蓄積・加工・可視化までデータ基盤の構成要素を手を動かしながら掴む 1 冊目。用語と技術マップをここで揃えロードマップの下敷きにする。
生成から提供までのデータエンジニアリングライフサイクルを体系化した教科書。1 冊目の部品知識を設計原則として再編し判断軸に変える。
高速化・通信・センサ連携など現場のパイプライン実装を Python で触る応用編。設計論を具体コードに落とし込むフェーズに据える。
ディメンショナルモデリングをアジャイルに運用する実践書。事実表と次元表の設計基準を獲得しデータ利活用の共通言語を組織に広げる。
Apache Iceberg を軸にデータレイクと DWH を統合するオープンテーブル戦略を学ぶ到達点。スキーマ進化と分散クエリ運用まで踏み込む。