データエンジニアリング入門

このロードマップの全体像

対象読者

SQL と Python は書けるが、データ基盤の全体像が見えていないアナリスト / ソフトウェアエンジニア
分析クエリは叩けるものの、収集・蓄積・加工の裏側を体系立てて説明できない実務者
既存の ETL 運用に疲弊し、モダンなデータスタックや Lakehouse へ舵を切りたいチームリード

5 冊で到達する状態

収集・蓄積・加工・提供というデータライフサイクルを自分の言葉で設計できる
バッチ / ストリーミング / OLAP の役割分担を理解し、ワークロードに応じて技術選定できる
ディメンショナルモデリングに基づき、分析に耐えるテーブル設計をレビューできる
S3 + Iceberg + 分散クエリエンジンによるレイクハウス構成の読み書きができる
SLA・データ品質・コストを意識したパイプライン運用ポリシーを言語化できる

進め方のヒント

1 冊目で全体像を掴んでから 2 冊目の原理書に入ると、用語の迷子になりにくい
3 冊目の実装ネタは、手元の小さな CSV やセンサデータで写経し肌感を作る
4 冊目のモデリングは、自社の既存テーブルを題材に「なぜこの粒度か」を書き出す訓練が効く
5 冊目は S3 互換ストレージ + Spark もしくは Trino で最小構成を動かしながら読む

この道で読む 4 冊（購入）

読む順に並べています。まずは1冊目から始めましょう。

まず読む1冊

［増補改訂］ビッグデータを支える技術 --ラップトップ1台で学ぶデータ基盤のしくみ

収集・蓄積・加工・可視化までデータ基盤の構成要素を手を動かしながら掴む 1 冊目。用語と技術マップをここで揃えロードマップの下敷きにする。

楽天ブックス → Amazon 紙版 → Kindle → 紀伊國屋書店 → honto →

Amazonアソシエイトおよび楽天アフィリエイト等の広告リンクを含みます。Amazonのアソシエイトとして tech-book.net は適格販売により収入を得ています。詳細

続けて読む

対象読者

5 冊で到達する状態

進め方のヒント

4 つのステップで読み進める

データ基盤の全体像を俯瞰する定番入門

データ基盤の全体像を俯瞰する定番入門

ライフサイクル起点の原理原則書

分析に耐える DWH テーブル設計術

Iceberg で挑むレイクハウス運用

この道で読む 4 冊（購入）

続けて読む

データエンジニアリング入門

対象読者

5 冊で到達する状態

進め方のヒント

データ基盤の全体像を俯瞰する定番入門

データ基盤の全体像を俯瞰する定番入門

ライフサイクル起点の原理原則書

分析に耐える DWH テーブル設計術

Iceberg で挑むレイクハウス運用

この道で読む 4 冊（購入）

続けて読む

次に読むロードマップ

論理思考と問題解決 ロードマップ

ビジネスプレゼン・資料作成 ロードマップ

行動経済学・実用心理学 ロードマップ

コミュニケーション・対人スキル ロードマップ

起業・スタートアップ ロードマップ

データドリブン・マーケティング ロードマップ

論理思考と問題解決ロードマップ

ビジネスプレゼン・資料作成ロードマップ

行動経済学・実用心理学ロードマップ

コミュニケーション・対人スキルロードマップ

起業・スタートアップロードマップ

データドリブン・マーケティングロードマップ