学習ロードマップ
Python 基礎から pandas / NumPy を用いた前処理・分析・機械学習まで、実データで扱える水準に 5 冊で到達する。
このロードマップが扱うもの
- Python は触ったことがあるが、pandas / NumPy のコードを前にすると手が止まる初中級者 - Excel や SQL での集計は日常的に行うが、コードベースのデータ処理に踏み出したいアナリスト - 機械学習の前段である特徴量エンジニアリングやデータ整備を自走できるようにしたい実務者
このロードマップの全体像
ロードマップ
第 1 章
pandas / NumPy に入る前に、文法・型・関数・クラスの語彙をここで揃える。以降の冊で詰まった時に戻る基点として置く。
MBA 教材の題材で Python とデータ分析を接続する。Excel 的発想から DataFrame 的発想へ切り替える助走区間として機能する。
金融時系列を題材に NumPy 配列操作と pandas の本格活用を縦通しで学ぶ。ロードマップの中核として前処理の引き出しを増やす。
欠損値補完・特徴量生成・モデル構築の工程を演習形式で反復する。pandas / NumPy の手を動かす量をここで一気に稼ぐ。
特徴量エンジニアリングと機械学習の基礎を scikit-learn で体系化する。pandas / NumPy から ML ワークフローへ進む到達点として置く。