パイプラインの依存関係・実行順序・障害対応を体験する
ECサイト 日次パイプライン
受注・ユーザー・商品データを毎日集計するDAG
Wave 1 を特定してください
このDAGで 最初に並列実行されるタスクグループ を全て選んでください
extract_orders
注文DBからデータ抽出
extract_users
ユーザーDBから抽出
extract_products
商品DBから抽出
stg_orders
型変換・クレンジング
stg_users
stg_products
fct_orders
3テーブルをJOINして集計
mart_daily_revenue
売上KPIをマートへ出力
mart_user_cohort
コホートをマートへ出力
notify_slack
Slackに完了通知
STEP 1 — 依存関係を確認しよう
まず「Wave 1」を特定してみよう!依存関係のないタスクが最初に並列実行されるよ。
💡 upstreams が空のタスク = 最初に動けるタスクだよ