こんにちは!データサイエンスグループの山本です( @__Y4M4MOTO__ )です。
先日、 TROCCO のユーザ会「 #TROCCOUG 」にて、「データカタログの最初の一歩 〜データ組織向けに dbt docs を整備している話〜」というタイトルで発表させていただきました。
この記事では、そのときの発表資料を公開しています。
発表資料
発表概要
弊社のデータサイエンスグループ内向けに dbt docs を整備している話です。
これまで社内にデータサイエンティストは1人しかいませんでしたが、2023年に3人に増え、グループ体制が始動しました。グループ体制になって困ったのが「データカタログが無かった」ことです。
また、同じく2023年に分析用データ基盤の dbt 移行がスタートしました。そこで、 dbt docs にデータに関する情報を集約し、データカタログの無い状態を脱することにしました。
本発表では、そのために取り組んだことやその結果などについて記しています。
感想
今回の TROCCOUG は「メタデータ・データカタログ」がテーマで、私の他にもいくつか発表がありました(当日の様子は X で #TROCCOUG というハッシュタグで検索すると確認できます)。
どの発表も社内のデータ利用者(セールス等)向けのデータカタログをどう用意するか?(「どんなものが用意できれば良いのか?」「どう運用していくか?」等)でかなり悩まれていて、データカタログというものの需要の高さととそれに応える難しさを改めて痛感しました…。
結び
この記事では TROCCUG での登壇資料を掲載しました。TROCCOUG は来月も開催されるとのことでしたので、気になった方はぜひ参加されてみてください!(→connpass)
ここまでお読みいただきありがとうございました!