Webサーバーのアクセスログ、アプリの操作ログ、CMSの更新ログなどを生データのままBigQueryなどのDWHに蓄積し、SQLで自由に分析できる環境を構築する施策です。Googleアナリティクスでは分からない詳細な分析や、機械学習のデータソースとして活用します。メリットは、データ分析の自由度向上と、長期的なデータ資産化です。
職種 |
情報システム | 施策難易度 |
★☆☆☆☆ |
|---|---|---|---|
業界① |
広告・出版 | 目的 |
データ活用 |
業界② |
メディア・Webメディア | 対象 |
データエンジニア データサイエンティスト 経営層 |
費用 |
100〜1000万円 | 90 |
主なToDo
- Fluentd等を使ってログを自動転送するパイプラインを作る
- 個人情報をマスク(秘匿化)して保存する
- RedashやTableauなどのBIツールから参照できるようにする
期待できる効果
サンプリングされていない全量データで分析ができる。将来的にAI活用する際の教師データとして使える。
躓くところ
データ量が膨大になり、保管コストとクエリコストがかさむ。SQLを書ける人がいないと宝の持ち腐れになる。

ログ収集・分析基盤(BigQuery等)【メディア・Webメディア】






