(2014年総集編6)Tableau Serverを始めとしたResult Outputの多様性によって,さまざまなシステムとの連携が容易に
本記事は移転しました。新サイトにリダイレクトします。
はじめに
トレジャーデータはクラウドでデータマネージメントサービスを提供しています。
Treasure Data Service(トレジャーデータサービス)上で集計された結果は,CSV出力はもちろんのこと,さまざまなシステムへ書き出すことが可能です。2014年,この「Result Output」の種類が増え,多くのシステムとの連携を可能にしました。ここではその連携のいくつかを紹介します。
1. Tableau Server
2014年の大きなニュースの1つとして,Tableau Serverへの Result Output が実現したことがあげられます。なぜこれが重要かというと,Tableau での定型レポーティング業務が完全に自動化されるからです。一度レポートのテンプレートを作成してしまえば,分析者はTableau Serverから常に最新のレポートを参照できるようになります。
定型レポーティングの悩みとトレジャーのアプローチ:
・毎回定型のレポートを作るのに単調な作業が多い
・目的のレポートを確認するのに多くの画面遷移が必要
- (アプローチ)おのおのの画面のダッシュボードをTableauで1つにまとめる。
Tableau ではダッシュボードにテーブルやチャートを自由に切り貼りできます。
・顧客のニーズを満たすカスタマイズ,カテゴライズが必要
- (アプローチ)特定のイベントやID,複数条件の組み合わせによる結果表示をインタラクティブに行える。
いくつかのカラムの特定の組み合わせによる抽出が容易に行えます。
・時には複数のデータテーブルをダウンロードし,Excel で再集計が必要
- (アプローチ)複数のデータソースの統合・集計処理をTreasure Data ServiceとTableau Server で実現。
Treasure Data Service上で複数のDB,Tableに対して UNION, JOIN → Treasure Data Serviceで集計 → Tableau Server へ書き出し。
・Web UI からの操作ではかゆいところに手が届かない
- (アプローチ)「生」データを保持しているので,あらゆるところに手が届く。
2. Data Mart
リコメンデーションやクラスタリングなど,Treasure Data Serviceで集計した結果をサービスに反映させたい場合には,集計結果をデータマートである Redshift などに書き出し,サービスからはこの Redshift を参照します。
もちろん,Redshift に限らず,Memcached などのオンメモリデータベースへの書き出しも可能です。
3. Google Spread Sheet
オンライン上でメンバーが集計結果をアクセス,編集する手段としてはGoogle Spread Sheet は非常に有用です。
Treasure Data Serviceでは,書き出し先としてGoogle Spread Sheetを設定することでそれが容易に実現できます。
4. Treasure Data
Treasure Data Serviceで集計した結果を,Treasure Data Serviceに保存する。当たり前の機能ですが,これは非常に意味のあることです。
データ分析というのは試行錯誤の繰り返しであり,その際には前処理されたデータ,次のステップへ渡す中間データ,試しに実行してできたテンポラリデータ,などたくさんのデータが生まれ,時にはローデータよりも大きなデータセットになる場合もあります。トレジャーデータではストレージのコストは既存のデータウェアハウスに比べると遙かに安くなっています。分析者は安心して新たな可能性に突き進んでいけます。