トレジャーデータで実践:Path 分析(アウトプット編2:遷移ダイアグラム)
本記事は移転しました。新サイトにリダイレクトします。
はじめに
「トレジャーデータで実践:Path 分析」シリーズでは,過去にWeb,広告,リアル店舗でのログを元に,コンバージョンパステーブルの作成例とその分析事例を紹介していました。
それに続く本記事では,より具体的かつ汎用的な分析事例として,コンバージョンパスを分析インプットとした時に,どんな分析アウトプットが出せるか,について以下の3つを紹介する事にします。
- 頻出パターンマイニング
- コンバージョンパス ダイアグラム(今回)
- 決定木モデル
上記の資料はパス分析の概念から始まり,トレジャーデータにおけるデータの持たせ方から分析アウトプットまで,パス分析のいろはを詳細に述べた資料です。
遷移ダイアグラム
遷移分析は,コンバージョンパスがどのようなノード遷移でコンバージョンに至ったのかを求めます。遷移ダイアグラムとは,コンバージョンしたユーザーのノード間の遷移をグラフとして可視化します。ノード間には方向(A→B と B→A は異なる)があり,方向が違えば辺の値(=CV率)も異なっています。
この遷移ダイアグラムを作ることで,CV率の高い遷移傾向をわかりやすく捉える事ができます。
上図の遷移ダイアグラムは,"Sign Up" をコンバージョンにした,トレジャーデータウェブサイト内のでのコンバージョンパスをインプットとして作成したものです。コンバージョンである "Sign Up" ノードでは,ゴールなので入ってくる矢印しか持っていません。その他のノードは入ってくる矢印もあれば出て行く矢印もあります。
矢印の太さは,CV率の高さによって決まります。これによって CV率の高い遷移が一目瞭然ですね。
Direct Attribution Node
ここからは遷移ダイアグラムの見方について説明していきます。
Direct Attribution Node は,コンバージョンポイントである "Sign Up" に直接矢印を飛ばしているノードを指します。これらのノードはコンバージョンの直前に現れることが多いことを意味しています。コンバージョンに直接寄与しているという意味でこのノードは注目に値します。
Direct Attribution Path
Direct Attribution Path はコンバージョンに直接繋がる一連の部分パスです。この部分パスの流れに載せる事で,コンバージョンへ導く事に期待できそうですね。このように Node と Path ,それぞれで特徴的なものを見いだすのが遷移ダイアグラムの活用法です。
Indirect Attribution Node
直接寄与(Direct)の概念があれば,間接寄与(Indirect)の概念も生まれてきます。コンバージョンから遠いノード,しかしこれらがパスの前半で現れることによって CV 率を高めてくれます。
Indirect Attribution Path
Period Shift Node
Period Shift(期ずれ)Node は,多くのノードから遷移されているものの,そこからあまり矢印が出て行かないノードを指します。これはパスの遷移が一端そこでストップし,時間をおいて(今回の集計対象期間の後に)コンバージョンへ向けて再度動くことになった傾向を表しています。
Gephi
今回の例ではノードの種類が少なかったため,分かりやすい遷移ダイアグラムを描く事ができました。しかし,ノードの種類がたくさんあると,遷移ダイアグラムは複雑ネットワークモデルのようなダイアグラムを描きます。
↑上図は ウィキペディア周辺のWWWの構造を可視化したものです。
さて,このような複雑なグラフを可視化する場合には,他のソフトウェアを利用する必要があります。Gephi はこのようなグラフの描画に適したオープンソースです。
Gephi によって遷移ダイアグラムを描画した図です。インタラクティブなグラフとなっており,ノードをクリックするとそのノードの近傍だけのつながりがピックアップされます。
冒頭の資料の中にはその他のダイアグラムについても紹介していますのでぜひともご参考下さい。