トレジャーデータ(Treasure Data)ブログ

トレジャーデータ(Treasure Data)ブログです。

本サイトは移転しました。新サイトにリダイレクトします。

トレジャーデータで実践:Path 分析(広告編,その1)広告配信ログ(アトリビューション)分析

本記事は移転しました。新サイトにリダイレクトします。

トレジャーデータはクラウドでデータマネージメントサービスを提供しています。

お問い合わせはこちらのフォームをご活用下さい。

はじめに

アトリビューション分析とは

「寄与」を意味するアトリビューション分析は、主に金融業界と広告業界で数年前から盛んに行われてきたものです。アトリビューションはユーザーの流入からコンバージョンに至るまでのパスを分析し、コンバージョンへの寄与の大きかった広告を次回の配信では重みを付けるようにして配信最適化を図るものです。トレジャーデータでは、このアトリビューション分析を広告業界におけるパス分析として捉え、実店舗における買い物回遊パス分析(前編・後編)の続編として紹介していきます。

また、今回の記事作成に当たってアトリビューション分析に関する以下の書籍を参考にさせて頂きました。

アトリビューション 広告効果の考え方を根底から覆す新手法

アトリビューション 広告効果の考え方を根底から覆す新手法

  • 作者: 田中弦,佐藤康夫,杉原剛,有園雄一
  • 出版社/メーカー: インプレスジャパン
  • 発売日: 2012/03/26
  • メディア: 単行本(ソフトカバー)
  • 購入: 2人 クリック: 30回
  • この商品を含むブログ (7件) を見る
 

Webアクセスログと(第三者)広告配信ログの違い

さて、まずはログに関する話から始めましょう。広告の配信ログは一見すると web でのアクセスログと似たようなものと考える方も多いかもしれませんが、以下の様な興味深い違いがあります:

  1. web での「アクセス」に対して広告では「インプレッション、クリック、インタラクション」といった複数のイベントを持っています。
  2. 自社サイト内の遷移しか捉えられなかった web でのログに対して、広告では「第三者配信ログ」と呼ばれる、複数のサイトを横断して遷移を追えるようになっています。
    ※「第三者配信」についてはこちらのリンクを参照下さい。本記事でも後編でご紹介します。
  3. ビデオなどの動画広告を再生したか否か、何秒再生したかといった新しい指標に基づく配信結果を知ることができます。

本記事では、1. 「イベントパス分析」と 2.「サイト(媒体)パス分析」の2つのアトリビューション分析を紹介します。

イベントパス分析

広告配信ログにおけるイベントは、 web の「アクセス」とは多少異なりいくつかのバリエーションを持っています。今回の記事に関連する主要なイベントを紹介します。

  • 「インプレッション」

インプレッション数とはインターネット広告が表示された回数を指します。ページビュー(PV)と混同しやすいですが、ページビューはウェブサイトが表示された(サイトがアクセスされた)回数に対し、インプレッションは一回のページ閲覧に対して複数の広告が切り替わって表示されます。従ってインプレッション総数はページビュー総数よりも多くなります。

  • クリック

実際に広告がクリックされた際にカウントされる指標です。インプレッションはユーザーに対して積極的に広告がアピールされるため受動的なイベントですが、クリックはユーザー側から広告に入り込んでいく能動的なイベントです。

クリック数はインプレッション数の1/100、1/1000 にとどまりますが、このイベントからのコンバージョンは一般的に高く、重要な指標として捉えられます。

  • サーチクリック

リスティング広告は、ユーザーが検索サイトから検索した結果ページに、記入されたキーワードに関連する広告をそこに表示する形のものです。検索結果からクリックされた場合は「サーチクリック」としてカウントされます。

ユーザーの検索キーワードに関連して広告を表示させるわけですから、インプレッションよりはユーザーの関心度が高いイベントですね。

  • インタラクション

ユーザーが広告に対して何らかの「操作」をした場合、インタラクションとしてカウントされます。ここでの操作とは何かというところですが、主にビデオ広告を再生した際にカウントされる「ビデオインタラクション」を指します。動画広告を広げる、視聴する、音声のオンオフ、スキップする、再視聴するなど、何らかのアクションを「操作」と考えます。「インタラクション率」という指標は、これはインタラクション回数をインプレッション数で割った割合を表します。ユーザーが期待するアクションをとったかどうかを測る指標になります。

  • パネル

指標としてはあまり使われませんが、ここでは複数の広告をスライドで表示切り替えできるパネル広告に対して、ユーザーがスライドさせて表示した広告に対してこの指標がカウントされます。Facebookなどでもよく見られますね。

イベントをノードとしたコンバージョンパス

広告におけるコンバージョンは、実際には上述した複数のイベントの相乗効果によって成し遂げられますが、アトリビューション分析ではどのパスがコンバージョンに寄与したのか、またはどのイベントが全体のコンバージョンに寄与したのか、といった視点をとります。

広告配信ログサンプルについて

イベントにおけるアトリビューション分析を紹介するにあたって、汎用的な広告配信ログのサンプルを作成してみました。また、なるべく具体的になるように「site_name, site_cagegory」項目にはこちらのポータルサイト一覧より引用しました。プレイスメントは「サイト名 + { レクタングル,バナー,スカイスクレイパー,ボタン }」の組み合わせによる命名ルールとなっています。その他のプレイスメントの種類については Google AdSence の以下のヘルプページが参考になります。

support.google.com

※ site 項目をノードにしたアトリビューション分析は後編で紹介します。

Conversion Path

f:id:doryokujin:20150407100613p:plain

Conversion Set

1つのコンバージョンパスを1レコードに情報集約したものです。前編では赤色掛けしたイベントコンバージョンパスを、後半では青色掛けしたサイトコンバージョンパスを見ていきます。

f:id:doryokujin:20150407100804p:plain

パス類型

イベント項目に基づいてパスを数種類に類別します。広告業界では、主に下図の5種類の類別を行っています。

f:id:doryokujin:20150407094843j:plain

クリックスルーコンバージョン

上から2つ(A,B)は、「クリック」というイベントを通過してコンバージョンしたパスで、一般的に「クリックスルーコンバージョン」と呼ばれています。

  • A:広告に興味を持ってクリックし直接コンバージョンに至る
  • B:クリックしてサイトを閲覧してすぐにはコンバージョンに至らなかったが印象には残っており、後に想起され、わずかな記憶から検索する「サーチクリック」を経てページ閲覧に至る

というものです。また B は「クリック」→「サーチクリック」と「サーチクリック」→「クリック」の双方を含んでいるものとします。

ビュースルーコンバージョン

残り3つ(C,D,E)のコンバージョンパスは「クリック」イベントは持たず、「ビュー(インプレッション)」と「サーチクリック」からなります。

  • C:何気なく目にした広告にわずかな印象を残し、後に想起され「サーチクリック」の末にコンバージョンに至る
  • D:数回の「ビュー」のみ
  • E:「サーチクリック」後の「ビュー」で記憶がよみがえってコンバージョンに至る

というものです。

ビュー / クリックスルーコンバージョンパスの各々の占有率

まずは全体のコンバージョン総数に対して、A〜Eがそれぞれ何パーセントを占めるのかを見ていきます。全コンバージョンで割ったものが占有率、非コンバージョンパスで割ったものがコンバージョン率と呼んでいます。

1. 全コンバージョン回数、平均パス長、平均コンバージョン時間

全体のコンバージョン回数とパスの平均パス長、平均コンバージョン時間を算出します。一般に平均パス長とコンバージョン時間は、値が小さいほどコンバージョンへの効率が良いものと判断できます。(クエリ実行後の結果)

全コンバージョン回数平均パス長平均コンバージョン時間
716520 22.54 505905

全体で 716,520 回のコンバージョンがありました。また、平均的に22回の広告遷移の末にコンバージョンしました。コンバージョンまでに平均的に505905秒(≃5.8日)の時間を要しました。

2. コンバージョン率(全体) 

(クエリ実行後の結果)

コンバージョン回数非コンバージョン回数コンバージョン率
716520 57376043 1.23% 

コンバージョン率は1%と、なかなか渋い数値となっています。アトリビューション分析によって配信最適化を行い、数%アップを狙いたいものです。

3. 各パス類型における回数、コンバージョン占有率、平均コンバージョン時間

5つのパス類型それぞれのコンバージョン回数および全体のコンバージョンに占める割合,平均コンバージョン時間を見てみましょう。

(クエリ実行後の結果)

f:id:doryokujin:20150407095534j:plain  f:id:doryokujin:20150407105403p:plain

考察

  • まず,A〜Eまでの5つの類型で全体のコンバージョンパスの99%以上を占めていることに注目です。このパスがベーシックパターンとして利用されてきた理由がわかりました。
  • また,ビュースルーコンバージョンが全体の多くを占めていることがわかりますが、これはインプレッション数がクリック数よりも遙かに多いことから自明です。
  • 一方,平均cv時間に着目すると,「サーチクリック」に関連するパス:B,C,E のcv時間が2倍以上早いことがわかります。ここで「サーチクリック」イベントの重要性が見えてきます。

 

さて、今まで占有率を見てきましたがパス分析の神髄は コンバージョンと非コンバージョンの比較になります。次回では各々のパスのコンバージョン率を調べ,新たな発見を見ていきましょう。

また,Tableau 上で アトリビューション分析用のダッシュボードを作成し,紹介するつもりです。