Marketing Analysis Contest

マーケティング分析コンテスト

2020

審査結果・レポート公開中

提供データ

1.データの概要

本コンテストでは「シングルソースデータ」を提供します。シングルソースデータとは、企業の広告や販売促進などの「マーケティング活動」と、消費者が購入に至るまでのステップである「消費行動のプロセス」とを、同一の被験者で調査したデータです。

具体的には、同一被験者から、TV視聴履歴やWeb閲覧履歴、雑誌や新聞の購読履歴、といった「刺激系データ」と、商品別の認知、購入意向、購入経験、リピート状況といった「購買系データ」を把握します。これにより、どのようなテレビ番組を見た人が商品に対する認知率を高めているのか、テレビとWebサイトの両方で接触があるとどの程度購入意向が高まるのかなどを分析することができます。すなわち、消費者を軸とした本来の広告効果や販促効果を把握することができます。

今回提供するデータの全体像は図1の通りです。また、具体的なデータ収集方法については図2を参照してください。

メディア等の接触状況としては、テレビ番組視聴、Webサイト閲覧、雑誌・新聞講読などの基礎的なメディアとの接触についてデータを提供します。テレビ番組は調査期間のすべての番組の視聴状況、Webサイトはアクセスログデータをもとに約4,000以上のサイトへの接触頻度(週単位)、雑誌は調査期間に発売された主要雑誌(月刊、週刊、隔週刊など)の講読状況、新聞は宅配契約・駅売り等の講読状況のデータを提供します。

また、これらのメディアとの接触以外にも、週別での主要チャネルの利用状況、日常的に利用する路線(通勤・通学ルート)などのデータも提供します。これらのデータと購買状況を比較することで、店頭の販促・陳列、電車広告などが購買に及ぼす影響を把握できます。

商品別の購買状況については、商品の認知率、店頭接触率、購買率、複数購買率(リピート購買率)や、購入意向のデータを提供します。これらのデータは、主要製品については、調査期間の前半と後半の2回収集しているものが多く、1ヶ月間のマーケティング活動の影響を受けた結果、購買率や購買意向がどのように変化したのかを同一被験者で把握することできます。このデータを分析するだけでも、商品別の変化状況を把握できますが、メディア等の接触状況とクロス集計分析することで、メディアが購買行動に及ぼす影響を正確に分析することができるでしょう。

さらに、「テレビCMの出稿データ」や「雑誌広告の出稿データ」についても提供します。各商品別のCMがどの番組の時に流れていたのか、各雑誌にはどのような広告が載っていたのかというデータです。これにより、実際に出稿があったテレビ番組を見ている人を抽出して、その商品に及ぼす影響を分析することが可能になります。

2.調査対象商品

(以下は2012年の結果です。2020年は5月中旬に更改します)
商品別の購買状況では、以下のような商品のデータを提供する予定です。

  • 飲料(32商品)
    • 炭酸
    • 缶コーヒー
    • 無糖系
    • スポーツ・機能性
    • ドリンク剤
    • その他
  • アルコール(10商品)
    • ビール、発泡酒、新ジャンル
    • チューハイ
  • 食品(25商品)
    • 菓子
    • アイス
    • 健康食品
    • その他
  • サービス(13商品)
    • 外食
    • 携帯電話サービス
  • 家電(14商品)
    • デジカメ
    • テレビ
    • プリンタ
  • 化粧品(11商品)
  • 医薬品(17商品)
  • 自動車(2商品)
  • 保険会社(11商品)
  • その他(9商品)

3.分析事例

本コンテストで提供する「シングルソースデータ」を用いることで、以下のような分析をすることが可能です。

  • テレビCMのフリークエンシー別の購買状況
  • テレビCMを見せてWebへ誘導できている割合
  • 番組の視聴者にあった商品の宣伝
  • WEBサイトの閲覧が購買に及ぼす影響
  • WEB上の口コミが商品選びに及ぼす影響
  • テレビとWEBの相乗効果
  • カテゴリー別の最適な雑誌出稿パターン
  • テレビ番組や雑誌などにおけるパブリシティの効果
  • 電車の中吊り広告が購買に及ぼす影響
  • カテゴリー別の消費者がよく使うチャネル
  • 消費スタイル・ライフスタイルが商品選択に及ぼす影響
  • メディアミックスの最適化

4. データの提供方法

今回のシングルソースデータは非常に膨大な量になります。3,000サンプルという調査対象者が多いだけではなく、テレビ番組数では1万5千番組、調査対象商品も140ブランド、Webサイトは4,000サイトなど、分析対象となる変数の量も膨大です。そのため、エクセルなどの表計算ソフトでは全てのデータを同時に分析することはできません。十分な分析をするためには、データベースソフトや統計処理ソフトなどの活用が必要になります。
今回も、誰もが分析することができるように、以下のような2つのパターンでデータを提供する予定です。
また希望者に限り、R言語用のデータも提供します(5月下旬から順次送付予定)

SAS、SPSS形式

  • 統計処理ソフトのSASやSPSSをお持ちの方が、そのまま利用できるような形でローデータを提供
  • 変数の定義・値なども保存されているためすぐに分析作業が可能

CSV形式

ローデータを調査別のファイルに分割してCSV形式で提供

  • 変数などの定義については別ファイルでの提供
  • 分析したいデータを抽出し、表計算ソフトなどにデータを変換することで分析可能

R形式(希望者のみ5月下旬より配布予定)

  • マルチプラットフォーム、オープンソースのため、特別な統計処理ソフトをお持ちでなくても、分析が可能
  • 各データはデータフレームとして作成してあり、R言語でそのままロードするためのファイルを提供