消費者行動を予測する~マーケティングにおける予測モデルの活用

河原達也
マーケティング事業推進局 企画開発部
河原達也
  • facebook
  • facebook
  • Twitter
  • HatenaB!

1.はじめに

企業では、店舗やウェブサイトなどの顧客接点を通じて、消費者の行動履歴データを取得できるようになりました。消費者の行動履歴データは既にウェブ広告のターゲティングに利用されており、他のマーケティング領域での活用も期待されています。

その1つにマーケティング施策の効果予測と検証が挙げられます。企業としては多大な費用がかかるマーケティング施策の投資リスクを軽減したいのは当然です。施策の結果である行動履歴データは、まさにこの目的に適したデータと言えるでしょう。前述したウェブ広告のターゲティングも、反応率の高い消費者を予測することで投資リスクを軽減していると言うことができます。

本稿では、マーケティング施策の効果を評価するための予測モデルとそのアウトプット事例をご紹介します。

2.有用な予測モデルとは

ビッグデータの有用性を語る文脈で、ビッグデータによる予測の精度が話題になることがあります。例えば、総選挙での獲得議席数を予測した「Yahoo! JAPANビッグデータレポート」の精度の高さは話題になりました。

しかし、マーケティングにおける予測の目的は、予測を的中させることではありません。さまざまな打ち手をシミュレーションで評価し、マーケターの意思決定に反映することです。競合の動向や天気や経済状況など、マーケターがコントロールできない変数ばかりをモデルに投入して精度を追求したところで、マーケターには何の役にも立ちません※注1。マーケターにとって有用な予測モデルとは、「マーケターの打ち手につながる変数がモデルに組み込まれている」「各変数の影響の大きさを比較、評価できる」ということです。

近年、機械学習法によるビッグデータの解析が注目を集めていますが、そのような解析からマーケターに有用な知見を抽出することは簡単ではありません。なぜなら、機械学習では変数間の関係が複雑にモデル化され、打ち手と消費者行動の関係を分かりやすく描写できないことが通常だからです。以下の章では、従来より使われている統計手法を用いて、打ち手と消費者行動の関係を描写する方法をご紹介します。

※注1 マーケターの打ち手に関係のない変数でも、打ち手の効果を正確に把握するためにモデルに投入することがある。打ち手の効果を把握するためには、打ち手以外の要因の影響を除いたベースラインを算出する必要があるためである。例えば、ビールの売上への効果を評価するときに、気温の高低や忘年会などの影響を取り除かなければ、打ち手の効果は抽出できないということ。

3.予測モデルによるシミュレーション事例

3-1.多項ロジットモデルの概要

予測モデルを構築する手法として、ここでは消費者の商品選択行動をモデル化できる多項ロジットモデルをご紹介します。

このモデルは複数の商品から1つを選択する行動をモデル化する手法です。商品選択への影響要因を定量的に把握できます。

【図表1】が分析データのイメージです。

2016_554_31-34_02.jpg

目的変数は各消費者の商品選択の結果で、消費者1が商品Aを購入したことが表現されています。また説明変数には具体的な商品スペックが数値で表現されています。説明変数はマーケターの課題に応じて設定します。例えば、商品デザインなら具体的な商品スペック、コミュニケーションメッセージの検討なら商品イメージ、見込み顧客のターゲティングなら消費者プロフィールといった具合です。商品の選択肢がA、B、Cの3つだとすると、商品の選択確率は以下の式でモデル化されます。そして各商品の魅力度は、【商品Aの魅力度=exp(商品Aの効用)】と表現されます。

2016_554_31-34_01.jpg

商品から得られる効用が高くなると魅力度が指数的に上昇していくということです。さらに各商品の効用は【商品Aの効用=(価格の影響度×商品Aの価格)+(容量の影響度×商品Aの容量)+...】というように、説明変数とその影響度の積の合計で決まります。

各説明変数の影響度はモデル化することによって算出されるパラメータです。多項ロジットモデルによる選択確率の予測が、実際のデータにできるだけあてはまるようにスコアが決まります。このスコアは各変数の商品選択確率に対する影響の大きさを表しています。つまり、商品の選択に重要な商品特徴や消費者属性が明らかになるということです。

3-2.メインバンクの選択への適用

実際のデータに多項ロジットモデルを適用した事例をご紹介しましょう。利用したデータは銀行の利用に関するアンケートデータで す。分析データの概要は以下のとおりです。

右辺の分子は商品Aの魅力度、分母はそれぞれの商品の魅力度を合計したものです。商品Aの魅力度が他の商品に比べて高いほど、 商品Aの選択確率が1に近づくというモデルです。

目的変数

メインバンクとして利用している銀行(以下から1つ選択)

・三井住友銀行 ・三菱東京UFJ銀行・みずほ銀行

・りそな/埼玉りそな銀行・ゆうちょ銀行

説明変数

各銀行のブランドイメージ 店舗、ATMの数が多い(回答on=1、回答off=0。以下同様。)/時間や 曜日を気にせず利用できる窓口、ATMがある/インターネット上で取

引できる/手数料が安い・無料/企業の知名度が高く、信頼できる

対象者の属性

・性別(男性=1、女性=0)・年齢(実数)

・世帯年収(選択式回答の代表値)

調査概要

調査地域:全国 調査方法:インターネット調査 調査期間:2014年10月10日~ 2014年10月14日

【図表2】が多項ロジットモデルを用いて算出したブランドイメージの影響度です※注2。

2016_554_31-34_03.jpg

「店舗、ATMの数が多い」と「インターネット上で取引できる」の影響度が高くなっていることが分かります。一方、「時間や曜日を気にせず利用できる窓口・ATMがある」の影響度はそれほど高くありません。このことは、利用時間帯の利便性では不十分で、利用場所の利便性が重要であることを示唆しています。店舗、ATMの数が多い時間や曜日を気にせず利用できる窓口・ATMがあるインターネット上で取引ができ手数料が安い/無料企業の知名度が高く、信頼できるまた、「企業の知名度が高く、信頼できる」の影響度もそれほど高くありません。これは分析対象とした銀行の知名度が総じて高く、信頼性が差別化要因にならないことを示しています。企業の信頼性をPRする広告はそれほど効果が期待できないということです。【図表3】が消費者属性の影響度です。消費者属性については銀行ごとに影響度が算出されます。例えば、ゆうちょ銀行では「性別(男性)」、「年齢」、「世帯年収」の影響度がすべてマイナスになっています。このことは、女性で、年齢が若く、世帯年収が低いほど、ゆうちょ銀行の選択確率が高くなることを表しています。このように、自社商品の選択確率が高い(若しくは低い)消費者プロフィールを特定することで、見込み顧客のターゲティングを行うことができます。

2016_554_31-34_04.jpg

3-3.シミュレーションによる施策の評価

前述したように、マーケティングにおける予測モデルの役割は、検討しているマーケティング施策の効果を評価し、投資リスクを軽減することです。そのためにはさまざまなシナリオで消費者反応をシミュレートし、施策間の優劣を評価する必要があります。

多項ロジットモデルでは、説明変数を変化させたときの選択確率の変化をシミュレートすることができます。【図表2】では「インターネット上で取引ができる」というイメージの影響度が高くなっていました。そこで広告コミュニケーションの目的を「インターネット 取引に関する浸透度の向上」と想定して、「インターネット上で取引できる」というイメー ジが向上した場合のインパクトをシミュレートしてみましょう。比較対象は「企業の知名 度が高く、信頼できる」とします。

現状のブランドイメージのスコアをベースとして、ゆうちょ銀行の「インターネット上で取引できる」と「企業の知名度が高く、信頼できる」の各イメージが10%上昇した場合の選択確率の変化をシミュレートしたのが【図表4】です。「インターネット上で取引ができる」というイメージが浸透した場合、ゆうちょ銀行の選択確率が2.8%上昇する一方、「企業の知名度が高く、信頼できる」というイメージが向上しても、選択確率は0.9%しか上昇しません。広告コミュニケーションの目的をインターネット取引の浸透に設定した場合、企業信頼度の向上を目的とした場合よりも3倍以上の効果が期待できるということです。

2016_554_31-34_05.jpg

※注2 影響度を変数間で比較するため、基準化された影響度を表示。基準化の方法は河原(2016)に準拠。

4.行動履歴データの予測モデルへの活用に向けて

消費者の行動履歴データは、消費者数、行動の種類、時間に比例して増加するビッグデータです。しかし、データが大きいこと自体にはあまり意味はありません。過去に起こった細かな事実をただ並べるだけではマーケターには役立たないからです。データの価値はそこから得られる知見の有用性で測られるべきです。マーケターが達成したい目標がまずあって、それを達成するための施策のアイデアと行動履歴データが理解可能な形で関連付けられたとき、はじめてそのデータの有用性を見出すことができます。こう考えると行動履歴データの活用には2つのハードルがあることが分かります。1つはマーケターの施策に繋がるインプットデータを紐付けることです。行動履歴データに紐づいている施策に関する情報は非常に限られていることが普通です。例えばID-POSデータは、商品の購入価格や消費者の性別・年齢は分かりますが、その商品がどのような特徴を有しているか、どのような広告コミュニケーションを行ったか、どの商品と比較されたかといった情報は分かりません。「おむつとビール」のような話もありますが、行動履歴データのみから得られる知見は限られています。

もう1つは、インプットデータを意味ある情報に整理することです。商品の特徴や広告コミュニケーションに関するデータは、テキストや音声、画像など様々な形式が考えられます。そのようなデータをそのまま使って消費者行動との関係を描写することは不可能です。商品や広告コミュニケーションの特徴を表現する意味のある情報を抽出し、数値データに変換しなければなりません。これについては画像解析や音声認識で注目を集めているディープラーニング(深層学習)が応用できる可能性があります。

今後、広告クリエイティブや広告出稿のデータを解析して、そこから意味ある情報を抽出 する研究を進めて行く予定です。抽出された情報と消費者行動の関係を描写する予測モデ ルを構築することができれば、広告のプランニングに有用な知見が得られると考えています。

[引用文献] 河原達也(2016)ブランド選択へのCox比例ハザードモデ ルの応用. マーケティング・リサーチャー,No.130,47-55.

この記事をシェアする
  • facebook
  • facebook
  • Twitter
  • HatenaB!