お客さまのビジネスに今すぐ役立つ、データに関する最新情報を定期的にお届けします
マラソンを継続できるユーザーはどんな人?~数理モデルの検索データへの適用可能性を検討する~
- 事例・分析レポート
[アナリスト:小川知紘、工藤脩人、坂口博昭]
ビジネスにおいて新規ユーザー獲得は重要なテーマですが、中でも継続してくれるユーザーを獲得したいという課題をお持ちの方は多いのではないでしょうか。
そこで今回は「マラソン」をテーマに、ヤフーが保有するデータから継続するユーザーの特徴を捉えられないかを試してみましたのでご紹介します。どういう特徴を持っているユーザーがマラソンを継続しやすいのか、是非想像しながらご覧ください。
・ 分析方針
今回はどの要素がどの程度影響するかを把握できるよう、通常は購買データでの顧客の生涯価値の推定に用いられるPareto/NBDモデル(Abe, 2009)を使用することにしました。具体的には、直近の購買からの経過時間(Recency)と購買頻度(Frequency)をもとに、解約などの明確な離脱タイミングが分からない非契約型消費における顧客の生存率の推定を行うためのモデルになります。
このモデルの良い点は個々の顧客の属性を共変量として推定に組み込むことが出来るところです。例えば「20代独身男性は40代既婚男性よりも〇〇を購入し続けやすい」というような推定が可能になります。
また、継続の有無がログとして目に見えやすいオンライン主体のテーマではなく、オフライン主体のテーマの方が意義を持ちやすいという点を踏まえて、分析官の1人が趣味としているマラソンを今回のテーマとして設定しました。
・ 集計定義
下図のようなイメージで、今回は検索データを用いて集計・分析を行いました。・分析対象ユーザー:20~59歳のうち、2021-2022年にマラソンに関するトレーニングや大会関連検索をしており、2019-2020年には検索をしていないユーザー
=2021-2022年の間にマラソンを始めた/再開したユーザー
(定義詳細)
(定義詳細)
(定義詳細)
属性:性別、年齢
推定属性:スポーツ好き、美容通、健康志向、既婚or独身、専業主婦(主夫)
注) 各ユーザーの検索アクティブ度のコントロールも行っています
・ 集計結果
上記定義で実際にモデルを回したところ、スポーツ好きのユーザーがマラソンを継続しやすいという当然の結果もきちんと見えた上で、年齢が高くなるほど継続しやすくなる(具体的には10歳、年齢が上がると継続期間が約20%長くなる)といった結果が見えてきました。この結果が正しいとすると、顧客の生涯価値の観点からは「年齢が高めのユーザーを狙いましょう」ということにはなりますが、なぜこのような結果が出たのかが分からないとアプローチまで踏み切るのは難しそうです。
そこで、出てきた示唆の検証のためにユーザーの特徴を見てみました。
まずは、年齢によってマラソン関連の検索に差があるかを確認するために、継続期間の長いユーザーのうち、年齢が高めのユーザーの検索キーワードを年齢が低めのユーザーと比較しました。
■継続期間の長いユーザーのうち、年齢高め(40-59歳)vs年齢低め(20-39歳)に特徴的なマラソン関連検索キーワード
さらに年齢が高めのマラソン継続ユーザーが、一般ユーザーと比較してどんな特徴的な関心ごとを持っているかも見てみたところ、旅行や健康通、グルメ好きに対する関心が特徴的であることが分かりました。
上記の結果を総合的にとらえると:
・マラソンを継続する要因として、年齢の高さが浮かび上がった
・理由を深堀りしていくと、マラソン大会への関心の強さが見えてきた
一方で若年は具体的な目的がある人が継続するという継続要因の違いも見えてきた
・また、年齢が高めのマラソン継続ユーザーでは旅行やグルメへの関心も特徴的であった
⇒1つの仮説として、旅行やグルメも含めたマラソン大会に参加する楽しみを感じる年齢が高めのユーザーはマラソンを継続しやすい
と言えるのではないでしょうか。
このことから、今後マラソンを継続する新規ユーザーを獲得したい/作りたい場合には、タイムやダイエットなど具体的な目的ではなく、マラソン大会への参加を通じたグルメや旅行の楽しみを年齢が高めの層に訴求してみるのも有効かもしれません。
・ おわりに
今回はマラソン継続ユーザーの特徴把握を例として、RF(Recency-Frequency)分析の枠組みをヤフーの検索データに適用できるのかを検証してみました。モデルを使うことで、ログの残らないオフラインのテーマであっても継続に効いている要素の把握が可能となり、加えて結果を他のデータで補完することで要因や特徴等も捉えられる可能性が見えてきました。
ヤフー・データソリューションでは、引き続き皆様のビジネスに貢献できるよう、様々な活用可能性の検討を進めてまいります。
参考文献
Abe, M. (2009). "Counting your customers" one by one: A hierarchical Bayes extension to the Pareto/NBD model. Marketing Science, 28(3), 541-553.
※今回公開したデータを含め、ヤフー・データソリューションは、お客さまのデータを統計データとしたうえでデータの可視化や分析結果をご提供するサービスであり、個人を識別できるデータ (パーソナルデータ) については、お客さまから新たに同意をいただかない限り外部に提供することはありません。
※本記事の内容は公開日時点の情報です。
お客さまのビジネスに今すぐ役立つ、データに関する最新情報を定期的にお届けします