AREKORE

daikikatsuragawaのアレコレ

アソシエーションルールマイニングに基づく推薦のすゝめ2021

はじめに

2021年某日…「今こそ“アソシエーションルールマイニングに基づく推薦”の時代なんじゃないか!?」と感じました。その思いを綴ります。

アソシエーションルールマイニングに基づく推薦

まずはアソシエーションルールマイニングに基づく推薦についてサラッと説明します。

アソシエーションルールとはアイテム間の関連性の規則を指します。以下のように表現されます。

 \displaystyle
A \rightarrow B

これは「事象Aが起こると事象Bが起こる」という意味です。Aは条件部、Bは結論部と呼ばれます。例えば、「パンとバターを購入した人はミルクを購入する」という事象は“パンとバターを購入”→“ミルク購入”というルールとして表現されます。

任意のアソシエーションルールが有用か否かを判断する指標として、様々な評価値があります。どれだけ一般的なルールかを計る評価値として支持度(Support)があります。

 \displaystyle

支持度(Support)=
\frac{条件部(A)と結論部(B)を含むデータ数}{全データ数}

どれだけ関係の強いルールかを計る評価値として信頼度(Confidence)があります。

 \displaystyle

信頼度(Confidence)=
\frac{条件部(A)と結論部(B)を含むデータ数}{条件部(A)を含むデータ数}

信頼度に対して結論部の発生する頻度を考慮した評価値としてリフト値(Lift)があります。

 \displaystyle
リフト値(Lift)=
\frac{\frac{条件部(A)と結論部(B)を含むデータ数}{条件部(A)を含むデータ数}}{\frac{結論部(B)を含むデータ数}{全データ数}}

上記の評価値に基づいて、推薦に有用なルールを特定することが可能です。

膨大なデータからルールと評価値を出力する手法としてアソシエーションルールマイニングがあります。主に利用されているアルゴリズムであるaprioriにより、一定の支持度を超える有用なルールに絞ることも可能です。

アソシエーションルールマイニングによって得られたアソシエーションルールに基づいて以下のような順序で推薦ができると思われます。

  1. ルール群の条件部を推薦対象の現状でフィルタリング
  2. 信頼度(もしくはリフト値)に基づき結論部をランク付け
  3. 状況に合わせて上位N件を推薦

例えば、ECサイトにおいて「Aの他に何か買おうか」と思案している顧客に「Bがオススメ。(信頼度に基づき)Aの購入者の90%が同時に購入しています。」と伝えることができます。

これが本記事で紹介したい「アソシエーションルールマイニングに基づく推薦」です。

その理由(わけ)とは…

アソシエーションルールマイニング自体は素晴らしい手法です。ただし、最近発表されたものではなく、近年では様々な手法が提案されており、推薦の改善、進化が進んでいます。そんな中、2021年某日…「今こそ“アソシエーションルールマイニングに基づく推薦”の時代なんじゃないか!?」と思った理由を綴ります。その主な理由は以下2点です。

推薦の根拠を説明可能

アソシエーションルールマイニングはルールおよび評価値がシンプルで、どんな人でも理解しやすいため、推薦の根拠を説明できると思われます。Bを推薦するときに、その根拠として、「A→B」というルールに基づき、あなたがAだからという旨を伝えることができます。そして、信頼度に基づき、信頼度がX%である場合、「AのX%がBでもある」という旨も伝えることができます。「説明可能であること」は相手に行動を促すのために良い要素であると考えられます。「説明可能であること」までもサービスとして提供したい場合、有用な選択になるんじゃないかと考えています。

推薦を実施したい相手に紐づく情報がなくても推薦可能

アソシエーションルールマイニングに基づく推薦の場合、推薦を実施したい相手に紐づく情報が必要ありません。例えば、他の推薦手法では、相手の情報(生年月日、性別など)を説明変数として利用する場合があります。それに対して基本的なアソシエーションルールマイニングに基づく推薦では状態(買い物カゴの中身、閲覧履歴など)と過去のルールを組み合わせることで推薦が実現されます。つまり、匿名性が必要な場面や新規顧客にも対応可能です。

日本におけるデータ提供・活用文化の醸成に貢献?

近年モバイル決済が浸透しています。これにより消費者の特徴や行動に基づき様々な恩恵を受けることができる未来*1が想像できます。しかし、データ提供におけるプライバシーなどに関するリスクは存在するため、それを考慮した上で恩恵がない、想像できていない方々がいると言う現状*2もあるかと思います。特に上記2点は、そのような思いを持っている方々にもアプローチが可能です。それゆえ、現状を打破し、今後のデータ活用が浸透するキッカケになるのではないかと考えています。特に、データ提供・活用が実施されていないサービスに対して有効だと考えられます。そして、特に日本におけるデータ提供・活用をブレイクスルーするひとつのキッカケになるのではないかと期待しています。

おわりに

「今こそ“アソシエーションルールマイニングに基づく推薦”の時代なんじゃないか!?」と思ったその思いを綴りました。「推薦の根拠を説明可能」、「推薦を実施したい相手に紐づく情報がなくても推薦可能」という理由より、シチュエーションによってはニーズに応えられる手法なんじゃないでしょうか?今こそ、検討をしてみてはどうでしようか?