- ホームバナーは顧客の最初の画面で最初に見える中核領域であり、超パーソナライズ推薦システムを通じてクリック率(CTR)とユーザー体験を最大化している
- 従来の**MAB(マルチアームド・バンディット)**ベースの単純なクリック率最適化方式から脱却し、DeepFM・Two-Tower・HGNN など最新アルゴリズムとグラフベースの埋め込みにより、バナー・ユーザー特性を精緻に反映している
- バナーのライフサイクル短縮、ノイズの多いクリックフィードバック、データ不均衡といったドメイン特有の問題を、Continual Learning、個別モデルと統合モデルの混合運用などで解決している
- 最終的にCTRを16%以上改善し、新規バナー・コールドユーザー対応、リアルタイム・ビジネスポリシー連携など、体系的な推薦パイプラインを構築した
- 今後はリアルタイムサービング、Multi-Task Learning、埋め込み品質の高度化、多角的な成果指標の導入など、継続的な進化を予定している
顧客ごとに最適化されたビッグバナーでより良い体験を作る
- 顧客の好みと表示コンテンツの多様性が増す中、一律のバナー表示では満足のいく体験を提供するのに限界があった
- CTR最大化を目標に、各ストアホーム上部のビッグバナーにパーソナライズ表示ロジックを導入するプロジェクトを進めた
ホームバナーの重要性と特徴
- ホームバナーはMUSINSAサービスで顧客が最初に目にする画面最上部のスライド型バナー(全35枚)で、アプリでは1枚、Webでは3枚が表示される
- MUSINSA全体トラフィックの約**97%**がメイン画面進入時にホームバナーに接触する
- ホームバナーのクリックは全クリック数の35%、クリック発生セッションの37%を占めるほど比重が大きい
- 高い表示頻度により、ビジネス転換効果が非常に大きい領域である
従来の推薦方式の限界
- 従来はMAB(Multi-Armed Bandit)アルゴリズムを活用してCTR中心の推薦を行っていた
- **探索(Exploration)と活用(Exploitation)**のバランスを調整
- 3つの限界:
- 単一のクリック率指標への依存により、多様な顧客嗜好・バナー特性の反映が不十分
- バナー間の関連性を反映しにくい(独立処理)
- コールドスタート(新規バナーのクリックデータ不足時に性能低下)
- この限界を克服するため、新しい推薦システムを設計した
推薦システムのパイプライン
- システムは多段階パイプラインで構成される
- バナー表現の強化: バナー関連テキスト・画像・関連商品ベースの埋め込み(HGNN、GraphSAGE活用)を抽出
- クリック予測モデルの学習: DeepFM(特徴量相互作用)とTwo-Tower(ユーザー/バナー分離埋め込み)モデルを同時適用
- バナースコアリングと適用: ユーザーごとのCTR予測スコアをバッチ/リアルタイムで算出
- データが十分なユーザーには精緻なパーソナライズ
- 新規・コールドユーザーにはセグメントベース推薦
- ビジネスポリシーの反映: システム配点に加え、会社方針や戦略、キャンペーンバナー、緊急変更などもリアルタイムで反映
- 最終バナー表示: スコアの高いTop-Nバナーを最終推薦・表示
推薦の中核モデル紹介
- DeepFM: FM(二次相互作用)+DNN(高次元相互作用)の並列構造により、疎なデータと複雑な相互作用の両方を効果的に学習でき、CTR予測に優れる
- Two-Tower: ユーザー・バナーそれぞれの独立したニューラルネットワークから埋め込みを抽出し、大規模データとリアルタイムサービングに強みを持つ類似度ベース推薦
DeepFM
- FMレイヤー(二次特徴量相互作用)+DNNレイヤー(高次元非線形特徴統合)の結合
- 疎なデータに強く、End-to-End学習構造で一貫した性能最適化が可能
- ユーザー情報、バナーメタ、埋め込み(64次元)情報を特徴量として使用
- 埋め込みベクトルを1つの単一ブロックとして処理し、学習効率と安定性を確保
- CTR予測結果でバナー順位を算出
Two-Tower
- ユーザーとバナーを別個のニューラルネットワーク(タワー)で埋め込み、類似度を算出する方式
- 大規模データに適した拡張性と、事前ベクトル化による高速応答(低遅延)が可能
- 各タワーで、人口統計、行動ログ、テキスト/画像など多様な入力情報を活用
- 学習分離・並列処理構造により、大規模推薦問題に高速かつ柔軟に対応
実運用で直面する主な難しさ
- ホームバナーはライフサイクルが非常に短く(2〜3日、数時間単位の場合もある)、リアルタイム反映が必要
- フィードバック信号が主にクリックに依存するため、ユーザーの真の嗜好を判別しにくい
- バナーは商品・ブランドと異なり、定型化されたメタデータが不足しており、画像・テキストなどの文脈把握が難しい
- ストア別のデータ不均衡(専門館ごとのトラフィック・活性度の差)により、全体性能が低下する可能性がある
- 問題克服のため、表現力強化、鮮度維持、不均衡緩和という3つの技術軸を中心にシステムを再設計した
実質的な改善策
バナー特性の強化
- PinSAGE埋め込み平均利用の限界(複合バナー表現の限界、新規バナー推薦不可)を克服するためHGNNを導入
- ユーザーの行動パターンを基に、グラフ構造上のバナー-商品関係をGraphSAGEで埋め込み化
- テキスト・画像情報にはLLM埋め込みの組み合わせを使用
- リアルタイムのユーザー埋め込み更新とContinual Learningを導入し、最新のユーザー関心を反映
- CTR 8.3%向上
Continual Learning
- 全データの一括学習から脱却し、継続的アップデートを導入(1時間単位、直近3時間ログ)
- 活動量に応じて動的に学習率を調整(週次最大5倍、夜間2倍)
- 高速適応とモデル老朽化防止により、性能低下のない迅速な推薦反映を実現
- CTR 24%向上
戦略的なモデル選択
- ストア別の最適モデリング戦略を確定
- メインストアはDeepFM+Continual、専門館はTwo-Tower個別モデルで、CTR 19%向上
最終成果
- 従来のMAB比で**Two-Tower 11.2%、DeepFM 16.1%**のCTR改善
- MUSINSAホームにはDeepFM+Continual Learning、専門館にはTwo-Towerモデルを本番適用
今後の方向性
- リアルタイムサービングアーキテクチャへの移行、Multi-Task Learningの導入(CTR+GGMV)、埋め込み品質・グラフ構造の改善、成果指標の多角化などの高度化を推進
- 単一のCTRから脱却し、多様なビジネス目標の達成と質的体験まで評価するモデルへ進化させる計画
1件のコメント
良い文章ですね〜