Amazon、J.P.モルガン、Anthemが合成データを開発・活用する方法
(blog.naver.com)1.Amazon「Alexa」
- AlexaのAIチームは2019年に合成データ生成ツールを開発
- これらのツールは、AmazonのAIアシスタント「Alexa」をヒンディー語、米国で使われるスペイン語、ブラジルで使われるポルトガル語版として提供するのに用いられた
- Amazonでは、信頼できる自然言語理解モデルを学習させるうえで、データが不十分なことがあった
- これを補うために合成データを作ることにした
- Amazonの合成データ生成ツールの1つは「文法誘導」という技術を使用
- これは少数の参照コマンドを分析し、一般的な構文と意味形式(パターン)を学習する
- その形式から、新しく似た文を数千件生成する
- 別のツールは、利用可能なデータの事例から単語や句を再結合して新しい文を作る
2.Amazon「Just Walk Out」技術
- Amazonは「Just Walk Out(JWO)」技術を高度化する際にも合成データを活用
- これは、顧客が入口でクレジットカードやアプリをスキャンした後、店内に入り、自分が欲しい商品を持って出ると決済が自動で行われる技術で、キャッシュレス店舗「Amazon Go」の運営技術としても有名
- JWO技術にはディープラーニング技術、コンピュータビジョン技術、センサー融合が集約されている
- これは店舗で「誰が何を持っていったか」を確認する
- Amazonでは、AIモデルがより高い精度を保証するには多様な学習データが必要だと判断し、合成データでこれを補うことにした
- JWO技術に関連しては、現実的な買い物シナリオのさまざまな変形を模倣した合成データセットを構築
- 例えばAmazonは、店舗で一度に多くの顧客を処理できるよう保証するため、合成データを活用して多数の合成キャラクターを生成
- また店舗規模を拡大する前に、合成データを使って試験用により大きな食料品店の仮想モデルも作成
3.J.P.モルガン
- J.P.モルガンではAIリサーチチームが金融関連の合成データを生成
- マネーロンダリング防止の行動、顧客の移動履歴、市場執行データ、不正検知のための決済データを合成データセットとして開発
- J.P.モルガンは「金融サービス業界では有用なデータが多く生まれるが、それを利用するのはしばしば難しかった」としている
- 彼らは、データに依存する新しい商品やサービスを革新し構築する手段として合成データに注目
- 金融サービスにおける研究とモデル開発を加速させるために合成データセットを作成
4.Anthem
- 米国の健康保険企業Anthemは、合成データプラットフォームを開発するためGoogle Cloudと協業中
- 同社はアルゴリズムと統計モデルを使って、約1.5〜2ペタバイト規模の合成データを生成する計画
- このデータには、病歴、医療保険金請求、その他の中核的な医療データを人工的に作成したデータセットが含まれる
- 合成データは、不正な保険金請求や人々の健康記録における異常を確認するAIアルゴリズムを検証し、学習させるために使われる予定
- Anthemは、不正をより適切に検知し、会員にパーソナライズされたケアを提供する合成データプラットフォームを構築する計画
1件のコメント
Synthetic dataを「合成データ」と訳したようですね。私は「人工データ」のほうがより適切だと思います。