PayPal: リアルタイムのグラフデータベース分析で不正を防ぐ方法
(yozm.wishket.com)-
eコマース業界は新型コロナウイルス感染症により急成長した
-
デジタル決済が増えた分、決済不正も同様に増加した
-
PayPalはリアルタイムのグラフ分析で不正を防止している
-
リアルタイム計算は、ApacheのオープンソースグラフDSLフレームワーク「Gremlin」のおかげ
-
グラフ技術はeコマース業界における不正検知と予防に非常に効果的
eコマース業界は新型コロナウイルス感染症により急成長した
デジタル決済が増えた分、決済不正も同様に増加した
PayPalはリアルタイムのグラフ分析で不正を防止している
リアルタイム計算は、ApacheのオープンソースグラフDSLフレームワーク「Gremlin」のおかげ
グラフ技術はeコマース業界における不正検知と予防に非常に効果的
2件のコメント
久しぶりに目にするキーワードがあって、興味深く読みました。
Aerospike はオープンソース(APL)の Key-value storage です。In-memory や SSD での最適化された動作に特化しており、非常に高性能です。ただし、クラスターの規模やキー、値のサイズなどに制約があるため、導入時には検討が必要だと認識しています。
Key-Value storage の上にクエリレイヤーを載せる、ここでは Gremlin を載せた構成ですが、合理的なアーキテクチャだと思います。グラフクエリレイヤーを最初から作るのは簡単ではありません。
ただ、物理構成に関する説明が不足しているのは残念ですね。グラフデータベースはクエリが非常に複雑なため、データノードとクエリノードが分離されたり、scale-out したりすると性能が急激に低下します。複雑なクエリのために中間ノードに計算用の一時データが大量に蓄積され、メモリ不足が起こりやすくなり、QPS が低下します。
この問題を Scale-up で解決したのか、Scale-Out で解決したのかが気になりますが、Scale-out したのであれば、その過程をもう少し詳しく記述してくれていたらよかったのに、という惜しさが残ります。
Gremlin や Titan のようなものを見てからもう 8 年は経った気がしますが、グラフデータベース分野は思ったより発展のスピードが速くないようです。
本文が少し難しくて理解しづらかったのですが、コメントを見て少し理解しやすくなりました。ありがとうございます。