7 ポイント 投稿者 bluearisu 2022-01-20 | 2件のコメント | WhatsAppで共有
  • eコマース業界は新型コロナウイルス感染症により急成長した

  • デジタル決済が増えた分、決済不正も同様に増加した

  • PayPalはリアルタイムのグラフ分析で不正を防止している

  • リアルタイム計算は、ApacheのオープンソースグラフDSLフレームワーク「Gremlin」のおかげ

  • グラフ技術はeコマース業界における不正検知と予防に非常に効果的

2件のコメント

 
kwangyeol 2022-01-20

久しぶりに目にするキーワードがあって、興味深く読みました。

Aerospike はオープンソース(APL)の Key-value storage です。In-memory や SSD での最適化された動作に特化しており、非常に高性能です。ただし、クラスターの規模やキー、値のサイズなどに制約があるため、導入時には検討が必要だと認識しています。

Key-Value storage の上にクエリレイヤーを載せる、ここでは Gremlin を載せた構成ですが、合理的なアーキテクチャだと思います。グラフクエリレイヤーを最初から作るのは簡単ではありません。

ただ、物理構成に関する説明が不足しているのは残念ですね。グラフデータベースはクエリが非常に複雑なため、データノードとクエリノードが分離されたり、scale-out したりすると性能が急激に低下します。複雑なクエリのために中間ノードに計算用の一時データが大量に蓄積され、メモリ不足が起こりやすくなり、QPS が低下します。

この問題を Scale-up で解決したのか、Scale-Out で解決したのかが気になりますが、Scale-out したのであれば、その過程をもう少し詳しく記述してくれていたらよかったのに、という惜しさが残ります。

Gremlin や Titan のようなものを見てからもう 8 年は経った気がしますが、グラフデータベース分野は思ったより発展のスピードが速くないようです。

 
bluearisu 2022-01-21

本文が少し難しくて理解しづらかったのですが、コメントを見て少し理解しやすくなりました。ありがとうございます。