11 ポイント 投稿者 xguru 2024-12-01 | まだコメントはありません。 | WhatsAppで共有
  • ストリーム処理 / バッチ処理 / 高性能演算(AI)ワークロードを統合処理するフレームワークを目指す
  • 現在、Spark SQL と Spark DataFrame API に対する Drop-in 代替ソリューションを提供(互換)
  • 単一マシンまたは分散構成で動作可能
  • TPC-H ベンチマーク基準で Spark 比 4倍高速、ハードウェアコストを 94% 削減し、コード変更は不要
  • Python パッケージとして利用可能 pip install "pysail==0.2.0.dev0"
  • 技術スタック
    • Rust ベースのエンジンで、Apache Arrow と Apache DataFusion の上に構築
    • Spark Connect プロトコルを使用して Spark セッションが Sail サーバーと通信

まだコメントはありません。

まだコメントはありません。