22 ポイント 投稿者 sigridjineth 2025-01-06 | 4件のコメント | WhatsAppで共有

韓国語に最も強いRAG専用の埋め込みモデルである BGE-M3 を、Huggingface が提供する Python 実装を超えて、TensorFlow/Keras を使い、エンタープライズ環境で大規模サービングが可能な形で再実装してみるブログ記事です。

  1. エンタープライズサービング対応
  • Java/Scala ベースの Hadoop-Spark 環境で大規模分散処理が可能
  • Kotlin/Spring Boot による高性能サーバー実装
  • TensorFlow Serving による大規模プロダクション環境対応
  • TensorFlow Lite によるモバイル/組み込み環境対応
  1. モデル構造の単純化
  • Dense Layer と LayerNorm のみで中核構造を実装
  • 複雑な Python 依存関係を除去
  • 軽量化された構造で高いスループットを確保
  1. 実装の特徴
  • Word/Position/Token Type 埋め込みを基本的な Dense Layer で実装
  • 24 個の Transformer ブロックを純粋な TensorFlow 演算で構成
  • Multi-Head Self-Attention をカスタム実装して性能を最適化
  1. 実際の活用事例
  • 大規模 Hadoop 環境での分散埋め込み処理
  • Spring Boot ベースの連合学習および RAG サービス
  • Apple Neural Engine を活用したモバイル推論
  • エンタープライズ級の TensorFlow Serving デプロイ

記事で説明する実装方式の特徴は、Python 依存を排除し、TensorFlow のネイティブ機能だけを活用することで、大規模なエンタープライズ環境でも安定したサービス提供を可能にしている点です。

4件のコメント

 
sigridjineth 2025-01-07

https://github.com/sionic-ai/BGE-M3-Model-Converter
コード全体を公開しました。

 
aer0700 2025-01-07

記事自体はそれほど難しくないのですが、説明に添付されたコードがやや不完全なので、その方式で実装された完全なコード全体が共有されていると、より良いと思います。

 
sigridjineth 2025-01-07

https://github.com/sionic-ai/BGE-M3-Model-Converter
全コードを公開しました。

 
aer0700 2025-01-09

ありがとうございます
ゆっくりもう一度見てみます(笑)