韓国語に最も強いRAG埋め込みモデル BGE-M3 をゼロから実装する

(blog.sionic.ai)

22 ポイント投稿者 sigridjineth 2025-01-06 | 4件のコメント | WhatsAppで共有

韓国語に最も強いRAG専用の埋め込みモデルである BGE-M3 を、Huggingface が提供する Python 実装を超えて、TensorFlow/Keras を使い、エンタープライズ環境で大規模サービングが可能な形で再実装してみるブログ記事です。

エンタープライズサービング対応

Java/Scala ベースの Hadoop-Spark 環境で大規模分散処理が可能
Kotlin/Spring Boot による高性能サーバー実装
TensorFlow Serving による大規模プロダクション環境対応
TensorFlow Lite によるモバイル/組み込み環境対応

モデル構造の単純化

Dense Layer と LayerNorm のみで中核構造を実装
複雑な Python 依存関係を除去
軽量化された構造で高いスループットを確保

実装の特徴

Word/Position/Token Type 埋め込みを基本的な Dense Layer で実装
24 個の Transformer ブロックを純粋な TensorFlow 演算で構成
Multi-Head Self-Attention をカスタム実装して性能を最適化

実際の活用事例

大規模 Hadoop 環境での分散埋め込み処理
Spring Boot ベースの連合学習および RAG サービス
Apple Neural Engine を活用したモバイル推論
エンタープライズ級の TensorFlow Serving デプロイ

記事で説明する実装方式の特徴は、Python 依存を排除し、TensorFlow のネイティブ機能だけを活用することで、大規模なエンタープライズ環境でも安定したサービス提供を可能にしている点です。

4件のコメント

sigridjineth 2025-01-07

https://github.com/sionic-ai/BGE-M3-Model-Converter
コード全体を公開しました。

aer0700 2025-01-07

記事自体はそれほど難しくないのですが、説明に添付されたコードがやや不完全なので、その方式で実装された完全なコード全体が共有されていると、より良いと思います。

sigridjineth 2025-01-07

https://github.com/sionic-ai/BGE-M3-Model-Converter
全コードを公開しました。

aer0700 2025-01-09

ありがとうございます
ゆっくりもう一度見てみます（笑）