Microsoft AICI - Prompts as WASM Programs

xguru · 2024-03-14T10:36:01+09:00

AICI - Artificial Intelligence Controller Interface 大規模言語モデル（LLM）の出力をリアルタイムで制限・指示するコントローラーを構築できるコントローラーは、制約付きデコーディング、プロンプトおよび生成テキストの動的編集、並列生成間の調整が可能コントローラーは、トークンごとのデコーディング中にカスタムロジックを統合し、LLMリクエスト中に状態を保持する AICIの目的は、既存および新しいコントローラー戦略を容易に構築し、実験できるようにすること基盤となるLLM推論・提供エンジンの実装詳細を抽象化することで、コントローラー開発を簡素化し、高速なコントローラーをより容易に記述できるようにし、 LLM推論・提供エンジン間の互換性を容易に実現することを目指す AICIは、（最終的には）マルチテナントLLMデプロイを含め、ローカルおよびクラウド実行向けに設計されているコントローラーは、GPUがトークン生成で稼働している間にCPUを活用し、LLM推論エンジンと同じシステム上で実行される軽量なWebAssembly（Wasm）モジュールとして実装される AICIは推論スタックの一層として、Guidance、LMQLなどの制御ライブラリがその上で動作し、LLM推論・サービスエンジン全体にわたる移植性、効率性、性能向上のすべてを得られるよう設計されている AICIは柔軟性 : コントローラーは、Wasmにコンパイル可能なあらゆる言語（Rust, C, C++, ...）で記述するか、Wasm内でインタープリタ実行できる（Python, JavaScript, ...）セキュリティ : コントローラーはサンドボックス化されており、ファイルシステム、ネットワーク、その他のリソースにアクセスできない高速 : Wasmモジュールはネイティブコードにコンパイルされ、LLM推論エンジンと並列に実行されるため、生成プロセスに最小限のオーバーヘッドしか生じない Microsoft Researchが設計・制作したプロトタイプ

(github.com/microsoft)

5 ポイント投稿者 xguru 2024-03-14 | まだコメントはありません。 | WhatsAppで共有

AICI - Artificial Intelligence Controller Interface
大規模言語モデル（LLM）の出力をリアルタイムで制限・指示するコントローラーを構築できる
コントローラーは、制約付きデコーディング、プロンプトおよび生成テキストの動的編集、並列生成間の調整が可能
コントローラーは、トークンごとのデコーディング中にカスタムロジックを統合し、LLMリクエスト中に状態を保持する
AICIの目的は、既存および新しいコントローラー戦略を容易に構築し、実験できるようにすること
- 基盤となるLLM推論・提供エンジンの実装詳細を抽象化することで、
  - コントローラー開発を簡素化し、
  - 高速なコントローラーをより容易に記述できるようにし、
  - LLM推論・提供エンジン間の互換性を容易に実現することを目指す
AICIは、（最終的には）マルチテナントLLMデプロイを含め、ローカルおよびクラウド実行向けに設計されている
- コントローラーは、GPUがトークン生成で稼働している間にCPUを活用し、LLM推論エンジンと同じシステム上で実行される軽量なWebAssembly（Wasm）モジュールとして実装される
- AICIは推論スタックの一層として、Guidance、LMQLなどの制御ライブラリがその上で動作し、LLM推論・サービスエンジン全体にわたる移植性、効率性、性能向上のすべてを得られるよう設計されている
AICIは
- 柔軟性 : コントローラーは、Wasmにコンパイル可能なあらゆる言語（Rust, C, C++, ...）で記述するか、Wasm内でインタープリタ実行できる（Python, JavaScript, ...）
- セキュリティ : コントローラーはサンドボックス化されており、ファイルシステム、ネットワーク、その他のリソースにアクセスできない
- 高速 : Wasmモジュールはネイティブコードにコンパイルされ、LLM推論エンジンと並列に実行されるため、生成プロセスに最小限のオーバーヘッドしか生じない
Microsoft Researchが設計・制作したプロトタイプ

Microsoft AICI - Prompts as WASM Programs

関連記事

まだコメントはありません。