- AI21 Labsが、Mambaアーキテクチャをベースにした世界初の本番運用レベルのAIモデル、Jambaを公開
- Jambaは、Mamba SSM(構造化状態空間モデル)と従来のトランスフォーマーアーキテクチャの強みを組み合わせ、印象的な性能と効率向上を実現
- 256Kトークンの広大なコンテキストウィンドウを備え、単一の80GB GPUで最大140Kトークンを処理
Jambaのハイブリッドアーキテクチャと性能
- Jambaは、ハイブリッドSSM-トランスフォーマーアーキテクチャを通じて、52Bパラメータのうち推論時には12Bのみを使用するMixture of Experts(MoE)レイヤーを活用
- MetaのLlama 2のような競合モデルよりもはるかに長いコンテキストを処理でき、高いスループットと効率を維持
- 長いコンテキストで3倍高いスループットを提供し、同規模のトランスフォーマーベースモデルよりも効率的
- ブロックおよびレイヤーのアプローチを特徴とし、各Jambaブロックは注意機構またはMambaレイヤーを含み、その後に多層パーセプトロン(MLP)が続く
- この構造では、全8レイヤーのうち1つがトランスフォーマーレイヤーとして使われる比率になっている
- さまざまなベンチマークで優れた結果を示し、同規模の最新モデルと比べて幅広いタスクで上回る、または同等の性能を達成
ライセンス
- JambaはApache 2.0ライセンスの下でオープンウェイトとして公開され、Hugging Faceで利用可能
- 現時点のJambaは商用利用に必要な安全対策なしの研究モデルとして公開されているが、AI21 Labsは今後数週間以内に、より安全なバージョンを公開する計画
1件のコメント
Hacker Newsのコメント