- Mistralが、画像とテキストの両方を処理できる初のモデルである Pixtral 12B を公開
- Mistralのテキストモデル Nemo 12B をベースに構築
- URL または base64 でエンコードされた画像を通じて、任意の数とサイズの画像に関する質問に回答可能
- Anthropic の Claude ファミリーや OpenAI の GPT-4 など、他のマルチモーダルモデルと同様に、画像キャプション生成や写真内の物体数カウントなどのタスクを実行できるとみられる
- GitHub および Hugging Face で、トレントリンク経由でダウンロード可能
- Apache 2.0 ライセンスに基づき、制限なくダウンロード、ファインチューニング、利用が可能
- 現時点ではWebデモは動作していないが、MistralのチャットボットおよびAPIサービスプラットフォームである Le Chat と Le Plateforme で近日中にテスト可能になる予定
- 最近Mistralは、General Catalyst 主導の6億4,500万ドル規模の資金調達ラウンドを完了し、企業価値60億ドルの評価を受けた
- 設立から1年あまりの Mistral には Microsoft が少数株式を保有しており、欧州の OpenAI と見なされている
- 無料の「オープン」モデルを公開し、マネージド版に課金し、企業顧客にコンサルティングサービスを提供する戦略を取っている
まだコメントはありません。