Mistral、初のマルチモーダルモデル Pixtral 12B を公開

xguru · 2024-09-13T11:03:02+09:00

Mistralが、画像とテキストの両方を処理できる初のモデルである Pixtral 12B を公開 120億パラメータを持つ、約24GBのモデル Mistralのテキストモデル Nemo 12B をベースに構築 URL または base64 でエンコードされた画像を通じて、任意の数とサイズの画像に関する質問に回答可能 Anthropic の Claude ファミリーや OpenAI の GPT-4 など、他のマルチモーダルモデルと同様に、画像キャプション生成や写真内の物体数カウントなどのタスクを実行できるとみられる GitHub および Hugging Face で、トレントリンク経由でダウンロード可能 Apache 2.0 ライセンスに基づき、制限なくダウンロード、ファインチューニング、利用が可能現時点ではWebデモは動作していないが、MistralのチャットボットおよびAPIサービスプラットフォームである Le Chat と Le Plateforme で近日中にテスト可能になる予定最近Mistralは、General Catalyst 主導の6億4,500万ドル規模の資金調達ラウンドを完了し、企業価値60億ドルの評価を受けた設立から1年あまりの Mistral には Microsoft が少数株式を保有しており、欧州の OpenAI と見なされている無料の「オープン」モデルを公開し、マネージド版に課金し、企業顧客にコンサルティングサービスを提供する戦略を取っている

(techcrunch.com)

5 ポイント投稿者 xguru 2024-09-13 | まだコメントはありません。 | WhatsAppで共有

Mistralが、画像とテキストの両方を処理できる初のモデルである Pixtral 12B を公開
- 120億パラメータを持つ、約24GBのモデル
Mistralのテキストモデル Nemo 12B をベースに構築
- URL または base64 でエンコードされた画像を通じて、任意の数とサイズの画像に関する質問に回答可能
- Anthropic の Claude ファミリーや OpenAI の GPT-4 など、他のマルチモーダルモデルと同様に、画像キャプション生成や写真内の物体数カウントなどのタスクを実行できるとみられる
GitHub および Hugging Face で、トレントリンク経由でダウンロード可能
Apache 2.0 ライセンスに基づき、制限なくダウンロード、ファインチューニング、利用が可能
現時点ではWebデモは動作していないが、MistralのチャットボットおよびAPIサービスプラットフォームである Le Chat と Le Plateforme で近日中にテスト可能になる予定
最近Mistralは、General Catalyst 主導の6億4,500万ドル規模の資金調達ラウンドを完了し、企業価値60億ドルの評価を受けた
- 設立から1年あまりの Mistral には Microsoft が少数株式を保有しており、欧州の OpenAI と見なされている
- 無料の「オープン」モデルを公開し、マネージド版に課金し、企業顧客にコンサルティングサービスを提供する戦略を取っている

Mistral、初のマルチモーダルモデル Pixtral 12B を公開

関連記事

まだコメントはありません。