8 ポイント 投稿者 GN⁺ 2024-02-27 | 1件のコメント | WhatsAppで共有
  • Mistral Largeは最先端のテキスト生成モデルで、最高水準の推論能力を備える
  • 多様な言語で複雑な推論タスクを実行でき、テキスト理解、変換、コード生成に利用可能
  • MMLUベンチマークで強力な性能を示しており、API経由で一般提供されているモデルとしては世界で2番目に高い順位のモデル
    • GPT-4の86.4%に次ぐ81.2%、Claude 2は78.5%、Gemini Proは71.8%

Mistral Largeの新機能と強み

  • 英語、フランス語、スペイン語、ドイツ語、イタリア語にネイティブレベルで対応し、文法や文化的文脈についての繊細な理解を提供
  • 32Kトークンのコンテキストウィンドウにより、大規模な文書から正確な情報の想起が可能
  • 正確に指示へ従う機能により、開発者は独自のモデレーションポリシーを設計でき、これはle Chatのシステムレベルのモデレーション設定に使われている
  • 関数呼び出し機能を内蔵しており、la Plateformeで実装された制限付き出力モードとあわせて、アプリケーション開発や技術スタックのモダナイゼーションを大規模に可能にする

Microsoftとのパートナーシップを通じてAzureでモデルを提供

  • Mistralの目標は先進的なAIを普及させることであり、そのためにAzureでオープンモデルと商用モデルを提供
  • MistralのモデルはLa PlateformeとAzureを通じて利用でき、ユーザー環境へ直接デプロイすることも可能
  • La PlateformeはMistralの欧州インフラ上で安全にホスティングされ、AzureではAzure AI StudioとAzure Machine Learningを通じて提供される
  • セルフデプロイでは、最もセンシティブなユースケース向けにモデルの重みにアクセスでき、導入事例を読んだりチームに連絡したりして詳しい情報を得られる

Mistral Largeの能力

  • Mistral Largeは標準ベンチマークにおいて、先行するLLMモデルと比較して強力な推論能力を示す
  • 多言語性能でも、Mistral Largeはフランス語、ドイツ語、スペイン語、イタリア語でLLaMA 2 70Bを大きく上回る
  • コーディングや数学タスクでも最高レベルの性能を示す

新しいMistral Small、低レイテンシワークロードに最適化

  • Mistral Largeとあわせて、レイテンシとコストに最適化した新モデルMistral Smallをリリース
  • Mistral SmallはMixtral 8x7Bより高性能でレイテンシも低く、オープンウェイト提供とフラッグシップモデルの間を埋める洗練された中間ソリューション
  • Mistral SmallはMistral Largeと同じRAG有効化および関数呼び出しの革新を活用
  • 競争力のある価格のオープンウェイトエンドポイントと、新しい最適化モデルエンドポイントを提供し、性能/コストのトレードオフを包括的に見渡せる

JSON形式と関数呼び出し

  • JSON形式モードは、言語モデルの出力が有効なJSONになるよう強制する
  • 関数呼び出しにより、開発者は独自のツールセットとMistralエンドポイントを接続し、内部コード、API、データベースとのより複雑な相互作用を可能にする
  • 関数呼び出しとJSON形式はmistral-smallmistral-largeでのみ利用可能で、すべてのエンドポイント向けのフォーマット指定も近日追加予定

GN⁺の意見

  • Mistral Largeは、多言語対応と高度な推論能力を備えた人工知能言語モデルであり、多様な言語で複雑なタスクを実行できる点が特に注目に値する。
  • このモデルは既存のGPT-4のようなモデルと競争できる可能性を持ち、とくに多言語対応はグローバル市場での適用可能性を高める。
  • Azureとのパートナーシップは、Mistral AIのモデルがより広いユーザー基盤へ到達する機会を提供し、クラウドベースAIサービスの拡張性とアクセス性を強化する。
  • Mistral Smallのような最適化モデルの投入は、コスト効率が高く低レイテンシなAIソリューションを必要とする企業にとって魅力的な選択肢になり得る。
  • JSON形式と関数呼び出し機能は、開発者がAIモデルを自分たちのアプリケーションへより容易に統合できるようにし、AI技術の実用性と柔軟性を高める。

1件のコメント

 
GN⁺ 2024-02-27
Hacker Newsの意見
  • マーケティング資料の率直さを高く評価する。市場の先行製品より低いベンチマークスコアを示すのは、Googleがベンチマークを選択的に使うより良いと思う。

  • すでに多くのことをしてきたが、オープンソースコミュニティに貢献するという約束を改めて確認する内容があればよかったという意見。これが彼らのブランドの主要な部分だと思っていた。

  • miqu騒動以降、より多くのオープンウェイトが出てくることを期待して見ていたが、結果は待ってみる必要がありそうだ。

  • 変更点の更新: APIエンドポイント名の変更とモデルエンドポイントの追加、新しいモデルのリリース、既存モデルの更新および廃止予定の案内。

  • 新しいAPI機能: Mistral SmallとMistral Largeモデルで関数呼び出しとJSONモードが利用可能。

  • La Plateforme: 多通貨対応の決済システムを追加し、エンタープライズ向けプラットフォーム機能を導入。

  • Le Chat: Mistralモデルと簡単にやり取りできる新しいチャットインターフェースをリリース。

  • 新しいモデルをLLM CLIツール用プラグインに追加した。これで次のように使える。

  • Le Chatを使って今日発生したいくつかのコーディング問題を解いてみたが、ChatGPT(GPT-4を含む)よりはるかに良い回答を返した。ChatGPTの品質が一部の人々が言うようにコスト削減のために落ちたのかは定かではないが、このいくつかの問題についてはMistralの回答品質の方がはるかに優れていた。

  • Le Chatの存在を知らなかった。Mistralを使ったChatGPTの競合製品が欲しかったし、製品名の前に「le」を付けたのも気に入っている。

  • AzureではGPT-4よりMistralの方が少し安い。

  • オープンウェイトを巡るあらゆる騒ぎはすでに終わったのか、このままクローズドのままなのかという疑問。

  • パラメータサイズに関する情報がどこにもないが、これは意図的なのか、それとも見落としているのかという質問。

  • まるで複数の交換可能なCPUアーキテクチャが存在するようなものだ。新しいLLMが出るたびに独占が大きく弱まり、さらに良くなるという期待を抱かせる。オープンソースモデルがなくても、OpenAIはすでに彼らのミッションを達成したように見える。