- Forge は、企業が独自の 社内知識基盤AIモデル を構築できるようにするシステムであり、公開データ中心の既存モデルの限界を補完
- 社内文書、コードベース、運用データなどを活用して ドメイン特化モデル を学習し、事前学習・事後学習・強化学習の各段階をすべて支援
- モデル、データ、知識に対する 統制権と知的資産の保護 を維持できるため、規制産業でも活用可能
- カスタムモデル によって、企業向けエージェントが内部システムやポリシーを理解し、ツール利用や意思決定を正確に実行可能
- 多様なアーキテクチャと継続的な強化学習を支援し、エンタープライズAIの戦略的自律性 と長期的な改善可能性を高める
Forge概要
- Forge は、企業が 固有の知識とデータ を基に フロンティア級AIモデル を構築できるようにするシステム
- 従来の公開データベースモデルが一般的なタスクに最適化されているのに対し、Forge は企業内部の標準、ポリシー、コード、意思決定の記録など 組織固有の文脈 を反映
- これにより、AI が企業の 運用環境とワークフロー に合わせて動作することを支援
- Mistral AI はすでに ASML、Ericsson、European Space Agency、HTX Singapore などと協力し、この技術を適用中
組織知識基盤モデルの学習
- Forge は、社内文書、コードベース、構造化データ、運用記録など 大規模な社内データ でモデルを学習させる
- モデルはその環境における 用語、推論パターン、制約条件 を習得
- 学習段階は3つで構成
- 事前学習(pre-training): 社内データでドメイン認識モデルを構築
- 事後学習(post-training): 特定のタスクと環境に合わせてモデルを詳細調整
- 強化学習(reinforcement learning): 社内ポリシーと評価基準に合わせてモデルの振る舞いを整列させ、実環境での性能を向上
- これにより、組織知能を反映したモデル の開発が可能
統制と戦略的自律性
- Forge は、企業が モデルとデータに対する統制権 を維持できるよう設計
- モデルは社内データで学習され、社内ポリシー・評価基準・運用要件に従って管理可能
- 規制環境における コンプライアンスとガバナンス要件 を満たすことができる
- 自社インフラ内でモデルを運用することで 戦略的自律性 を確保
カスタムモデルと信頼性の高いエージェント
- 企業向けエージェントは単なる応答生成ではなく、内部システムの探索、ツール利用、ポリシーに基づく意思決定 を行う必要がある
- ドメイン学習モデルを基盤とするエージェントは、内部用語や手順を理解し、システム間の関係を把握
- ツール選択の精度向上、多段階ワークフローの安定性強化、社内ポリシーを反映した意思決定が可能
- 結果として、運用コンポーネントとしてのAIエージェント を実現可能
多様なモデルアーキテクチャをサポート
- Forge は Dense と Mixture-of-Experts(MoE) アーキテクチャの両方をサポート
- Dense モデルは汎用タスクに強みがあり、MoE は 低遅延とコスト効率 によって大規模モデルの運用が可能
- マルチモーダル入力 をサポートし、テキストや画像など多様なデータ形式を学習可能
エージェント中心の設計
- Forge は コードエージェント を主要ユーザーとして設計
- 例: Mistral Vibe のような自律エージェントが、モデルのファインチューニング、ハイパーパラメータ探索、タスクスケジューリング、合成データ生成を実行
- Forge は学習中に 評価指標のモニタリング を行い、性能低下を防止
- インフラ管理とデータパイプラインのレシピを含め、自然言語コマンドだけでモデルをカスタマイズ 可能
継続的改善と評価
- Forge は 継続的な適応学習 をサポート
- 強化学習パイプラインを通じて、社内フィードバックでモデルの振る舞いを改善
- 評価フレームワークにより、社内ベンチマーク、規制ルール、ドメイン別課題に対するテストが可能
- 結果として、静的デプロイではなく継続改善型のモデルライフサイクル を実現
エンタープライズ適用事例
- 政府機関: 多言語の政策文書と行政手続きの学習により、政策分析と公共サービスを支援
- 金融機関: 規制文書とリスク手順の学習により、内部ガバナンスの一貫性を確保
- ソフトウェアチーム: 社内コードベースの学習により、実装・デバッグ・レビューなど開発生産性を向上
- 製造業者: 設計仕様と保守データの学習により、診断と意思決定を支援
- 大企業: 社内知識システムを基盤とするエージェントにより、複雑なワークフロー支援と情報検索精度を向上
結論: 企業中心AIインフラへの転換
- AIモデルが 企業インフラの中核レイヤー として定着する中、組織知識のモデル化 が重要になっている
- Forge は、企業が自社データで学習・整列・評価可能なモデルを構築し、戦略資産へと発展 させる基盤を提供
- これにより、AI を外部ツールではなく 組織知識とともに進化する中核能力 へと転換できる
1件のコメント
Hacker Newsのコメント
Mistral は気に入っている。コストと EU 域内でのデータ保管のバランスが完璧だ。品質低下もほとんどない。
ただ、モデル名の体系があまりにもわかりにくい。たとえば Devstral 2 というモデルがあるが、Codestral でも Devestral でもない。
API には devstral-2512、devstral-latest、devstral-medium-latest など複数の名前がある。
devstral-latest が正しいのだろうと思ってサポートに問い合わせたら、12 時間後に「devstral 2 は devstral 2 です」として AI が生成した IntelliJ 設定ガイド が送られてきた。
問題は、そのガイドに出てくる画面が実際には存在しないことだ
devstral-2512、devstral-latest、devstral-medium-latest はすべて devstral 2 だ。
labs-devstral-small-2512 と devstral-small-latest は devstral small 2、
devstral-medium-2507 は devstral 1.0、devstral-small-2507 は devstral small 1.1 だ
企業ごとにカスタマイズしたワークフローを提供しようとしている方向に見える。
あるいは Google のように部署間の連携が取れていないだけかもしれない
モデル品質は低いが、ヨーロッパではそれが最善だ。
もちろん中国製モデルを欧州サーバーで動かすこともできるだろうが
Mistral を過小評価すべきではない。汎用 LLM サービス としてはかなり安価で、
巨大モデルではなく カスタムモデリング に注力する戦略は、最終的に報われる気がする。
特に規制の多い EU 環境では強みを持てる。
世の中はコード生成だけではない
ただしこれは 参入障壁の低い戦略 なので、簡単に模倣されうる。
ERP、CRM など製品ごとの事前学習モデルを多数そろえ、
顧客企業のカスタマイズデータを反映した後続モデルを販売できれば、それが本当の モート(moat) になる。
ひっそりと契約を取ることが重要だ
カスタムモデリングがその膨大な知識をどう置き換えられるのか疑問だ
データセットをアップロードするだけで、すぐにエンドポイントでモデルを使える。
制約はあるが、アクセス性を大きく高めている
ローカルでも動作するので、開発者が コントロール権 を維持できる
モデル品質は LLM の中でも最下位レベルだ
「事前学習(pre-training)」と「後続学習(post-training)」の意味が気になった。
実際には十分な クリーンなデータセット はないはずで、
彼らのいう事前学習が本当に基盤モデルの学習なのか、それとも SFT(教師あり微調整)なのか混乱する。
もしかすると内部データをもとに 合成データ を生成し、低解像度の知識蒸留をしているのかもしれない
目標は依然として次トークン予測なので、「continued pre-training」と呼ばれる。
後続学習は SFT、DPO、RL など、人間のフィードバックに基づくあらゆる工程だ
後続学習は RAG のようにプロンプトへデータを追加することだ
Forge の説明を見ると、企業内部の文書やコードベースでモデルを学習させ、
ドメイン知識を内在化するとしている。
だが自分は、知識の習得 にはファインチューニングより RAG のほうが有効だと思う。
ファインチューニングはモデルの「トーン」を変えるには向いているが、新しい知識を注入するのは難しい
自分は Mistral のアプローチを応援している。
巨大モデル競争ではなく、顧客ごとのエンジニアリング と EU 市場に集中する戦略は賢明だ
他のモデルは読者の理解レベルを過剰に気にするが、
Mistral は深く技術的な議論にもよくついてくる
最近の Mistral は本当に面白い試みをたくさんしている。
OpenAI や Anthropic と競争するのは難しいが、
製品設計の独創性 が際立っている。
個人的にはそこで働いてみたいと思うほどだ
Mistral は最近すばらしい機能をたくさん出している。
最前線のモデルではないが、小規模企業が自力でモデルを学習 するのは難しいことを考えると、
こうしたツールには大きな機会がある。
特に unsloth のようなツールと組み合わせれば、学習はずっと現実的に感じられる
実際、どれほど多くの企業向けユースケースで ファインチューニング が必要なのか気になる。
単に RAG で十分なのではないか?
ログ分析、ツール利用、ドメイン知識の反映などでネットワーク越しの LLM 呼び出しを減らせる
一方でファインチューニングは、モデルの 推論能力 そのものを向上させる
このアプローチが AI の収益構造に何を示唆しているのか興味深い。
GPU の台数は参入障壁にはならなさそうだ。
むしろ 専門的で独占的なデータ こそが本当のモートになる。
企業の内部データには代替不可能な知識が含まれている。
Mistral はまさにそこに賭けている
実質的には 35 億年の進化データ で訓練された存在とも言える
AI で収益を上げる最も賢い道だ。
MongoDB も VoyageAI を通じて
企業向け RAG とカスタムモデルのコンサルティング市場に参入している