DeepSeek推論エンジンのオープンソース化への道のり
(github.com/deepseek-ai)- DeepSeekチームが社内の推論エンジン(DeepSeek Inference Engine)をオープンソースに還元するための計画を公開
- 既存の推論エンジンはvLLMベースで、DeepSeek-V3およびR1モデルのデプロイ需要の増加に伴い、共有を検討中
- 既存コードやインフラ依存、保守負担などにより全面公開は難しく、その代わりにモジュール化と機能単位での貢献方式へと方向転換
- 今後はオープンソースコミュニティと緊密に連携し、性能最適化と再利用可能な機能を共有する計画
- DeepSeekは推論最適化およびモデル公開時のコミュニティとのDay-0サポート同期に積極的に取り組む方針
DeepSeek推論エンジンのオープンソース化への道のり
Open Source Weekの反応とその後の貢献
- 最近実施されたOpen Source Weekで、複数のライブラリをオープンソースとして公開
- コミュニティからの好意的な反応の中で、協業、議論、バグ修正などが活発に行われた
- これをきっかけに、DeepSeek社内の推論エンジンをオープンソースとして共有することを決定
基盤技術
- DeepSeekの学習フレームワークはPyTorchベース
- 推論エンジンはvLLMプロジェクトの初期フォークをベースに開発されており、DeepSeekモデル向けに特化した多くのカスタマイズを含む
オープンソースとして全面公開するうえでの現実的な制約
- コードベースの差異: 1年以上前のvLLMフォークから始まっており、構造は似ているが大幅に変更されている
- 社内インフラへの依存: クラスタ管理ツールなどDeepSeek独自のインフラと強く結びついており、外部での活用が難しい
- 保守リソースの不足: 小規模な研究チームとして、大規模なオープンソースプロジェクトを継続的に管理する余力が不足
代替案: 既存のオープンソースプロジェクトとの協業
今後は次の方向で貢献する予定:
- モジュール化された機能の抽出: 独立したライブラリとして再利用可能なコンポーネントに分けて貢献
- 性能最適化の共有: 社内実装における性能改善点や設計アイデアを既存のオープンソースプロジェクトに反映
コミュニティへの感謝とビジョン
- オープンソースコミュニティの存在がなければ、AGI開発の進展は不可能だっただろう
- OS、言語、MLフレームワーク、推論エンジンなど、AIイノベーションの基盤はオープンソースエコシステム
- DeepSeekはコミュニティとの協調を通じて、AGIの恩恵が人類全体に貢献できるよう継続的に努力していく
> [!NOTE]
> この記事はDeepSeek Inference Engineコードベースのオープンソース化戦略に関する案内です。
> 今後のモデル公開に関連して、DeepSeekはオープンソースコミュニティおよびハードウェアパートナーとの協業を引き続き拡大していく予定です。
> 特にモデル公開前に、推論関連技術を事前共有して整合を図ることで、多様なハードウェア環境でDay-0からSOTAサポートが可能になるようエコシステムを調整していく方針です。
1件のコメント
Hacker Newsの意見
3月にvLLMがDeepSeek論文の改善点を適用し、vLLM v0.7.3のDeepSeek性能が約3倍以上向上
コードベースの分岐点に共感する
商用AI企業が研究成果やノウハウを共有する動機
「オープンソースコミュニティにとって面白いものはあるが、社外で動かせるようにするにはかなり整理が必要で、リリース後に適切に保守する人員もいない」
DeepSeekの優れたエンジニアリングを見た
中国が米国の支配に対抗するため、オープンソースのAIツールやモデルなどを大量に公開する戦略なのか気になる
tl;dr 「vLLMフォークは保守不可能になり、これからは公開の場で再構築する予定」
検閲を実装する一つの方法のように感じる