8 ポイント 投稿者 GN⁺ 2025-04-15 | 1件のコメント | WhatsAppで共有
  • DeepSeekチームが社内の推論エンジン(DeepSeek Inference Engine)をオープンソースに還元するための計画を公開
  • 既存の推論エンジンはvLLMベースで、DeepSeek-V3およびR1モデルのデプロイ需要の増加に伴い、共有を検討中
  • 既存コードやインフラ依存、保守負担などにより全面公開は難しく、その代わりにモジュール化と機能単位での貢献方式へと方向転換
  • 今後はオープンソースコミュニティと緊密に連携し、性能最適化と再利用可能な機能を共有する計画
  • DeepSeekは推論最適化およびモデル公開時のコミュニティとのDay-0サポート同期に積極的に取り組む方針

DeepSeek推論エンジンのオープンソース化への道のり

Open Source Weekの反応とその後の貢献

  • 最近実施されたOpen Source Weekで、複数のライブラリをオープンソースとして公開
  • コミュニティからの好意的な反応の中で、協業、議論、バグ修正などが活発に行われた
  • これをきっかけに、DeepSeek社内の推論エンジンをオープンソースとして共有することを決定

基盤技術

  • DeepSeekの学習フレームワークはPyTorchベース
  • 推論エンジンはvLLMプロジェクトの初期フォークをベースに開発されており、DeepSeekモデル向けに特化した多くのカスタマイズを含む

オープンソースとして全面公開するうえでの現実的な制約

  • コードベースの差異: 1年以上前のvLLMフォークから始まっており、構造は似ているが大幅に変更されている
  • 社内インフラへの依存: クラスタ管理ツールなどDeepSeek独自のインフラと強く結びついており、外部での活用が難しい
  • 保守リソースの不足: 小規模な研究チームとして、大規模なオープンソースプロジェクトを継続的に管理する余力が不足

代替案: 既存のオープンソースプロジェクトとの協業

今後は次の方向で貢献する予定:

  • モジュール化された機能の抽出: 独立したライブラリとして再利用可能なコンポーネントに分けて貢献
  • 性能最適化の共有: 社内実装における性能改善点や設計アイデアを既存のオープンソースプロジェクトに反映

コミュニティへの感謝とビジョン

  • オープンソースコミュニティの存在がなければ、AGI開発の進展は不可能だっただろう
  • OS、言語、MLフレームワーク、推論エンジンなど、AIイノベーションの基盤はオープンソースエコシステム
  • DeepSeekはコミュニティとの協調を通じて、AGIの恩恵が人類全体に貢献できるよう継続的に努力していく

> [!NOTE]
> この記事はDeepSeek Inference Engineコードベースのオープンソース化戦略に関する案内です。
> 今後のモデル公開に関連して、DeepSeekはオープンソースコミュニティおよびハードウェアパートナーとの協業を引き続き拡大していく予定です。
> 特にモデル公開前に、推論関連技術を事前共有して整合を図ることで、多様なハードウェア環境でDay-0からSOTAサポートが可能になるようエコシステムを調整していく方針です。

1件のコメント

 
GN⁺ 2025-04-15
Hacker Newsの意見
  • 3月にvLLMがDeepSeek論文の改善点を適用し、vLLM v0.7.3のDeepSeek性能が約3倍以上向上

    • それでもなお改善の余地は大きい
    • vLLMを使って、ShareGPTデータセットで毎秒5Kトークン、ランダム 2000/100で毎秒12Kトークンをベンチマークした
    • DeepSeek-V3/R1推論システム概要によると、各H800ノードはプリフィル時に平均73.7kトークン/秒の入力(キャッシュヒットを含む)、またはデコード時に14.8kトークン/秒の出力を提供する
    • DeepSeekは異なる推論アーキテクチャを展開しているが、これは改善の余地が大きいことを示している
    • さらなるオープンソース化に期待
  • コードベースの分岐点に共感する

    • vLLMの初期フォークをベースにDeepSeekモデル向けにカスタマイズすると、拡張が難しくなる
    • 保守可能なサブライブラリを切り出し、情報を直接共有するアプローチは、コミュニティと協力するうえで良いやり方
    • 障害はあるが、貢献しない安易な道を選ばなかった
    • 技術に関する情報だけを共有するほうがよいのかもしれないが、それでも知識共有ではある
    • 彼らがそれをしないほうが、むしろ簡単だったはず
    • 彼らに賛辞を送る
  • 商用AI企業が研究成果やノウハウを共有する動機

    • GoogleがTransformerアーキテクチャを公開した理由
    • 人類のために良いことをしたい、進歩を促進したいと考えているのかもしれない
    • 商業的利益に反する行動を企業経営陣がどうして取れるのか疑問
    • 情報や知的財産の共有を促進する商業的ロジックがあるのか気になる
  • 「オープンソースコミュニティにとって面白いものはあるが、社外で動かせるようにするにはかなり整理が必要で、リリース後に適切に保守する人員もいない」

    • 多くの会社がこの立場にある
    • 「私たちはこれを保守しませんが、自由にフォークしてください」というメモ付きでオープンソース化してほしい
  • DeepSeekの優れたエンジニアリングを見た

    • 今後も続いてほしい
  • 中国が米国の支配に対抗するため、オープンソースのAIツールやモデルなどを大量に公開する戦略なのか気になる

    • 市場にとって良いことだと思う
  • tl;dr 「vLLMフォークは保守不可能になり、これからは公開の場で再構築する予定」

  • 検閲を実装する一つの方法のように感じる