DeepSeek V4、フロンティアにほぼ到達しつつ価格は一部水準
(simonwillison.net)- DeepSeekがV4シリーズ初のモデルとして DeepSeek-V4-Pro と DeepSeek-V4-Flash のプレビューモデルを公開した。両モデルとも100万トークンのコンテキストをサポートするMixture of Expertsモデルで、MITライセンスで提供される
- DeepSeek-V4-Pro は総計1.6Tパラメータ、アクティブ49Bパラメータを持つモデルで、Kimi K2.6、GLM-5.1、DeepSeek V3.2を上回る新たな最大級のオープンウェイトモデルとみられる
- DeepSeek V4の中核的な差別化要因は 価格 で、Flashは入力100万トークンあたり$0.14・出力$0.28、Proは入力$1.74・出力$3.48と、比較対象の小型・大型モデルより低価格に設定されている
- この低価格は 長文コンテキストの効率化 と結びついており、100万トークンコンテキストでProはDeepSeek-V3.2比で単一トークンFLOPs 27%・KVキャッシュ10%、FlashはFLOPs 10%・KVキャッシュ7%の水準まで削減されている
- 独自ベンチマークではDeepSeek-V4-Proはフロンティアモデルと競争可能だが、GPT-5.4やGemini-3.1-Proよりはやや低く、最先端フロンティアモデルに対して約 3〜6か月 遅れた開発軌道を示している
モデル公開と基本仕様
- DeepSeekが2025年12月の V3.2とV3.2 Speciale に続き、V4シリーズ初のモデルとして DeepSeek-V4-Pro と DeepSeek-V4-Flash の プレビューモデル 2種を公開した
- 両モデルとも 100万トークンコンテキスト をサポートするMixture of Expertsモデルで、標準的なMITライセンスを採用している
- DeepSeek-V4-Proは総計 1.6Tパラメータ、アクティブ49Bパラメータを持つモデルで、DeepSeek-V4-Flashは総計284Bパラメータ、アクティブ13Bパラメータを持つモデルである
- DeepSeek-V4-ProはKimi K2.6の1.1T、GLM-5.1の754B、DeepSeek V3.2の685Bより大きく、新たな最大級のオープンウェイトモデルとみられる
- Hugging Face基準のモデルサイズはProが 865GB、Flashが 160GB で、軽く量子化したFlashは128GB M5 MacBook Proで動作できる可能性があると期待されている
- Proモデルも必要なアクティブ専門家(expert)だけをディスクからストリーミングできれば、同じマシンで動作する可能性がある
-
OpenRouterによる簡単なテスト
- OpenRouter と llm-openrouter を使い、次のコマンドでモデルを呼び出した
-
llm install llm-openrouter llm openrouter refresh llm -m openrouter/deepseek/deepseek-v4-pro 'Generate an SVG of a pelican riding a bicycle' - 生成結果として DeepSeek-V4-FlashのペリカンSVG と DeepSeek-V4-ProのペリカンSVG が公開されている
- 比較対象として 2025年12月の DeepSeek V3.2、2025年8月の V3.1、2025年3月の V3-0324 に同じプロンプトを与えた結果もあわせて示されている
価格、効率、性能ポジション
- DeepSeek V4で最も際立つ要素は 価格 であり、DeepSeekの価格ページ によるとFlashは入力100万トークンあたり$0.14、出力100万トークンあたり$0.28である
- Proは入力100万トークンあたり $1.74、出力100万トークンあたり $3.48 に設定されている
- 比較表ではDeepSeek V4 FlashはGPT-5.4 Nanoの入力$0.20・出力$1.25、Gemini 3.1 Flash-Liteの入力$0.25・出力$1.50より低く、小型モデルの中で最も安価である
- DeepSeek V4 ProはGemini 3.1 Proの入力$2・出力$12、GPT-5.4の入力$2.50・出力$15、Claude Sonnet 4.6の入力$3・出力$15、Claude Opus 4.7の入力$5・出力$25、GPT-5.5の入力$5・出力$30より低く、大型フロンティアモデルの中で最も安価である
-
効率化が低価格を支えている
- DeepSeek論文 では、今回のリリースで長文コンテキストのプロンプト効率に大きく注力したと説明している
- 100万トークンコンテキストでは、DeepSeek-V4-ProはDeepSeek-V3.2比で単一トークンFLOPsが 27%、KVキャッシュサイズが 10% にとどまる
- 同条件でDeepSeek-V4-FlashはDeepSeek-V3.2比で単一トークンFLOPsが 10%、KVキャッシュサイズが 7% まで低下している
-
ベンチマーク上はフロンティアに近いが最上位には届かない
- DeepSeekの 自己報告ベンチマーク は、Proモデルが他のフロンティアモデルと競争可能であるという結果を示している
- 論文によると、推論トークン拡張を適用したDeepSeek-V4-Pro-Maxは標準的な推論ベンチマークでGPT-5.2とGemini-3.0-Proを上回る性能を示す
- ただしGPT-5.4とGemini-3.1-Proよりはやや低く、最先端フロンティアモデルに対して約 3〜6か月 遅れた開発軌道を示している
- huggingface.co/unsloth/models でUnslothの量子化版公開が期待されており、Flashモデルがローカルマシンでどの程度うまく動作するかが注目点として残っている
まだコメントはありません。