19 ポイント 投稿者 darjeeling 2026-04-23 | 4件のコメント | WhatsAppで共有

recipes.vllm.ai が大幅に刷新されました。vLLM で「モデル X をハードウェア Y でどう動かす?」への答えをインタラクティブに得られます。

主な変更点

HuggingFace ミラーURLhuggingface.corecipes.vllm.ai に置き換えると、そのモデルのレシピへすぐ移動できます(例: recipes.vllm.ai/Qwen/Qwen3.6-35B-A3B

インタラクティブコマンドビルダー — ハードウェア、variant、並列化戦略を選ぶと、すぐ使える vllm serve コマンドを生成

プラグイン型ハードウェア — NVIDIA(Hopper/Blackwell)↔AMD(MI300X/MI355X) をワンクリックで切り替え、フラグ・環境変数を自動適用

JSON API — すべてのレシピを /.json パスで提供し、エージェント・自動化ツールからそのまま利用可能

エージェントスキルでレシピに貢献する

リポジトリにエージェントスキルが含まれており、新しいレシピを end-to-end で貢献できます。ベンチマーク実行からレシピ生成・PR提出まで、エージェントが案内します。

→ github.com/vllm-project/recipes

4件のコメント

 
hmmhmmhm 2026-04-23

もう少しすれば、どのデバイスでもワンクリックでデプロイできるようになるんでしょうか……すごいですね

 
darjeeling 2026-04-23

サービス向けのものは、これからは一通り揃ってきそうですね。

 
arthurk 2026-04-23

まだ対応していないモデルがかなり多いですね。

 
darjeeling 2026-04-23

ですので、貢献できる良い機会だと思います。