vLLM Recipes刷新 - モデル+ハードウェアの組み合わせ別設定をワンクリックで
(recipes.vllm.ai)recipes.vllm.ai が大幅に刷新されました。vLLM で「モデル X をハードウェア Y でどう動かせばいい?」への答えをインタラクティブに得られます。
主な変更点
HuggingFace ミラー URL — huggingface.co を recipes.vllm.ai に置き換えると、該当モデルのレシピへ直接移動できます(例: recipes.vllm.ai/Qwen/Qwen3.6-35B-A3B)
インタラクティブなコマンドビルダー — ハードウェア、variant、並列化戦略を選ぶと、すぐ使える vllm serve コマンドを生成
プラグイン型ハードウェア — NVIDIA(Hopper/Blackwell)↔AMD(MI300X/MI355X) をワンクリックで切り替え、フラグ・環境変数を自動適用
JSON API — すべてのレシピを /.json パスで提供し、エージェント・自動化ツールからそのまま利用可能
エージェントスキルでレシピに貢献する
リポジトリにエージェントスキルが含まれており、新しいレシピを end-to-end で貢献できます。ベンチマーク実行からレシピ生成・PR 提出まで、エージェントが案内します。
→ github.com/vllm-project/recipes
4件のコメント
もう少しすれば、どのデバイスでもワンクリックでデプロイできるようになるんでしょうか……すごいですね
サービス向けのものは、これからは一通り揃ってきそうですね。
まだ対応していないモデルがかなり多いですね。
ですので、貢献できる良い機会だと思います。