19 ポイント 投稿者 darjeeling 6 일 전 | 4件のコメント | WhatsAppで共有

recipes.vllm.ai が大幅に刷新されました。vLLM で「モデル X をハードウェア Y でどう動かせばいい?」への答えをインタラクティブに得られます。

主な変更点

HuggingFace ミラー URLhuggingface.corecipes.vllm.ai に置き換えると、該当モデルのレシピへ直接移動できます(例: recipes.vllm.ai/Qwen/Qwen3.6-35B-A3B

インタラクティブなコマンドビルダー — ハードウェア、variant、並列化戦略を選ぶと、すぐ使える vllm serve コマンドを生成

プラグイン型ハードウェア — NVIDIA(Hopper/Blackwell)↔AMD(MI300X/MI355X) をワンクリックで切り替え、フラグ・環境変数を自動適用

JSON API — すべてのレシピを /.json パスで提供し、エージェント・自動化ツールからそのまま利用可能

エージェントスキルでレシピに貢献する

リポジトリにエージェントスキルが含まれており、新しいレシピを end-to-end で貢献できます。ベンチマーク実行からレシピ生成・PR 提出まで、エージェントが案内します。

→ github.com/vllm-project/recipes

4件のコメント

 
hmmhmmhm 6 일 전

もう少しすれば、どのデバイスでもワンクリックでデプロイできるようになるんでしょうか……すごいですね

 
darjeeling 6 일 전

サービス向けのものは、これからは一通り揃ってきそうですね。

 
arthurk 6 일 전

まだ対応していないモデルがかなり多いですね。

 
darjeeling 6 일 전

ですので、貢献できる良い機会だと思います。