1 ポイント 投稿者 recast7838 4 시간 전 | 1件のコメント | WhatsAppで共有

Moonshot AIが、従来モデルと比べてコーディング性能を大幅に向上させ、推論トークン消費量を30%削減した、エージェント中心のオープンウェイトなコーディングモデル「Kimi K2.7-Code」をリリースしました。


全文翻訳

今週、Moonshot AIがKimi K2.7-Codeをリリースしました。これはコーディングに特化したエージェント中心のモデルです。モデルウェイトは修正MITライセンスに従ってHugging Faceで配布されます。また、Kimi APIとKimi Codeからも利用できます。K2.7-Codeは一般的な対話ではなく、長期的なソフトウェアエンジニアリング作業を対象としています。このモデルは複数段階にわたって計画を立て、コードを修正し、ツールを実行し、デバッグを行います。Moonshot AIはこのモデルをサブスクリプション型のコーディングプラットフォームと組み合わせて提供しています。

Kimi K2.7-Codeの仕様

K2.7-CodeはMixture-of-Experts(MoE)モデルです。合計1兆(1T)個のパラメータを持ち、トークンごとに320億(32B)個のパラメータが有効化されます。この構造では、合計384のエキスパートのうちトークンごとに8つのエキスパートが選択され、1つのエキスパートが共有される方式を採用しています。Denseレイヤー1層を含め、合計61層で構成されています。

アテンション機構にはMLAが使われ、フィードフォワード経路にはSwiGLUが適用されています。MoonViTビジョンエンコーダは、画像および動画入力のために4億(400M)個のパラメータを追加します。このモデルはネイティブINT4量子化が適用された状態で提供されます。コンテキストウィンドウは256Kトークン(262,144)です。制約は2つあります。Thinking modeは必須であり、これを無効にするとAPIエラーが返されます。サンプリングパラメータはtemperature 1.0、top_p 0.95、n 1、ペナルティ 0.0に固定されています。デフォルトの最大出力は32,768トークンです。vLLM、SGLang、KTransformersを使ってセルフホスティングできます。Hugging Faceリポジトリのサイズはディスク基準で約595GBと非常に大きく、ノートPC向けのモデルではなく、サーバー級のデプロイを想定しています。

ベンチマークスコア

Moonshotチームは6種類のベンチマーク結果を公開しました。これらはK2.7-CodeをK2.6、GPT-5.5、Claude Opus 4.8と比較したものです。K2.7-Codeはすべての項目でK2.6を上回りました。コーディング分野で最も大きな伸びを示したのはKimi Code Bench v2で、従来の50.9%から62.0%へ上昇しました。

K2.7-CodeはMCP Mark Verifiedベンチマークで81.1%を記録し、Opus 4.8の76.4%を上回りました。また、MLS Bench LiteではGPT-5.5に近い数値を記録しました。K2.7-CodeはKimi Code CLIで実行され、GPT-5.5はCodex xhigh、Opus 4.8はClaude Code xhigh環境でテストされました.

1件のコメント

 
cnaa97 1 시간 전

本当にすごい