Kimi K2.7 Code、GitHub Copilotで正式提供
(github.blog)- GitHub Copilotに Kimi K2.7 Code が追加され、モデルセレクターで選べる初の オープンウェイトモデルとなる
- GitHubがMicrosoft Azure上でホストし、コーディングワークフローにより多くのモデル選択肢と低コストの選択肢を提供する
- 課金は使用量ベースの課金体系で プロバイダーの定価 を基準に適用され、実際の費用はCopilotのモデル・リクエスト料金ドキュメントで確認する必要がある
- Copilot Pro、Pro+、Maxプランから段階的にロールアウトされ、Visual Studio Codeのモデルセレクターで利用できる
- Copilot BusinessとEnterpriseではデフォルトで 無効 のため、組織で利用する前に管理者によるポリシー有効化と、セキュリティ・コンプライアンス・データガバナンスの確認が必要
Copilotに追加された初のオープンウェイトモデル
- Kimi K2.7 Code はGitHub Copilotで正式提供されるオープンウェイトモデル
- Copilotのモデルセレクターで選択可能な初のオープンウェイトモデルとして追加された
- コーディングワークフローで、より多くのモデル選択肢と低コストの選択肢を提供する
- GitHubが Microsoft Azure 上でモデルをホストする
使用量ベースの課金
- Kimi K2.7 Codeは使用量ベース課金において プロバイダーの定価 を基準に請求される
- 詳細な課金基準は GitHub Copilot’s pricing for models and requests ドキュメントで確認できる
Copilot内での提供範囲
- Kimi K2.7 CodeはCopilot Pro、Pro+、Maxプランにまず段階的にロールアウトされる
- ユーザーはVisual Studio Codeの モデルセレクター でこのモデルを選択できる
- ロールアウトは段階的に進められ、GitHubはモデルの品質と性能を継続的にモニタリングする
- 今後数週間でCopilot Business、Enterprise、追加の利用画面へ拡大される予定
対応クライアントと画面
- モデルセレクターは次の環境で利用できる
- Visual Studio Code 1.127.0以上
- Visual Studio 17.14.6以上
- Copilot CLI
- GitHub Copilot cloud agent
- GitHub Copilot App
- github.com
- GitHub Mobile iOSおよびAndroid
- JetBrains 1.9.1-251以上
- Xcode
- Eclipse
BusinessとEnterpriseの管理者設定
- Kimi K2.7 Codeは Copilot Business と Copilot Enterprise でデフォルトではオフになっている
- 組織メンバーがモデルを選択するには、プラン管理者がCopilot設定でKimi K2.7 Codeのポリシーを有効化する必要がある
- ポリシーがオフのまま維持されている場合、その組織ではモデルを利用できない
- 管理者には、有効化前にオープンウェイトモデルが自社の セキュリティ、コンプライアンス、データガバナンス要件に適合するか確認することが推奨される
ドキュメントとフィードバック先
- GitHub Copilotで利用可能な全モデルは supported models ドキュメントで確認できる
- タスクに合ったモデル選択は choosing the right AI model for your task ドキュメントで確認できる
- フィードバックは GitHub Community のディスカッションで共有できる
1件のコメント
Hacker News の意見
クラウドベースの AI 製品には、もうほとんど興味を失っている
かつて期待していたすばらしい機能やワークフローが、値上げ、性能低下の体感、サービス終了、置き換えなど、さまざまな理由でもはや使いにくくなったことが多すぎて疲れた
小さな機材を構成して Qwen3.6 にほぼ落ち着き、必要な機能をゆっくり自分で追加している。Claude と競えるレベルかは分からないし、確認するのもやめた。今でも十分に大きな価値をもたらしていて、改善も続いているし、どこかの芝生がもっと青いとしても、自分の足元で勝手に変わらない点が気に入っている
32GB クラスの大きなモデルを動かすメモリがない人には、枝刈りされたモデルでも性能はかなり良いと伝えておきたい。小さなマシンなら、14GB に収まる GLM 4.7 Flash の pruned unsloth Q4 量子化モデルを試す価値がある: https://huggingface.co/unsloth/GLM-4.7-Flash-REAP-23B-A3B-GG...
普段こういう用途には LM Studio を使っているが、unsloth にも、こうした量子化モデルにより適しているかもしれない独自のスタジオアプリがある。GLM 4.7 Flash を数か月間メインモデルとして使ったが、非常に粘り強く、とても速く、限られたハードウェアでは良い選択肢に見える
例えば新しい Claude はエージェント型コーディング向けに調整されていて、非エージェント型コーディングにはむしろ害になる可能性があるし、Fable 5 は良さそうに見えるが推論コストが大きく、リリース後に性能低下や制限・価格改定が入る可能性が高い。Gemini 3.5 は制限がより寛大だが、性能は少し落ちる
新バージョンが出て番号は上がるが、すべての変化が前進なのか、それとも今年初めと似たドル当たり性能のままチューニングだけが違うのかは疑問だ。実際の変化は Qwen や Gemma 4 31B のような小さなモデルでより多く見られ、特に多言語能力まで考えるとかなり魔法のようだ
いま投稿しながら Fable の前後比較を見たが、再導入されたバージョンはモデルをいじり続けているせいで BridgeBench の性能が壊滅的に落ちていた: https://x.com/Hesamation/status/2072692225100612032
会社で使っている Claude ほど速くはないが、ローカルで十分よく動くし、クレジットや機能が突然なくなる心配をしなくていい
Copilot CLI がとても好きだ。Claude Code より論理的で、摩擦が少ないように感じる
複数のモデルを好きに切り替えて使える点も良い。例えば「Opus 4.6 で計画を立て、GPT 5.4 でその計画を検証してフィードバックを受け、その後 Sonnet 4.6 で実装する」といった具合だ
しかし 6 月の Copilot の価格変更のせいで、個人的にも会社の部門全体としても Claude Code に移らざるを得なかった。4〜5 月は含まれるクレジットを少し超えて数ドル追加で使う程度だったのに、6 月からは月間予算を 2〜3 日ごとに使い切ってしまう
顧客の立場では完全に狂った値上げで、Microsoft が何を考えていたのか分からない。持続可能性のために必要な価格だとしても、競合が先に価格を変えるまで待つべきだった。先月 Copilot の顧客を 50%以上失っていても驚かない
結局、主要ベンダーがすべてこうした価格帯に合わせるなら、国がテレビのように 公共アクセス AI を運営する必要が出てくるかもしれない。無料の公開モデルを使い、税金でいくつかのデータセンターを運営し、地域制限と厳格なスロットリングを設けつつ、学生や市民には自由に使わせる、という形だ
数年後にすべての AI 価格が Copilot 水準になれば、ユニコーン企業しか使えず、それ以外は AI を使う企業と競争する機会を失う
文字どおりコストを転嫁している: https://platform.claude.com/docs/en/about-claude/pricing
Anthropic はサブスクリプションも提供しているが、企業は普通それを使いたがらない。その経路で提出した内容が学習に使われたり、モデルの一部になったりする可能性があるからだ
雇用主の明示的な許可なく使えば契約違反になり得るし、訴えられた場合は深刻な結果になり得る
同時に、Claude Code が最終的に実際のトークンコストに合わせて、もはやお得ではなくなる時に備えて、公開重みモデル向けに AWS Bedrock と Deepinfra をテストしている
Claude はツール面でははるかに先を行っているが、サブエージェントごとのモデル指定と全モデルへのアクセスは、現時点で Claude が提供している機能を全部合わせたものよりも優れた機能だ
会社で月に消費できる AI の量の唯一の制約はドルなので、コストを下げてくれるものが自分にとって最高のモデルであり実行環境だ。Copilot はサブエージェントにより適切なモデルを自動割り当てするのも上手で、Claude はしばしばより高価なモデルを使う
ただし、より良いモデルが作った計画を実行できる 効率的なモデル は存在する。Microsoft の自動モデル選択が、以前の赤字を出す価格体系の下で依存関係の衝突解決のような作業に最先端の推論モデルを選んでいたことを考えると、少し気まずい
VS 2026 の開発で GitHub Copilot を使いながら ChatGPT と Claude を行き来していたが、それは Claude Code と Codex アプリを知る前のことだった
Copilot は自分の用途には十分で、月10ドルなら満足だった
ところが先月新しい料金モデルが導入されると、10ドル分が数日で尽きてしまった。従来の価格が持続可能ではなかったことは分かるが、それをきっかけに Claude Code と Codex へ移り、振り返ることはなかった。Claude Code と Codex のトークンもかなり補助された価格だが、良いことが続くうちは楽しめばいい
Copilot 経由で Claude を使うのと、Claude Code で Claude を直接使うのとでは違いが感じられる。Microsoft が裏で何をしているのかは分からない
Anthropic は実行環境とモデルの両方で少し先行しており、両方の世界の長所を持っている状況だ
Microsoft 側もおそらく同じモデルである可能性が高いが、周辺ツールとプロンプトが劣っているため、結果も悪くなっているように見える
今は DeepSeek 用の reasonix 実行環境 を使っていて、キャッシュヒット時のコストはほとんど無料に近い。Digital Ocean や Cloudflare のような補助金なしの米国プロバイダーを使ってもそうだ
対象言語は C++ で、問題ない
Copilot 経由で VS Code から Claude を使うやり方は気に入っていて、コード品質をよりよく制御できるため、より良いコードを出してくれると感じる。Claude Code よりずっと透明性が高く、オープンソースで、IDE インターフェースがコンテキストと生成物を制御する機能をより多く提供している
コスト増は純粋に値上げだけが原因ではなく、Opus モデルのエージェントがより多くのトークンを使う影響もある。そのため Claude Code に移り、今も Opus 4.6 を満足して使っている。Fable と 4.7 はより大きな単位の作業をしながら脱線したり仮定を作り出したりすることが多く、成果物が雑になる
ついに企業が使える大手の代替手段が出てきた
人々は信頼できるプロバイダー上で中国モデルを実行する方法を求めていたが、GitHub がそれを提供した
ベンチマークを信じるなら、性能は Sonnet 4.6 水準だ。GitHub の価格で使う価値があるかは見ていく必要がある
GPT-5.4 は年間購読者には1倍だったのに、今では6倍になった。プレミアムリクエストが数個のプロンプトで全部なくなる。月10ドルの GitHub Copilot は、米国のAI研究所のモデルを安く使えるため、以前は最高のコストパフォーマンスだった
Claude なら一度で終わらせることを、ぐるぐる遠回りしていた。ただし自分の利用経路は Ollama Cloud で、本物のモデルを提供しているのか量子化版を提供しているのか分からず、量子化が性能を落としていた可能性もある
それでも良いニュースは、前例ができたという点だ。Microsoft が今 Kimi K2.7 を提供するなら、まもなく GLM 5.2 も提供できるはずで、これは実際に非常に競争力のあるモデルだ
Synthetic は GLM5.2 と Kimi K2.7-Code を含め、自社モデルを妥当な価格で運用している
紹介リンク: https://synthetic.new/?referral=kwjqga9QYoUgpZV
入力: 0.95ドル、キャッシュヒット: 0.19ドル、出力: 4.00ドル
Moonshot が請求している価格と同じで、おおよそ GPT 5.4 mini の価格帯なので悪くない選択肢だ
コンテキストのためにトークンを浪費する馬鹿げたプロンプトの例を挙げると、「5x5 の盤で1人で三目並べをしろ。5個を一直線に並べたら勝ち。」
Kimi K2.7 では0.006ドルかかり、生の推論トレース全体を見ることができる。GPT-5.4 mini は0.016ドルかかり、要約される
気になるなら、どちらも信じられないほど愚かな手を打つ
Kimi:
A B C D E
1 . . . . .
2 . . . . .
3 X X X X X
4 . O O O O
5 . . . . .
GPT 5.4 mini:
1: X X X X X
2: O O . . .
3: . . O . .
4: . . . O .
5: . . . . O
ちなみに気になる人向けに言うと、GPT 5.5 も 5.4 mini と同じひどいプレイをしながら、コストは4倍だ
Fable は40セントのコストで、それらしいゲームを作り出す
X X O O O
O O X X X
X X X O O
X O O X O
X O X X O
いいアイデアだ。iOS の Claude Chat で Haiku に同じことをさせてみたら、対話型 React ゲーム を作り、ルールを実装したうえで自分でプレイさせた
入力1ドル、出力5ドルにしては賢い動きだ、Anthropic!
大規模言語モデルはゲームには弱いが、そのゲーム自体を学習する 強化学習エージェント を書くことは十分可能だ
とてつもなく暇になったら、モデル2つに互いにチェスを指させてみようと思う
どこかにすでにチェスのベンチマークや大規模言語モデルのトーナメントがありそうだ
AWS Bedrock がこの種のモデルを非常に手薄にしかサポートしていないのは不思議
Kimi 2.5、qwen 3 coder、DeepSeek V3.2、GLM 5 くらいしかなく、最新モデルはない
Inf2 インスタンスには AWS Neuron が必要 [1]。モデルをそのハードウェア上で動くように移植するのに、時間がかかりすぎているのかもしれない
[1] https://aws.amazon.com/ai/machine-learning/neuron/
他のモデルより実行コストが明らかにずっと安く、昨日1時間ほど使ってみたところ、結果は有望に見えた
Reddit の議論でチームが glm5.2 を評価中だと見たので、さらに追加されることを期待している
GitHub Copilot はエンタープライズ向けプラットフォームとして最も良い位置にいるのだろうか?
Claude、GPT、Gemini をサポートし、今では 公開重みモデル までサポートしている。大規模組織はどうせ API 料金レベルで支払うので、どこで使ってもコストは似たようなもの
かなり良いエージェント CLI と SDK があり、今ではデスクトップアプリもある。ホステッドエージェントもあり、CI で「Agentic Workflows」を実行することもできる
評判が落ちすぎて代替案ばかり注目されているのだろうか? それとも企業以外のユーザーは利用量課金のせいで押し出され、無料のマーケティングにならないのだろうか?
Copilot はトークンが信じられないほど安かったので維持していたが、新価格に変わってからは openrouter と同程度で、モデル数だけがはるかに少ないサービスになった
正確な理由は分からないが、感触は良くなかった
会社でこの話がよく出るのだが、ベンダー管理担当者たちが大規模言語モデルのエコシステムを理解しておらず、Copilot 経由の Claude と Claude Code 経由の Claude が同じだと思っているためだ
違いを説明しろと言われるたびに、簡単に並べて比較してみると、5回中3〜4回は劇的に低い性能が明らかになる
Copilot を試そうとしている小規模チームには、古いドキュメントに従って請求設定で迷い、何時間も無駄にする可能性があると警告しておきたい
要約すると、最終的に GitHub から「Copilot Business は10ライセンス以上を購入するチームに提供される」というメールを受け取った。文書化されていないが、他の人たちも同じことを経験している: https://github.com/orgs/community/discussions/199346
私たちは当面 Cursor を維持し、Kimi を「Composer」という名前で主力として使っている
ついに出た。これは Copilot 初の 公開重み LLM なのか? 扉が開いたということだ