Morph (YC S23) – 毎秒4,500トークンのAIコード編集を適用
(news.ycombinator.com)- MorphはAIベースのコードエディタであり、大規模なコードベースに毎秒4,500トークン以上を適用する高速コード修正機能を提供する
- 開発者は、反復的な作業や大規模な変更が必要な作業において、AIの高速な処理能力によって作業時間を短縮できる
- 既存ツールとは異なり、大規模プロジェクトにも処理負荷を抑えて効率的に適用できる構造
主な特徴
- 4,500トークン/秒に対応: Morphは高いスループットにより、蓄積されたコードにAI編集内容を迅速に適用できる
- シンプルな使い方: ユーザー中心のUIと直感的なワークフローを提供し、AIベースのコード編集への参入障壁を下げる
- 汎用性: 多様なプログラミング言語やフレームワークに幅広く適用できる拡張性を提供する
活用事例と期待効果
- コードリファクタリング、変数名変更、コメントの一括追加、セキュリティパッチの自動化などで高い効率を発揮
- 大規模コードベースを持つ企業やスタートアップで、時間とコストの削減効果が期待できる
1件のコメント
Hacker Newsのコメント
開発者体験では、生の推論速度より正確さのほうが重要だという主張にはあまり同意できない。ユーザーがはるかに遅い tok/sec を受け入れてでもより大きなモデルを好むのは、結局コード品質が第一の基準だからだ。大きなコード修正(例: 5,000 トークン)では 200〜300ms 程度の遅延はあまり意味のある数値ではない。編集速度そのものは、ボトルネックというより品質のほうが大きな要素だ。コード変更で 200ms 短縮することが品質より優先されるというのは、まったく共感できない。1〜2 個のエージェントを並列で使えば、コードをレビューしている間にすでに大半の修正は終わっている。品質の測定基準が気になるし、高速モデルと大規模モデルの間でエラー率の差がどの程度あるのか知りたい
推論速度が約 50% 速くなるなら、正確さが一桁%改善することよりも、自分のワークフローにとってはるかに大きな価値があると感じる。どうせ変更点は自分で確認しなければならないので、反復サイクルが速いほうがよく感じられる。ただし、正確さが十分高くて、検証を減らしたり頻度を下げたりできるレベルなら、このときは推論速度の利点はほとんど意味がなくなる
完全に同意する。AI モデルがコード変更を提案したあと、最初にやるべきことは必ずその成果物を丁寧にレビューすることだ。ほとんどの場合、プロンプトに欠けたコンテキストや特定のトークンのせいで、コードが重複したり的外れに生成されたりする。変更を一括適用するとデバッグはさらに難しくなり、この種の大量コード挿入が積み重なるほど、コードは思ったより早く壊れる可能性が高い
私の理解では、単に ±300ms 程度の話ではなく、300ms と 10 秒のような非常に大きな差がある。こうした大規模モデルの応答待ちは、少なくとも自分にとっては明らかな制約だ。しかも、このような単純作業にはリソースが不必要に消費されている感じもある。実際、コード変更を賢く適用する作業は、既存のプログラミング環境でも十分扱える領域だと思う。こういうものが本当に LLM を必要とするほど難しい作業なのか気になる
あなたにとってはレビュー時間がボトルネックのように感じられるんだと思う。私は今、誰かがコードエージェントの成果物をずっと速くレビューできるよう支援する機能を作っている。もし時間があれば、あなたのワークフローについてもう少し詳しくインタビューしたい。コメントか、私のプロフィールにある連絡先から連絡してもらえるとうれしい
重要なのは、開発者が没入状態(flow)を維持することだと思う。エラーも遅延も、どちらも没入を断ち切る要因になる。結論として、コーディングでは品質(正確性)が最も重要な要素だ。品質評価には大きく 2 つの基準を使っている。第一に、ユーザーのクエリからタスク完了までの全体ラインで評価するエンドツーエンド性能(aider スタイルの bench)。第二に、適用精度(文法/構文の問題、文字単位の diff など)。大規模モデルと高速モデルのエラー率差はおよそ 2% 前後だ。複雑な、あるいは難しい言語なら大規模モデルのほうが適しており、タスクに適したモデルへ自動でルーティングするオプションもある
microsoft copilot を使ってみたが、特にコード適用の段階であまりにも遅く不便だと感じた。リソースが豊富なところで、モデルをまともに訓練できていないのが不思議だ。要望: どの diff フォーマットを LLM に生成させるのが最適か、システムプロンプトを公式ドキュメントに入れてほしい。LLM のアップグレードのたびに diff フォーマットが変わることが多く、どのフォーマットが最善なのか毎回推測しなければならず不便だ。加えて、プライバシーポリシーがはっきり理解できないのだが、私の解釈どおりだと有料ユーザーでもデータが保存/学習されるという意味なのか気になる。(電話なしで)サービスに料金だけ支払って、データを学習に使われないようにする方法が知りたい。Morph Privacy Policy を参照した
ZDR(Zero Data Retention) オプションも可能だ。info@morphllm.com にメールを送ってもらえれば設定する。Morph を OpenRouter 経由で使う場合は常に Zero Data Retention だ
「自分のデータでモデルを訓練するな」という要求は少し滑稽な主張だ。こうしたモデルが作られた原理そのものが、他人のコードで訓練した結果なのだから。こういうツールを使いながら、自分のデータは訓練に使うなと言うのは、実際のところ利己的な考えで、集団利益のジレンマに近い。こうしてモデルはより良くなっていくのだから
公式デモで提供された HTML 例を https://morphllm.com/dashboard/playground/apply でそのまま適用してみたところ、何の変更も要求していないのに CSS が追加され、contact セクションまでできた。そうした内容は更新指示に含まれていなかった
コスト面で見ると、Morph は Gemini Flash よりかなり高いという印象だ。Gemini Flash でもかなり良いコード生成ができるし、高速に編集を反映する AI も良いが、価格帯は気軽ではない。たとえば Morph v3 fast は入力 $1.20/M トークン、出力 $2.70/M トークンだが、Gemini 2.5 Flash は入力 $0.30/M トークン、出力 $2.50/M トークンだ(参照: OpenRouter)
念のため確認したいのだが、Morph は他の LLM の結果を「適用」するツールであって、独自の LLM ではないのだろうか。毎秒 4,500 トークンを生成するのではなく、適用基準という理解で合っているのか気になる
とても印象的だ。社内 AI コーディングシステム向けにこうしたソリューションを探している立場なのだが、オープンソースの Osmosis Apply 1.7B のようなプロジェクトと比べると何が違うのか気になる。Morph モデルがオープンソース/オープンウェイトではない前提だ
以前は Morph を OpenRouter で見かけなかったが、今は載っているようだ。ただ、登録されているモデルは旧バージョンのように見える。今後もっと積極的にサポートする予定はあるのか。それと、fast apply モデルが Relace や Llama/Cerebras と比べて、性能(特に正確性)でどうかというベンチマーク結果も気になる
Hacker News の力はすごい! 今ではそちらにも新しいモデルが登録された
現在 v2 モデルは morph-v3-large を指している。まもなく v3-large と v3-fast も追加される予定だ
Relace との比較が気になる。どちらも YC 出身の会社で、機能もかなり似ているように見える Relace
ChatGPT と VSCode の間をつなぐブリッジになるブラウザ拡張があって、その間に Morph(または Claude)を挟めば、agentic coding を Web UI からすぐ活用できて本当に良さそうだ。API ではなく Web インターフェースを使うアイデアだ
AI が賢く rebase+merge を自動化してくれる機能があれば、開発速度は飛躍的に上がると思う。複数ユーザーのコード変更を AI が意図まで理解して自動でマージしてくれたら、本当に生産性向上になる
Claude Code を使えば、すでにその機能を使える。単に「別のブランチをマージして競合を解決して」と頼めばいい
マージコンフリクトの状況にどれくらいの頻度で遭遇するのか気になる