- Cursorは**「自律コーディングエージェントが数週間動作する実験」**を進め、人間のチームなら数か月かかるプロジェクトを自動化できるかを探ったと発表
- このシステムを検証するため、「Webブラウザをゼロから作る」目標を設定し、エージェントが約1週間で100万行以上のコードを書いたと主張
- しかし公開された**GitHubリポジトリ(fastrender)**には多数のコンパイルエラーとCI失敗があり、実行可能なブラウザではないことが確認される
- Cursorは動作可否や再現可能なデモ、ビルド可能なコミットを示しておらず、実験結果の具体的な成功根拠もない
- それにもかかわらずCursorは**「エージェントが大規模プロジェクトで意味のある進展を遂げた」**と表現し、実際の性能検証なしに成功した印象を残している
Cursorのブログ実験概要
- 2026年1月14日、Cursorは**「Scaling long-running autonomous coding」**というブログ記事を公開
- 目標は「人間のチームなら数か月かかるプロジェクトを、自律コーディングエージェントでどこまで拡張できるか」を探ること
- 複数のアプローチを試した末に、**「調整の問題を解決し、単一エージェントなしで大規模プロジェクトへ拡張できる」**システムに到達したと説明
- 検証のために**「Webブラウザをゼロから作る」実験**を行い、エージェントが約1週間で1,000ファイルにわたり100万行以上のコードを書いたと明らかにした
実験結果の不明確さ
- Cursorは「新しいエージェントがコードベースを理解し、意味のある進展を遂げた」「数百のワーカーが同時に同じブランチへプッシュした」と主張
- しかし、ブラウザが実際に動作するかどうかは明記していない
- 記事にはスクリーンショット動画が含まれているが、実行可能なデモや具体的な結果説明はない
- 「ブラウザをゼロから作るのは非常に難しい」という文言以外に、動作の証拠は示されていない
コードベース検証結果
- リポジトリを直接ビルドすると、**
fastrenderライブラリのコンパイル失敗(34件のエラー、94件の警告)**が発生
- 最近のGitHub Actions実行結果でも、ワークフローエラーと多数のコンパイル失敗が確認される
- 直近100件のコミットで正常にビルドできたコミットは1件もない
- コード内部は意図や構造のない「AI slop」レベルの生成物と評価されている
cargo buildやcargo checkコマンドすら実行されていないように見える
- 関連Issue #98 も現在オープン中
再現性と信頼性の問題
- Cursorのブログには、実行方法、期待される結果、動作方式に関する説明がまったくない
- **再現可能なデモ、ビルド手順、検証済みコミット(tag/release/commit)**は提供されていない
- それにもかかわらず、記事の構成と表現は**「動作するプロトタイプ」**のように見せている
- Cursorは「動作する」と明記していないため虚偽の記述ではないが、成功を示唆する印象を残している
結論と評価
- Cursorは「プロダクションレベルのブラウザ」だとは主張していないが、**「意味のある進展」と「ブラウザ構築」**という表現によって、成功した実験のように見せている
- しかし、動作の証拠、ビルド可能なコード、再現可能な結果はまったくない
- 「数百のエージェントが協調して大規模プロジェクトで進展を遂げた」という主張は、いかなる証拠もない主張に過ぎない
- 最低限の基準である**「コンパイル可能で、単純なHTMLファイルをレンダリングできる水準」**すら満たしていない
- 結果としてCursorの実験は、自律コーディング拡張の可能性よりも、大規模コード生成の限界を浮き彫りにした事例にすぎない
5件のコメント
笑
関連記事 - 장시간 실행되는 자율 코딩의 확장
要するに、開発者はまだ切れないってことをうまく示したってことだよね〜
成功した結果 = まだ俺たちをクビにできないってことだぞ、この経営陣ども
Hacker Newsの反応
今週の実験は結局、Servo(Rustベースのブラウザ)の動かないラッパー(wrapper)程度だった、という指摘が一番上に来るべきだという声
関連コメントはこちら
最新のLLMならライセンスロンダリングや依存関係の剽窃にもかなり有効そうで、新しいベンチマークとして面白そう
今日の娯楽を提供してくれたCursorに乾杯
でもエンジンもなく完全に壊れた状態だなんて、Cursorは本当に赤っ恥だ
Cursorの公式ブログ記事はかなり控えめなトーンで書かれていたが、
Twitterでは「GPT-5.2でブラウザを作った」と言っているような誇張された印象を与えていた
実際には数千のエージェントを分離して数週間コミットを積ませたが、成果物はまだ動いていない
oursやtheirs戦略だけでも常に解決は可能自分で確かめようと思って、最後の100件のコミットに対して
cargo checkを回してみた結果はすべて失敗だった。結果ログ参照
こうした宣伝は結局、資金調達戦略の一環に見える
以前にも内部モデルがどれだけコードを書いたかなど、曖昧な投稿を何度もしていた
実質的な内容がないという意味ではないが、結果を公開で共有しない点は残念
Cursorは一時話題だったが、今はターミナルベースのエージェントが主流だ
うちの会社もCursorとの契約を終了してClaude Codeに切り替えようとしている
おそらく今回のブラウザプロジェクトは再び注目を集めるための試みだろう
GPT-5の発表のときも似たようなものだった。実質的な進歩は鈍化している
結局、信頼より検証が答えだ
Cursorは似たような実験としてExcelクローンも作っている
GitHubリポジトリによれば
16万回のワークフローのうち成功したのは247回だけで、ほとんどは予算超過で失敗している
エージェントはそうした制約をまったく気にしない
最新コミットは今ではビルドも実行も可能になっている(少なくともMacでは)
ただし依然として300万行のひどいコードだ
Cursorの宣伝動画に出ていたページはレンダリングされない。おそらく別のビルドを使ったのだろう
cargo checkは通るが、git logを見ると何か怪しいエージェントではなく人間が直接修正した痕跡がある
コミットログ分析参照
元記事は単なるクリック誘導用の見出しだったと思う
「数千のAIエージェントがブラウザを作った」という文句はあまりにも扇情的だ
「フェイクニュース」という言葉が政治的に汚染されてしまったのは残念だ。この分野にはぴったりの表現なのに
CursorのCEOは「RustでレンダリングエンジンとJS VMをゼロから作った」と主張したが、
実際の依存関係一覧を見ると
html5ever、cssparser、rquickjs などServo系ライブラリをそのまま使っていた
結局はServoを包んだ程度で、コンパイルすらできない
ほとんどの人はコードを見ればすぐ分かるはずなのに、おそらく大衆は確認しないと思ったのだろう
こうして誤った認識が広まり、後で訂正されても誰も気にしない
既存ライブラリで構成されている。それで300万行というのは笑える
vendorフォルダにコピーしただけだ関連内容はこちら参照
そこがブラウザで最も難しい領域だからだ
こうしたマーケティング手法はむしろ自爆だと思う
CursorのデザインとUXは素晴らしいが、深い作業ではバグが多すぎる
Claudeモデル追加で少し良くなったが、それでもAntigravityに劣る
しかも20ドルのサブスク上限もすぐ使い切ってしまう。モデルが10倍良くなって10倍安くなる可能性は低い
OpenAIのビジネスモデルが広告中心に変わっていくのを見ると、
Googleのほうがこの技術をより現実的に理解していたのではと思う
こういう話は結局、「シャベルを売る人たち」 のためのものだ
よく分かっていないCEOがこうしたニュースにだまされて、実際の人員を解雇することさえあり得る