5 ポイント 投稿者 GN⁺ 2026-01-17 | 5件のコメント | WhatsAppで共有
  • Cursorは**「自律コーディングエージェントが数週間動作する実験」**を進め、人間のチームなら数か月かかるプロジェクトを自動化できるかを探ったと発表
  • このシステムを検証するため、「Webブラウザをゼロから作る」目標を設定し、エージェントが約1週間で100万行以上のコードを書いたと主張
  • しかし公開された**GitHubリポジトリ(fastrender)**には多数のコンパイルエラーとCI失敗があり、実行可能なブラウザではないことが確認される
  • Cursorは動作可否や再現可能なデモ、ビルド可能なコミットを示しておらず、実験結果の具体的な成功根拠もない
  • それにもかかわらずCursorは**「エージェントが大規模プロジェクトで意味のある進展を遂げた」**と表現し、実際の性能検証なしに成功した印象を残している

Cursorのブログ実験概要

  • 2026年1月14日、Cursorは**「Scaling long-running autonomous coding」**というブログ記事を公開
    • 目標は「人間のチームなら数か月かかるプロジェクトを、自律コーディングエージェントでどこまで拡張できるか」を探ること
  • 複数のアプローチを試した末に、**「調整の問題を解決し、単一エージェントなしで大規模プロジェクトへ拡張できる」**システムに到達したと説明
  • 検証のために**「Webブラウザをゼロから作る」実験**を行い、エージェントが約1週間で1,000ファイルにわたり100万行以上のコードを書いたと明らかにした

実験結果の不明確さ

  • Cursorは「新しいエージェントがコードベースを理解し、意味のある進展を遂げた」「数百のワーカーが同時に同じブランチへプッシュした」と主張
    • しかし、ブラウザが実際に動作するかどうかは明記していない
  • 記事にはスクリーンショット動画が含まれているが、実行可能なデモや具体的な結果説明はない
  • 「ブラウザをゼロから作るのは非常に難しい」という文言以外に、動作の証拠は示されていない

コードベース検証結果

  • リポジトリを直接ビルドすると、**fastrenderライブラリのコンパイル失敗(34件のエラー、94件の警告)**が発生
  • 最近のGitHub Actions実行結果でも、ワークフローエラーと多数のコンパイル失敗が確認される
    • 直近100件のコミットで正常にビルドできたコミットは1件もない
  • コード内部は意図や構造のない「AI slop」レベルの生成物と評価されている
    • cargo buildcargo checkコマンドすら実行されていないように見える
    • 関連Issue #98 も現在オープン中

再現性と信頼性の問題

  • Cursorのブログには、実行方法、期待される結果、動作方式に関する説明がまったくない
  • **再現可能なデモ、ビルド手順、検証済みコミット(tag/release/commit)**は提供されていない
  • それにもかかわらず、記事の構成と表現は**「動作するプロトタイプ」**のように見せている
  • Cursorは「動作する」と明記していないため虚偽の記述ではないが、成功を示唆する印象を残している

結論と評価

  • Cursorは「プロダクションレベルのブラウザ」だとは主張していないが、**「意味のある進展」と「ブラウザ構築」**という表現によって、成功した実験のように見せている
  • しかし、動作の証拠、ビルド可能なコード、再現可能な結果はまったくない
  • 「数百のエージェントが協調して大規模プロジェクトで進展を遂げた」という主張は、いかなる証拠もない主張に過ぎない
    • 最低限の基準である**「コンパイル可能で、単純なHTMLファイルをレンダリングできる水準」**すら満たしていない
  • 結果としてCursorの実験は、自律コーディング拡張の可能性よりも、大規模コード生成の限界を浮き彫りにした事例にすぎない

5件のコメント

 
kimjoin2 2026-01-18

 
sinbumu 2026-01-19

要するに、開発者はまだ切れないってことをうまく示したってことだよね〜

 
jjw9512151 2026-01-18

成功した結果 = まだ俺たちをクビにできないってことだぞ、この経営陣ども

 
GN⁺ 2026-01-17
Hacker Newsの反応
  • 今週の実験は結局、Servo(Rustベースのブラウザ)の動かないラッパー(wrapper)程度だった、という指摘が一番上に来るべきだという声
    関連コメントはこちら

    • 誰かが人気オープンソースプロジェクトをAIで書き直したことがあるのか気になる
      最新のLLMならライセンスロンダリングや依存関係の剽窃にもかなり有効そうで、新しいベンチマークとして面白そう
    • 実際に誰かがコンパイル成功したというツイートを見た
    • ネガティブな結果にも価値はある。意図的に公開したなら立派だし、うっかり露呈したなら面白い
      今日の娯楽を提供してくれたCursorに乾杯
    • 最初はスクリーンショットを見て、一瞬自分の仕事が危ないと感じた
      でもエンジンもなく完全に壊れた状態だなんて、Cursorは本当に赤っ恥
  • Cursorの公式ブログ記事はかなり控えめなトーンで書かれていたが、
    Twitterでは「GPT-5.2でブラウザを作った」と言っているような誇張された印象を与えていた
    実際には数千のエージェントを分離して数週間コミットを積ませたが、成果物はまだ動いていない

    • 「マージコンフリクトを解決した」という表現には大して意味がない。ourstheirs 戦略だけでも常に解決は可能
    • では誰かが実際に実行成功したのだろうか? スクリーンショットはどこから出たのか? コードにはエラーが多すぎる
    • リンク先の内容を見るとブラウザが動いたように見えるが、それのどこが「控えめ」なのか気になる
  • 自分で確かめようと思って、最後の100件のコミットに対して cargo check を回してみた
    結果はすべて失敗だった。結果ログ参照

    • 今はコンパイルできるという新しいコメントがある
    • 実はスクリーンショットが捏造だった可能性もある。オッカムの剃刀で考えると、それが最も単純な説明
  • こうした宣伝は結局、資金調達戦略の一環に見える
    以前にも内部モデルがどれだけコードを書いたかなど、曖昧な投稿を何度もしていた
    実質的な内容がないという意味ではないが、結果を公開で共有しない点は残念

    • 他のモデル提供者と違って、ベンチマークを公開しない点にはずっと不満があった
      Cursorは一時話題だったが、今はターミナルベースのエージェントが主流だ
      うちの会社もCursorとの契約を終了してClaude Codeに切り替えようとしている
      おそらく今回のブラウザプロジェクトは再び注目を集めるための試みだろう
    • こういう誇張は結局、市場価値の水増しにすぎない。正当化はできない
    • 最近はどのLLM企業も真実より**「vibe-coded」なマーケティング**に頼っている
      GPT-5の発表のときも似たようなものだった。実質的な進歩は鈍化している
    • 昔はこういう誇張が嫌いだったが、今では世の中の現実として受け止めるようになった
      結局、信頼より検証が答えだ
  • Cursorは似たような実験としてExcelクローンも作っている
    GitHubリポジトリによれば
    16万回のワークフローのうち成功したのは247回だけで、ほとんどは予算超過で失敗している
    エージェントはそうした制約をまったく気にしない

  • 最新コミットは今ではビルドも実行も可能になっている(少なくともMacでは)
    ただし依然として300万行のひどいコード
    Cursorの宣伝動画に出ていたページはレンダリングされない。おそらく別のビルドを使ったのだろう

    • cargo check は通るが、git log を見ると何か怪しい
      エージェントではなく人間が直接修正した痕跡がある
      コミットログ分析参照
  • 元記事は単なるクリック誘導用の見出しだったと思う
    「数千のAIエージェントがブラウザを作った」という文句はあまりにも扇情的だ

    • これで今後誰かが「AIがブラウザを作った」と言うたびに、この事例をリンクできる
    • 実際には動かないプロジェクトがニュースサイクルを高速で回っている
      「フェイクニュース」という言葉が政治的に汚染されてしまったのは残念だ。この分野にはぴったりの表現なのに
  • CursorのCEOは「RustでレンダリングエンジンとJS VMをゼロから作った」と主張したが、
    実際の依存関係一覧を見ると
    html5ever、cssparser、rquickjs などServo系ライブラリをそのまま使っていた
    結局はServoを包んだ程度で、コンパイルすらできない

    • なぜわざわざCSSとJSを自前実装したと主張したのか理解できない
      ほとんどの人はコードを見ればすぐ分かるはずなのに、おそらく大衆は確認しないと思ったのだろう
      こうして誤った認識が広まり、後で訂正されても誰も気にしない
    • 実際にはServoのHTML/CSSパーサー、QuickJS、resvg、egui、wgpuなど
      既存ライブラリで構成されている。それで300万行というのは笑える
    • selectors、taffyも含まれており、一部は旧バージョンの依存関係を使っている
    • JSエンジンは個人プロジェクトを vendor フォルダにコピーしただけだ
      関連内容はこちら参照
    • レイアウトコードはServoのものを使ったのか、それともCursorが自分で書いたのか気になる
      そこがブラウザで最も難しい領域だからだ
  • こうしたマーケティング手法はむしろ自爆だと思う
    CursorのデザインとUXは素晴らしいが、深い作業ではバグが多すぎる
    Claudeモデル追加で少し良くなったが、それでもAntigravityに劣る
    しかも20ドルのサブスク上限もすぐ使い切ってしまう。モデルが10倍良くなって10倍安くなる可能性は低い

    • 複数のAI企業のバグだらけのアプリを使っていて、本当の仕事にはやはり人間の技能が必要だと感じる
      OpenAIのビジネスモデルが広告中心に変わっていくのを見ると、
      Googleのほうがこの技術をより現実的に理解していたのではと思う
  • こういう話は結局、「シャベルを売る人たち」 のためのものだ
    よく分かっていないCEOがこうしたニュースにだまされて、実際の人員を解雇することさえあり得る