Claude CodeでAGIを吸い込む

(kadekillary.work)

3 ポイント投稿者 GN⁺ 2025-06-17 | 1件のコメント | WhatsAppで共有

Claude Codeを通じて、汎用人工知能（AGI）への到達可能性についての見解を提示
著者が Claude との実際のコードセッションを通じて得た印象を共有
プログラミング能力、幅広い知識、創造性などにおいて Claude が到達した水準を強調
Claude の 文脈把握およびコード解釈能力 が現存するツールと一線を画していると述べる
人工知能の開発と活用のあり方が変化することによる 技術的な波及効果 を展望

はじめに

この記事は、Claude Code で人工知能プログラミングを体験しながら、人間レベルの汎用人工知能（AGI）への接近についての著者の考えをまとめたもの
著者は最近の対話型人工知能ツールの中で、Claude が示した結果に強い 衝撃と興奮 を覚えた

Claudeとのプログラミングセッション体験

Claude は複雑な プログラミング要求 を素早く創造的に解決できる
単純な計算や反復作業だけでなく、問題の本質を把握し、新しいアプローチの提示 も可能
著者は Claude に 最適化、構造改善、コードリファクタリング などの高度な業務を依頼し、それらの作業品質に深い感銘を受けた
Claude は既存の LLM よりも優れた 文脈理解 を示し、コードの意図まで把握している様子を見せた

Claude Codeの差別化ポイント

一般的な対話型人工知能とは異なり、Claude はコード作成だけでなく、プロジェクト全体の構造、コードレビュー、長期的な意図の説明など、人間の開発者の役割を果たせる
詳細な説明、テストコードの作成、さまざまな プログラミング言語およびパラダイム にも適応可能
コード内の論理エラーを指摘したり改善の方向性を提案したりするなど、能動的な実力 を見せる

AGIの臨界点に対する認識

著者は Claude Code を体験した後、現実味を帯びてきた AGI 到達可能性について新たな確信を得た
人間が直接ソフトウェアを作る方式から、まもなく AI主導 の開発環境への変化が現実化すると予想している

結論と展望

Claude Code は単なる1つの人工知能ツールではなく、AI活用のパラダイム そのものを転換させうる可能性を示している
将来は人間と AI が 共にプログラムを設計・実装 し、さらに革新的なソフトウェア開発文化を形成していく見通しである

1件のコメント

GN⁺ 2025-06-17

Hacker Newsの意見

バイアスはあるが [0]、LLMに依存しないオープンソースエージェントを中心にスクリプト化すべきだと思う
この技術はソフトウェア開発の土台を変えつつあるので、私たちが働き方を引き続きコントロールできるようにしておくべきだ

[0] https://github.com/all-hands-ai/openhands
- 良い資料に見える。Nvidia 4090 24GBで動かせるかなり強力なモデルがあり、DevstralやQwen 3もある
  Ollamaを使えば自分のハードウェアで簡単に実行できるが、GPUコストは大きな投資だ。それでも独占的なツールに月250ドル払っているなら、かなり早く元は取れる
- クローズドモデルのほうが単純に優れているなら、どうすればいいのだろう？
この記事は少し散漫だ。まず、コードベースを説明するのにスライドデッキはそれほど役に立たない
人々が口頭発表の補助以外ではスライドデッキをほとんど使わないのには理由がある。記事に出てくるものの大半は新しい能力ではなく、ワークフロー自動化には確かに価値があってクールだが、AGIがここで何に関係するのか分からない
- それに信用しにくい。記事でもその話を少ししていた気がする。ざっと流し読みしただけだが
  コードベースを理解するのにLLMが必要であってはならない。単にもっと理解しやすくすればいいだけだ。もちろん資本はQ3に次の機能を出すための近道やハックを好む
- LLMが最も役に立った用途の第1位は、コードのmermaidjsダイアグラムを作ることだった
  常に完璧ではないのは分かっているが、何度も「十分に良かった」し、ここでは幻覚を見たことはなく、あったのは欠落だけだった。足りないものが見つかれば修正を頼むのもとても簡単だ
- 記事の雰囲気からすると、AGIという言葉は冗談っぽく使っていて、自分をあまり深刻に捉えていないようで新鮮だ
  もちろん記事に有用な情報がなければ新鮮でも何でもなかっただろうが、実際スライドデッキがコードベース理解に役立つこともあると思う。ジュニアに時間を使わせたくない「あるといいもの」だが、5ドルほどで少し役立つ結果が出るならかなり悪くない
  LLM利用によって思考が拡張される転換の一部は、以前は価値に対して労力が大きすぎて避けていたことを見直せる点にある。自分でやったりチームメンバーの時間やメンタルを燃やしたりしなくていいなら、「そうだな、コードベースをざっと見て、すべての機能と要件を表形式のMarkdown文書にしてみてくれ。予想以上にうまくいくかもしれないし、だめなら別のことをすればいい」と言える
良い記事だ。似たような観察や手法を使っていて、Claude Codeはとりわけ良い
最近はgit worktreeのおかげで、ほとんど毎日複数の作業を同時に進めていて、それぞれが以前よりずっと速く、本当に奇妙なくらいだ
「サブエージェント」の部分では、Claude Codeがsigoden/aichat経由でo3を呼び出す構成に何度も救われたと認めざるを得ない
o3が特に得意な問題がある。競合状態やバグ探しのように、多くの文脈と非常に高い推論能力が必要なものだ
ただ、Opus 4が出てからは使う頻度が減っているし、もちろんこれはサブエージェントのようなものではまったくない
このプロンプトをメインのCLAUDE.mdに@includeして使っている: https://github.com/pgflow-dev/pgflow/blob/main/.claude/advan...

sigoden/aichat: https://github.com/sigoden/aichat
- ちょっと待って、何だって？ git worktreeでどうやって複数の作業を同時にやるの？
ターミナルはLLMにとってほぼ完璧なインターフェースのように思える。このアプローチがカスタムIDE統合より好まれるようになるのか気になる
- その通り。MCPサーバーを含め、文字通りあらゆるものにアクセスできる。Claude Codeが読み取り専用ユーザーとしてデータベースを確認したり、Puppeteerブラウザを開いてCSS変更の見た目がおかしくないか確認してくれたりするのは本当に良い
  完璧なインターフェースで、Anthropicはきちんと作り込んだ
  kubectlコマンドで自分のk8sクラスターをデバッグしたり、API経由でPrometheusを確認したりもできる。なんて素晴らしいんだ
- ある程度はそうだが、LLMの未来は人間の時間よりLLMの時間のほうが安いので、修正案を作るために5つの別個の試行を並列で走らせる方向になると思う
  この要素がワークフローに入ってくると複数のコンテナを立ち上げたくなるだろうし、そうなるとターミナルの利点は弱まる
- モデルが良くなるほど、IDEは低レベルなツールに見えてくるはずだ
- 何だって？ターミナルは文字通り最悪のインターフェースだ
  生成された後にコードを自分で編集したくないのか？
Rustの借用チェッカーを説明させるのは、コード読解能力を示す例として最悪の部類だ。その内容は学習データに山ほどある
- 同意する。Python asyncioタスクで例外がどう処理されるかを、コードを全部渡して説明させても、この世で最悪のインターンのようにふらふらする
  しかも「教える」方法もなく、仮にあったとしても現在の文脈を超えて持続しない
  重要だが比較的単純な作業には完全な時間の無駄だ
- 「その内容は学習データに山ほどある」という不満は奇妙だ
  誰かがRustの借用チェッカーを説明してくれたとして、その人が借用チェッカーの説明を読んだことがあるから認められず、「学習データにあった」と文句を言うべきなのか？何らかの形で学んだこともなく借用チェッカーを理解していると思っているのか？
  言いたいことはある程度分かる。こうしたツールが新しいアイデアを生み出せるという証拠は多くなく、知識量があまりに多いためその現象を検知しにくい、ということだろう。しかし実用上は、幻覚という枠内でも有用で助けになるので、あまり気にしていない
細部への注意がクラフトマンシップを気にかけている最良のシグナルのひとつだとするなら、Anthropicの法的規約が論理的に満たしようがないという事実は、ASIの慎重な管理者として信頼するには悪いシグナルではないのか？
競合的利用の禁止に違反せずには業務で使えないなら、少なくとも「ロボット三原則レベルで安全」だとは言いにくい
- 法務部門のことは分からないが、製品であるClaude Codeには細部に惜しみなく気を配った跡が見える
  「working…」表示にかわいくて適切な動詞を出すために、文脈に応じてHaikuを回すレベルにまで気を配っている
claude --dangerously-skip-permissions # science mode

これを見て笑った
同感。Claude CodeはCursorより強力に感じるが、その理由の1つはスクリプト化のしやすさだと思う
結局のところCursorはエディタで、Claude Codeはステロイドを打ったスイスアーミーナイフだ
従来型のコードベース以外でもClaude Codeをかなり使っている。Obsidianの保管庫でいろいろな作業に走らせたり、スクリーンショットを自分のCDNにアップロードしてMarkdownリンクを渡すローカルのカスタムキーバインドをスクリプトで作らせたり、過去1日のターミナルコマンドを要約するためにOllamaと通信するプログラムを作らせたりしている
以前は、ファイル形式の変更をスクリプト化するほどの価値があるか、それとも手作業で済ませるかを考えなければならなかったが、今はそのディレクトリでClaudeを実行して処理させるだけだ。本当にいろいろなことに役立つ
- 問題は、Claude Codeは料金プランがないと動かないことだ
  APIでは使えないので、月100ドルで本当に十分なのか疑問に思う。今では毎日一日中使っているが、自分が払っている100ドル分よりずっと多く消費している気がする
- Obsidianの保管庫でどんな用途に使っているのか本当に気になる
- Claude Codeをどうやってスクリプト化しているの？ CLIでは使ってきたけど、スクリプトからClaude Codeを呼び出す発想はなかったので、かなり面白そうに聞こえる
- 数日前、LLMに大量の自分のノートをカテゴリフォルダに整理させた。いや本当に、すごく助かった
余談だが、ここの背景と文字のコントラストのせいで本当に読みづらい
- 自分の場合は一番上の点滅するカーソルのせいだ。文章に集中しづらい
- そのまま読み飛ばしても、別に大して見逃すものはない
ここでもあそこでも、まだOpusへの言及がない
あれこれ全部試した末に、Claude Codeを使うためAnthropicの月100ドルの「Max」プランに落ち着いた。ところがClaude Opus 4が、今の自分の用途、つまり数式コードと研究には最適だが最も高価なモデルだと分かった
5時間のセッション制限に引っかかってAPIに切り替えたところ、1時間で20ドルを燃やした。そこで月200ドルの「Max」に上げたが、まだ制限には達していない
モデルは重要だ。こういう話は全部、「あまり賢くない人に当たった」みたいなものだ。当然だろう
- これは全部Opusでやっていた

Claude CodeでAGIを吸い込む

はじめに

Claudeとのプログラミングセッション体験

Claude Codeの差別化ポイント

AGIの臨界点に対する認識

結論と展望

関連記事

1件のコメント

Hacker Newsの意見