3 ポイント 投稿者 GN⁺ 2025-06-17 | 1件のコメント | WhatsAppで共有
  • Claude Codeを通じて、汎用人工知能(AGI)への到達可能性についての見解を提示
  • 著者が Claude との実際のコードセッションを通じて得た印象を共有
  • プログラミング能力、幅広い知識、創造性などにおいて Claude が到達した水準を強調
  • Claude の 文脈把握およびコード解釈能力 が現存するツールと一線を画していると述べる
  • 人工知能の開発と活用のあり方が変化することによる 技術的な波及効果 を展望

はじめに

  • この記事は、Claude Code で人工知能プログラミングを体験しながら、人間レベルの汎用人工知能(AGI)への接近についての著者の考えをまとめたもの
  • 著者は最近の対話型人工知能ツールの中で、Claude が示した結果に強い 衝撃と興奮 を覚えた

Claudeとのプログラミングセッション体験

  • Claude は複雑な プログラミング要求 を素早く創造的に解決できる
  • 単純な計算や反復作業だけでなく、問題の本質を把握し、新しいアプローチの提示 も可能
  • 著者は Claude に 最適化、構造改善、コードリファクタリング などの高度な業務を依頼し、それらの作業品質に深い感銘を受けた
  • Claude は既存の LLM よりも優れた 文脈理解 を示し、コードの意図まで把握している様子を見せた

Claude Codeの差別化ポイント

  • 一般的な対話型人工知能とは異なり、Claude はコード作成だけでなく、プロジェクト全体の構造、コードレビュー、長期的な意図の説明など、人間の開発者の役割を果たせる
  • 詳細な説明、テストコードの作成、さまざまな プログラミング言語およびパラダイム にも適応可能
  • コード内の論理エラーを指摘したり改善の方向性を提案したりするなど、能動的な実力 を見せる

AGIの臨界点に対する認識

  • 著者は Claude Code を体験した後、現実味を帯びてきた AGI 到達可能性について新たな確信を得た
  • 人間が直接ソフトウェアを作る方式から、まもなく AI主導 の開発環境への変化が現実化すると予想している

結論と展望

  • Claude Code は単なる1つの人工知能ツールではなく、AI活用のパラダイム そのものを転換させうる可能性を示している
  • 将来は人間と AI が 共にプログラムを設計・実装 し、さらに革新的なソフトウェア開発文化を形成していく見通しである

1件のコメント

 
GN⁺ 2025-06-17
Hacker Newsのコメント
  • 本当に素晴らしい記事だと思うし、自分も似たような経験やテクニックを共有しているところだ。Claude Codeの優れた性能のおかげで、複数の作業を同時に素早く処理できる効率を実感している。"sub agents" の部分については、Claude Codeがsigoden/aichat経由でo3を呼び出してくれたおかげで、数え切れないほど多くの問題を解決できた経験がある。特にo3は、競合状態やバグハンティングなど、文脈と高い推論能力が必要な問題に抜群だ。ただ、Opus 4のリリース後は相対的に使う頻度が減った。使っているプロンプトと参考リンクも共有しておく: advanced_ai.mdsigoden/aichat
  • last_week.md を見て、正直あまりにも読みにくいと感じた。文章が冗長すぎてPR文書のように見え、AI要約の文体そのものへの信頼性に疑問を持った。むしろコミットログを直接ざっと見るほうが良いと思う。たいていのAI要約文はスタイルが良くないことが多く、情報の信頼性にも依然として不満がある。結局、原文を直接読むほうが速くて効率的なことが多い。
    • オンボーディングについても同じような混乱と物足りなさを感じた。同僚と直接座ってコードベースを学ぶ従来の方法ではなく、AIが生成したスライドだけを読む未来には懐疑的だ。そんな未来は歓迎したくない。
    • 自分がよく使うシステムプロンプトを共有する。簡潔にし、技術用語を使ってよく、ありきたりなマーケティング表現や曖昧な言い回しは避けるようガイドしている。ユーザーが技術的に熟練している前提を強調している。完全にハルシネーションを防ぐことはできないが、コーディングや技術的な質問に対するAIの回答を読みやすくするのには役立つコツだ。
    • 欲しい文体はプロンプトで指定できる。記事の著者はPRっぽい冗長な文体が好みなのだろう、と感じたというちょっとした皮肉。
    • "What happened here was more than just code..." の時点で、もう読む気が失せた。
    • 昔のシコファント(Sycophant)バグのように、ユーザーを「気分良く」させることが、AIを賢く見せたり良い体験に感じさせたりする要素だという点を思い出させる。AIの強化学習の目標は正確性なのか、インタラクション最大化なのか、あるいはその両者が衝突しているのか疑問だ。
  • Rustのborrow checkerを説明する例は、コードを読む能力の実演としては最悪だと思う。あの内容は膨大な学習データにすでに含まれているのだから。
    • 同感だ。Pythonのasyncioタスクでの例外処理の説明を頼むと、AIは一貫性なくぶれていて、まるで最悪のインターンのようだ。しかも継続的に学習できる構造でもないので無駄だと思う。重要だが比較的単純な作業ですらこうなのだから、時間の無駄になりがちだ。
  • 自分はLLM-agnosticなオープンソースエージェントで自動化スクリプトを書く立場を支持している。この技術はソフトウェア開発の根幹を変えつつあるのだから、私たちの働き方をこれからも自分たちでコントロールし続けるべきだ。openhands
    • 良いリソースに見える。Nvidia 4090(24GB RAM)で動かせる強力なモデル(Devstral、Queen 3)もある。Ollamaのおかげで自前ハードウェア上での運用は簡単になったが、GPUのコストは大きい。ただ、月250ドルを有料サービスに払っているなら、自前で構築してもすぐ元は取れる計算だ。
    • もしクローズドモデルのほうが品質面で明らかに優れていたらどうするのか、という根本的な疑問がある。
    • 10000%同意する。
  • Opusへの言及がまったくない点が気になった。いろいろなモデルを試した末、月100ドルのAnthropic "Max" プランでClaude Codeを使っていたが、Opus 4が数学、コード、リサーチ業務に最適な最上位モデルだと分かった。5時間セッションの上限に達したあとAPIに切り替えたら、1時間で20ドル使ってしまった。結局、月200ドルの上位の "Max" にアップグレードしたところ、制限なく快適に使えている。モデル選びは本当に重要で、「愚かな人に出会った」程度の小さな違いに見えても、実際には大きな意味がある。
  • ターミナルはLLMにとって本当に完璧なインターフェースに思える。今後、カスタムIDE統合よりこうしたアプローチが主流になるのか気になる。
    • 実際、ターミナルインターフェースならシステムへのあらゆるアクセスが可能だ。claude codeで読み取り専用アカウントを使ってDBを点検したり、puppeteerブラウザを立ち上げてCSS変更を確認したりできる。k8sクラスターのデバッグやprometheus APIの確認まで全部できるので、とても満足している。
    • LLMに並列で5種類の修正案を試させて、人間の時間を節約する未来を想像している。こうした作業スタイルが広まれば、複数のコンテナを並列に回すようになるだろうし、ターミナルインターフェースの強みは相対的に弱まるかもしれない。
    • むしろターミナルは最悪のインターフェースだと思う。生成されたコードを直接編集できないのが欠点だ。
    • モデルがさらに進化すれば、むしろIDEのほうが低レベルな道具に見えるようになるだろう。
  • 細部へのこだわりが強いチームは職人技の重要なシグナルだと考えているが、Anthropicの利用規約が実行不可能なほど矛盾しているなら、信頼できるパートナーなのか疑わしくなる。競合利用禁止条項のせいで業務では使えないというのは、「three laws safe」とは程遠い状況だ。
    • 法務チームについては何とも言えないが、製品としてのClaude Codeは細部が本当に素晴らしい。コンテキストごとにhaikuを使って "working..." インジケーターにかわいくて適切な動詞を表示するような細やかさまである。
  • ページの背景と文字のコントラストが低く、読みにくいというフィードバック。
    • 自分は上部の点滅するカーソルのせいで集中しにくいと感じる。
    • 内容を読み飛ばしても、実質的な損はないという現実的な助言。
  • Claude Codeがcursorより強力に感じられる、という意見には共感する。Claude Codeは単なるコードエディタ以上の存在だ。Obsidian vaultでもさまざまな用途に使っていて、カスタムキーバインド、キャプチャの自動アップロード、CDN向けリンク生成、ターミナルコマンド要約プログラムの作成など、活用範囲は広い。以前は自動化スクリプトと手動作業の境界に悩むことが多かったが、今ではClaudeで全部まとめて処理していて満足している。
    • Claude Codeを使えるのはプラン加入者だけという制約がある。APIでは使えない点や、月100ドルで本当に足りるのかという疑問もある。一日中使うだけの価値があるツールだとは感じている。
    • Obsidian Vaultでの具体的な使い方をもっと聞いてみたい。
    • LLMに大量のノートをカテゴリ別フォルダに分類させたところ、とても効果的だった。
  • openai codexがまもなくRustでリライトされるという話に対して、AIがそこまで優秀なら、そもそもリファクタリングをAIにやらせる必要はないのでは、という冗談めいた反応。