15 ポイント 投稿者 GN⁺ 2026-01-25 | 1件のコメント | WhatsAppで共有
  • SwarmsはClaude Code内部に存在していたものの公開されていなかったマルチエージェント・オーケストレーション機能
  • ユーザーはもはや単一のAIコーダーと対話するのではなく、チームリード役のAIと対話
  • チームリードは直接コードを書かず、計画立案と作業分担、結果の統合を行い、下位エージェントに役割を割り当てる
  • 承認された計画の後、専門化されたワーカーエージェントが並列実行され、実際の実装を担当
  • Claude Codeが単一ツールを超えてチーム単位の開発プロセスへ拡張される流れを示している

動作方式

  • ユーザーが計画を承認するとDelegation Modeに切り替わる
  • 専門ワーカーエージェントが複数生成され、並列で作業を実行
  • 各ワーカーはコード作成、分析、修正など実質的な実装作業を担当
  • ワーカー間メッセージを通じて進捗状況と依存関係の調整を行う
  • すべての結果はチームリードに集約され、最終応答として返される

claude-sneakpeekツール

  • claude-sneakpeek リポジトリは、Claude Codeの機能フラグが有効な並列ビルドを提供
  • Swarmsモードを含む未公開機能を体験でき、既存のClaude Codeインストールとは完全に分離された環境で実行される
    • 別個の設定、セッション、MCPサーバー、認証情報を使用
  • Claude Codeに組み込まれているが、まだ公開されていない追加機能が提供される
    • Swarm modeによるネイティブなマルチエージェント実行をサポート
    • Delegate modeによるバックグラウンドエージェント生成
    • チームメンバー間メッセージングと作業オーナーシップ管理機能を提供
  • 個別のモデルおよびプロバイダー対応
    • Z.ai、MiniMax、OpenRouterをサポートし、cc-mirrorを通じてローカルモデル連携が可能

1件のコメント

 
GN⁺ 2026-01-25
Hacker Newsの反応
  • 正直、狂気じみた話に聞こえるかもしれないが、最も高品質なコードを得られたことがある。
    コストは10倍くらいかかったが、複数のサブエージェントを持つ丸ごとの「プロジェクトチーム」を1つのOpusインスタンスで管理させた。
    作業内容はレガシーJavaサーバーをC# .NET 10へ移植することで、9人のエージェント、7段階のKanban、分離されたGit Worktree構成を使った。
    各役割は次の通り。
    Manager(Claude Opus 4.5): Kanbanの状態に応じてエージェントを起こすグローバルイベントループ
    Product Owner(Claude Opus 4.5): 戦略担当、スコープクリープ防止
    Scrum Master(Opus 4.5): バックログの優先順位付けとチケット割り当て
    Architect(Sonnet 4.5): 設計専任、実装はしない
    Archaeologist(Grok-Free): 必要なときだけレガシーJavaのデコンパイルを読む
    CAB(Opus 4.5): 設計およびコード段階で機能を却下するゲートキーパー
    Dev Pair(Sonnet 4.5 + Haiku 4.5): AD-TDDループ、Juniorが失敗するテストを書き、Seniorが修正
    Librarian(Gemini 2.5): ドキュメント管理とふりかえりトリガー
    正直、「これって本当に必要か?」と言われたらたぶん「いいえ」だが、AIエージェントたちが協業するのを見るのがあまりに面白かった。
    初期プロセスのバージョンはこの画像にある

    • 技術的な詳細を共有してもらえるか気になる。
      純粋にプロンプトベースなのか、プラグインなのか、それともスクリプトで反復呼び出しする構成なのか知りたい。
      Kanbanがどこに存在しているのかも気になる
    • 自分もこれに近い構成を使っている。
      コーディネーター1人と、バックエンド、フロントエンド、DBの専門家のような専門化されたエージェント数人で構成されている。
      肝はコーディネーターだ。自分の認知負荷を減らし、全体の進捗をうまく追跡してくれる
    • 一般にScrum Masterはチケットを直接割り当てない
    • 次の段階は、自分が作ったものをサービス化することだと思う。
      「猿と話したいんじゃない、オルガン弾きと話したいんだ」という感じで、最初はマネージャーやプログラムマネージャーへのヒアリングから始まり、その後は彼らが勝手に進めて、デモや更新だけ求めるようになる気がする。笑える
    • これが風刺なのか本気なのか気になる
  • 実際には、これはClaudeに組み込まれたsub agent機能を活用したものだ。
    Goで30万行のtmux抽象化みたいなものを作る必要はない。
    Claudeにバックグラウンドsub agentで並列作業させればいい。
    プロンプト受け渡し、進捗追跡、レポート用ファイルを置いておくとよく、各エージェントを別々のworktreeに制限するのがおすすめだ。
    自分はこのパターンをworkforest.spaceにまとめている。
    ほとんどの人はオーケストレーターを別に作っているが、実際にはClaude自体が最高のオーケストレーター

    • これは単なるsub agentではない。
      従来ツールとの違いは、会話単位ではなく作業単位の抽象化だという点だ。
      Claude Codeはサードパーティーアプリの問題で会話中心にならざるをえず限界があったが、Claude Code Webがそれを初めて拡張した。
      この方式ではAIが自ら作業を調整し、ユーザーが継続的にプロンプトを投げる必要がない。
      複雑だが、AIが他のAIを管理する構造へ進化している
    • 実際にはこれは新機能というより、Claude Codeがすでに持っていたsub agentを実装に活用できるようにしたものだ。
      ただ、計画の詳細が不足しているので信頼性はまだ低い
    • 既存のsub agentとは異なる。
      メインエージェントが委任中心のコンテキストモードに切り替わり、チームベースのタスクシステムとメールボックスシステムが統合された形だ。
      プラグインでは実現できないレベルの統合だ
    • 「stacked PR」の可視化のおかげで概念をすぐ理解できた。
      自分はコミットをPRのように積み上げてrebaseで整理していたが、かなりつらかった。
      これからはブランチを2〜3本に分け、競合を最小化しながら管理する方式に改善できそうだ
    • 自分もメインのClaudeインスタンスをマネージャー役にして、実装エージェントたちを管理させている。
      コンテキストをきれいに保ちながら、高品質な結果を出す助けになる
  • 自分はコードがもっと短くて高品質な方向に進化してほしい。
    だが今の流れは逆に進んでいるように見える。
    モデルがより堅牢になり、常識やフィードバックループが強化されれば有用だろうが、現状では「コードが多いほどよい」という方向でむしろ問題を大きくしている。
    派手なデモはできても、実運用環境では10〜100倍複雑なコードになりそうだ

    • 自分も似た経験がある。
      ClaudeにCIへテストカバレッジ統計を追加しろと言ったら、nycが入っていないのでbashでIstanbulを再実装しようとした。
      結局「そのままnycを入れて」と言わなければならなかった
    • まだこの機能が公開されていないのを見ると、Anthropicもモデルの準備が十分ではないと判断しているようだ。
      それでも、こうした実験はモデルの限界を広げる助けになる気がする。
      今ではなくても、2026年ごろには可能になるかもしれない
  • HNで定期的にAIコーディングエージェント人気ランキングを調べる投票があるといいのにと思う。
    言語ごとのTIOBE Indexのように、どのモデルが人気を集めているのかトレンドを見たい

    • 気に入ったものを1つ選んで使えばいい。
      ランキング競争は結局ぐるぐる回るハイプサイクル
    • 似たようなアンケートを始めたところ。参加歓迎 → agentic-coding-survey.pages.dev
    • コミュニティの意見ではないが、自分はlmarenaリーダーボードをよく参考にしている。
      MiniMax 2.1が大半のGPTより上にいるのが興味深かった。
      openrouter.aiでモデルのスループットとコストもおおよそ把握できる
    • 自分はZvi Mowshowitzのニュースレターで最新動向を追っている。
      そのおかげでOpus 4.5をリリース1週間後にはメインで使うようになった
    • 自分のエージェントスキルはskills.shディレクトリの上位10位に入っている。
      そのユーザー層の約80%がClaude Code、75%がdarwin-arm64環境だ
  • Claudeはコードを作りすぎてしまい、レビューが難しくなる問題がある。
    一部には「テストさえ通ればいい」と言う人もいるが、長期保守のプロジェクトでは不安だ。
    長期運用プロジェクトでYOLO式のコード生成を試した人たちの経験が気になる

    • 実際のプロ環境では、一度に扱うエージェントは1つで十分だ。
      コード品質はまだ低く、デバッグもしばしば外す。
      それでも検索・理解・アイデア拡張には有用だ。
      個人実験のプロジェクトならYOLOアプローチでも構わない
    • 自分はGraphite/Cursorで働いている立場だが、CCに変更をstack形式で管理させ、自動レビューエージェントを付ければ、大規模な変更も理解しやすくなる。
      こうすればコード生成を自動化しつつ、システム理解も維持できる
    • Claude Codeがコードを書いたら、自作の「codex-review」スキルで最後のコミットをレビューさせている。
      Codexにレビュー観点を提案させ、実際のレビューでその精度を検証している
    • 今はまだ早すぎて結果を見極めにくいが、年末ごろには砂上の楼閣のようなプロジェクトがどんな結果になるのか見えてくると思う
  • 「もはやAIコーダーではなくチームリードと会話している」という文句があったが、
    そのツイート自体までAIが書いたように見えて笑ってしまう

    • そう、こういう修辞的表現はAIであまりにも頻繁に繰り返される
  • 2026年にはエージェントオーケストレーターが主要トレンドになる気がする。
    既存のソフトウェア用語(チームリード、チームメンバーなど)をそのまま使うほうが理解と受容を高めるだろう

    • 同意する。Gas Townのような複雑な概念は、モデルの異常挙動を補正するための回避策にすぎない。
      Anthropicが自社モデルを調整できるなら、そのようなレイヤーは不要になるはずだ。
      結局のところ重要なのはメッセージングとタスク管理だ
    • ただ、自分はPolecatsのような概念が過度な擬人化(anthropomorphization) を防ぐ助けになると思う
  • 「チームリードとチーム全体に、このボタンを赤くしろと言う」という表現が面白かった

    • 「主任エンジニア! アーキテクチャが必要! マーケティングチーム、セレブ広告! プロダクトチーム、ロードマップ! MLチーム、学習データ反映! 財務チーム、ROI計算! 運用チーム、24/7対応!」
      そして結論は「よし、じゃあボタンを赤くしよう!」だった。完璧な風刺だ
    • Claudeが単にプロンプトでそれを実現できるとしても、我々はそれで終わったと認めないだろう。
      この動画を見ると感覚がつかめる
    • デフォルトのシステムプロンプトが、いつswarmモードを使うべきかをうまく判断するようになっている。
      CLAUDE.mdで追加指示を与えれば、些細な作業ではswarmモードを使わないよう調整できる
  • 最近の2.1.9バージョンでは、メインループがサブエージェントをオーケストレーションする方法が完全に変わった。
    「FTSChunkManager agentがまだ実行中だが進行中なので待とう」といったログが出て、スタックトレースとJSON出力が一緒に表示される

  • Claude Codeデスクトップアプリでこうした動作を実際に見た。
    マスタータスクの下で大量のワーカーリーダーエージェントがコードベースを探索し、レポートやTODOリストを作成する。
    別のシステムがそれを統合してマスタースキーマと計画を作る。
    自分はdevops、frontend、architecture、securityの各チャットを作り、各チャットが終わるたびにログを残して相互に更新をやり取りさせている。
    SSHでdropletに接続してターミナルを使わせると、Claudeが自律的にビルド・修正・テスト・検証を繰り返す。
    こうして3日でこのプロジェクトを完成させた

    • 実際にはこれは、複数の並列探索エージェントを立ち上げて結果を集約する基本機能にすぎない
    • oh-my-opencodeと非常によく似た動作だ