130 ポイント 投稿者 xguru 2026-03-29 | 7件のコメント | WhatsAppで共有
  • 「ハーネスを構成して」 の一言で、ドメインに合った 専門エージェントチームを設計し、エージェントが使う スキルまで自動生成してくれる メタスキル
  • 6種類のアーキテクチャパターンをサポートし、エージェント間の オーケストレーションエラーハンドリングプロトコル を含む
  • アーキテクチャパターン
    • パイプライン: 順次依存タスク
    • ファンアウト/ファンイン: 並列独立タスク
    • エキスパートプール: 状況別に選択して呼び出し
    • 生成-検証: 生成後に品質チェック
    • スーパーバイザー: 中央エージェントが動的に分配
    • 階層的委任: 上位→下位への再帰的委任
  • 6段階ワークフロー : ドメイン分析 → チームアーキテクチャ設計(エージェントチーム vs サブエージェント) → エージェント定義生成 → スキル生成 → 統合とオーケストレーション → 検証とテスト
  • 実行モード は2種類:
    • エージェントチーム(基本): TeamCreate + SendMessage + TaskCreate 方式。2つ以上のエージェントや協業が必要な場合に推奨
    • サブエージェント: Agent ツールを直接呼び出し。単発タスクで通信が不要な場合に適する
  • Harness 実行時に .claude/agents/ へエージェント定義ファイル(例: analyst.md, builder.md, qa.md)、.claude/skills/ へスキルファイルが自動生成される
  • 生成できるチーム構成の例
    • ディープリサーチリサーチ用ハーネスを構成して。どんなテーマでも複数の角度から調査できるエージェントチームが必要だ — Web検索、学術資料、コミュニティの反応 — をクロス検証したうえで総合レポートを作成するチーム。
    • Webサイト制作フルスタックWebサイト開発ハーネスを構成して。デザイン、フロントエンド(React/Next.js)、バックエンド(API)、QAテストをワイヤーフレームからデプロイまでパイプラインで調整するチーム。
    • ウェブトゥーン制作ウェブトゥーンのエピソード制作ハーネスを構成して。ストーリー作成、キャラクターデザインのプロンプト、パネルレイアウト企画、セリフ編集のエージェントが必要で、お互いの成果物をスタイルの一貫性の観点からレビューできるようにしたい。
    • YouTubeコンテンツ企画YouTubeコンテンツ制作ハーネスを構成して。トレンド調査、台本作成、タイトル/タグのSEO最適化、サムネイルコンセプト企画をスーパーバイザーエージェントが調整するチーム。
    • コードレビュー総合コードレビューハーネスを構成して。アーキテクチャ、セキュリティ脆弱性、性能ボトルネック、コードスタイルを並列で監査するエージェントたちが、結果を1つのレポートに統合するチーム。
    • 技術文書作成このコードベースからAPIドキュメントを自動生成するハーネスを構成して。エンドポイント分析、説明文作成、使用例生成、完成度レビューをパイプラインで処理するチーム。
    • データパイプライン設計データパイプライン設計ハーネスを構成して。スキーマ設計、ETLロジック、データ検証ルール、モニタリング設定を階層的に委任するエージェントチーム。
    • マーケティングキャンペーンマーケティングキャンペーン制作ハーネスを構成して。ターゲット市場調査、広告コピー作成、ビジュアルコンセプトデザイン、A/Bテスト計画を反復的な品質レビューとともに進めるチーム。
  • revfactory/harness-100 — 10ドメイン、100個の本番対応エージェントチームハーネス(韓英 200パッケージ)を公開
    • 各ハーネスに4〜5人の専門エージェント、オーケストレータースキル、ドメイン特化スキルを含む
    • コンテンツ制作・ソフトウェア開発・データ/AI・ビジネス戦略・教育・法務・ヘルスケアなど 1,808個のMarkdownファイル で構成
    • すべて Harness プラグインで生成
  • Claude Code の エージェントチーム機能の有効化 が必要: CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1

7件のコメント

 
namojo 29 일 전

実際に使ってみた結果は圧巻です。ミノさんが作ったHarnessの構造自体がFan in/outしながら、Instructionに合わせた複数のマルチエージェントを目的に応じて生成し、それを管理するオーケストレーターが各作業段階を複数のPhaseに分解して実行します。

成果物のレベルは準専門家級で、レポートかもしれないし、アプリケーションまで、それに必要なコーダー、テスター、レビュアー、アナリストなど多様な役割のエージェントが高い水準で動作します。

MCPや他のツールのように、Harnessのせいでコンテキストがずっと大きく維持され、トークンがすぐ消費されると思われるかもしれませんが、Contextを開いてみると最大限の効率で使っていることが分かります。ただ、私たちが考える可読性や洗練された結果を作るには、Gemini APIベースでナノバナナ画像生成Skillを作って付ける必要があります。

Claude Max 200でもおそらく1時間〜2時間でDaily limitになると思いますし、Opusを使いました。

日本旅行の日程を伝えて、インタラクティブな旅行日程ページを日本旅行ガイドとして作ってほしいと頼んだ結果です。こういうものはトークンもあまりかからず、すぐ作れます。

http://namojo.github.io/tokyo-tour

 
tested 2026-03-30

使ってみた方、感想をお願いします。

 
xguru 2026-03-29

Kakao AI Native戦略チームのリーダー、ファン・ミンホさんが作られたものですね。
何度か紹介されている投稿を見かけていたので、いつ公開されるのか待っていました。
一度使ってみます!

 
edunga1 23 일 전

すでに Claude code agent team を使っているなら、特に目新しいものはありませんでした。
ただ、チーム構成情報などを新しいセッションでも引き継げるように、agents や skills を活用してインフラを構築できるのは便利でした。
手動でチームを構成すると、チーム向けのボイラープレートのようなものが繰り返し発生していたからです。

問題が1つあって、subagent と agent team の両方を考慮した環境であるため、Supervisor パターンでは、監督者がチームが生成済みであるにもかかわらず、subagent に作業を委任してしまう妙な状況がしばしば発生します。

 
neocode24 2026-03-31

Max 100 なのに、始めた途端にトークン上限に達しちゃいましたね :(

 
neocode24 29 일 전

時間を取って、適用した内容を整理してみました。実際にVibeCodingモノレポに適用してみました。

Mode A(開発)、B(コード監査)、C(統合: A+B)のうち、すでに進行しているプロジェクトでMode Bで進めました。
フロントエンド/バックエンドの型不一致など、静的解析では捉えられない項目を見つけることができました。
適用過程を整理してみました。

https://blog.neocode24.com/blog/claude-code-harness-real-world/

 
wang3281 2026-03-30

個人的にハーネスを作っている者として、オープンソースの適用効果がどのようなテスト結果として現れるのか気になります。定量化された公式なベンチマークツールが存在するのか……。たいてい他の方々は、体感ではない効果検証についてどのようにされているのか気になります。