- 「ハーネスを構成して」 の一言で、ドメインに合った 専門エージェントチームを設計し、エージェントが使う スキルまで自動生成してくれる メタスキル
- 6種類のアーキテクチャパターンをサポートし、エージェント間の オーケストレーション と エラーハンドリングプロトコル を含む
- アーキテクチャパターン
- パイプライン: 順次依存タスク
- ファンアウト/ファンイン: 並列独立タスク
- エキスパートプール: 状況別に選択して呼び出し
- 生成-検証: 生成後に品質チェック
- スーパーバイザー: 中央エージェントが動的に分配
- 階層的委任: 上位→下位への再帰的委任
- 6段階ワークフロー : ドメイン分析 → チームアーキテクチャ設計(エージェントチーム vs サブエージェント) → エージェント定義生成 → スキル生成 → 統合とオーケストレーション → 検証とテスト
- 実行モード は2種類:
- エージェントチーム(基本): TeamCreate + SendMessage + TaskCreate 方式。2つ以上のエージェントや協業が必要な場合に推奨
- サブエージェント: Agent ツールを直接呼び出し。単発タスクで通信が不要な場合に適する
- Harness 実行時に
.claude/agents/ へエージェント定義ファイル(例: analyst.md, builder.md, qa.md)、.claude/skills/ へスキルファイルが自動生成される
- 生成できるチーム構成の例
- ディープリサーチ —
リサーチ用ハーネスを構成して。どんなテーマでも複数の角度から調査できるエージェントチームが必要だ — Web検索、学術資料、コミュニティの反応 — をクロス検証したうえで総合レポートを作成するチーム。
- Webサイト制作 —
フルスタックWebサイト開発ハーネスを構成して。デザイン、フロントエンド(React/Next.js)、バックエンド(API)、QAテストをワイヤーフレームからデプロイまでパイプラインで調整するチーム。
- ウェブトゥーン制作 —
ウェブトゥーンのエピソード制作ハーネスを構成して。ストーリー作成、キャラクターデザインのプロンプト、パネルレイアウト企画、セリフ編集のエージェントが必要で、お互いの成果物をスタイルの一貫性の観点からレビューできるようにしたい。
- YouTubeコンテンツ企画 —
YouTubeコンテンツ制作ハーネスを構成して。トレンド調査、台本作成、タイトル/タグのSEO最適化、サムネイルコンセプト企画をスーパーバイザーエージェントが調整するチーム。
- コードレビュー —
総合コードレビューハーネスを構成して。アーキテクチャ、セキュリティ脆弱性、性能ボトルネック、コードスタイルを並列で監査するエージェントたちが、結果を1つのレポートに統合するチーム。
- 技術文書作成 —
このコードベースからAPIドキュメントを自動生成するハーネスを構成して。エンドポイント分析、説明文作成、使用例生成、完成度レビューをパイプラインで処理するチーム。
- データパイプライン設計 —
データパイプライン設計ハーネスを構成して。スキーマ設計、ETLロジック、データ検証ルール、モニタリング設定を階層的に委任するエージェントチーム。
- マーケティングキャンペーン —
マーケティングキャンペーン制作ハーネスを構成して。ターゲット市場調査、広告コピー作成、ビジュアルコンセプトデザイン、A/Bテスト計画を反復的な品質レビューとともに進めるチーム。
- revfactory/harness-100 — 10ドメイン、100個の本番対応エージェントチームハーネス(韓英 200パッケージ)を公開
- 各ハーネスに4〜5人の専門エージェント、オーケストレータースキル、ドメイン特化スキルを含む
- コンテンツ制作・ソフトウェア開発・データ/AI・ビジネス戦略・教育・法務・ヘルスケアなど 1,808個のMarkdownファイル で構成
- すべて Harness プラグインで生成
- Claude Code の エージェントチーム機能の有効化 が必要:
CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1
7件のコメント
実際に使ってみた結果は圧巻です。ミノさんが作ったHarnessの構造自体がFan in/outしながら、Instructionに合わせた複数のマルチエージェントを目的に応じて生成し、それを管理するオーケストレーターが各作業段階を複数のPhaseに分解して実行します。
成果物のレベルは準専門家級で、レポートかもしれないし、アプリケーションまで、それに必要なコーダー、テスター、レビュアー、アナリストなど多様な役割のエージェントが高い水準で動作します。
MCPや他のツールのように、Harnessのせいでコンテキストがずっと大きく維持され、トークンがすぐ消費されると思われるかもしれませんが、Contextを開いてみると最大限の効率で使っていることが分かります。ただ、私たちが考える可読性や洗練された結果を作るには、Gemini APIベースでナノバナナ画像生成Skillを作って付ける必要があります。
Claude Max 200でもおそらく1時間〜2時間でDaily limitになると思いますし、Opusを使いました。
日本旅行の日程を伝えて、インタラクティブな旅行日程ページを日本旅行ガイドとして作ってほしいと頼んだ結果です。こういうものはトークンもあまりかからず、すぐ作れます。
http://namojo.github.io/tokyo-tour
使ってみた方、感想をお願いします。
Kakao AI Native戦略チームのリーダー、ファン・ミンホさんが作られたものですね。
何度か紹介されている投稿を見かけていたので、いつ公開されるのか待っていました。
一度使ってみます!
すでに Claude code agent team を使っているなら、特に目新しいものはありませんでした。
ただ、チーム構成情報などを新しいセッションでも引き継げるように、agents や skills を活用してインフラを構築できるのは便利でした。
手動でチームを構成すると、チーム向けのボイラープレートのようなものが繰り返し発生していたからです。
問題が1つあって、subagent と agent team の両方を考慮した環境であるため、Supervisor パターンでは、監督者がチームが生成済みであるにもかかわらず、subagent に作業を委任してしまう妙な状況がしばしば発生します。
Max 100 なのに、始めた途端にトークン上限に達しちゃいましたね :(
時間を取って、適用した内容を整理してみました。実際にVibeCodingモノレポに適用してみました。
Mode A(開発)、B(コード監査)、C(統合: A+B)のうち、すでに進行しているプロジェクトでMode Bで進めました。
フロントエンド/バックエンドの型不一致など、静的解析では捉えられない項目を見つけることができました。
適用過程を整理してみました。
https://blog.neocode24.com/blog/claude-code-harness-real-world/
個人的にハーネスを作っている者として、オープンソースの適用効果がどのようなテスト結果として現れるのか気になります。定量化された公式なベンチマークツールが存在するのか……。たいてい他の方々は、体感ではない効果検証についてどのようにされているのか気になります。