プロンプトからハーネスまで - AIエージェント型パターン4年の記録
(bits-bytes-nn.github.io)- 2022〜2026年、AI開発パラダイムは3回転換した: Prompt Engineering → Context Engineering → Harness Engineering
- 各転換は、それ以前のパラダイムが約束を果たせなかった失敗から生まれたものであり、エンジニアリングの厳密さは失われたのではなく、プロンプトからコンテキストへ、コンテキストからハーネスへと位置を移しただけである
- [第1時代] Prompt Engineering (2022〜2024)
- 「英語こそがプログラミング言語」、「段階的に考えよ」
- どれほど精巧なプロンプトでも、コンテキストウィンドウに存在しないファイルは分からない
- [第2時代] Context Engineering (2025)
- 「何を言うべきか」から「どの情報を入れるべきか」へ
- 完璧なコンテキストを構成しても、それを消費するループ自体の設計が誤っていれば、依然として失敗する
- [第2.5時代] バイブコーディングとその二日酔い
- diffも見ずにAIの提案をすべて受け入れる — コードは読める水準を超えて肥大化する
- 「LLMがコードを書いたとしても、あなたがレビューしたならそれは vibe coding ではない」
- [第3時代] Harness Engineering (2026〜)
- 「エージェントがミスしたら、エージェントではなく ハーネスを修正せよ」
- エージェント = モデル + ハーネス
- Anthropic 3エージェント・アーキテクチャ、Ralphパターン、Lethal Trifecta、Meta AIのRule of Two
- 2026年現在、中心的なメトリクスはプロンプト品質ではなく、KV-cache hit rate(モデルが以前の計算を再利用する割合)とハーネス複雑度へと移っている
- バイブコーディング(Vibe Coding)の二日酔い、エージェントの自己評価不能、セキュリティ脆弱性など、実際の本番運用の障壁が各時代の限界を証明しており、ハーネスはこれらすべての問題に対する構造的対応である
- 各時代は前の時代を置き換えるのではなく**包含(subsume)**しており、プロンプトエンジニアリングは死んだのではなく、ハーネスエンジニアリングのサブモジュールになった
- ハーネスは**取り外し可能(rippable)**でなければならない — モデルが進化すれば、既存のエラー復旧ロジックの半分は不要になる
- 厳密さの次の移動先: Guardian Agent(リアルタイム監視レイヤー)→ 評価エンジニアリング(behavior beats benchmarks)→ 知識エンジン(コードグラフ・コミット履歴・メモリの結合)
8件のコメント
一つひとつ全部追いかけることはできないので、
「そんなに良いなら公式がアップデートしてくれるだろう」
と信じています。
実際、この間ずっとそうでしたし。
GitHubが市場の支配者ではないとしても、流れの最先端にはいるとは思っていました。各プロジェクトのスコープが小さすぎて市場で採用される割合が低いだけで、総合的に見ると効果的なコンセプトを数多く生み出していたと思います。私が開発者だからでしょうか。
次の時代には何が出てくるのでしょうか
次の3つの時代が何なのか、まったく見当もつかない。
これであそこにメタ・ハーネスも追加されるべきだ。
good
AWS Koreaのデータサイエンティストであるキム・ヨンミンさんが、ここ数年の開発手法の変化に関する記録をうまく整理してくださっていますね。
最近いったい何がこんなに変わったのか、と思っている開発者に見せるのに良い文章だと思います。
本当に素晴らしい文章ですね。