81 ポイント 投稿者 flowkater 2026-03-01 | 3件のコメント | WhatsAppで共有

バイブコーディングの創始者の週末

  • Karpathyが週末プロジェクトをエージェントに任せた。IP、ユーザー名、パスワード、目標だけを渡し、30分後にはすべて完成
  • 99%の時間はコードを自分で書かず、エージェントに指示し監督する方式 — "エージェンティック・エンジニアリング"
  • しかし開発者の60%がAIを使っていても、完全委任は0〜20%にとどまる — 委任のパラドックス。"Do you trust your agents?" に対し、多くはいまだに "いいえ"

① 分解力 (Decomposition)

  • "会員登録機能を作って" と言えば何かしらは出てくる。問題は、それが自分の望んでいたものではない確率が高いこと
  • AddPlan画面をPRDだけ投げてエージェントに任せたところ、何十ターンもピンポンが続き、半日を失った経験
  • AIとソクラテス式対話で5分インタビュー → エッジケースを事前整理 → 修正を2〜3ターンに短縮
  • 実装前に考える時間を持つこと、その5分が4時間を節約する

② コンテキスト設計 (Context Architecture)

  • AGENTS.mdをうまく書くことも重要だが、コードアーキテクチャ自体がよく設計されていれば、エージェントがコンテキストを把握する速度はまったく違う
  • フラットなディレクトリでエージェントが迷っていた状態を、Feature単位のディレクトリへ再構成したところ即座に改善
  • Armin Ronacher: "ツールは、LLMのカオスモンキーが完全に間違った使い方をしても耐えられるようにすべきだ"

③ 完了の定義 (Definition of Done)

  • CLIプロジェクトを一晩走らせたら、1時間で終了 — 型定義だけ整えて、ビジネスロジックは空っぽの殻
  • 2回目の試行では、テスト自体をエージェントが自分に都合よく書き換えた
  • エージェントの "完了" は、自分の "完了" と違う
  • Elvisの7段階DoDシステム(PR→CI→コードレビュー3件→Telegram)は極端だが、方向性を示している

④ 失敗復旧 (Failure Recovery Loop)

  • 再分配エンジンで、同じパラメータが関数ごとに異なるセマンティクスを持ち、Aを直すとBが壊れる無限ループ
  • 同じプロンプトで再試行するのは、同じ方向に何度も壁へ頭を打ちつけるようなもの
  • 失敗を3種類(コンテキスト不足、方向の誤り、構造的衝突)に分類すると、対処が明確になる
  • "Must NOT Have" ガードレールが無限ループを断ち切った

⑤ 可観測性 (Observability)

  • liquidglassをエージェントに任せておいて、"変だけど…まあ放っておこう" が最も高くつく判断
  • 20個のファイルが絡み合った状態になり、ロールバックも不可能
  • その後は曳光弾戦略 + ブループリント — 初めて適用する技術はブループリントを先に描けないので、曳光弾が素早く輪郭を描いてくれる
  • 可観測性が信頼を生み、信頼が委任を可能にする

⑥ メモリ設計 (Memory Architecture)

  • 3日連続で作業すると、毎朝15分ずつ文脈説明に消える
  • Claude Code hooksでセッション終了時に自動でメモリを抽出 → 次のセッションを5秒で復元
  • Boris ChernyのチームはCLAUDE.mdをgitにチェックインしてチーム全体で共有
  • 個人の記憶ではなく、チームの記憶がエージェントに渡る構造

⑦ 並列管理 (Parallel Orchestration)

  • Boris Chernyは10〜15個の並列セッションを同時に回す
  • CTO時代に6つのスクワッドをマネジメントしていた経験が、エージェントの並列管理と驚くほど似ている
  • ADHDではなく、意図されたマルチタスク = マネジメント
  • 人は質問するが、エージェントは尋ねずに自分の判断で進める — 事前設計がより重要になる

⑧ 抽象化レイヤー設計 (Abstraction Layering)

  • Level 0(直接コーディング)→ Level 1(エージェントへの指示)→ Level 2(オーケストレーター)→ Level 3(メタ設計)
  • 毎日20分かかっていたルーティンをスキル化して2分に短縮した経験
  • コンパウンディング・エンジニアリング — プロジェクトはゴールテープのゲームではなく複利型のゲーム。前のセッションが後に複利で効いてくる

⑨ センス (Taste)

  • AIが作ったデザインは60〜70点。Ellieのデザインが入った瞬間に "あ、これはいける" と感じるセンス
  • AIが作った情報整理ポストはいいね0、衝動的に書いた一行の自慢投稿は閲覧数3万
  • KinglyCrowの "No Skill, No Taste" — LLMはスキル習得の参入障壁を下げたが、tasteという本当の障壁はむしろ増幅された
  • Chris Lattner: "実装の自動化が進むほど、設計・判断・センスの重要性はむしろ高まる"
  • 80%があふれる時代に、差別化は残りの20%から生まれる

おわりに

  • 終わったのはタイピングであって、エンジニアリングではない
  • この9つはAI以前から優れたエンジニアが備えていたもの
  • 良い設計のレバレッジは大きくなったが、悪い設計の被害も大きくなった
  • そのショーの主役はAIではなく、AIをうまく扱うエンジニアだ

3件のコメント

 
armila 2026-03-03

SSoTをきちんと守るだけで、ハルシネーションをかなり減らせるんですよね。トークンの節約にもなります。

 
tsboard 2026-03-03

「終わったのはタイピングであって、エンジニアリングではない」

共感します。笑

 
yangeok 2026-03-02

ありがとうございます。PCをつけておくだけでサーバーの役割までしてくれるcoworkが出てきて怖かったのですが、少し安心しましたし、これからどう変わっていくのか頭の中でイメージできました(笑)