2 ポイント 投稿者 agentkay 26 일 전 | まだコメントはありません。 | WhatsAppで共有

bkit — Context EngineeringでClaude Codeを“正しく”使う

2025年12月、私はbkamp.aiというサービスをリリースしました。

  • 11個のマイクロサービス
  • Next.jsベースのポータル
  • AWS EKS + GitOps (ArgoCD)
  • Terraformインフラ

そしてこれらすべてをわずか9日で本番環境に載せました。

開発者は私ひとりで、
AIにはClaude Codeを使いました。


この記事は「速く作った」という話ではありません

多くのAI開発事例は、次のように説明されます。

  • 「AIでN日で作った」
  • 「プロンプトをうまく書けばいい」

しかし実際に9日間開発して感じたことは、まったく別のものでした。

AIがコードを書くのが上手いのは事実です。
しかし何を書くべきかはAIが決めるわけではありません。

それを決めるのは結局、次のものです。

  • 設計
  • ルール
  • 作業単位
  • 検証方法

私はこれをContext Engineeringと定義しました。


Context Engineeringとは何か

簡単に言えば、

プロンプトをうまく書くことではなく、
AIが働く環境そのものを設計すること

です。

たとえば、

  • 先に設計書を作る
  • 作業単位を文書基準で分ける
  • 結果を検証するルールを作る
  • 再現可能なサイクルを作る

つまり、

AIは「執筆者」ではなく、
定義済みコンテキストをレンダリングするエンジンになります


bkampで実際に行った方法

1. Day 0 — コードを書く前にルールを作る

最初のコミットにはコードがありませんでした。

代わりに次のものを作りました。

  • .claude/CLAUDE.md (約150行)
  • 要件文書
  • 戦略文書

ここには次の内容が定義されています。

  • PDCAサイクル (Plan → Do → Check → Act)
  • すべての成果物は人間が検証
  • 企画は日本語、コードは英語、コミットは日本語
  • 作業単位と進め方

この100行ほどのルールが、その後のすべての開発を決定しました。


2. 作業単位は「機能」ではなく「文書」

通常は次のように依頼します。

  • 「チャット機能を作って」

しかし実際には次のように進めました。

  • 「文書7の3.2節を実装して」

この違いは非常に大きいです。

AIの立場から見ると、

  • 機能 → 解釈が必要(不確実性)
  • 文書 → そのまま実装(決定的)

結果として、

出力のばらつきがほとんど消えます


3. 1日 = 1つのPDCAサイクル

開発はこのように進みます。

  • Plan (設計)
  • Do (実装)
  • Check (Gap分析)
  • Act (修正)

そしてこのサイクルを日単位で繰り返します。

この方法の利点は、

  • コンテキストが常に最新状態に保たれる
  • 作業範囲が明確
  • AIが「今何をすべきか」を明確に理解できる

4. チェックポイントを打ち、大胆に作り直す

4日目にはフロントエンドを全面的に再構成しました。

しかしその前に必ず行うことがあります。

  • ロールバック可能なチェックポイントを作成

こうすることで、

失敗しても安全
→ 大胆な構造変更が可能


5. インフラは最後にまとめて接続する

8日目の1日で、

  • Terraform
  • Kubernetes
  • CI/CD
  • ArgoCD

を一気に接続しました。

これが可能だった理由は単純です。

それ以前にすべての構造がすでに整列していたからです


ここから得た核心的なパターン

この9日間で繰り返されたパターンは次のとおりです。

  1. まずルールを定義する
  2. まず設計を作る
  3. 文書を基準に作業する
  4. PDCAサイクルで反復する
  5. チェックポイントを作る
  6. 不一致は文書で解決する
  7. コードは最後

では、これを継続して維持できるのか?

ここで問題が生じます。

この方法は強力ですが、

人間が継続的に維持するにはあまりにも大変です

  • ルールをずっと覚えておかなければならず
  • 文書を常に合わせ続けなければならず
  • 毎回PDCAを守らなければなりません

そこで作ったのがbkitです。


bkitとは何か

bkitはClaude Codeプラグインです。

しかし単なるツールではありません。

bkampで使った作業方式を、
そのままシステム化したものです


最も重要な概念: PDCA = 状態機械

bkitではPDCAを次のように実装しました。

  • 状態: plan, design, do, check, act など
  • 遷移: 状態間の移動ルール
  • ガード: 条件チェック

たとえば、

  • 設計と実装の一致率が90%以上 → 通過
  • そうでなければ → 自動で修正ループを実行

つまり、

「レビュー → 修正」が自動で繰り返されます


Context Engineeringをシステム化した構造

bkitは次の要素で構成されています。

  • Skills (ドメイン知識)
  • Agents (役割ベースの振る舞い)
  • PDCA状態機械
  • Context注入システム
  • Quality Gate (検証)
  • Audit Log (記録)
  • Feedback Loop (自動反復)

これを一文でまとめると、

AIを使うのではなく、
AIが働くシステムを作る


結果

この方法で得られた結果は次のとおりです。

  • Claude Code 79バージョン連続互換
  • 4,000+ テスト、失敗 0
  • 200+ CI検証ルール
  • DocsとCodeの完全同期

結論

これはAIがより賢くなったという話ではありません。

人間の作業が前倒しされたという話です

  • 設計が先
  • ルールが先
  • 検証が先

その次に、

  • AIが実行し
  • システムが検証し
  • 人間が承認します

TL;DR

  • プロンプトだけでは限界がある
  • Context Engineeringが核心だ
  • AIは執筆者ではなくレンダラーだ
  • ワークフローはモデルより重要だ

リンク


この方法について意見やフィードバックがあれば、本当に歓迎します。

まだコメントはありません。

まだコメントはありません。