Claude Codeとともにbkamp.aiを立ち上げるのに9日かかり、そのノウハウをbkitプラグインに込めました。

(bkit.ai)

2 ポイント投稿者 agentkay 2026-04-29 | まだコメントはありません。 | WhatsAppで共有

bkit — Context EngineeringでClaude Codeを“正しく”使う

2025年12月、私はbkamp.aiというサービスをリリースしました。

11個のマイクロサービス
Next.jsベースのポータル
AWS EKS + GitOps (ArgoCD)
Terraformインフラ

そしてこれらすべてをわずか9日で本番環境に載せました。

開発者は私ひとりで、
AIにはClaude Codeを使いました。

この記事は「速く作った」という話ではありません

多くのAI開発事例は、次のように説明されます。

「AIでN日で作った」
「プロンプトをうまく書けばいい」

しかし実際に9日間開発して感じたことは、まったく別のものでした。

AIがコードを書くのが上手いのは事実です。
しかし何を書くべきかはAIが決めるわけではありません。

それを決めるのは結局、次のものです。

設計
ルール
作業単位
検証方法

私はこれをContext Engineeringと定義しました。

Context Engineeringとは何か

簡単に言えば、

プロンプトをうまく書くことではなく、
AIが働く環境そのものを設計すること

です。

たとえば、

先に設計書を作る
作業単位を文書基準で分ける
結果を検証するルールを作る
再現可能なサイクルを作る

つまり、

AIは「執筆者」ではなく、
定義済みコンテキストをレンダリングするエンジンになります

bkampで実際に行った方法

1. Day 0 — コードを書く前にルールを作る

最初のコミットにはコードがありませんでした。

代わりに次のものを作りました。

.claude/CLAUDE.md (約150行)
要件文書
戦略文書

ここには次の内容が定義されています。

PDCAサイクル (Plan → Do → Check → Act)
すべての成果物は人間が検証
企画は日本語、コードは英語、コミットは日本語
作業単位と進め方

この100行ほどのルールが、その後のすべての開発を決定しました。

2. 作業単位は「機能」ではなく「文書」

通常は次のように依頼します。

「チャット機能を作って」

しかし実際には次のように進めました。

「文書7の3.2節を実装して」

この違いは非常に大きいです。

AIの立場から見ると、

機能 → 解釈が必要（不確実性）
文書 → そのまま実装（決定的）

結果として、

出力のばらつきがほとんど消えます

3. 1日 = 1つのPDCAサイクル

開発はこのように進みます。

Plan (設計)
Do (実装)
Check (Gap分析)
Act (修正)

そしてこのサイクルを日単位で繰り返します。

この方法の利点は、

コンテキストが常に最新状態に保たれる
作業範囲が明確
AIが「今何をすべきか」を明確に理解できる

4. チェックポイントを打ち、大胆に作り直す

4日目にはフロントエンドを全面的に再構成しました。

しかしその前に必ず行うことがあります。

ロールバック可能なチェックポイントを作成

こうすることで、

失敗しても安全
→ 大胆な構造変更が可能

5. インフラは最後にまとめて接続する

8日目の1日で、

Terraform
Kubernetes
CI/CD
ArgoCD

を一気に接続しました。

これが可能だった理由は単純です。

それ以前にすべての構造がすでに整列していたからです

ここから得た核心的なパターン

この9日間で繰り返されたパターンは次のとおりです。

まずルールを定義する
まず設計を作る
文書を基準に作業する
PDCAサイクルで反復する
チェックポイントを作る
不一致は文書で解決する
コードは最後

では、これを継続して維持できるのか？

ここで問題が生じます。

この方法は強力ですが、

人間が継続的に維持するにはあまりにも大変です

ルールをずっと覚えておかなければならず
文書を常に合わせ続けなければならず
毎回PDCAを守らなければなりません

そこで作ったのがbkitです。

bkitとは何か

bkitはClaude Codeプラグインです。

しかし単なるツールではありません。

bkampで使った作業方式を、
そのままシステム化したものです

最も重要な概念: PDCA = 状態機械

bkitではPDCAを次のように実装しました。

状態: plan, design, do, check, act など
遷移: 状態間の移動ルール
ガード: 条件チェック

たとえば、

設計と実装の一致率が90%以上 → 通過
そうでなければ → 自動で修正ループを実行

つまり、

「レビュー → 修正」が自動で繰り返されます

Context Engineeringをシステム化した構造

bkitは次の要素で構成されています。

Skills (ドメイン知識)
Agents (役割ベースの振る舞い)
PDCA状態機械
Context注入システム
Quality Gate (検証)
Audit Log (記録)
Feedback Loop (自動反復)

これを一文でまとめると、

AIを使うのではなく、
AIが働くシステムを作る

結果

この方法で得られた結果は次のとおりです。

Claude Code 79バージョン連続互換
4,000+ テスト、失敗 0
200+ CI検証ルール
DocsとCodeの完全同期

結論

これはAIがより賢くなったという話ではありません。

人間の作業が前倒しされたという話です

設計が先
ルールが先
検証が先

その次に、

AIが実行し
システムが検証し
人間が承認します

TL;DR

プロンプトだけでは限界がある
Context Engineeringが核心だ
AIは執筆者ではなくレンダラーだ
ワークフローはモデルより重要だ

リンク

bkit: https://github.com/popup-studio-ai/bkit-claude-code
事例: https://bkamp.ai

この方法について意見やフィードバックがあれば、本当に歓迎します。