- 2025年現在、コーディングエージェントを自分で作ることは、個人開発者が取り組める最高のプロジェクトの一つ
- エージェントは300行のコードとLLMトークンループだけで動作し、これを作ってみることで、消費者ではなくAIの生産者へ転換する機会を得られる
- 基本構成要素は、ファイル読み取り、ファイル一覧、Bash実行、ファイル編集、コード検索のようなツールで、これにより実際の自動化機能を実装する
- モデル選定では、Claude Sonnet、Kimi K2のようなエージェント向きのモデルが適しており、必要に応じて GPT のようなオラクル型モデルをツールとして接続し、高度な検証を行う
- 実際に Amp、Cursor、Claude Code、GitHub Copilot などの商用製品も類似した構造である
ワークショップ概要
- Geoffrey Huntley が実施した無料ワークショップで、コーディングエージェントを自作する方法と原理を、実践中心で案内
- Roo code、Cline、Amp、Cursor、Windsurf、OpenCode といった既存の商用 AI 支援ツールと構造や原理を比較しながら、実際に実装してみる機会を提供
- 制作経験を通じて、単なる AI ユーザーから、自ら AI を活用して自動化ツールを作る開発者へ成長できる
- 中核となる構造は、およそ 300 行のコードで LLM トークンをループ的に活用し、エージェント機能を作ること
- 各ツール別のプリミティブ(読み取り、ファイル一覧、実行、編集、コード検索)機能を追加し、実際の動作例とコードは GitHub リポジトリ で公開
エージェントとは何か
- 最近「エージェント」という用語は広く使われているが、実質的な意味や内部動作の原理は明確でない
- エージェント制作の参入障壁が下がるにつれ、AI の消費者を超えて、業務自動化を主導できる生産者へ成長できる
- 2025年時点では、基本的なデータベース概念(Primary key)のように、エージェント制作の原理が必須知識として定着しつつある
- Canva などの企業はすでに採用面接の過程でAI の使用を推奨しており、AI 自動化の能力は採用の重要要素になっている
- いま後れを取る理由は AI そのものではなく、自己研鑽を通じて新しいツールを身につけないことにある
コーディングエージェントの中核原理
- コーディングエージェントは300行のコードとLLMトークンループだけで構成され、反復的なトークン入力によって機能を実行する
- **同時作業(concurrent work)**の概念が重要
- 例: Zoom 会議中でもエージェントが並列で作業を進められるため、業務効率が大きく向上する
- すべての LLM がエージェント的というわけではない
- 「高安全」(例: Anthropic、OpenAI)
- 「低安全」(例: Grok)
- 「オラクル」(要約・高次思考に有利)
- 「エージェント的」(行動バイアス、素早い反復・ツール呼び出し)
- 開発者はモデルごとの特性を理解し、目的に応じて活用するモデルを選ぶ
- むやみにコンテキストウィンドウを割り当てることは性能低下の要因であり、「少ないほど結果が良い」ことを意識すべき
- ルール: 「Less is more」→ 必要な分だけツールとデータを文脈に配置してこそ最適な性能を確保できる
コーディングエージェント構築プロセスの流れ
-
1. ツール登録と関数呼び出し
- たとえば 天気照会ツールを LLM に登録し、適切な状況で LLM が関数呼び出し形式で対応できるようにする
- MCP(Model Context Protocol) は「関数に関する情報バナー」に似ており、関数の説明だけ登録しても自動呼び出しが可能
-
2. プリミティブツールごとの中核機能
- ファイル読み取り(ReadFile): パスを渡すとファイル内容をコンテキストとして読み込む
- ファイル一覧(ListFiles): ディレクトリ内のファイル・フォルダ一覧を提供
- コマンド実行(Bash): LLM がシステムシェルのコマンドを実行し、結果を返す
- ファイル編集(Edit): 指定ファイルの作成・修正を自動化
- コード検索(CodeSearch): パターン、キーワード、関数名を基準にコードベース全体を高速検索する(ripgrep 活用)
-
3. 例と結果の流れ
- 各ツールを LLM に統合し、自然言語プロンプトだけで連続した業務(例: FizzBuzz コード生成→実行確認、ディレクトリ探索→内容分析など)を自動化
- ツール関数はユーザー入力やシナリオに応じて順次呼び出され、結果の返却をループ内で繰り返す
- エージェントの主要な動作シーケンス: ユーザー入力→ツール呼び出し要否の判断→ツール実行→結果をコンテキストに割り当て→反復
拡張可能性とオープンソース
- 現在、ほとんどのコーディングエージェントは ripgrep などの既存オープンソースツールを基盤として動作している
- GitHub には SST Open Code、mini-swe-agent など、わずか 100 行で実装されたシンプルかつ強力なエージェントプロジェクトが存在し、性能や構造の参考にできる
- 開発者には既存製品を比較するより、直接作って原理を理解し活用することが推奨される
- 実業務・自動化へ適用する際には、自前のエージェントの作成と組織内への展開が競争力につながる
結論と示唆
- コーディングエージェントは複雑な技術ではなく、シンプルなループ構造とツールの組み合わせで構成される
- コーディングエージェント制作の核心は構造理解と迅速な実行力であり、自作経験を通じて AI 技術の変化に積極的に対応できる
- 重要なのは AI そのものより、継続的な自己研鑽とツール制作能力の確保といった自己投資が現時点で最も重要な個人の成長戦略だということ
- 「AI があなたの仕事を奪うのではなく、あなたの同僚がエージェントで武装して自動化し、より速く働くことが脅威である」
まだコメントはありません。