効果的な「Agents」の構築方法

(anthropic.com)

21 ポイント投稿者 GN⁺ 2024-12-21 | 2件のコメント | WhatsAppで共有

エージェントとは何か？

エージェントの定義はさまざまだが、主に2つに分けられる:
- ワークフロー(Workflows): 事前定義されたコードパスを通じてLLMとツールが協調する
- エージェント(Agents): LLMがタスク実行とツール使用を動的に制御する
Anthropicではこの2つをいずれも エージェントシステム(Agentic Systems) と分類しており、柔軟性と自律性において重要な違いがある

いつエージェントを使うべきか？

シンプルな解決策が可能なら、複雑さを最小限にすることが重要
ワークフロー: 予測可能なタスクを処理する際に有用で、一貫性と安定性を提供する
エージェント: 大規模で柔軟性とモデル主導の意思決定が必要な場合に適している
多くの場合、LLM呼び出しを最適化したり、コンテキスト例を活用したりするだけで十分

フレームワーク利用ガイド

代表的なフレームワーク:
- LangGraph, Amazon Bedrock AI Agent, Rivet, Vellum
フレームワークの利点:
- LLM呼び出し、ツール定義、呼び出しチェーンを簡素化できる
欠点:
- 複雑さを増したり、デバッグを難しくしたりする可能性がある
推奨: まずはLLM APIを直接使って始め、フレームワークを使う場合でも基盤となるコードを理解すべき

エージェントシステムの構成要素

拡張LLM (Augmented LLM)

特徴: 検索、ツール利用、メモリ機能を追加で備える
実装方法:
- Model Context Protocol を使ってサードパーティーツールと統合できる
- シンプルで文書化されたインターフェースを提供する

主要なワークフローパターン

プロンプトチェイニング(Prompt Chaining)
- タスクを固定された下位ステップに分けて順次処理する
- 利用例:
  - マーケティング文言を生成した後に翻訳する
  - 文書の下書きを作成した後にレビューする
ルーティング(Routing)
- 入力データを分類し、適切な処理へ振り分ける
- 利用例:
  - カスタマーサポートの問い合わせ分類（一般質問、返金依頼、技術サポート）
  - 簡単な質問は小型モデルへ、複雑な質問はより高性能なモデルへルーティングする
並列化(Parallelization)
- タスクを分割する、または同じタスクを複数回実行する
- 利用例:
  - コード脆弱性レビュー時に複数のプロンプトを使う
  - ユーザー入力を分離してフィルタリングと応答を行う
オーケストレーター-ワーカー(Orchestrator-Workers)
- 中央のLLMがタスクを分解してワーカーLLMに割り当て、結果を統合する
- 利用例:
  - 複雑なコーディング作業でのファイル修正
  - 複数情報の検索タスク
評価者-最適化(Evaluator-Optimizer)
- LLMの応答を評価し、フィードバックを与えて反復的に改善する
- 利用例:
  - 文学翻訳における翻訳品質の改善
  - 複数回の検索と分析タスク

エージェント

エージェントはタスクを計画し、独立して実行し、必要に応じて人間と相互作用する
特徴:
- ツールの利用を通じて環境から「真実」を取得し、進行状況を評価する
- 作業中のチェックや中断条件を設定できる
利用例:
- 複雑なコーディングエージェント
- Claudeがコンピュータ上で作業を実行する実装

パターンの組み合わせとカスタマイズ

上記のパターンは特定の状況に合わせて調整・組み合わせが可能
複雑さは、結果の改善が実証される場合にのみ追加すべき

まとめ

LLM分野での成功は、最も複雑なシステムを構築することではなく、必要に合った適切なシステムを作ることにかかっている
シンプルなプロンプトから始め、評価を通じて最適化し、単純な解決策では不十分な場合にのみ多段階のエージェントシステム追加を検討すべき
エージェント実装時の中核原則
1. シンプルさを保つ: エージェントの設計を簡潔に保つ
2. 透明性を優先する: エージェントの計画ステップを明確に示す
3. エージェント-コンピュータ・インターフェース(ACI)の品質改善: ツールの文書化とテストを徹底する
フレームワーク活用と実装戦略
- フレームワークは初期実装に有用だが、抽象化レイヤーを減らし、基本コンポーネントでシステムを構築することも検討すべき
- 上記の原則に従えば、強力でありながら信頼でき、保守しやすいエージェントを作ることができる

顧客事例: 実務でのエージェント活用

A. カスタマーサポート
- 自然な会話の流れと外部データ統合を通じて効果的な解決策を提供する
- 利点:
  - 解決成功率で測定可能
  - 使用量ベースの価格モデルを適用できる
B. コーディングエージェント
- コードソリューションは自動テストによって検証可能
- 利点:
  - テスト結果をフィードバックとして活用できる
  - 問題空間が明確で構造化されている
C. ツール設計と最適化
- LLMのツール利用方法を考慮して設計する
- 推奨方法:
  - 直感的で簡潔なパラメータ名を使う
  - テストと反復的改善を行う
  - ツール定義に例やエッジケースを含める

2件のコメント

savvykang 2024-12-23

ローコードに、扱いにくさを下げる工夫が適用されたように見えますが、データスキーマやバージョン管理がなければ変更追跡はできないでしょう。

curiousotter 2024-12-23

浅い経験では、見た目上は関数型プログラミングで関数を組み合わせる感じなのに、関数の I/O（パラメータ、戻り値の型）が何になるのか分からない、混沌としたプログラミングのように感じました……
やっていて絶えず思うのは、これをあえてやる必要があるのか……？ここまで対応しなければならないのか……ということです。
まだ今のところ、エージェント型システムが本当に必要な分野が何なのか、いまひとつ実感できていません。