mini-swe-agent - 100行のAIエージェントでGitHub Issueを解決し、コマンドラインも支援
(github.com/SWE-agent)- SWE-benchとSWE-agentを作ったPrinceton・Stanfordのチームが開発したミニマルなAIコーディングエージェント
- 約100行のPythonコードで構成された超軽量のAIソフトウェアエンジニアリングエージェントで、巨大な設定ファイルやモノレポなしで動作
- bashのみをツールとして使用し、LLMのtool-callingインターフェースがなくてもどのモデルとも互換性あり
- SWE-bench verifiedベンチマークで74%以上を達成し、Gemini 3 Pro基準でも同水準を記録
subprocess.runで各アクションを独立実行するため、状態を保持するシェルセッションが不要で、Docker移行時もdocker execに置き換えるだけというシンプルさ- 完全に線形なヒストリ構造により、trajectoryとLLMに渡されるメッセージが同一で、デバッグやファインチューニングに最適
- ローカル、Docker/Podman、Singularity/Apptainer、Bubblewrap、Contreeなど多様なサンドボックス環境でのデプロイをサポート
- litellm、openrouter、portkeyなどを通じてすべてのモデルをサポートし、
/completionおよび/responseエンドポイントとinterleaved thinkingに対応 - Meta、NVIDIA、IBM、Essential AI、Nebius、Anyscale、Princeton・Stanfordなどで採用
- Claude Codeと比べて起動速度がはるかに速く、エージェントのスキャフォールドへの過学習なしにLLM自体の性能を評価するベースラインとして活用可能
- CLI(
mini)、バッチ推論、trajectoryブラウザ、Pythonバインディング(DefaultAgent,LitellmModel,LocalEnvironment)を提供 - MITライセンス
1件のコメント
これで、エージェントの直接開発が簡単になりますね。