mini-swe-agent - 100行のAIエージェントでGitHub Issueを解決し、コマンドラインも支援

xguru · 2026-04-26T09:31:02+09:00

SWE-benchとSWE-agentを作ったPrinceton・Stanfordのチームが開発したミニマルなAIコーディングエージェント約100行のPythonコードで構成された超軽量のAIソフトウェアエンジニアリングエージェントで、巨大な設定ファイルやモノレポなしで動作 bashのみをツールとして使用し、LLMのtool-callingインターフェースがなくてもどのモデルとも互換性あり SWE-bench verifiedベンチマークで74%以上を達成し、Gemini 3 Pro基準でも同水準を記録 subprocess.runで各アクションを独立実行するため、状態を保持するシェルセッションが不要で、Docker移行時もdocker execに置き換えるだけというシンプルさ完全に線形なヒストリ構造により、trajectoryとLLMに渡されるメッセージが同一で、デバッグやファインチューニングに最適ローカル、Docker/Podman、Singularity/Apptainer、Bubblewrap、Contreeなど多様なサンドボックス環境でのデプロイをサポート litellm、openrouter、portkeyなどを通じてすべてのモデルをサポートし、/completionおよび/responseエンドポイントとinterleaved thinkingに対応 Meta、NVIDIA、IBM、Essential AI、Nebius、Anyscale、Princeton・Stanfordなどで採用 Claude Codeと比べて起動速度がはるかに速く、エージェントのスキャフォールドへの過学習なしにLLM自体の性能を評価するベースラインとして活用可能 CLI（mini）、バッチ推論、trajectoryブラウザ、Pythonバインディング（DefaultAgent, LitellmModel, LocalEnvironment）を提供 MITライセンス

(github.com/SWE-agent)

12 ポイント投稿者 xguru 2026-04-26 | 1件のコメント | WhatsAppで共有

SWE-benchとSWE-agentを作ったPrinceton・Stanfordのチームが開発したミニマルなAIコーディングエージェント
約100行のPythonコードで構成された超軽量のAIソフトウェアエンジニアリングエージェントで、巨大な設定ファイルやモノレポなしで動作
bashのみをツールとして使用し、LLMのtool-callingインターフェースがなくてもどのモデルとも互換性あり
SWE-bench verifiedベンチマークで74%以上を達成し、Gemini 3 Pro基準でも同水準を記録
subprocess.runで各アクションを独立実行するため、状態を保持するシェルセッションが不要で、Docker移行時もdocker execに置き換えるだけというシンプルさ
完全に線形なヒストリ構造により、trajectoryとLLMに渡されるメッセージが同一で、デバッグやファインチューニングに最適
ローカル、Docker/Podman、Singularity/Apptainer、Bubblewrap、Contreeなど多様なサンドボックス環境でのデプロイをサポート
litellm、openrouter、portkeyなどを通じてすべてのモデルをサポートし、/completionおよび/responseエンドポイントとinterleaved thinkingに対応
Meta、NVIDIA、IBM、Essential AI、Nebius、Anyscale、Princeton・Stanfordなどで採用
Claude Codeと比べて起動速度がはるかに速く、エージェントのスキャフォールドへの過学習なしにLLM自体の性能を評価するベースラインとして活用可能
CLI（mini）、バッチ推論、trajectoryブラウザ、Pythonバインディング（DefaultAgent, LitellmModel, LocalEnvironment）を提供
MITライセンス

1件のコメント

ragingwind 2026-04-26

これで、エージェントの直接開発が簡単になりますね。

mini-swe-agent - 100行のAIエージェントでGitHub Issueを解決し、コマンドラインも支援

関連記事

1件のコメント