12 ポイント 投稿者 xguru 4 일 전 | 1件のコメント | WhatsAppで共有
  • SWE-benchとSWE-agentを作ったPrinceton・Stanfordのチームが開発したミニマルなAIコーディングエージェント
  • 約100行のPythonコードで構成された超軽量のAIソフトウェアエンジニアリングエージェントで、巨大な設定ファイルやモノレポなしで動作
  • bashのみをツールとして使用し、LLMのtool-callingインターフェースがなくてもどのモデルとも互換性あり
  • SWE-bench verifiedベンチマークで74%以上を達成し、Gemini 3 Pro基準でも同水準を記録
  • subprocess.runで各アクションを独立実行するため、状態を保持するシェルセッションが不要で、Docker移行時もdocker execに置き換えるだけというシンプルさ
  • 完全に線形なヒストリ構造により、trajectoryとLLMに渡されるメッセージが同一で、デバッグやファインチューニングに最適
  • ローカル、Docker/Podman、Singularity/Apptainer、Bubblewrap、Contreeなど多様なサンドボックス環境でのデプロイをサポート
  • litellm、openrouter、portkeyなどを通じてすべてのモデルをサポートし、/completionおよび/responseエンドポイントとinterleaved thinkingに対応
  • Meta、NVIDIA、IBM、Essential AI、Nebius、Anyscale、Princeton・Stanfordなどで採用
  • Claude Codeと比べて起動速度がはるかに速く、エージェントのスキャフォールドへの過学習なしにLLM自体の性能を評価するベースラインとして活用可能
  • CLI(mini)、バッチ推論、trajectoryブラウザ、Pythonバインディング(DefaultAgent, LitellmModel, LocalEnvironment)を提供
  • MITライセンス

1件のコメント

 
ragingwind 3 일 전

これで、エージェントの直接開発が簡単になりますね。