Anthropic、Claude 4をリリース
(anthropic.com)Anthropicは2025年5月23日にClaude 4シリーズをリリースしました。今回発表されたClaude Opus 4とClaude Sonnet 4は、前バージョンと比べてコーディングおよび長時間の作業遂行能力を改善したモデルで、価格は従来と同じに据え置かれています。
-
継続作業能力
- 7時間の連続作業: Rakutenが検証したオープンソースのリファクタリングで、7時間にわたり独立して作業を実行
- 数千のステップを要する複雑な作業も中断なく処理
- 従来のAIエージェントの限界を大きく超える作業継続性
-
強化されたメモリシステム
Navigation Guideのようなメモリファイルを自動生成し、長期作業における状況認識を改善- ポケモンのゲームプレイ中にナビゲーションガイドを自ら作成するなど、実用的なメモリ活用
- 以前のモデル比で65%減少した近道・抜け穴の利用行動
-
ハイブリッド推論モデル
- 即時応答モード: 素早い回答が必要な場合
- 拡張思考モード: 最大64Kトークンまで深い推論が可能
- 状況に応じて2つのモードを自動で切り替え
-
ツール使用
- 並列ツール実行: 複数のツールを同時に使用して効率性を向上
- 思考中のツール使用: 推論過程でWeb検索などを活用し、より正確な回答を生成
-
コード品質の改善
- Block評価: 「編集とデバッグの最中にコード品質を向上させた最初のモデル」
- iGentレポート: コードベース探索のエラー率が20%からほぼ0%に減少
- Sourcegraph: より洗練されたコード品質と深い問題理解力
-
Claude Codeの実務統合
- IDE直接統合: コード変更内容がエディタにすぐ表示
- GitHub PR対応: PRレビューアーのフィードバックを自動処理し、CIエラーを修正
- バックグラウンド作業: GitHub Actionsによる自動化をサポート
- 拡張可能なSDK: 開発者が独自のエージェントを構築可能
-
API新機能
- コード実行ツール
- MCPコネクタ
- Files API
- 最大1時間のプロンプトキャッシュ
-
安全性
- ASL-3 (AI Safety Level 3) の保護措置を実装
- より精緻な指示遵守能力
- 悪用可能性を低減した、より責任ある動作
2件のコメント
7時間にわたって中断なくリファクタリングを実行したと書かれていますが、品質が十分なら、開発者が退勤後に任せておいて翌日にレビューするような、高度な外注作業レベルも期待できそうですね 😂
このあたりをうまく捉えて、Googleのようなところでも
Julesのようなコーディングエージェントを試験的にベータ提供しているところですよね……。AIに作業を投げておけば、ローカルマシンではなくクラウド環境で勝手にさくさく進めて、あとで結果を確認してコミットやデプロイなどをすればよい、という感じで