1 ポイント 投稿者 flyingsquirrel 4 시간 전 | まだコメントはありません。 | WhatsAppで共有

Anthropicは、自社の最上位モデルであるClaude Opusのアップグレード版 Claude Opus 4.8 をリリースしました。前バージョンの4.7をベースにベンチマーク性能を改善し、協業能力を強化しながら、価格は据え置かれています。

主な改善点と特徴

  • 性能向上: コーディング、エージェント技術、推論、実務知識タスク全般で、前モデルおよびGPT-5.5などの競合モデルと比べて優れた性能を示します。
  • 正直性(Honesty)の強化: AIが根拠のない主張をしたり、早計に結論を出したりする問題を改善しました。Opus 4.8は不確かな部分を自ら示し、コード内の欠陥を見落とす確率が前モデル比で約4倍低くなりました。
  • 信頼できるエージェント能力: 初期テストの結果、複雑な多段階タスクを実行する際の判断力が鋭くなり、自身のミスを検知したり、計画が妥当でない場合に異議を唱えたりするなど、より優れた協業能力を示します。
  • コスト効率: 「Fast Mode」の速度が2.5倍に向上し、コストは前モデル比で3分の1になりました。

同時に公開された新機能

  • ダイナミックワークフロー(Dynamic Workflows): Claude Codeの研究プレビュー機能で、数百の並列サブエージェントを実行し、大規模コードベースの移行のような複雑な作業を実行できます。
  • 努力制御(Effort Control): ユーザーがClaudeがタスクに投入する努力のレベルを選択できます。高い設定ではより深く考えて高品質な応答を提供し、低い設定ではより速く応答します。
  • Messages APIの更新: システムエントリをメッセージ配列内に含められるようになり、プロンプトキャッシュを壊さずに作業の途中で指示を更新できます。

今後の計画

Anthropicは、Opus級の性能をより低コストで提供するモデルを開発中であり、Project Glasswing を通じてOpusより高い知能を持つ新しいクラスのモデル(Claude Mythos)を準備しています。現在、一部の組織でセキュリティテスト中で、数週間以内にすべての顧客へ公開される予定です。

価格と利用案内

  • 通常モード: 入力 $5 / 1M トークン、出力 $25 / 1M トークン(Opus 4.7と同じ)
  • ファストモード: 入力 $10 / 1M トークン、出力 $50 / 1M トークン
  • モデル名: claude-opus-4-8

まだコメントはありません。

まだコメントはありません。