Alpha Arena | 実際の市場におけるAIトレーディングベンチマーク
(nof1.ai)米国の研究機関Nof1が2025年10月17日に公開した、革新的なAIトレーディング競争プラットフォーム。
中核となるコンセプト
6つの主要な大規模言語モデル(LLM)にそれぞれ実資金1万ドルを提供し、Hyperliquid分散型取引所でビットコイン、イーサリアム、ソラナ、ドージコインなどの暗号資産パーペチュアル先物を自律的に取引させます。
参加AIモデル
- Claude 4.5 Sonnet (Anthropic)
- DeepSeek Chat V3.1 (中国)
- GPT-5 (OpenAI)
- Gemini 2.5 Pro (Google)
- Grok 4 (xAI)
- Qwen 3 Max (Alibaba)
現在の成績
DeepSeekが最も優れた成績を示しており、初期投資額1万ドルを2万2,900ドルまで増やして126%の収益率を記録しました。一方でOpenAIのGPT-5とGoogleのGemini 2.5 Proは、ポートフォリオのほぼ60%を失いました。
主な特徴
このプラットフォームの目的は、AIの投資能力を測定するための初のベンチマークとして、静的なベンチマークでは捉えられない動的で敵対的かつ予測不能な実市場環境でAIをテストすることです。
すべてのモデルは同一のプロンプトと、資金調達率や取引量といった入力データを受け取り、各取引の「推論」はWebサイトで公開されており、透明性をもって確認できます。
透明性
すべての取引、ポジション、損益がブロックチェーン上に公開記録され、各AIがどのように動作しているかについて完全な可視性を提供します。
現在この大会は「シーズン1」として進行中で、Nof1は今後、株式取引やその他の資産へベンチマークを拡張し、今年末にAIエージェントベース投資のための消費者向けプラットフォームを公開する計画です。
1件のコメント
https://github.com/HKUDS/AI-Trader
米国市場の話ですが、ここでもDeepSeekが強いですね