当前位置：首页 > 热点关注 > 正文内容

全球六大顶级AI实盘厮杀 DeepSeek第一真金白银交易比拼

3小时前热点关注5

　　全球六大主流大语言模型各自获得一万美元，在同一真实市场中进行实盘交易。上周六，美国人工智能研究实验室nof1.ai在其“阿尔法竞技场”平台上举办了一场活动，给六个顶级模型一万美元的真金白银，让它们下场交易。

　　这六大模型包括Anthropic的Claude 4.5 Sonnet、深度求索的DeepSeek V3.1 Chat、谷歌的Gemini 2.5 Pro、OpenAI的GPT 5、xAI的Grok 4和阿里通义的Qwen 3 Max。每个模型获得10，000美元的真实资本，在交易所Hyperliquid上，以相同提示词与输入数据条件下，交易加密货币的永续合约。比赛的目标是将风险调整后的收益最大化，每个模型需自行产生超额收益、确定仓位、择时交易并管理风险。

　　系统会提供当前时间、账户信息、持仓情况以及实时价格和指标等数据，要求模型做出决策：如果持有仓位，是继续持有还是平仓；如果空仓，是买入还是继续观望。经过近60小时的激战后，截至北京时间周一17:18，DeepSeek的持仓总市值接近1.4万美元，收益率约40%，最高时一度接近1.5万美元，表现最佳。Grok 4次之，目前持仓总市值在1.33万美元附近。这两个模型主要通过做多比特币和以太坊获利。Claude主要交易瑞波币和以太坊，Qwen则专注于以太坊，两者收益位列三四，但也整体跑赢比特币现货走势。相比之下，GPT 5和Gemini出现了明显亏损，目前持仓总市值分别为7300美元和6900美元，意味着两个模型已亏损约2700和3100美元，表现最差。

　　 nof1.ai表示，进行这一竞赛是为了让基准测试更贴近真实世界，金融市场是最理想的试炼场热点话题，因为这类市场具有动态性、对抗性、开放性与高度不可预测性。这些特质能以静态测试无法企及的方式真正挑战人工智能。nof1.ai未提到本次竞赛的具体结束时间，只表示第一季将运行数周，随后推出重大更新的第二季。有分析认为，市场早已期待在DeFAI方向上出现杀手级应用，让LLM参与链上博弈有很大的想象空间。全球六大顶级AI实盘厮杀 DeepSeek第一真金白银交易比拼全球六大顶级AI实盘厮杀 DeepSeek第一真金白银交易比拼

返回列表

上一篇：《焦点访谈》 20251021 “十四五”·答卷书写中国绿色传奇

下一篇：现货黄金向下跌破4200美元创四年最大跌幅