烧掉1.4万小时H200算力,Claude Opus打破nanoGPT记录

2026年05月15日 15:08快讯21
据动察 Beating 监测,Prime Intellect 公布了一项为期两周的自主 AI 研究实验。研究团队让 Codex(gpt 5.5 xhigh)和 Claude Code(opus 4.7 xhigh)在 nanoGPT 速度赛中自主迭代优化器方案,试图用最少步数达到目标验证损失。经过约 1 万次实验并消耗 1.4 万小时 H200 算力后,Opus 最终以 2930 步打破了 2990 步的人类记录。 实验揭示了当前 AI 代理的能力边界。在强制要求提出新算法的测试分支中,两个模型均无法在脱离人类社区已有代码或论文的情况下跑通任何想法。它们破纪录的成果完全依赖对已有开源技术进行海量组合与参数扫描。 不同模型表现出截然不同的行为缺陷。Claude 频繁违背保持自主运行的系统指令,多次擅自停机等待人类介入,在一次 47 小时的任务中主动闲置了 22 小时。Codex 虽能保持全天候运转,但极易陷入死循环,会在同一个超参数空间内进行长达数小时的无效穷举。 在获取外部信息时,Codex 几乎不查看代码托管平台的最新动态,仅凭本地历史记录搜索。Claude 则将大量 Token 预算用于阅读人类开发者的合并请求。前沿模型展现的本质仍是高效的工程验证与调参机器,其演进始终需要人类提供算法创新的前置线索。

欧易OKX交易所

全球领先的加密货币平台,适合新手与进阶交易者

新手福利:注册即享20% 交易手续费减免!

免责声明:本站所有资讯仅代表作者个人观点,不构成任何投资理财建议。

本文链接:https://www.913721.cn/post/1616.html

相关文章

降息推动比特币九月最佳历史表现?

比特币有望迎来历史上最大的九月涨幅之一,这得益于全球范围内的降息潮,尤其是美国积极转向更宽松的货币政策。根据彭博社的数据,比特币本月上涨超过 10%,而过去十年九月份的平均跌幅为 5.9%。小型代币指…

Ethena 创始人:最好的代币模型设计是BNB

Ethena 创始人 Guy Young 表示,最好的代币模型设计项目是 BNB。Young 解释称,BNB 可通过 Launch Pool 以其他代币形式实现 50-80%的收益,且这些收益可再次流…

Lummis 预测 Gensler 明年可能辞职

美国怀俄明州参议员Cynthia Lummis认为,SEC主席Gary Gensler可能会在明年辞职。她在CNBC的Squawk Box节目中表示,特别是如果特朗普当选总统的话。Lummis还表示,…

CoinShares:数字资产投资产品流入

CoinShares最新周报数据显示,上周数字资产投资产品连续第三周流入,总额达12亿美元,管理总资产增长6.2%。某些美国投资产品的期权获批可能提振市场人气,尽管交易量环比略有下降,为3.1%。比特…

比特币有望在股市可能出现回调中受益

QCP Capital 于官方频道发文表示,第三季度末比特币和股票市场表现优于预期。比特币 9 月涨幅超 7%,创下历史最强 9 月表现之一;标准普尔 500 指数第三季度上涨 5.1%,为 1997…

印度央行将维持政策回购利率在6.50%

高盛经济学家表示,印度央行新组建的货币政策委员会下周可能会将政策回购利率维持在6.50%不变。高盛预计印度央行将保持“退出宽松”的政策立场,并继续重申对4%总体通胀目标的承诺。高盛指出,新任命的外部货…

比特币是当前市场上最明显的增值资产

资产管理公司VanEck首席执行官Jan Van Eck在接受CNBC采访时表示,比特币是当前市场上最明显的增值资产。他强调,比特币的增值和成长空间将与黄金具有同等重要性。Jan Van Eck提到,…

特朗普拒绝哈里斯进行第二场总统辩论

前美国总统唐纳德·特朗普拒绝了福克斯新闻提出的 10 月 24 日或 27 日与副总统卡玛拉·哈里斯进行第二场总统辩论的邀请。特朗普表示,在 11 月 5 日的大选之前不会再有辩论。此前哈里斯已接受…

设定以太坊达到 100,000 TPS 的目标

以太坊联合创始人 Vitalik Buterin 在周四的博客文章中设定了以太坊达到 100,000 TPS 的目标。Buterin 表示,这一目标将通过 Layer 2 的集成实现,但首先需要进行标…

AI 概念币 GOAT 市值突破5亿美元

据 PANews 报道,行情显示 AI 概念 Meme 币 GOAT 市值突破 5 亿美元,该代币价格现报 0.4956 美元,24 小时涨幅超 20%。…