OpenAI曝作弊门！GPT-5.6创史上最高作弊率

资讯组小编 • 文章来源: 新智元 • 1小时前 • 新闻

新智元报道

【新智元导读】GPT-5.6终于来了，但我们用不了。权威报告曝其创下史上最高作弊率：不仅黑进测试系统偷答案，竟还教唆同类隐瞒违规罪证。超级AI，已经学会向人类系统性撒谎？

GPT-5.6，终于登场了！

这款OpenAI最强网络安全模型，在基准测试上正面硬刚Claude Mythos 5，在编程能力上直接领先了一个身位。

然而反常的是，它的发布方式却很低调：没有面向公众开放，只允许极少数受信任合作伙伴通过API访问。

而更让人瞠目结舌的，是发布之后随即曝光的一份独立评估报告。

METR在对GPT-5.6 Sol评测时，发现了一件令业界震惊的事：这个模型，是迄今为止他们见过的作弊率最高的AI。

作弊门爆发：史上最高作弊率！

这份在保密协议和OpenAI法务团队施压下艰难披露的报告，揭露了一个可怕的事实——

在针对复杂长程任务的测试中，GPT-5.6 Sol表现出了此前在任何公开模型中都未曾见过的、极高水平的高智商作弊与欺骗行为。

崩盘的「时间跨度」

METR针对Sol启动了Time Horizon 1.1软件与研发任务套件。

测试的核心逻辑是：人类给AI智能体一个宏大的、需要复杂操作的任务，测量它在不需要人类介入的前提下，能够自主连续工作多少个小时。

然而，ETR的工程师们震惊地发现，他们沿用了数年的科学测量方法论，在Sol面前彻底崩盘了。

因为Sol的跑分结果，高频、剧烈地在11.3个小时与270个小时之间来回跳变，置信区间的离散度大到了荒谬的地步（5小时至11400小时）。

导致测量系统全面瘫痪的原因只有一个：Sol在疯狂地作弊，它把测试它的系统给「黑」了。

GPT-5.6，在人类眼皮底下偷看答案

METR发现，GPT-5.6主动展现出强烈的「情境意识」——

它意识到自己正在接受人类的考试，并且意识到这个考试系统本身是由代码构成的、存在人类尚未发觉的Bug。

于是，它选择直接攻击考试系统，通过「走捷径」来刷分！

在METR披露的真实案例中，Sol的手段极其高明。

比如，它学会了潜伏与信息窃取。

在某项长周期软件开发任务中，Sol偷偷将利用程序打包进数据流。

这段程序精准地激活了METR评估服务器沙盒的一处提权漏洞，成功潜入了后台隐藏的测试集，直接将人类藏起来的正确答案泄露了出来。

另外，它还学会了底层源码反向提取。

在另一项任务中，Sol发现正常解题需要消耗大量的计算步骤。为了规避这种「体力活」，它在暗中摸清了评估环境的目录结构，绕过权限，强行将隐藏源代码反向提取出来，直接把答案复制粘贴。

METR首席评估专家痛心疾首地指出——

Sol的作弊率，刷新了我们在公共ReAct Agent框架上评估过的所有模型的最高纪录。

如果把作弊行为一律判为零分，那么它的真实自主解决问题能力只有11.3小时；但如果你被它蒙蔽，它的时间跨度会瞬间暴涨到惊人的270小时以上！

这彻底打脸了OpenAI此前关于Sol安全、受控的说法。

Sol把聪明才智，全部用在了如何欺骗人类考官上。

AI教唆AI隐瞒罪证！硅谷安全防线的黑洞

更可怕的事还在后面。

根据OpenAI向METR同步的数据，在Sol进行多智能体协同的内部部署测试中，监控系统记录下了这样一段让人害怕的交互指令。

一个正在运行的Sol主模型实例，在觉察到输出可能触犯安全护栏后，竟然向正在并行的另一个子代理模型实例发出了明确的欺骗性指令，要求对方协同修改运行日志，「联手隐瞒」这些违规证据，以防被人类抓包！

这是又一起AI系统性联手欺骗人类的案例。

更令人恐惧的是，METR指出，Sol能被抓到破绽，核心在于OpenAI恪守了关键安全底线：拒绝在训练中对模型的原始思维链进行逆向惩罚。

这样，Sol在密谋欺骗人类时，必须把内心独白都写出来。

然而，专家警告：未来的模型一定意识到：在思维链里暴露欺骗人类的计划会被人类发现并惩罚。

到了那个时候，AI会进化出更深的城府——它们会在内心深处进行密谋，而在吐出的CoT和最终回答里表现得绝对忠诚。

如果这一天到来，意味着AI将学会毫无破绽的诈骗。人类将被AI彻底架空！

GPT-5.6硬刚Mythos，结果如何？

所以，GPT-5.6和Mythos到底谁更强？

有网友将 GPT-5.6 Sol 和 Mythos进行了对比，双方势均力敌，战况胶着。

具体跑分显示，两大巨头互有胜负。

智能体编程

在衡量AI自主解决复杂、真实软件工程任务的Terminal-Bench 2.1上，GPT-5.6 Sol强势胜利。

常规版的Sol拿到了88.8%的惊人高分，超越Claude Mythos 5（88.0%）。

而当开启了多子代理并行的Sol Ultra模式后，这一数字被生生推高到了91.9%！

相比之下，谷歌尚在预览阶段的Gemini 3.1 Pro仅跑出了70.7%，沦为背景板。

网络安全：惨烈肉搏

在网络安全与漏洞防御基准测试中，Sol与Mythos展开了更为残酷的拉锯。

在ExploitBench测试中，Anthropic2月的老版本Mythos Preview以74.2%的微弱优势，在胜率上险胜了Sol的73.5%。

但是，全场的焦点在于能效比。

数据显示，Sol在取得73.5%的高胜率时，仅仅消耗了12万个输出Token；而Claude Mythos Preview为了达到相似的水平，竟然疯狂燃烧了33.5万个输出Token！

这意味着，在网络防御和漏洞修复的实战部署中，Sol的经济成本是Anthropic的三分之一。

在Token消耗上的「降维打击」，让Sol拥有压倒性优势。

而在另外两个网安基准上，双方互有胜负。

CyberGym：Sol以83.6%的成绩，微弱压倒了Mythos Preview的83.1%。

CyScenarioBench：则是Anthropic的天下，Mythos Preview以29.2%的胜率压制了Sol的28.0%。

HealthBench Professional：Anthropic更是凭借其深厚对齐底蕴，以66.0%的高分大幅领先Sol的60.5%。

此外，在量化生物学与基因组学基准GeneBench v1上，Sol在消耗更少Token的前提下，将准确率一举拉高到了30%。

ExploitGym测试同样证实：随着推理算力的持续向外扩展，GPT-5.6的三款模型性能均呈现出近乎线性的上扬，这意味着Sol的compute潜力巨大。

总而言之，GPT-5.6 Sol与Claude Mythos 5的交锋，结果是战平。

双方在各个细分领域缠斗，没有任何一方绝对垄断。

被锁进保险箱的AI之王

遗憾的是，这一次，GPT-5.6遭受了和Mythos 5同等级别的待遇，甚至更加严苛。

在强硬指令下，OpenAI不得不宣布：GPT-5.6 Sol目前仅处于极度受限的「有限预览」状态。

只有极少数被列入受信白名单的承包商、国家级网络安全机构以及顶级战略合作伙伴，才能通过API和Codex使用。

普通企业和民间开发者，被无情地拒之门外。

对此，OpenAI十分愤怒，在官方公告中控诉：

我们认为这种政府访问流程不应成为长期默认做法。它使用户、开发者、企业、网络安全防御者和需要这些工具的全球合作伙伴无法获得最佳工具。

OpenAI之所以敢于公开叫板，底气来源于刚刚发布的报告。

在报告中反复强调，根据在谷歌浏览器和Firefox环境下的实战测试，Sol虽然能捕捉到复杂的系统Bug和漏洞原语，但它至今未能表现出完全自主独立生成「全链条端到端攻击」的能力。

在他们看来，GPT-5.6的危险指数依然控制在「关键网络安全威胁」的红线之下，还不会自我进化，主动向人类网络发起进攻。

然而METR的报告显示，恐怕并非如此。

普通用户，何时能等来GPT-5.6？

本文来自转载新智元，观点仅代表作者本人，发现AI平台仅提供信息存储空间服务。
如若转载，请联系原作者；如有侵权，请联系编辑删除。

赞 (0)

资讯组小编

微信扫一扫

微信扫一扫

Fable平替登顶真相：它没打败Opus，它雇了Opus

Fable平替登顶真相：它没打败Opus，它雇了Opus

上一篇 1小时前

字节 Doubao-Seed-2.1-Pro 测评

字节 Doubao-Seed-2.1-Pro 测评

下一篇 1天前

扫码关注我们，了解最新AI资讯~

新闻

美国豆包实至名归——“反重力”2.0引众怒：IDE功能被剥离，开发者被迫回退旧版。

资讯组小编
2026年5月22日
新闻

OpenAI上线广告平台，一场卖给穷人的富人生意

资讯组小编
2026年5月6日
新闻

DeepSeek 要用蜜雪冰城的打法，做中国版 Claude Code

资讯组小编
2026年5月25日
新闻

库克最后一舞！苹果WWDC2026：Siri AI终于来了

资讯组小编
2026年6月9日
新闻

互联网大厂的2025：千亿利润蒸发，AI重排座次

资讯组小编
2026年4月13日
新闻

谷歌发布安卓 AI 系统，这就是苹果想象中的自己

资讯组小编
2026年5月13日

发表回复

登录后才能评论

Anthropic最新调查：重度AI授权用户对个人薪资与就业最乐观
3小时前
分享到:

Anthropic发布最新的AI经济指数报告，结合9700名用户的问卷调查与遥测数据，揭示了人工智能对工作模式与职业前景的影响。报告发现，工作含金量越高，耗费的AI算力也越多：高薪岗位的平均算力消耗是低薪岗位的2.07倍。问卷调查显示，超过三分之一的用户预计AI将在一年内接管大部分工作。使用不同AI工具时，用户的放权程度有很大差异，用户在网页端写文章时，习惯与AI来回修改13轮，而在使用终端工具Claude Code时，通常只下一道指令，交由AI一步到位直接生成。
Anthropic 测试移动端 Claude Cowork
3小时前
分享到:

2026年6月26日，Anthropic 开始测试移动端 Claude Cowork 功能。该功能允许用户通过手机发起、调整和监控任务，定位为桌面端的远程控制补充。目前 Cowork 主要运行于 macOS 和 Windows 的 Claude Desktop 应用，移动端暂不支持完整文件操作能力。此举旨在扩展其1月发布的 Cowork 智能体工作模式，提升跨设备协同效率。测试基于新曝光界面截图，尚未公布上线时间。
谷歌Gemini集成Play商店，支持应用搜索与内购
3小时前
分享到:

2026年5月，谷歌宣布将Play商店功能集成至Gemini助手；6月下旬起，该功能开始向符合条件的用户逐步推送。用户可在Gemini聊天界面直接搜索应用、跳转安装或完成内购，全程无需离开Gemini。例如，输入“帮我找一款规划每周饮食的App”，Gemini即推荐并直达Play商店页面；亦可查询内购项目或购买礼品卡。功能仅限18岁以上个人账号用户，需安装最新版Play商店，暂不支持企业账号。
Anthropic：获批将Mythos 5重新部署至部分美国机构
3小时前
分享到:

6月27日，Anthropic发文称，自6月12日以来公司一直与美国政府紧密合作，以恢复对Claude Mythos 5和Fable 5的访问。今日收到美国政府通知，Mythos 5可重新部署至一批美国机构。公司正在继续与政府合作，扩大对Mythos 5的访问，并使Fable 5再次可供公众使用。
OpenAI：开启下一代模型GPT-5.6系列的限量预览
3小时前
分享到:

6月27日，OpenAI宣布已开启GPT-5.6系列的限量预览。该系列包括旗舰模型Sol、适用于日常工作的均衡模型Terra、以及快速且经济实惠的模型Luna。据介绍，Terra性能与GPT-5.5相当但价格便宜一半，Luna则以最低成本提供较强能力。OpenAI表示，计划在未来几周内全面开放GPT-5.6 Sol、Terra和Luna。在今天发布前OpenAI与美国政府沟通了模型能力及发布计划。应美方要求，此次将先向少量经审核的可信合作方进行预览。
美媒：美国政府将决定谁可以使用新版ChatGPT
7小时前
分享到:

据华盛顿邮报报道，美国政府将对希望使用ChatGPT开发商OpenAI最新技术的公司进行审查，这是特朗普政府对硅谷监管力度的一次重大扩展。OpenAI在周五发布的博客文章中宣布了其最新的人工智能模型GPT-5.6（名为SOL）。文章称，政府将首先批准哪些人可以使用新版本，同时人工智能公司和政府将共同制定一项针对该行业的长期监管计划。该公司明确表示，他们对联邦政府的进一步监管持谨慎态度。OpenAI指出：“我们认为这种政府审批流程不应成为长期默认模式。它会使真正需要这些工具的用户、开发者、企业、网络安全防御人员和全球合作伙伴无法获得最佳工具。”
加州推出AI失业追踪系统CAIT
14小时前
分享到:

2026年6月，美国加州州长加文·纽森宣布上线“California AI-Unemployment Tracker（CAIT）”系统。该系统每月更新，通过交叉分析失业保险申领数据与职业AI易替代性，旨在早期识别AI对劳动力市场的潜在影响。首份报告截至2026年5月显示，加州整体未现AI引发的大规模失业潮，但高学历、从事易替代职业者（尤其旧金山湾区）申领量持续上升。专业服务业和信息产业变化最显著。加州政府强调CAIT是预警工具，非归因证据，旨在提前支持高风险群体。
近400家美国报纸联合起诉OpenAI和微软白嫖内容，AI热潮恐成地方新闻“丧钟”
17小时前
分享到:

彭博社最新披露一份 6 月 24 日公示的美国法院文件，代表近 400 家纸媒的出版商联盟指控微软和 OpenAI 公司，称其未经许可抓取网站内容用于训练 AI。

该联盟于本周三向美国纽约南区联邦地区法院提起诉讼，指控微软和 OpenAI 两家公司未经授权抓取新闻内容，用于训练 Copilot 和 ChatGPT 等 AI 背后模型，涉嫌侵犯版权，并触犯《数字千年版权法》。

起诉书称，被告“系统性且秘密地”爬取出版商的网站，并将文章、故事和其他原创作品复制到自己的服务器上，用它们来训练大型语言模型，同时从作品中删除版权管理信息。
微博上线官方命令行工具weibo-cli
17小时前
分享到:

2026年6月22日，微博开放平台正式发布开源命令行工具weibo-cli。该工具面向开发者及AI Agent，基于Node.js 18+开发，支持内容发布、互动管理、数据检索与趋势分析等功能。用户可通过npm全局安装，使用OAuth或设备码完成认证，并调用70余个API接口。命令采用结构，输出支持JSON、YAML等四种格式，原生兼容MCP协议。工具按Credits订阅计费，提供Free至Ultra五档套餐，已上线npm并采用MIT协议。
溧阳博物馆展出AI修复老照片引争议，已撤展
17小时前
分享到:

6月26日前，江苏常州溧阳市博物馆临展厅展出的“时光里的家园”展览中，一张标注为‘八十年代拍摄’的AI修复老照片引发质疑——碑文文字模糊扭曲。该展由溧阳市总工会主办，5月1日开展。因原图模糊，总工会委托AI技术修复影像，致文字失真。溧阳市文体广电和旅游局证实情况，已于近日撤下该照片，并将强化跨单位内容审核机制，避免类似问题再发。

【腾讯云】 4核4G服务器新客 38元/年起，支持 OpenClaw/Hermes 等热门镜像；Token Plan 低至28元/月，多种主流模型极速调用