尴尬了！OpenAI刚派GPT-5.5-Cyber修补地球，Codex却爆出致命bug

资讯组小编 • 文章来源: 新智元 • 1小时前 • 新闻

今天，OpenAI祭出满血GPT-5.5-Cyber，要给全世界的开源代码修漏洞。结果话音刚落，Codex被扒出史诗级bug：一年狂写640TB，能把SSD直接写废。

刚刚，OpenAI重磅发布「满血版」GPT-5.5-Cyber！

这是迄今为止，最强大的网络安全模型，专为经授权的高级防御任务量身定制。

在权威CyberGym基准测试中，它一举拿下85.6%高分，强势击败Mythos 5。

其核心能力涵盖：踪漏洞代码、验证安全隐患、生成补丁，并为人工审查提供证据。

同在今天，Codex Security插件同步首发——

不仅能修复现有系统中的漏洞，还能自动防止新漏洞进入生产环境。

谁曾想，几乎同一时间，Codex竟被曝出了「史诗级」漏洞。

不少开发者反馈，Codex 在执行流式任务和长时间运行时，会以极高的频率向本地SQLite日志疯狂写入数据。

一年预估写入640TB，这足以在一年内写废一块消费级SSD。

文章配图-1

文章配图-2

OpenAI一边抛出「修补地球」的安全神话，另一边就爆出「烧穿硬盘」的致命 Bug。

现实版的冰与火之歌，同框上演了！

「满血」GPT-5.5-Cyber登场

强压Mythos 5

不得不说，OpenAI这次是真的下了血本。

它一口气甩出了网安计划Daybreak（破晓）的三大核心战略，核心叙事只有一句话——

AI已经改变了网络安全的「物理定律」。

这次发布的核心，是GPT-5.5-Cyber的完整版。

这是OpenAI迄今最强的「网络安全专用模型」，专门给「经过验证的防御者」准备的最强网安工具。

在CyberGym基准上，它拿到了85.6%，单模型最高分。

作为对比，普通版GPT-5.5是81.8%，而Claude Opus 4.7，停在了73.1%。

在考核「能不能把漏洞变成真实攻击代码」的ExploitGym上，Cyber版39.5% VS 普通版25.95%；

在考核长链条漏洞挖掘的SEC-bench Pro上，Cyber版69.8% VS 普通版63.1%。

三个基准，满血Cyber版，全面碾压GPT-5.5。

Codex塞进「AI安全工程师」

亮出「破晓」之刃

如果说GPT-5.5-Cyber是矛，那Codex Security就是那把递到每个开发者手边的盾。

OpenAI更新了Codex Security插件，把它直接焊进了Codex的工作流里——

开箱即用的漏洞扫描、威胁建模、攻击路径追踪、补丁自动生成，一条龙。

文章配图-1

文章配图-2

文章配图-3

它的逻辑很简单粗暴：在每个程序员身边，塞一个安全工程师。

自今年3月研究预览上线以来，Codex Security已经扫描了超过3000万次提交，覆盖3万多个代码仓库。

其中，人工复核确认修复的发现超过7万个，自动判定修复的超过50万个。

这就是当下「补漏洞」必须达到的规模：以前是人海战术，现在是机器速度。

修补地球，成了KPI

OpenAI还发起了一个听起来就很燃的计划——Patch the Planet（修补地球）。

为什么这件事重要？因为开源世界的真相，残酷得有点反直觉。

被广泛使用的开源项目里，94%的项目，一年内90%以上的新增代码，靠的是不到10个开发者。

撑起半个互联网的代码，背后常常只有几个人在熬夜。

AI让「找漏洞」变得越来越快，可这反而成了维护者的灾难——成千上万份报告砸过来，一大半还是低质量的误报。

所以「修补地球」的核心，恰恰是专业人工：

研究员先去重、先验证，把干净的补丁送到维护者面前，而不是把噪声一股脑倒给他们。

首批30多个开源项目已承诺加入，包括cURL、Go、Python、Sigstore、pyca/cryptography等。

一个五天冲刺就在19个项目里浮现出数百个问题、合并了数十个补丁。

除此之外，OpenAI宣布启动Daybreak（破晓）网络安全合作伙伴计划。

它把自己最强的模型能力，通过Cisco、CrowdStrike、Palo Alto Networks、Cloudflare等近30家安全巨头的产品，输送到千千万万家组织里。

在政府层面，OpenAI已经和美、英、欧盟的ENISA等机构，建立了「可信网络安全访问」合作。

简言之，OpenAI不只是要做一个模型，它要做全球网络安全的底层操作系统。

这盘棋下得很大，姿态也摆得极高。

「破晓」这个名字本身就在暗示：黎明已至，防御者将在攻击者动手之前，抢先完成修复。

听上去，一切都那么完美。直到网友们打开了自己的硬盘监控——

「高强度使用Codex的宝子们注意一下，你的磁盘可能正在遭受核打击」。

Codex狂写日志

一年烧穿一块SSD

事情是这样的，有GitHub开发者们发现：

Codex在流式传输和自动化长任务时，会以约5MB/s（实测峰值甚至到16MB/s）的恐怖速度，疯狂往本地一个叫~/.codex/logs_2.sqlite的SQLit日志文件里写TRACE日志。

5MB/s是什么概念？换算一下，一年大概要写640TB。

文章配图-1

文章配图-2

而一块普通消费级SSD的标称写入寿命（TBW）大约只有600TB。

也就是说，要不了一年，光是Codex在后台默默写的这些日志，就能把整块固态硬盘的寿命彻底榨干。

最细思极恐的地方在于：这一切是「静默」发生的。

一位GitHub用户1996fanrui实测，自己机器开机运行21天，主SSD就被写进去了约37TB数据。

一查，罪魁祸首正是Codex的SQLite日志。

可打开文件管理器一看，这文件大小却平平无奇——

因为它在疯狂地「写入再删除、写入再删除」，每分钟上万次插入与清理，文件不大，但实际砸到闪存上的写入量，远超人们肉眼能看到的。

实际上，这个相关问题最早在今年4月就有人提了issue（#17320），之后一路有人补刀——

#24275、#22444，再到6月14日那个直接捅破天的#28224。

GitHub地址：https://github.com/openai/codex/issues/28224

OpenAI最近的更新日志里确实碰了碰SQLite的稳定性，可对「写入速率」这个核心问题，一直都没修。

issue还大大地开着。

官方回复：已修复

就在刚刚，OpenAI研究员Vaibhav (VB) Srivastav及时回应道：

这一问题已的得到修复，并随着最新Codex版本一同发布了。

他提醒道，「所有人务必通过npm、bash安装脚本将Codex升级到最新版本」。

同一个智能，能修补地球，也能烧穿你的硬盘。

能力的两面，本就长在同一具身体上。

当AI改写网络安全的「物理定律」，它改写的也是人类「看得见」的边界。

黎明已至。只是这一次，照亮世界的光，会不会也是我们看不清自己造物的开始？

参考资料：

https://openai.com/index/daybreak-securing-the-world/

本文来自转载新智元，观点仅代表作者本人，发现AI平台仅提供信息存储空间服务。
如若转载，请联系原作者；如有侵权，请联系编辑删除。

GPT-5.5-Cyber OpenAI

赞 (0)

资讯组小编

微信扫一扫

微信扫一扫

200块薅出1.4万算力！OpenAI被薅秃了？

200块薅出1.4万算力！OpenAI被薅秃了？

上一篇 1小时前

AI中转站正在「裸奔」：清华团队提出首个可信原生中转基础设施TrustedARI

AI中转站正在「裸奔」：清华团队提出首个可信原生中转基础设施TrustedARI

下一篇 1小时前

扫码关注我们，了解最新AI资讯~

新闻

Claude“神话”模型登场！自主科研成果超《科学》论文水平，token在燃烧

资讯组小编
2026年6月10日
新闻

Anthropic自曝下一代Claude训练内幕！有人专职研究「性格」

资讯组小编
2026年5月23日
新闻

5年撤停1.22万大学专业点！AI时代一专定终身要结束了

资讯组小编
2天前
新闻

马斯克翻车了！一边告OpenAI，一边偷偷蒸馏ChatGPT

资讯组小编
2026年5月1日
新闻

对谈苏妈后，李开复的“一把手工程”堪称CEO学习的新圣典

资讯组小编
2026年5月21日
新闻

微软CEO长文：以后两种资本，人力资本+Token资本

资讯组小编
2026年6月15日

发表回复

登录后才能评论

豆包发布2.1 Pro模型
1小时前
分享到:

6月23日，火山引擎在北京举办2026夏季FORCE原动力大会，集中发布豆包大模型2.1，以及视频、图像、音频等多款新模型，并升级面向Agent的云服务体系。据了解，豆包2.1 Pro在 Coding（编程）、Agent（智能体）、VLM（视觉语言模型）三大核心方向实现能力跃升。
豆包Seedance2.5即将发布，单视频生成长度可达30秒
2小时前
分享到:

火山引擎Force大会上，豆包视频生成模型最新版本Seedance2.5亮相，实现三项核心升级：单条视频生成长度最长可达30秒，突破同类产品15至20秒瓶颈；支持最多50个全模态素材联合输入，生成过程可稳定保持复杂素材细节；提供灵活视频编辑能力，支持在不改变整体画面的前提下进行局部内容修改。新模型目前处于内测尾声，将于7月初正式上线。
Meta暂停AI训练监控项目因内部数据泄露
7小时前
分享到:

2026年6月23日，Meta公司宣布暂停“模型能力计划（MCI）”项目。该项目原用于AI训练，持续记录员工键盘敲击与鼠标操作。暂停主因是一次内部数据泄露：本应受控的员工敏感信息（含私人对话、绩效数据及语音转写记录）被意外开放给全体员工访问。Meta发言人称已启动全面调查，强调暂无证据表明存在恶意调取行为，但承认隐私防护机制失效。此举系Meta本月内第二起AI相关安全事件，凸显其AI系统治理风险。
亚马逊在ChatGPT投放广告引流，拒向OpenAI开放商品数据
7小时前
分享到:

2026年6月22日，亚马逊开始在ChatGPT平台投放付费广告，引导用户跳转至其自营店铺完成购物。此举由电商分析师尤奥扎斯·卡济乌凯纳斯证实，系亚马逊首次高调参与AI平台广告合作。尽管愿出资触达ChatGPT海量用户，亚马逊却严格限制OpenAI等AI公司抓取其商品、价格及库存数据，近期更通过技术封禁与法律手段阻断多个AI爬虫。其核心策略是将AI平台作为导流入口，而非数据共享伙伴。分析指出，这凸显其AI商业化路径的矛盾：重流量获取、轻生态协同。
甲骨文上财年裁员约2.1万
7小时前
分享到:

甲骨文上财年裁员约2.1万，减员规模大于此前已知水平，其中包括因使用人工智能（AI）而被取消的岗位。甲骨文周一在年度财务监管申报文件中称：“我们在各项业务中采用和部署AI技术，已经导致并且未来可能继续导致员工人数减少。”
优必选发布商用具身智能人形机器人Walker C1
15小时前
分享到:

6月22日，第四届中国国际供应链促进博览会在北京开幕，优必选正式发布全新商用具身智能人形机器人Walker C1。该机器人高1.64米、重55公斤，具备53个自由度，采用3D打印晶格结构模拟肌肉，支持芭蕾、华尔兹及人机共舞等高动态动作。其搭载2070 TOPS端侧算力与自研Thinker具身智能大模型，可实现自然语言交互、3D导航与持续学习。面向接待导览、商业服务等多场景，Walker C1开放软硬件接口，支持用户定制化二次开发。
米哈游发布声明严打冒名采购算力服务行为
15小时前
分享到:

2026年6月22日，上海米哈游科技有限公司发布官方声明，称近期发现多家不法单位及个人冒用其名义对接算力服务及相关配套采购。声明指出，原负责该类采购的专员已离职，不再代表公司开展任何商务活动。米哈游强调，所有正规采购需求仅通过后缀为@mihoyo.com的邮箱确认，指定唯一合作邮箱为ai_business_partners@mihoyo.com。公司谴责此类冒用行为侵犯企业权益、误导合作伙伴，并保留依法追责权利。
2026年AI手机占全球出货量45%，内存成本成普及关键
15小时前
分享到:

2026年，支持生成式AI的智能手机将占全球出货量的45%（2025年为36%），但全年总出货量预计同比下滑13.9%至10.8亿部，创近年新低。内存供应紧张推高成本，导致低价机型缩减甚至退出市场，AI手机批发价目前难低于400美元。高端机型凭借利润空间优势持续扩张，而中低价市场普及则取决于内存供应缓解与端侧模型优化进展。
英伟达发布全球首套全栈机器人安全系统Halos
15小时前
分享到:

2026年6月22日，英伟达正式推出NVIDIA Halos for Robotics——业界首个整合AI算力与功能安全的全栈机器人安全系统。该系统面向人形机器人及物理AI的开发、验证与工业部署，由Agility公司率先采用，将应用于工厂、仓库及物流场景。Halos涵盖硬件（IGX Thor与Holoscan Sensor Bridge）、软件（Halos OS及开源外部感知安全蓝图）和认证（Halos AI系统检验实验室）三大模块，支持Linux与QNX Safety 8.0，已向注册开发者开放早期访问。
英伟达启动欧洲35台AI超算建设
15小时前
分享到:

2026年6月21日晚，英伟达宣布在欧洲启动35台AI高性能计算（HPC）超级计算机建设。项目覆盖国家级超算中心、AI工厂及高校，采用GB200/GB300 GPU与Quantum-X800 InfiniBand网络等全栈基础设施。建成后将提供超800 EFLOPS算力，服务气候、医疗、量子计算等领域，惠及300余万名研究人员。此举为欧洲史上最大年度超算扩建，旨在构建普惠型AI科研基础设施。

【腾讯云】 4核4G服务器新客 38元/年起，支持 OpenClaw/Hermes 等热门镜像；Token Plan 低至28元/月，多种主流模型极速调用