刚刚,Anthropic首个神话级Claude 5正式解禁!

刚刚,Anthropic首个神话级Claude 5正式解禁!

藏了两个月说「太危险」的Mythos 5终于解封!ASI级「神话」,今夜降临。

Anthropic今夜「双连发」!

就在刚刚,Claude Fable 5和Claude Mythos 5同时上线。

那个被Anthropic藏了两个月、说「太危险不能公开」的Mythos级模型,第一次交到了所有人手上。

刚刚,Anthropic首个神话级Claude 5正式解禁!

从Opus 4.7到4.8用了43天,4.8到Fable 5只用了11天

Fable这个名字来自拉丁语fabula,和希腊语mythos同源。

同一个故事,同一个底座。公开版叫寓言,完整版叫神话。

软件工程、知识工作、视觉、科学研究、长上下文,在几乎所有benchmark上,Fable 5都是第一。

而且,任务越长、越复杂,拉开的差距就越大。

刚刚,Anthropic首个神话级Claude 5正式解禁!

用Every CEO Dan Shipper的话来说,这简直就是一头「性能怪兽」!

刚刚,Anthropic首个神话级Claude 5正式解禁!

Fable 5和Mythos 5的分数几乎一模一样,差距通常在1到3个百分点以内。

它们最大的区别在于,前者内置了「安全分类器」,后者完全没有限制。

一旦触发了网安任务的查询,Fable 5直接会被「降级」到Opus 4.8回复。

刚刚,Anthropic首个神话级Claude 5正式解禁!

Fable 5在所有安全任务中,拿下0分,就是最好的说明

定价方面,Fable 5和Opus 4.8 Fast Mode基本一致,输入10美元/百万token,输出50美元/百万token。

虽然是Opus标准版的两倍,但不到Mythos Preview的一半,也只有GPT-5.5 Pro的六分之一。

Pro、Max和Team订阅用户在6月22日前可以免费体验,但之后就要花credits了。API今天即可使用,开发者调claude-fable-5就行。

刚刚,Anthropic首个神话级Claude 5正式解禁!

Claude 5「双模」首秀

编程全球第一

Fable 5上线后,上的画风已经变了。

在刚加入Anthropic的Karpathy看来,这是一次配得上「大版本号」升级的跨越式进步。

工作软件正在变得像自来水一样随取随用,你可以随手索取任何东西,解释器、可视化工具、仪表盘、一次性定制应用。

末尾,他还引了一句「黑客帝国」的台词:「解放你的思想」。

刚刚,Anthropic首个神话级Claude 5正式解禁!

经历过Claude每一次发布的研究员Alex Albert表示,这是第一个让他觉得「不像工具,像伙伴」的模型。

刚刚,Anthropic首个神话级Claude 5正式解禁!

Claude Code负责人Felix Rieseberg直接下了一个判断,「第三个AI时代」在今天正式开启!

随之而来的,是一场史诗级的质变——我们将不再只是给AI派发「任务」,而是正式向它们赋予「职责」。

刚刚,Anthropic首个神话级Claude 5正式解禁!

这几句话背后真正的分量,恐怕许多人尚未真正领悟。

光说无凭,在各大基准测试、内/外部严苛评估中,Claude 5早已展现出「碾压级」统治力。

刚刚,Anthropic首个神话级Claude 5正式解禁!

碾压,不是一点半点

在人类最后考试(HLE)上,Mythos 5不用工具,实力赶超Preview版本。

相较于GPT-5.5、Gemini 3.1 Pro,Mythos 5更是断层式领先。

刚刚,Anthropic首个神话级Claude 5正式解禁!

然后,再来看看Claude「最拿手」的智能体编程任务。

SWE-Bench Pro,衡量真实世界Agent编程能力的核心榜单,也是所有前沿模型卷得最凶的赛道。

Fable 5拿下80.3%。

作为参照,11天前刚发的Opus 4.8是69.2%,GPT-5.5是58.6%,Gemini 3.1 Pro是54.2%。

Fable 5比Opus 4.8高出11个百分点,比GPT-5.5高出21.7个百分点。

上代王者刚坐稳11天的王座,被自家新模型一脚踹翻。

刚刚,Anthropic首个神话级Claude 5正式解禁!

FrontierCode Diamond,Cognition做的专测Agent代码质量的榜单,Fable 5拿了29.3%,GPT-5.5是5.7%。五倍差距。

而且Fable 5在中等算力档位就到顶了。不需要拉满思考,随便想想就是第一。

刚刚,Anthropic首个神话级Claude 5正式解禁!

刚刚,Anthropic首个神话级Claude 5正式解禁!

Stripe拿到Fable 5早期权限后干了一件大事。

在一个5000万行的Ruby代码库里,做了一次全局代码迁移。这种级别的工作,正常情况下需要一整个团队花两个多月。

Fable 5只用了一天。一天,5000万行,整个团队都看傻了。

Physical Superintelligence CEO测完之后也大受震撼。

在前沿物理研究任务上,Fable 5不仅只消耗了GPT-5.5三分之一的推理token,而且只用了36小时就跑到了GPT-5.5花四天才到的位置。

刚刚,Anthropic首个神话级Claude 5正式解禁!

Fable 5编曲造物,强到可怕

Anthropic的每一个测试,都在展示同一件事——Fable 5能长时间自主工作,而且产出质量高到离谱。

它自主玩Factorio,工程师们的圣经级工厂建设游戏。

画面上密密麻麻的传送带飞速运转,机械臂在火炉和组装机之间疯狂挥舞。AI自己规划资源流向、建设自动化生产线,在一个每秒都在消耗资源的混沌环境里从零搭出秩序。

它在浏览器里设计了一个完整的3D可打印模型。

先是几行代码,然后一个带UI面板、工具栏的3D CAD编辑器在屏幕上被凭空渲染出来。

接着Fable 5切换身份,在搭建的编辑器里旋转视角、拉伸网格、倒角边缘,把一个抽象概念塑造成可以送去3D打印的实体模型。

刚刚,Anthropic首个神话级Claude 5正式解禁!

它还推演了太阳系行星运动,从物理第一性原理出发自己推导轨道方程,然后用推导结果预测日食。

刚刚,Anthropic首个神话级Claude 5正式解禁!

最魔幻的一个,暗色画布顶端打着「FIFTH SYMPHONY FABLE」的标题,贝多芬第五交响曲的EDM混音响起,高精度粒子流体在画面中心炸开。

低音轰鸣时涌起深紫色星云,小提琴扬起时冰蓝色流体如极光般撕裂黑暗,每一次流体碰撞和扩散都踩在节拍上。

这首混音曲本身,也是Fable 5用代码生成的。

一个从没「听」过音乐的AI,用代码写了一首贝多芬混音,再用代码写了一段跟着节拍跳舞的流体模拟。

另外,让Fable 5玩「杀戮尖塔」游戏时,配上持久化的文件记忆后,性能提升是Opus 4.8的3倍,到达游戏最终关卡的频率也是3倍。

记忆让Fable 5变强的幅度,远超同样的记忆对上一代模型的效果。

模型在「从自己的经验中学习」这件事上,已经跨到了另一个台阶。

不用一行代码,裸眼通关「宝可梦」

不仅如此,Fable 5在「视觉能力」上也取得了巨大的进步,程度不亚于编程。

之前的Claude模型玩宝可梦火红版,需要一整套复杂的辅助工具才能推进,地图导航、游戏状态解析、额外的工具接口,全都得喂进去,还经常卡关。

Fable 5只用了一个极简的视觉接口。

没有地图,没有导航辅助,没有任何额外的游戏状态信息。

就靠看屏幕截图,从头到尾打通了整个宝可梦火红。

Anthropic放出了一段完整的延时摄影视频记录了全过程。AI看着像素画面做决策、踩草丛遇敌、选技能打道馆、穿迷宫,一路推到通关。

刚刚,Anthropic首个神话级Claude 5正式解禁!

这意味,Fable 5能从科学期刊里复杂的图表中提取精确数值,能仅凭几张截图把一个Web应用的源代码完整重建出来。

模型对视觉信息的理解深度到了一个新的层级,不再是「能看图说话」,而是「看懂了,然后能动手」。

刚刚,Anthropic首个神话级Claude 5正式解禁!

AI当科学家

Science级成果一周搞定

如果说编程和视觉还在「提效」的范畴里,Fable 5和Mythos 5在生命科学领域做的事情,已经开始让人重新想「AI能做什么」这个问题了。

在蛋白质设计任务中,Mythos 5实现全自动研发。

从选靶点、跑设计到失败自纠错一气呵成,14个疾病靶点成功斩获9个强候选方案,精准覆盖免疫、神经退行性及肌肉疾病。

刚刚,Anthropic首个神话级Claude 5正式解禁!

最炸裂的,是基因组学。

Mythos 5花了一周多时间,几乎没人管,自己搜集了138个物种、几百万个细胞的数据,自己设计并训练了一个机器学习模型。

训练出来的东西,甚至超越了近期发在Science上的同类研究。

体量小100倍,性能反超。Anthropic打算过几个月把结果发出来。

刚刚,Anthropic首个神话级Claude 5正式解禁!

拒绝「蒸馏」,换脑Opus 4.8

由此,不难理解,为何Anthropic为Fable 5加了一层「安全分类器」。

尤其是,碰到网络安全、生物化学或模型蒸馏相关的请求时,系统自动把回答交给Opus 4.8处理。

刚刚,Anthropic首个神话级Claude 5正式解禁!

越狱抵抗力对比图(400轮红队测试)

有不少开发者吐槽,一些简单任务,也会触发Fable 5「红线」,直接降级。

刚刚,Anthropic首个神话级Claude 5正式解禁!

刚刚,Anthropic首个神话级Claude 5正式解禁!

值得注意的是,想要「蒸馏」Fable 5,可没那么简单。

不同于网安任务,触发此类问题后,Fable 5不会通知,直接通过提示词修改、控制向量和PEET等方法,直接限制模型的能力。

Anthropic预估,大概约0.03%的流量会受到波及。

刚刚,Anthropic首个神话级Claude 5正式解禁!


王座之战,「神话」开场

GPT-5.5发布才一个半月,能看到Fable 5尾灯的项目就剩两个。

Blueprint-Bench 2差2.4个百分点,Terminal-Bench上GPT-5.5凭Codex CLI拿了83.4%,是整张表里最近的一项。

往下,全是单方面屠杀。

刚刚,Anthropic首个神话级Claude 5正式解禁!

而Anthropic在出拳的同时,还藏了一层意思在名字里。

Mythos,是文明解释自身命运的神圣叙事。Fable,是人类最古老的道德教化。

古希腊哲学的诞生,曾被视为Logos对Mythos的一次胜利,人类学会了用理性解释世界。

刚刚,Anthropic首个神话级Claude 5正式解禁!

如今一家公司站在ASI的门槛上,把最强的模型命名为「神话」与「寓言」。

机器征服Logos的速度,所有人都看到了。

接下来的问题是,意义的制造和善恶的判断,还能不能留在人类手里。

参考资料:

https://www.anthropic.com/news/claude-fable-5-mythos-5

https://x.com/claudeai/status/2064394146916229443

https://www-cdn.anthropic.com/d00db56fa754a1b115b6dd7cb2e3c342ee809620.pdf

本文来自转载新智元 ,观点仅代表作者本人,发现AI平台仅提供信息存储空间服务。
如若转载,请联系原作者;如有侵权,请联系编辑删除。

(0)
资讯组小编的头像资讯组小编
号称“最强模型”的Mythos正式发布,但Anthropic还给它装了个“护栏”
上一篇 5小时前
公开版Mythos上线,Claude 最强模型开始分层发售
下一篇 4小时前



扫码关注我们,了解最新AI资讯~

相关推荐

发表回复

登录后才能评论