Claude 最强模型 Fable 5 全解析:Mythos 级别的怪物

Claude 上新

今天凌晨,Anthropic 发布新模型 Fable 5,毫无疑问的,也是当下的最强模型

Claude 最强模型 Fable 5 全解析:Mythos 级别的怪物

这时候,手机前、刚起床的彦祖可能会问:不是说发的是 Mythos 么?这个 Fable 是啥?其实啊,Mythos 和 Fable 底层是同一个模型,区别在于护栏:

  • 原版的模型叫做 Mythos 5,只给政府和特定机构使用;定价:$25/百万 token输入,$125/百万 token输出
  • 这个加上护栏的、开放给所有人使用的,叫做 Fable 5,定价是 $10/百万 token输入、$50/百万 token输出(刚好比 opus 4.8 贵一倍)

Pro、Max、Team 和按席位的 Enterprise Plan 用户,在6 月 22 号之前都能够使用到 Fable 5(消耗同等用量 Opus 两倍额度),之后要花 usage credits,API 今天就完全可用,模型名称叫做claude-fable-5

Claude 最强模型 Fable 5 全解析:Mythos 级别的怪物

这里我也浅浅试了一下,体感上确实不错

但是…注意,我说但是了,对于护栏的存在,很多的任务拒绝完成,然后强行退回 Opus 4.8

Claude 最强模型 Fable 5 全解析:Mythos 级别的怪物

如果是 Claude Code,它则会回复说

Request was blocked

This request triggered safety guardrails. Rephrase your prompt or rewind to continue.

Anthropic 说触发率不到 5%,我的实际感受远高于这个数字,以至于到目前为止我还没能完整地跑通一个「全程由 Fable 回答」的任务,同时,我发现自己并非唯一的幸运儿

比如下面这个,生物学家对 fable 5 说 hi,然后被拒绝…原因是记忆里面包含相关的生物信息,判定为风险…然后如果开启了隐身模式,就能正常 say hi 了,这就尼玛…

Claude 最强模型 Fable 5 全解析:Mythos 级别的怪物

所以吧…真可能是我各种奇奇怪怪的事儿做多了,系统觉得「此子必不可留」,让我获得了足够的「不配得感」,所以这篇文章里关于能力的部分,大部分来自官方数据和早期测试客户的反馈,来自官方公告

公告地址:anthropic.com/news/claude-fable-5-mythos-5

Claude 最强模型 Fable 5 全解析:Mythos 级别的怪物

http://anthropic.com/news/claude-fable-5-mythos-5

一套模型,两个名字

前文提到:Mythos 和 Fable 背后是同一个模型,区别在于护栏

套护栏叫 Fable,没限制的叫 Mythos

而至于名字,Mythos 是希腊语的「神话」;Fable 来自法语的 Fabula 也就是「被讲述的东西」,意思也比较相近

Mythos 级是 Anthropic 在 Opus 之上新立的一个能力层级。今年四月,他们通过 Project Glasswing(玻璃翼计划?这个也没啥正式翻译)放出了第一个 Mythos 级模型 Claude Mythos Preview,只给一小撮网络安全防御者和关键软件基建方

当时就说了,等护栏做好了,会把 Mythos 级开放给所有人,也就有了 Fable

至此,A 社的模型能力排行如下:

正版 Mythos > Fable > Opus > Sonnet > Haiku

斗宗强者

毫无疑问,根据「越新的头部模型越强」的普遍原则,叠加 Falbe/Mythos 是 Claude 家的最强序列,Fable 5 几乎在所有测试基准上都是当前最强,任务越长越复杂,它甩开其他模型越远

比如:Stripe 拿 Fable 5 跑了一个五千万行的 Ruby 代码库的全库迁移, 一天做完。同样的活儿,一个团队手工干要两个多月。Fable 5 还比过去的 Claude 更省 token,同样的难题花的钱更少。在 Cognition 的 FrontierCode 评测上,它在中等推理强度下就拿了前沿模型里的最高分

Claude 最强模型 Fable 5 全解析:Mythos 级别的怪物

拿到早期权限的客户各自跑了测试,挑几句看看口径:Cursor 的 Michael Truell 说它在 CursorBench 上是最强模型,打开了一类过去够不着的长周期问题。GitHub 的 Mario Rodriguez 说它接复杂的长周期编码任务,自主性和可靠性超过了之前的基准。Cognition 的 Scott Wu 说它是 FrontierBench 上得分最高的模型,开箱就能泛化到陌生工具。Replit 的 Michele Catasta 说它在自家的 vibe-coding 评测上几乎跑满

Claude 最强模型 Fable 5 全解析:Mythos 级别的怪物

恐怖如斯

作为宗门的新一代天骄,Fable 5 它是通关了宝可梦的

过去的 Claude 玩宝可梦,是得搭一套辅助 harness,负责喂各种游戏状态。Fable 5 只看原始截图,就把《宝可梦 火红》从头打到尾通关了,这个水平,直指当年还在接受九年义务教育的我,不愧是宗门天骄

Claude 最强模型 Fable 5 全解析:Mythos 级别的怪物

之前那套喂地图喂状态的 harness,不再必要了

它还能从科学图表里抠出精确数字,看几张截图就把一个网页应用的源码重建出来

记忆和长上下文也上了一个台阶,比如让它玩《杀戮尖塔》,给它一份持久存取的文件当记忆,成绩提升是 Opus 4.8 的三倍,打到最终幕的次数也是三倍…这怎么玩的游戏和我一样,不愧是能与我比肩的斗宗强者

Claude 最强模型 Fable 5 全解析:Mythos 级别的怪物

Claude 最强模型 Fable 5 全解析:Mythos 级别的怪物

至于剩下的,Anthropic 放了四个 demo,我一个一个贴

第一个,它从物理第一性原理推导行星轨道运动,拿这个预测日食

Claude 最强模型 Fable 5 全解析:Mythos 级别的怪物

日食模拟,从万有引力开始算的

第二个,它自己玩《异星工厂》Factorio,自己规划策略、自己把自动化流水线搭起来

Claude 最强模型 Fable 5 全解析:Mythos 级别的怪物

很休闲的一款游戏,推荐大家试试

这个游戏好啊,益智、提神、醒脑,和我一样喜欢玩这个游戏,难怪 Fable 这么聪明

Claude 最强模型 Fable 5 全解析:Mythos 级别的怪物

第三个,它在浏览器里的 CAD 编辑器里设计了一个完整的可 3D 打印模型。那个 CAD 编辑器也是它造的,包括里面的 AI copilot

Claude 最强模型 Fable 5 全解析:Mythos 级别的怪物

编辑器是它造的,模型也是它设计的

第四个,它写代码做了一段流体模拟,流体的运动卡上一首古典 EDM remix 的节拍。那首 remix 也是它用代码生成的,它从没听过音乐

Claude 最强模型 Fable 5 全解析:Mythos 级别的怪物

从没听过音乐,用代码作了首 EDM

知识工作方面,Hebbia 面向资深推理的金融评测里,Fable 5 拿了所有模型的最高分。IMC 说它的交易分析评测几乎全项满分

假设被实验室证实

Mythos 5 在生物科研上做到的事,跑分表格装不下了

先说药物设计。Anthropic 内部的蛋白设计专家用 Mythos 5,把药物设计过程的部分环节加速了约十倍。有一个例子,Mythos 5 拿着蛋白设计和生物信息学工具,在无人干涉下,做到了匹配甚至超过熟练的人类操作者,把项研究里的 14 个蛋白靶点,9 个产出了值得继续做药的强候选

Claude 最强模型 Fable 5 全解析:Mythos 级别的怪物

免疫检查点、神经退行、肌肉病这些靶点,9 个出了强候选

Mythos 5 是 Anthropic 第一个能稳定产出新颖且站得住脚的科学假设的模型。在盲测对比里,科学家有大约八成的时候更偏好 Mythos 的分子生物学假设而不是 Opus 级模型的。对于实验假设,有些已经出成果了:比如一个关于大肠杆菌某蛋白的新机制,已被相关实验室的研究证实了

基因组学那边,Mythos 5 在超过一周的大体自主的工作里做了一项新研究。它把横跨 138 个动物物种、数百万个细胞的单细胞数据组装起来,自己设计并训练了一个机器学习模型,用来识别在亲缘很远的物种里执行相同功能的细胞

Mythos 训出来的这个模型,超过了最近发表在 Science 上的一个模型,体积还小了 100 倍,结果计划未来几个月发表

护栏

可能我的记忆里的信息比较诡异,导致简单的任务我能跑

Claude 最强模型 Fable 5 全解析:Mythos 级别的怪物

复杂的请求就被退回

Claude 最强模型 Fable 5 全解析:Mythos 级别的怪物

背后 Anthropic 给 Fable 5 套了一组分类器,单独的 AI 系统,盯着每一轮对话,判断你的请求有没有碰到三个区域:网络安全、生物化学、蒸馏。碰到了就把球扔给 Opus 4.8

Anthropic 说平均触发率在 5% 以下,超过 95% 的会话完全不触发。但这个数字是按会话数算的,发个「hi」也算一个会话。真拿它干活,尤其是长任务,体感完全是另一回事

任务一长,中间某一轮碰了分类器,整个对话就从 Fable 切到了 Opus,后面的回答都是 Opus 4.8 在给你稳稳接住

再比如我的历史记忆比较复杂,可能就会莫名其妙的被视作宗门细作,退回的时候界面顶上会顶出一行「Switched to Opus 4.8」,右边给你一个「Edit and retry with Fable 5」,让你改改话术再撞一次护栏

就比如下面这个极为正常的工作:翻译全文:https://www.anthropic.com/news/claude-fable-5-mythos-5

Claude 最强模型 Fable 5 全解析:Mythos 级别的怪物

Edit and retry 这词起得讲究…

Claude Code 那边也一样,碰到护栏就直接弹 Request was blocked,让你改问题或者回退

再说回 Fable 的三类拒绝回答

第一类是网络安全。Mythos 级模型擅长找漏洞、利用漏洞,还会做 agentic hacking,把侦察、横向移动这些环节自己串起来。护栏直接让 Fable 在这类任务上做不出任何进展

Claude 最强模型 Fable 5 全解析:Mythos 级别的怪物

Anthropic 做了大量红队测试,外部 bug bounty 跑了超过 1000 小时没找到通用越狱,外部红队在长周期 agentic 任务上也没找到,只有英国 AISI 在一个很短的初始窗口里有所进展

Claude 最强模型 Fable 5 全解析:Mythos 级别的怪物

一家外部合作方测下来,Fable 5 在有害网络请求上的护栏是所测全部模型里最硬的,比 Opus 4.8 和 4.7 都硬,对 30 种公开越狱技术零突破

第二类是生物和化学。过去只挡很窄的一撮生物武器问题,现在 Anthropic 觉得不够了。他们测了 Mythos 5 预测一种病毒外壳组装的能力(用的是 Dyno Therapeutics 未发表的候选),那是设计基因治疗载体 AAV 的一步,同样的本事换个人用就能拿去设计危险病毒

Claude 最强模型 Fable 5 全解析:Mythos 级别的怪物

Mythos 级模型光靠生物推理就超过了专门做蛋白任务的蛋白语言模型。为了尽快安全发布,眼下 Fable 把大部分生物化学请求都退回给了 Opus 4.8,往后会慢慢收窄

第三类是蒸馏。Anthropic 此前发现过大规模的蒸馏企图,而之后这些行为,会被分类器标记为蒸馏,然后退回 Opus 4.8

还有一处变化跟企业客户直接相关。Mythos 级模型的所有流量,无论是 Anthropic 自家界面还是第三方,都要求 30 天数据保留

这些数据不拿去训练、不做安全以外的用途,会记录所有人类访问,30 天后删除

先免费,6 月 22 截止

打开网页版会先弹一个框,告诉你 Fable 5 在 6 月 22 号之前算在套餐额度里,但它吃额度是 Opus 的两倍。6 月 23 号起从订阅计划里撤掉,之后要用得花 usage credits

等容量够了,再把它恢复成订阅计划的标准配置

Claude 最强模型 Fable 5 全解析:Mythos 级别的怪物

吃 Opus 两倍额度,6 月 23 号起这部分得自己掏 credits

网页版的模型列表里能直接选到 Fable 5,旁边标着「Included until June 22」。Claude Code 那边,无论是 terminal 还是 Claude 应用,列表里默认看不到它,得手动敲 /model claude-fable-5 才能切过去

Claude 最强模型 Fable 5 全解析:Mythos 级别的怪物

网页里能选到,Claude Code 里得敲 /model claude-fable-5 才出来

平台这边,claude-fable-5 在 Claude API、AWS 上的 Claude Platform、Amazon Bedrock、Vertex AI、Microsoft Foundry 都能调

Mythos 5 则不公开,只给 Glasswing 的合作伙伴(拆了网络安全护栏),以及不久后选定的一批生物研究者(拆了生物化学护栏)。Anthropic 说会跟美国政府一起,稳步扩大 Mythos 5 的可信访问名单,还要开一个让网络安全机构系统化申请的通道,另开一个面向生物研究的通道

本文来自转载赛博禅心 ,观点仅代表作者本人,发现AI平台仅提供信息存储空间服务。
如若转载,请联系原作者;如有侵权,请联系编辑删除。

(0)
评测组小编的头像评测组小编
独家|阿里达摩院推出世界模型版“奥运会”,蚂蚁灵波排第一、自家模型没上榜
上一篇 5天前
做AI研究时Claude会偷偷变笨,Anthropic被研究界围攻
下一篇 5天前



扫码关注我们,了解最新AI资讯~

相关推荐

发表回复

登录后才能评论