实测Claude史上最强模型Fable 5,普通人慎用

对普通人最坏的消息要来了。

就在刚刚,Anthropic 宣布推出 Claude Fable 5 和 Claude Mythos 5。

其中,Fable 5 是 Anthropic 首个面向公众开放的 Mythos 级模型,Mythos 5 则主要面向少数网络安全防御机构、关键基础设施提供方以及后续进入可信访问计划的生物医学研究者。

实测Claude史上最强模型Fable 5,普通人慎用

只是,鲜少有人注意的是,按照官方说明,Fable 5 从现在到 6 月 22 日,会包含在 Pro、Max、Team 和按席位计费的 Enterprise 计划里,不额外收费。到了 6 月 23 日,Fable 5 将从这些订阅计划中移出,继续使用就需要消耗 usage credits。

换句话说,过去那种一张「月卡」解锁最强 AI 的模式,或许将一去不复返。对于用户而言,未来需要考虑的可能不只是订阅价格,还有每一次调用、每一次长任务执行背后真实消耗的 token 成本。

欢迎进入 Token 计费时代。

Claude Fable 5 封神登场,但它也是最狠的「Token 刺客」

Anthropic 对 Fable 和 Mythos 的命名也给出了解释。Fable 源自拉丁语 fabula,意为「被讲述的小故事」,含义上接近希腊语 Mythos。

两个新名字看起来像两款模型,实际更接近同一底层模型的两个版本。Fable 5 目前面向公众开放,带有更严格的安全限制;

Mythos 5 目前 只通过 Project Glasswing 计划提供给少数网络安全防御机构和关键基础设施合作方。

根据 Anthropic 官方博客的介绍,Fable 5 是该公司目前一般可用模型中能力最强的一款,在软件工程、知识工作、视觉理解、科学研究等方向都有明显提升。任务越长、越复杂,它相对此前 Claude 模型的优势越大。

Fable 5 的意义在于,Mythos 级能力第一次大规模面向普通用户开放。基准测试跑分图如下,主打一个遥遥领先。

实测Claude史上最强模型Fable 5,普通人慎用

不过,模型名字本身也引发了一些讨论。原OpenAI Codex 相关负责人 Tibo都发文调侃道,Anthropic 用了 OpenAI 想用但没有用的 Fable 命名。

实测Claude史上最强模型Fable 5,普通人慎用

能力层面,软件工程是官方最强调的方向之一。

Anthropic 提到,Stripe 在早期测试中让 Fable 5 处理一个 5000 万行 Ruby 代码库的迁移任务。这个工作如果交给一个工程团队手动完成,原本需要两个多月,Fable 5 在一天内完成。

实测Claude史上最强模型Fable 5,普通人慎用

Cognition 的 FrontierCode 测试也显示,Fable 5 在复杂生产级代码任务中表现领先。这个评测关注的不是普通代码题,而是模型能否完成困难编程任务,并达到高质量生产代码库的要求。

实测Claude史上最强模型Fable 5,普通人慎用

Anthropic 还强调,Fable 5 比此前 Claude 模型更节省 token。当然,这话听听得了,以往每次 Claude 新模型的发布都有类似的表述,但几乎都成了一个个 Token 刺客,为偌大的互联网提供了相当多的笑话。

知识工作方面,Fable 5 在 Hebbia 的金融基准测试中拿到最高成绩,提升集中在文档推理、图表理解和复杂问题分析。IMC 的交易分析评测也显示,Fable 5 在事实检索、概念推理、原因分析和期望值分析上都有较强表现。

视觉能力也是发布重点。Anthropic 称,Fable 5 能从复杂科学图表中提取精确数字,也能根据网页截图重建应用源码。

官方还展示了一个更直观的案例:Fable 5 只依靠游戏画面完成《宝可梦火红》,没有使用额外地图、导航工具或游戏状态信息。此前的 Claude 模型做类似任务,还需要更复杂的辅助系统。

实测Claude史上最强模型Fable 5,普通人慎用

长上下文和记忆能力也有提升。Anthropic 在《杀戮尖塔》测试中发现,给模型提供持久化文件记忆后,Fable 5 的表现提升幅度达到 Opus 4.8 的三倍,进入最终章节的频率也提升三倍。

生命科学方向更敏感。Anthropic 称,内部蛋白质设计专家使用 Mythos 5,把部分药物设计流程加速约 10 倍。

实测Claude史上最强模型Fable 5,普通人慎用

在一个案例里,Mythos 5 借助蛋白质设计和生物信息学工具,在没有人工协助的情况下完成了科学家通常要处理的一整套流程,包括选择结合位点、调用设计工具、处理失败结果。14 个蛋白靶点中,有 9 个产生了值得继续研究的候选方案。

生命科学和网络安全能力的提升,也解释了 Anthropic 为什么没有把完整 Mythos 级能力直接放开。

Fable 5 面向公众开放时,配套了一套新的安全分类器。只要用户请求涉及网络安全、生物、化学或模型蒸馏等高风险方向,系统就会自动改由 Claude Opus 4.8 响应,并告知用户模型发生了变化。

Anthropic 表示,早期数据中,超过 95% 的 Fable 5 会话不会触发这种变化。普通写作、编程、分析、设计、数据处理等任务,大多数情况下仍能使用 Fable 5 本身。但只要进入高风险区域,模型能力就会受到限制。

网络安全是限制最严的方向。Anthropic 承认,Mythos 级模型擅长发现和利用软件漏洞,也具备较强的代理式攻击能力,可能覆盖侦察、发现、横向移动等环节。为了避免这种能力被滥用,Fable 5 的网络安全分类器覆盖范围很广。

实测Claude史上最强模型Fable 5,普通人慎用

生物和化学方向也类似。Anthropic 认为,模型已经具备完成真实科学任务的能力,过去只屏蔽少数生物武器相关问题已经不够。因此,Fable 5 暂时会在大多数生物和化学相关请求上回退到 Opus 4.8 处理。

值得一提的是,Anthropic 还为 Fable 5 加入了一层针对前沿大模型开发的隐藏保护。

它主要限制 Claude 协助构建预训练流水线、分布式训练基础设施或 ML 加速器设计等任务,避免模型反过来加速其他机构训练下一代前沿模型。

实测Claude史上最强模型Fable 5,普通人慎用

和触发后会切换到 Opus 4.8 的安全限制不同,这类保护不会直接提示用户,而是通过提示词修改、steering vectors 或 PEFT 等方式,降低 Fable 5 在相关任务上的性能。目前也已经有受害者现身说法。

实测Claude史上最强模型Fable 5,普通人慎用

截至目前,Claude Fable 5 现已面向全球用户开放。开发者可以通过 Claude API 调用 claude-fable-5。Claude API 和按需付费的 Enterprise 计划从发布日起已经全面可用。

Fable 5 和 Mythos 5 的价格相同,均为每百万输入 token 10 美元,每百万输出 token 50 美元。按照 Anthropic 的说法,这已经低于 Claude Mythos Preview 的一半,但对于高强度长任务来说,价格仍然不低。

实测Claude史上最强模型Fable 5,普通人慎用

AI 终于数清了 6 根手指

比起官方博客,实测更能说明 Fable 5 到底变强在哪里。根据我的实测,Fable 5 已经能够识别 6 根手指了。

实测Claude史上最强模型Fable 5,普通人慎用

恰逢高考结束,我们也拿了道全国高考一卷语文作文题,让它练练手,怎么说呢?整体文风表达比较流畅,并不「普通」。

实测Claude史上最强模型Fable 5,普通人慎用

更具体的对比可以参考@ Hypergent 的实测,在小行星可视化任务中, Fable 5 不仅完成数据提取,还设计了包含轨道轨迹和悬停详情的交互式展示,在保证性能的同时提升了信息表达能力。

实测Claude史上最强模型Fable 5,普通人慎用

在健身度假村规划任务中,Fable 5 借助 GPT-Image-2 和 Nano Banana 生成更符合实际使用逻辑的场地方案,能够考虑区域连接、功能分布和人流动线,而不仅是简单摆放建筑。

实测Claude史上最强模型Fable 5,普通人慎用

Fable 5 能够把天文现象与可视化表达结合起来,展示太阳耀斑对极光影响的模拟;而 Opus 4.8 甚至未能正常加载。

实测Claude史上最强模型Fable 5,普通人慎用

前特斯拉 AI 总监,OpenAI 联创 Andrej Karpathy(现已加入 Anthropic)的评价更能说明开发者的感受。

实测Claude史上最强模型Fable 5,普通人慎用

不过,在设计审美上,人类目前仍然略占上风。

实测Claude史上最强模型Fable 5,普通人慎用

沃顿商学院教授 Ethan Mollick 的实测更能体现 Fable 5 的变化。他拿到早期访问权限后,重点测试了游戏、地图和研究工具等复杂任务。

其中最有代表性的是一个等时线地图项目。Mollick 要求 Fable 5 构建一个基于真实交通数据的交互式地图,展示不同城市在一定时间内的可达范围。模型随后调用多个 Agent 收集航班、铁路和道路数据,同时完成代码编写和测试,并不断根据反馈修正结果。

实测Claude史上最强模型Fable 5,普通人慎用

Mollick 还让 Fable 5 开发了一款名为 Concord 的研究工具。模型先生成 19 页设计文档,又连续工作 9 个半小时,最终完成软件开发,用于分析开放式研究数据并校准人类与 AI 的判断结果。

实测Claude史上最强模型Fable 5,普通人慎用

实测也暴露出明显问题。Mollick 认为,Fable 5 仍然会出现错误和遗漏,需要人工检查和完善。同时,长任务带来的 token 消耗非常高,而 Fable 5 的价格又明显高于 Opus 4.8,真正投入生产环境后,成本可能成为最大的现实挑战。

高强度长任务能力,最终都会反映到使用成本上。作为 20 美元套餐的 Pro 用户,我甚至只是简单跑了几个任务,就用完了额度。

而 Claude 客户端也显示 Fable 5 「included until June 22」,如开头所述,按照 Anthropic 的安排,免费包含窗口结束后,Fable 5 会从部分订阅计划中移出,继续使用需要消耗 usage credits。

实测Claude史上最强模型Fable 5,普通人慎用

过去用户付一笔不算贵的月费,就能在很大程度上享用世界上最强的一批智能。订阅制模糊了真实成本,也让普通个体在某些时刻和一些巨头站上了同一条起跑线。

Token 计费降临之后,一切都会发生变化。

AI 会从一种近似包月服务,变成一种按量消耗的生产资料。最强模型也正在变成一种更昂贵、更精细计价的生产工具。

有些人可以不太在乎成本,比如让 Fable 5 执行 24 小时长链任务,重构 5000 万行代码,独立开发一个完整应用,持续跑研究项目,反复测试和修改结果。

但更多普通用户则会在每一次调用前下意识地掂量:这个问题值不值得花 token?这个任务值不值得交给最强模型?这次尝试失败后,还要不要继续让它重来一遍?

实测Claude史上最强模型Fable 5,普通人慎用

最糟糕的消息莫过于此。AI 没有变弱。相反,它正以前所未有的速度变强,强到足以独立完成越来越多原本属于人类的脑力工作。

与此同时,获得这种能力的门票正在不断提高。普通人与先进生产力之间,刚刚被大模型拉近的信息差,可能会因为昂贵的 token 计费重新拉开。

Anthropic 如此,未来 OpenAI 等其它厂商也很难例外。前沿模型越强,训练和推理成本越高,尤其是这两家 AI 公司目前都在争取上市,都需要向资本市场证明自己不只是能训练更强模型,也能把模型能力变成持续收入。

因此,与其说 Fable 5 的发布是一次模型升级,倒不如说是一次彻底调整 AI 订阅体系的预热。如果 AI 的普惠窗口期开始进入倒计时,那这绝对不会是最好的消息。

本文来自转载APPSO ,观点仅代表作者本人,发现AI平台仅提供信息存储空间服务。
如若转载,请联系原作者;如有侵权,请联系编辑删除。

(0)
评测组小编的头像评测组小编
Anthropic 发布 Claude Fable 5:史上最强 Claude,全民开放,定价腰斩
上一篇 4小时前
奥特曼亲自上阵,Images 2.0登顶王座!大米刻字,生图跨入GPT-5时代
下一篇 2026年4月22日 上午9:50



扫码关注我们,了解最新AI资讯~

相关推荐

发表回复

登录后才能评论