实测Claude史上最强模型Fable 5，普通人慎用

对普通人最坏的消息要来了。

就在刚刚，Anthropic 宣布推出 Claude Fable 5 和 Claude Mythos 5。

其中，Fable 5 是 Anthropic 首个面向公众开放的 Mythos 级模型，Mythos 5 则主要面向少数网络安全防御机构、关键基础设施提供方以及后续进入可信访问计划的生物医学研究者。

只是，鲜少有人注意的是，按照官方说明，Fable 5 从现在到 6 月 22 日，会包含在 Pro、Max、Team 和按席位计费的 Enterprise 计划里，不额外收费。到了 6 月 23 日，Fable 5 将从这些订阅计划中移出，继续使用就需要消耗 usage credits。

换句话说，过去那种一张「月卡」解锁最强 AI 的模式，或许将一去不复返。对于用户而言，未来需要考虑的可能不只是订阅价格，还有每一次调用、每一次长任务执行背后真实消耗的 token 成本。

欢迎进入 Token 计费时代。

Claude Fable 5 封神登场，但它也是最狠的「Token 刺客」

Anthropic 对 Fable 和 Mythos 的命名也给出了解释。Fable 源自拉丁语 fabula，意为「被讲述的小故事」，含义上接近希腊语 Mythos。

两个新名字看起来像两款模型，实际更接近同一底层模型的两个版本。Fable 5 目前面向公众开放，带有更严格的安全限制；

Mythos 5 目前只通过 Project Glasswing 计划提供给少数网络安全防御机构和关键基础设施合作方。

根据 Anthropic 官方博客的介绍，Fable 5 是该公司目前一般可用模型中能力最强的一款，在软件工程、知识工作、视觉理解、科学研究等方向都有明显提升。任务越长、越复杂，它相对此前 Claude 模型的优势越大。

Fable 5 的意义在于，Mythos 级能力第一次大规模面向普通用户开放。基准测试跑分图如下，主打一个遥遥领先。

不过，模型名字本身也引发了一些讨论。原OpenAI Codex 相关负责人 Tibo都发文调侃道，Anthropic 用了 OpenAI 想用但没有用的 Fable 命名。

能力层面，软件工程是官方最强调的方向之一。

Anthropic 提到，Stripe 在早期测试中让 Fable 5 处理一个 5000 万行 Ruby 代码库的迁移任务。这个工作如果交给一个工程团队手动完成，原本需要两个多月，Fable 5 在一天内完成。

Cognition 的 FrontierCode 测试也显示，Fable 5 在复杂生产级代码任务中表现领先。这个评测关注的不是普通代码题，而是模型能否完成困难编程任务，并达到高质量生产代码库的要求。

Anthropic 还强调，Fable 5 比此前 Claude 模型更节省 token。当然，这话听听得了，以往每次 Claude 新模型的发布都有类似的表述，但几乎都成了一个个 Token 刺客，为偌大的互联网提供了相当多的笑话。

知识工作方面，Fable 5 在 Hebbia 的金融基准测试中拿到最高成绩，提升集中在文档推理、图表理解和复杂问题分析。IMC 的交易分析评测也显示，Fable 5 在事实检索、概念推理、原因分析和期望值分析上都有较强表现。

视觉能力也是发布重点。Anthropic 称，Fable 5 能从复杂科学图表中提取精确数字，也能根据网页截图重建应用源码。

官方还展示了一个更直观的案例：Fable 5 只依靠游戏画面完成《宝可梦火红》，没有使用额外地图、导航工具或游戏状态信息。此前的 Claude 模型做类似任务，还需要更复杂的辅助系统。

长上下文和记忆能力也有提升。Anthropic 在《杀戮尖塔》测试中发现，给模型提供持久化文件记忆后，Fable 5 的表现提升幅度达到 Opus 4.8 的三倍，进入最终章节的频率也提升三倍。

生命科学方向更敏感。Anthropic 称，内部蛋白质设计专家使用 Mythos 5，把部分药物设计流程加速约 10 倍。

在一个案例里，Mythos 5 借助蛋白质设计和生物信息学工具，在没有人工协助的情况下完成了科学家通常要处理的一整套流程，包括选择结合位点、调用设计工具、处理失败结果。14 个蛋白靶点中，有 9 个产生了值得继续研究的候选方案。

生命科学和网络安全能力的提升，也解释了 Anthropic 为什么没有把完整 Mythos 级能力直接放开。

Fable 5 面向公众开放时，配套了一套新的安全分类器。只要用户请求涉及网络安全、生物、化学或模型蒸馏等高风险方向，系统就会自动改由 Claude Opus 4.8 响应，并告知用户模型发生了变化。

Anthropic 表示，早期数据中，超过 95% 的 Fable 5 会话不会触发这种变化。普通写作、编程、分析、设计、数据处理等任务，大多数情况下仍能使用 Fable 5 本身。但只要进入高风险区域，模型能力就会受到限制。

网络安全是限制最严的方向。Anthropic 承认，Mythos 级模型擅长发现和利用软件漏洞，也具备较强的代理式攻击能力，可能覆盖侦察、发现、横向移动等环节。为了避免这种能力被滥用，Fable 5 的网络安全分类器覆盖范围很广。

生物和化学方向也类似。Anthropic 认为，模型已经具备完成真实科学任务的能力，过去只屏蔽少数生物武器相关问题已经不够。因此，Fable 5 暂时会在大多数生物和化学相关请求上回退到 Opus 4.8 处理。

值得一提的是，Anthropic 还为 Fable 5 加入了一层针对前沿大模型开发的隐藏保护。

它主要限制 Claude 协助构建预训练流水线、分布式训练基础设施或 ML 加速器设计等任务，避免模型反过来加速其他机构训练下一代前沿模型。

和触发后会切换到 Opus 4.8 的安全限制不同，这类保护不会直接提示用户，而是通过提示词修改、steering vectors 或 PEFT 等方式，降低 Fable 5 在相关任务上的性能。目前也已经有受害者现身说法。

截至目前，Claude Fable 5 现已面向全球用户开放。开发者可以通过 Claude API 调用 claude-fable-5。Claude API 和按需付费的 Enterprise 计划从发布日起已经全面可用。

Fable 5 和 Mythos 5 的价格相同，均为每百万输入 token 10 美元，每百万输出 token 50 美元。按照 Anthropic 的说法，这已经低于 Claude Mythos Preview 的一半，但对于高强度长任务来说，价格仍然不低。

AI 终于数清了 6 根手指

比起官方博客，实测更能说明 Fable 5 到底变强在哪里。根据我的实测，Fable 5 已经能够识别 6 根手指了。

恰逢高考结束，我们也拿了道全国高考一卷语文作文题，让它练练手，怎么说呢？整体文风表达比较流畅，并不「普通」。

更具体的对比可以参考@ Hypergent 的实测，在小行星可视化任务中， Fable 5 不仅完成数据提取，还设计了包含轨道轨迹和悬停详情的交互式展示，在保证性能的同时提升了信息表达能力。

在健身度假村规划任务中，Fable 5 借助 GPT-Image-2 和 Nano Banana 生成更符合实际使用逻辑的场地方案，能够考虑区域连接、功能分布和人流动线，而不仅是简单摆放建筑。

Fable 5 能够把天文现象与可视化表达结合起来，展示太阳耀斑对极光影响的模拟；而 Opus 4.8 甚至未能正常加载。

前特斯拉 AI 总监，OpenAI 联创 Andrej Karpathy（现已加入 Anthropic）的评价更能说明开发者的感受。

不过，在设计审美上，人类目前仍然略占上风。

沃顿商学院教授 Ethan Mollick 的实测更能体现 Fable 5 的变化。他拿到早期访问权限后，重点测试了游戏、地图和研究工具等复杂任务。

其中最有代表性的是一个等时线地图项目。Mollick 要求 Fable 5 构建一个基于真实交通数据的交互式地图，展示不同城市在一定时间内的可达范围。模型随后调用多个 Agent 收集航班、铁路和道路数据，同时完成代码编写和测试，并不断根据反馈修正结果。

Mollick 还让 Fable 5 开发了一款名为 Concord 的研究工具。模型先生成 19 页设计文档，又连续工作 9 个半小时，最终完成软件开发，用于分析开放式研究数据并校准人类与 AI 的判断结果。

实测也暴露出明显问题。Mollick 认为，Fable 5 仍然会出现错误和遗漏，需要人工检查和完善。同时，长任务带来的 token 消耗非常高，而 Fable 5 的价格又明显高于 Opus 4.8，真正投入生产环境后，成本可能成为最大的现实挑战。

高强度长任务能力，最终都会反映到使用成本上。作为 20 美元套餐的 Pro 用户，我甚至只是简单跑了几个任务，就用完了额度。

而 Claude 客户端也显示 Fable 5 「included until June 22」，如开头所述，按照 Anthropic 的安排，免费包含窗口结束后，Fable 5 会从部分订阅计划中移出，继续使用需要消耗 usage credits。

过去用户付一笔不算贵的月费，就能在很大程度上享用世界上最强的一批智能。订阅制模糊了真实成本，也让普通个体在某些时刻和一些巨头站上了同一条起跑线。

Token 计费降临之后，一切都会发生变化。

AI 会从一种近似包月服务，变成一种按量消耗的生产资料。最强模型也正在变成一种更昂贵、更精细计价的生产工具。

有些人可以不太在乎成本，比如让 Fable 5 执行 24 小时长链任务，重构 5000 万行代码，独立开发一个完整应用，持续跑研究项目，反复测试和修改结果。

但更多普通用户则会在每一次调用前下意识地掂量：这个问题值不值得花 token？这个任务值不值得交给最强模型？这次尝试失败后，还要不要继续让它重来一遍？

最糟糕的消息莫过于此。AI 没有变弱。相反，它正以前所未有的速度变强，强到足以独立完成越来越多原本属于人类的脑力工作。

与此同时，获得这种能力的门票正在不断提高。普通人与先进生产力之间，刚刚被大模型拉近的信息差，可能会因为昂贵的 token 计费重新拉开。

Anthropic 如此，未来 OpenAI 等其它厂商也很难例外。前沿模型越强，训练和推理成本越高，尤其是这两家 AI 公司目前都在争取上市，都需要向资本市场证明自己不只是能训练更强模型，也能把模型能力变成持续收入。

因此，与其说 Fable 5 的发布是一次模型升级，倒不如说是一次彻底调整 AI 订阅体系的预热。如果 AI 的普惠窗口期开始进入倒计时，那这绝对不会是最好的消息。

本文来自转载APPSO ，观点仅代表作者本人，发现AI平台仅提供信息存储空间服务。
如若转载，请联系原作者；如有侵权，请联系编辑删除。

实测Claude史上最强模型Fable 5，普通人慎用

Claude Fable 5 封神登场，但它也是最狠的「Token 刺客」

AI 终于数清了 6 根手指

相关推荐

谷歌发布 Android CLI：AI Agent 让安卓开发效率提升3倍

连夜测了一波DeepSeek-V4，我发现它可能只剩“审美”这个短板了

2026年4月 主流AI编程模型横评与费用对比

生物课，可能会被这类 AI + 3D 工具重做一遍

腾讯版“贾维斯”上线：一句话搞定电脑配置，每天1000万Token免费用

MiniMax 推出了 Mavis，活脱脱的 Agent「三省六部」

发表回复

2026年4月主流AI编程模型横评与费用对比