Anthropic 发布 Claude Fable 5:史上最强 Claude,全民开放,定价腰斩

今天凌晨(北京时间),Anthropic 正式发布了Claude Fable 5。
这是他们”Mythos”级模型的安全公开版——也就是说,把原来只开放给特定合作方的高端能力,下放给普通用户了。
Fable 5 的能力在几乎所有基准测试上都刷新了最高纪录。任务越复杂、越长,它领先其他 Claude 模型的幅度就越大。
与此同时,还有一款Claude Mythos 5:同一个模型,但把安全限制解除了相当一部分。面向网络安全防御者和部分生物医学研究者开放。
两款模型的价格是$10/百万输入token、$50/百万输出token,比之前的 Claude Mythos Preview 便宜了一半以上。

01 Fable 5 到底有多强

Anthropic 的文章里给了大量真实测试案例,不像是软文,更像是产品说明书——但每一个数字都在说同一件事:这次提升是真实且巨大的。
刚刚,Anthropic首个神话级Claude 5正式解禁!
编程:
Stripe(支付巨头)在早期测试中反馈:Fable 5 把”几个月的工程压缩成了几天”。
在一个 5000 万行的 Ruby 代码库里,模型用一天完成了本来需要一个团队干两个多月的人工迁移。
在 Cognition 的 FrontierCode 评测(测试模型能否在满足高质量代码库标准的前提下完成困难编程任务)中,Fable 5 在各前沿模型里得分最高,即使只看中等难度的任务。
金融分析:
在 Hebbia 的金融基准测试(面向资深分析师级别的推理能力)中,Fable 5 得分第一,在文档推理、图表解读、问题解决上有显著提升。
交易公司 IMC 评价:Fable 5 在他们的交易分析评估中几乎全面通过,包括事实查询、概念推理、根本原因分析,以及期望值分析。
视觉理解:
Fable 5 在视觉任务上也是新的 SOTA(最优水平)。能精确提取科学图表里的数字,能从截图直接重建 Web 应用源代码。
更有意思的是:之前的 Claude 模型即使加了辅助工具都玩不好 Pokémon FireRed,但 Fable 5 只需要一个纯视觉的最小化工具就直接通关了。
就……玩通了。
记忆与长上下文:
Fable 5 在数百万 token 的长程任务中能保持专注,还能用自己生成的笔记持续改进输出。
在卡牌游戏 Slay the Spire 的测试里,给它加上持久化的文件记忆,性能提升幅度是 Opus 4.8 的三倍。Fable 到达游戏最终关卡的频率也提升了三倍。
Anthropic 还展示了几个自主完成的 demo:推算日食、自主导玩 Factorio(工厂自动化建造游戏)、在浏览器 CAD 编辑器里设计可3D打印的模型——顺便还为这个编辑器自己写了一个内置 AI 助手,用来建模。
最后这个 demo 里,Fable 5 还同步写了一首古典 EDM 混音,驱动流体模拟跟着节拍跳动。
然而它从来没听过音乐。

02 Mythos 5:在实验室里造药

Fable 5 负责安全公开,Mythos 5 则负责展示上限。
Anthropic 把 Mythos 5 拿去做了一个蛋白质设计实验:在没有任何人类协助的情况下,Mythos 5 独立完成了一款基因治疗载体(AAV)的设计步骤——包括选择结合位点、运行蛋白质设计工具、处理中途出现的失败。
最后,14 个蛋白质靶点里有 9 个产生了高质量候选分子,目前正在推进研究。
这不是重点。重点是:这个能力是双刃的。同样的能力用来设计治疗性蛋白质是救人;如果被恶意使用,也可以用来设计危险病毒。
Anthropic 在论文里第一次承认了这一点。
此外,Mythos 5 在分子生物学领域已经能持续生成novel的、有说服力的科学假设。在双盲对比测试中,Anthropic 的科学家在约 80% 的情况下更偏好 Mythos 的假设,而不是 Opus 级模型的输出。
更有意思的是:其中一个假设——关于大肠杆菌蛋白的一种novel机制——被一个独立实验室的研究证实了。他们做的时候根本不知道 Anthropic 的模型也在研究同一个问题。
Mythos 5 还用一周时间完成了单细胞基因组学研究,分析了涵盖 138 个物种的数百万个单细胞数据,自主设计并训练了一个机器学习模型,来识别远缘物种中执行相同功能的细胞。唯一的人类输入只是一些高层次的指导。
结果:这个模型比最近发表在Science期刊上的同类模型表现更好——而它比那个模型小了 100 倍。

03 安全这道坎,怎么过的

Fable 5 之所以叫 Fable 5 而不是 Mythos 5,核心区别在于安全护栏。
Anthropic 为 Fable 5 训练了一套新的分类器(classifiers),用于检测潜在的滥用请求,包括越狱攻击。当检测到涉及网络安全、生物学与化学、或模型蒸馏攻击时,响应会自动切换到 Claude Opus 4.8,而不是 Fable 5 本尊。
用户会收到通知——不会莫名其妙降级,但也不会完全拒绝。
数据显示:超过 95% 的 Fable 5 对话完全不触发任何降级,对于这些会话,Fable 5 的体验等同于 Mythos 5。
安全团队做了大量红队测试。内部测试加上外部漏洞赏金计划,1000+ 小时测试后,没有发现通用越狱漏洞。英国 AI 安全研究所(UK AISI)在短暂测试窗口内有一些进展,但尚未突破。
Anthropic 的态度很诚实:”完全防止越狱几乎不可能,但我们的目标是让剩余越狱的难度和成本高到我们能在被大规模使用之前就检测到。”
数据政策也有更新:所有 Mythos 级模型的流量将实行 30 天数据保留,不用于训练,也不对外分享,绝大多数情况下 30 天后删除。

04 Mythos 5 的开放路径

现在,所有已加入 Project Glasswing 的网络安全合作伙伴(也就是和美国政府合作的防御者们)可以免费升级到 Claude Mythos 5——同样内核,去掉了网络安全限制。
同时,Anthropic 宣布将推出两个新的”可信访问计划”(Trusted Access Program):

网络安全方向

:让更多网络安全组织能系统性地申请 Mythos 5 访问权限

生物学方向

:面向生物医学研究者开放 Fable 5(解除生物化学限制,但保留网络攻击限制),帮助加速新药研发

这是 Anthropic 第一次明确说”我们要让更多外部研究者用到 Mythos 级能力”——虽然路径还是谨慎的,但口子开了。

05 怎么用上

Claude Fable 5:今天全面上线,所有用户可用。

API 和按量付费企业计划:立即可用,无额外费用

订阅计划(Pro/Max/Team/企业版):即日起至6月22日免费使用

6月23日起,使用需要消耗额度;如果容量允许,免费窗口会延长

后续计划将 Fable 5 重新纳入订阅套餐标准权益

Claude Mythos 5:目前仅限 Glasswing 合作伙伴(网络安全方向)和即将开放的部分生物学研究者。
定价:$10/M 输入,$50/M 输出,不到之前 Mythos Preview 的一半。
开发者可以直接通过 Claude API 调用claude-fable-5。

06 最后

Fable 5 的命名来自拉丁语fabula(故事),Mythos 来自希腊语mythos(神话)。两个词本是同源,都指”讲述出来的东西”。

Fable = “公开版”,Mythos = “受限版”。只不过 Anthropic 故意用了一个同源的词根,让它听起来像是”故事”和”神话”的区别,而不是”阉割版”和”完整版”的区别。

本文系【发现AI】原创内容,部分内容综合自网络,如有侵权,请联系编辑删除。
转载请注明来源:http://faxai.cn 发现AI

(0)
资讯组小编的头像资讯组小编
公开版Mythos上线,Claude 最强模型开始分层发售
上一篇 4小时前
实测Claude史上最强模型Fable 5,普通人慎用
下一篇 4小时前



扫码关注我们,了解最新AI资讯~

相关推荐

发表回复

登录后才能评论