评测
-
“智能体最后的考试”,Fable 5竟然不敌GPT 5.5
没想到打脸来得如此之快!! 刚刚,UC伯克利放出了一场号称“智能体最后的考试”的全新基准测试。 它把当今最强的AI Agent们拉到考场上,让它们干真正的活—— 在Siemens …
-
AI预测世界杯大横评:豆包靠玄学,千问看数据,deepseek选黑马
我养了五只AI「章鱼保罗」,它们为世界杯谁夺冠吵起来了 世界杯还没开踢,AI已经先坐上了解说席。 据外媒Sport1报道,距章鱼保罗在世界杯上创造神奇预测16年后,这只预言帝将以A…
-
小米 MiMo Code:开源 AI 编程助手深度评测以及安装教程
1. MiMo Code 是什么? 小米 MiMo 团队推出的终端原生 AI 编程助手,基于 OpenCode fork 构建。核心特色:跨会话记忆、多智能体协作、自我进化机制。 …
-
实测小米最快1T大模型:吞吐量每秒1000+ Tokens,Vibe Coding七秒交付
全球大模型的军备竞赛,正在“智商”之外开辟新的战场—— 推理速度。 把这个战场抬到新高度的,是小米。 小米发布了全新的MiMo-V2.5-Pro-UltraSpeed模型,也就是M…
-
Claude 最强模型 Fable 5 全解析:Mythos 级别的怪物
Claude 上新 今天凌晨,Anthropic 发布新模型 Fable 5,毫无疑问的,也是当下的最强模型 这时候,手机前、刚起床的彦祖可能会问:不是说发的是 Mythos 么?…
-
Fable 5评测:强,贵,甚至能发现自己正在被检测
藏了2个月的“神话模型”Claude Mythos 终于被Anthropic放出来了。 今天凌晨,Anthropic 上线 Claude Fable 5——一个新的“全球最强”。它…
-
GPT-5.6首批实测来了!精准狙击Mythos
刚刚,Anthropic放出藏了俩月的大杀器——Claude Fable 5和Mythos 5,无异于扔下一枚炸弹。 现在压力直接给到OpenAI。 同一时间,GPT-5.6也泄露…
-
实测Claude史上最强模型Fable 5,普通人慎用
对普通人最坏的消息要来了。 就在刚刚,Anthropic 宣布推出 Claude Fable 5 和 Claude Mythos 5。 其中,Fable 5 是 Anthropic…
-
6款AI大模型挑战高考数学!一款拿下148分,压轴题成分水岭
“6款主流大模型的解题能力整体表现呈现出清晰的梯队分化。” 6月7日,2026年全国高考数学科目考试落下帷幕,随后,多个数学相关的话题登上热搜。过去两年,AI行业迎来高速发展,大模…
-
Kimi Work不是中国版Codex
它帮我把马斯克“取关”了。 Kimi Work和CoWork。图片由AI生成 Vibe Working有可能是接下来比Vibe Coding更火的词。 就在上周,Kimi发布了新的…
-
难上热搜的高考数学,我拿ChatGPT和豆包PK了一把!
今年高考数学,又把不少人做沉默了。 从考场出来后,很多考生的第一反应不是有几道题不会,而是怎么每一道都这么能算。 于是乎,计算量大、题型新、区分度高,成了这张卷子被讨论最多的几个关…
-
Kimi Work内测三天,我的桌面变成了案发现场
上周拿到了Kimi Work的内测资格,说起来还挺巧的,那几天我正好在整理桌面文件。 做过的都知道这事有多烦,不说一个月了,就几天,桌面上密密麻麻几十上百个文件,截图一大堆乱七八糟…
