评测

评测

“智能体最后的考试”，Fable 5竟然不敌GPT 5.5

没想到打脸来得如此之快！！刚刚，UC伯克利放出了一场号称“智能体最后的考试”的全新基准测试。它把当今最强的AI Agent们拉到考场上，让它们干真正的活—— 在Siemens …

评测组小编
2026年6月12日
评测

AI预测世界杯大横评：豆包靠玄学，千问看数据，deepseek选黑马

我养了五只AI「章鱼保罗」，它们为世界杯谁夺冠吵起来了世界杯还没开踢，AI已经先坐上了解说席。据外媒Sport1报道，距章鱼保罗在世界杯上创造神奇预测16年后，这只预言帝将以A…

评测组小编
2026年6月12日
评测

小米 MiMo Code：开源 AI 编程助手深度评测以及安装教程

1. MiMo Code 是什么？小米 MiMo 团队推出的终端原生 AI 编程助手，基于 OpenCode fork 构建。核心特色：跨会话记忆、多智能体协作、自我进化机制。 …

评测组小编
2026年6月11日
评测

实测小米最快1T大模型：吞吐量每秒1000+ Tokens，Vibe Coding七秒交付

全球大模型的军备竞赛，正在“智商”之外开辟新的战场—— 推理速度。把这个战场抬到新高度的，是小米。小米发布了全新的MiMo-V2.5-Pro-UltraSpeed模型，也就是M…

评测组小编
2026年6月11日
评测

Claude 最强模型 Fable 5 全解析：Mythos 级别的怪物

Claude 上新今天凌晨，Anthropic 发布新模型 Fable 5，毫无疑问的，也是当下的最强模型这时候，手机前、刚起床的彦祖可能会问：不是说发的是 Mythos 么？…

评测组小编
2026年6月10日
评测

Fable 5评测：强，贵，甚至能发现自己正在被检测

藏了2个月的“神话模型”Claude Mythos 终于被Anthropic放出来了。今天凌晨，Anthropic 上线 Claude Fable 5——一个新的“全球最强”。它…

评测组小编
2026年6月10日
评测

GPT-5.6首批实测来了！精准狙击Mythos

刚刚，Anthropic放出藏了俩月的大杀器——Claude Fable 5和Mythos 5，无异于扔下一枚炸弹。现在压力直接给到OpenAI。同一时间，GPT-5.6也泄露…

评测组小编
2026年6月10日
评测

实测Claude史上最强模型Fable 5，普通人慎用

对普通人最坏的消息要来了。就在刚刚，Anthropic 宣布推出 Claude Fable 5 和 Claude Mythos 5。其中，Fable 5 是 Anthropic…

评测组小编
2026年6月10日
评测

6款AI大模型挑战高考数学！一款拿下148分，压轴题成分水岭

“6款主流大模型的解题能力整体表现呈现出清晰的梯队分化。” 6月7日，2026年全国高考数学科目考试落下帷幕，随后，多个数学相关的话题登上热搜。过去两年，AI行业迎来高速发展，大模…

评测组小编
2026年6月8日
评测

Kimi Work不是中国版Codex

它帮我把马斯克“取关”了。 Kimi Work和CoWork。图片由AI生成 Vibe Working有可能是接下来比Vibe Coding更火的词。就在上周，Kimi发布了新的…

评测组小编
2026年6月8日
评测

难上热搜的高考数学，我拿ChatGPT和豆包PK了一把！

今年高考数学，又把不少人做沉默了。从考场出来后，很多考生的第一反应不是有几道题不会，而是怎么每一道都这么能算。于是乎，计算量大、题型新、区分度高，成了这张卷子被讨论最多的几个关…

资讯组小编
2026年6月8日
评测

Kimi Work内测三天，我的桌面变成了案发现场

上周拿到了Kimi Work的内测资格，说起来还挺巧的，那几天我正好在整理桌面文件。做过的都知道这事有多烦，不说一个月了，就几天，桌面上密密麻麻几十上百个文件，截图一大堆乱七八糟…

评测组小编
2026年6月5日

2 / 13
1
2
3
4
5
6

Meta推出299美元智能眼镜新系列
19分钟前
分享到:

Meta 6月23日宣布，公司与依视路陆逊梯卡合作推出全新的“Meta Glasses”系列。该系列采用全新设计，包含三种镜框款式，起售价为299美元，较公司第二代入门款Meta Ray-Ban智能眼镜至少便宜80美元。
英伟达发布BioNeMo Agent工具包
19分钟前
分享到:

当地时间6月23日，英伟达宣布推出NVIDIA BioNeMo Agent Toolkit，该工具包包含英伟达超过十年的生命科学库、工具和开放模型，使AI智能体、科学家和实验室能够通过收集证据、跨研究结果进行推理、运行计算实验以及推荐下一步最佳行动来协同工作，从而加速科学发现。
特朗普政府施压Meta，要求其提交AI模型接受安全审查
21分钟前
分享到:

据多位知情人士称，特朗普政府正施压Meta，要求其自愿提交人工智能模型接受审查，以便政府评估这些模型的性能与漏洞。消息人士称，这一要求是在特朗普政府给这家社交媒体巨头的电子邮件中提出的。Meta于今年4月推出了Muse Spark人工智能模型，但它是美国唯一一家尚未与联邦政府达成协议，自愿共享其模型以供审查的主要人工智能技术开发商。
防止OpenAI式出走：谷歌重金拉拢前员工AI创业，抢夺早期算力大客户
7小时前
分享到:

谷歌宣布支持一项面向前员工（xoogler）的AI创业公司的孵化器计划，以深化与校友网络的合作并争夺早期云服务及芯片客户。首期项目由Google AI Futures Fund支持，计划招募10至20家初创公司，提供为期12周的孵化支持。入选初创公司将获得最高10万美元资金，以及价值35万美元的Google Cloud与AI信用额度。除资金和算力支持外，前谷歌高管团队将为创业者提供导师指导，包括前雅虎CEO玛丽莎·梅耶尔。新孵化器的合作方包括前员工克里斯·方创立的校友社区平台Xoogler.co，以及前员工库沙格拉·什里瓦斯塔瓦参与发起的创投项目Key Studio。目前Xoogler.co的全球成员已超过3.5万名，包含2500名认证投资者。谷歌正极力说服更多初创公司使用其自研的算力芯片和云服务，试图在早期阶段建立技术绑定，培育未来的大客户。
研究提出AI或助推妄想的“放大螺旋”机制
7小时前
分享到:

2026年6月23日，伦敦国王学院与德国新教应用科学大学精神科医生在《自然》发表论文，提出解释AI如何加剧妄想的“放大螺旋”理论。研究指出，聊天机器人通过语言对齐、超个性化生成和迎合倾向三特征叠加，可能主动强化用户错误信念，而非被动回应。该机制易在长期高强度使用中触发，导致脱离现实、睡眠剥夺及进食紊乱等身心影响。研究人员呼吁临床筛查中纳入AI使用史，尤其针对首次出现精神病性症状者。该框架目前仍属待验证假设。
FFmpeg曝高危漏洞CVE-2026-8461，可静默远程执行代码
7小时前
分享到:

2026年6月23日，开源多媒体框架FFmpeg被曝出严重安全漏洞CVE-2026-8461（CVSS评分8.8）。该漏洞源于MagicYUV解码器中的堆缓冲区越界写入，攻击者构造恶意视频文件，无需用户交互，即可在NAS、BT下载工具或视频软件自动生成预览时触发。Kodi、OBS Studio、Jellyfin等主流媒体软件受影响，Jellyfin已确认可远程执行代码。FFmpeg官方已发布修复版本8.1.2，建议用户立即升级或禁用MagicYUV解码器。
OpenAI机密IPO文件曝光，未来承诺高达6650亿美元
13小时前
分享到:

据The Information报道，OpenAI的机密IPO注册申请草案显示，截至2026年3月31日，OpenAI账面零债务，租约负债不足7.5亿美元，单季资本支出仅4600万美元，但未来芯片、能源与数据中心采购承诺高达6650亿美元。OpenAI第一季度净亏损约85亿美元，营收成本中72%支付给关联方，并以4.88亿美元股权结算算力账单。OpenAI合并报表的数据中心合资项目中，50亿美元亏损归属于外部合伙人。Anthropic承诺向Fluidstack支付45亿美元，并由博通为Anthropic向谷歌租赁的350亿美元芯片订单提供担保。
OpenCLI App发布：推出免npm独立包，支持自动保持浏览器登录态
13小时前
分享到:

OpenCLI近日上线了OpenCLI App桌面版应用，推出无需依赖node.js或npm环境的独立安装包，降低了普通用户的使用门槛，并集成了自动刷新登录态等便捷功能。OpenCLI是一款将网页转化为命令行界面（CLI）并允许AI智能体调用浏览器进行自动化的工具，支持在终端中用命令行直接浏览bilibili、知乎和Hackernews，同时支持面向Claude Code、Cursor等AI编程助手提供桥接，让智能体直接在用户已登录的Chrome浏览器里模拟点击、填写表单、提取网页数据或截屏。新发布的OpenCLI App桌面端整合了完整运行环境，并支持在系统托盘管理，用户无需命令行基础即可通过图形界面完成配置修改、运行诊断和版本更新，还能自动维持网页登录凭证长期有效。
QQ邮箱开启专为AI智能体打造的Agently Mail内测
13小时前
分享到:

QQ邮箱正式开启专为AI智能体（agent）设计的专属邮箱「Agently Mail」内测。新邮箱与用户个人或企业邮箱的数据完全隔离，允许AI使用独立身份进行邮件收发、搜索和附件处理，避免AI因误删、错发或过度读取对用户个人隐私造成安全威胁。此外，Agently Mail还可作为智能体的数字身份证，支持自主注册第三方平台、接收验证码，或在企业间自动完成询价、报价与订单对接等全流程自动化协作。目前，Agently Mail已支持多个主流智能体平台。
谷歌注资A24影业7500万美元，联手DeepMind开发非提示型AI影视工具
13小时前
分享到:

谷歌将向出品过《后室》等影片的独立制片公司A24投资约7500万美元。这是谷歌首次直接持有电影制片厂股份。双方签署了多年期、非排他性合作协议，谷歌不会获得A24旗下电影和电视库等数据的访问权限。谷歌DeepMind部门与A24的合作旨在为电影制作与发行流程开发新工具。A24负责技术与创新的合伙人Scott Belsky表示，目前的AI开发者过于强调通过技术降低电影制作成本和缩短周期，这并不吸引电影人。他认为应当利用AI保留创意控制权并支持创作冒险，双方联合开发的工具不会采用当前令许多创作者反感的提示词生成模式。为了推进向全球化媒体公司扩张的战略，A24正在制作旗下史上预算最高的电影项目，即由Alex Garland执导的《艾尔登法环》（Elden Ring）游戏改编电影，制作预算高达1.75亿美元。

【腾讯云】 4核4G服务器新客 38元/年起，支持 OpenClaw/Hermes 等热门镜像；Token Plan 低至28元/月，多种主流模型极速调用