评测

评测

阶跃Step 3.7 Flash登顶AA榜：速度、性价比、端到端三项第一

OpenRouter Trending榜单冷不丁窜出一匹国产黑马，热度暴涨稳居全球第二。定睛一看，原来是阶跃星辰新发的Step 3.7 Flash。再一看，不只OpenRout…

资讯组小编
2026年6月4日
评测

花1500美元，让AI“黑”自己的App：GPT-5.5成功率70%，部分模型0分交卷

一个专门为 AI 设计的“Bug 靶场”。大模型会写代码已经不是什么新鲜事了。但如果给它们一个真实的移动应用、一份 APK 安装包以及有限的预算，它们能否像安全研究员一样主动发现…

评测组小编
2026年6月4日
评测

Hermes桌面版真实体验：像极了Codex、全英文、profile切不了

Hermes官方终于出桌面版了！智东西6月3日报道，宣布和英伟达合作后，Nous Research在昨日晚间，终于放出了他们开发的Hermes桌面版（预览）。在此之前，Herm…

评测组小编
2026年6月3日
评测

扣子3.0实测：手机就能远程遥控你电脑里的Agent

扣子，来了个大版本的升级——3.0正式发布！现在做一个游戏，只需要给扣子看一眼就行。例如我们给扣子发了个视频，然后只说了一句：看一眼这个游戏，做一个类似《我的世界》的游戏项目…

评测组小编
2026年6月3日
评测

百度最强视觉识别模型来了！仅0.9B，文档解析能力超越Gemini、GPT

近日，百度正式发布文心衍生视觉识别模型PaddleOCR-VL-1.6。在权威文档解析能力评测集OmniDocBench v1.6上，PaddleOCR-VL-1.6总指标达到9…

资讯组小编
2026年6月2日
评测

MiniMax M3一手实测：老黄PPT上74个Logo，我以为能难住它

MiniMax M3突然上线后，Token Plan的新计费方式也引起了热议。众说纷纭之下，MiniMax官方也火速回应，提高了周用量限额，并对以前没有周限额的老用户保持了这个设…

评测组小编
2026年6月2日
评测

MiniMax 低调发布 M3 和 MiniMax Code，我们测完后有几点感受

前沿的 Coding 能力、1M 的上下文窗口，还有原生的多模态就在今天，MiniMax 发布了新一代模型 M3。这次最值得看的地方，是 M3 终于在同一个模型里凑齐了三种能力…

评测组小编
2026年6月2日
评测

MiniMax M3 测评

短的结论：筑起高台摘星辰基本情况：在 4 月初，智谱发布的 GLM-5.1 彻底拉开了与 MiniMax M2.7 的差距，问鼎国产模型 Coding 王座至今。而彼时稀宇的下…

评测组小编
2026年6月2日
评测

400 tokens/秒！阶跃Step 3.7 Flash，把Agent任务成本打到Claude零头

400TPS极速狂飙，开启生产级高效率Flash模型范式，直接一刀打穿Agent底价，把全球开发者惊艳到了。世界上最遥远的距离，不是AI看不懂你的需求，而是你的经费，根本撑不到A…

评测组小编
2026年6月1日
评测

MiniMax M3来了！12小时无人干预炼出4个模型，还把CUDA内核加速到9.4倍

今天，MiniMax正式发布了其新一代旗舰大模型MiniMax M3，在多个衡量编程与Agent能力的基准测试中达到前沿水平。在真实软件工程能力基准测试SWE-Bench Pro上…

评测组小编
2026年6月1日
评测

说实话，我觉得Claude 4.8有点拉

就在今天凌晨，Anthropic 掏出来了他们最新的 Claude Opus 4.8。距离 Opus 4.7 才过去一个多月，不得不说，Claude 上新的速度是越来越快了。本…

评测组小编
2026年5月30日
评测

发现了个宝藏 AI 算力平台TokenLX ，内置 190+ 模型！

最近和几个做 AI 出海的朋友聊天，大家已经很少去聊哪个模型又刷了榜。谈论最多的，是哪个模型调度平台好用、实惠、安全。这话题我是一点都不意外。毕竟前不久全球大佬都在扎堆往 AI …

评测组小编
2026年5月30日

3 / 13
1
2
3
4
5
6

Meta推出299美元智能眼镜新系列
16分钟前
分享到:

Meta 6月23日宣布，公司与依视路陆逊梯卡合作推出全新的“Meta Glasses”系列。该系列采用全新设计，包含三种镜框款式，起售价为299美元，较公司第二代入门款Meta Ray-Ban智能眼镜至少便宜80美元。
英伟达发布BioNeMo Agent工具包
16分钟前
分享到:

当地时间6月23日，英伟达宣布推出NVIDIA BioNeMo Agent Toolkit，该工具包包含英伟达超过十年的生命科学库、工具和开放模型，使AI智能体、科学家和实验室能够通过收集证据、跨研究结果进行推理、运行计算实验以及推荐下一步最佳行动来协同工作，从而加速科学发现。
特朗普政府施压Meta，要求其提交AI模型接受安全审查
17分钟前
分享到:

据多位知情人士称，特朗普政府正施压Meta，要求其自愿提交人工智能模型接受审查，以便政府评估这些模型的性能与漏洞。消息人士称，这一要求是在特朗普政府给这家社交媒体巨头的电子邮件中提出的。Meta于今年4月推出了Muse Spark人工智能模型，但它是美国唯一一家尚未与联邦政府达成协议，自愿共享其模型以供审查的主要人工智能技术开发商。
防止OpenAI式出走：谷歌重金拉拢前员工AI创业，抢夺早期算力大客户
7小时前
分享到:

谷歌宣布支持一项面向前员工（xoogler）的AI创业公司的孵化器计划，以深化与校友网络的合作并争夺早期云服务及芯片客户。首期项目由Google AI Futures Fund支持，计划招募10至20家初创公司，提供为期12周的孵化支持。入选初创公司将获得最高10万美元资金，以及价值35万美元的Google Cloud与AI信用额度。除资金和算力支持外，前谷歌高管团队将为创业者提供导师指导，包括前雅虎CEO玛丽莎·梅耶尔。新孵化器的合作方包括前员工克里斯·方创立的校友社区平台Xoogler.co，以及前员工库沙格拉·什里瓦斯塔瓦参与发起的创投项目Key Studio。目前Xoogler.co的全球成员已超过3.5万名，包含2500名认证投资者。谷歌正极力说服更多初创公司使用其自研的算力芯片和云服务，试图在早期阶段建立技术绑定，培育未来的大客户。
研究提出AI或助推妄想的“放大螺旋”机制
7小时前
分享到:

2026年6月23日，伦敦国王学院与德国新教应用科学大学精神科医生在《自然》发表论文，提出解释AI如何加剧妄想的“放大螺旋”理论。研究指出，聊天机器人通过语言对齐、超个性化生成和迎合倾向三特征叠加，可能主动强化用户错误信念，而非被动回应。该机制易在长期高强度使用中触发，导致脱离现实、睡眠剥夺及进食紊乱等身心影响。研究人员呼吁临床筛查中纳入AI使用史，尤其针对首次出现精神病性症状者。该框架目前仍属待验证假设。
FFmpeg曝高危漏洞CVE-2026-8461，可静默远程执行代码
7小时前
分享到:

2026年6月23日，开源多媒体框架FFmpeg被曝出严重安全漏洞CVE-2026-8461（CVSS评分8.8）。该漏洞源于MagicYUV解码器中的堆缓冲区越界写入，攻击者构造恶意视频文件，无需用户交互，即可在NAS、BT下载工具或视频软件自动生成预览时触发。Kodi、OBS Studio、Jellyfin等主流媒体软件受影响，Jellyfin已确认可远程执行代码。FFmpeg官方已发布修复版本8.1.2，建议用户立即升级或禁用MagicYUV解码器。
OpenAI机密IPO文件曝光，未来承诺高达6650亿美元
13小时前
分享到:

据The Information报道，OpenAI的机密IPO注册申请草案显示，截至2026年3月31日，OpenAI账面零债务，租约负债不足7.5亿美元，单季资本支出仅4600万美元，但未来芯片、能源与数据中心采购承诺高达6650亿美元。OpenAI第一季度净亏损约85亿美元，营收成本中72%支付给关联方，并以4.88亿美元股权结算算力账单。OpenAI合并报表的数据中心合资项目中，50亿美元亏损归属于外部合伙人。Anthropic承诺向Fluidstack支付45亿美元，并由博通为Anthropic向谷歌租赁的350亿美元芯片订单提供担保。
OpenCLI App发布：推出免npm独立包，支持自动保持浏览器登录态
13小时前
分享到:

OpenCLI近日上线了OpenCLI App桌面版应用，推出无需依赖node.js或npm环境的独立安装包，降低了普通用户的使用门槛，并集成了自动刷新登录态等便捷功能。OpenCLI是一款将网页转化为命令行界面（CLI）并允许AI智能体调用浏览器进行自动化的工具，支持在终端中用命令行直接浏览bilibili、知乎和Hackernews，同时支持面向Claude Code、Cursor等AI编程助手提供桥接，让智能体直接在用户已登录的Chrome浏览器里模拟点击、填写表单、提取网页数据或截屏。新发布的OpenCLI App桌面端整合了完整运行环境，并支持在系统托盘管理，用户无需命令行基础即可通过图形界面完成配置修改、运行诊断和版本更新，还能自动维持网页登录凭证长期有效。
QQ邮箱开启专为AI智能体打造的Agently Mail内测
13小时前
分享到:

QQ邮箱正式开启专为AI智能体（agent）设计的专属邮箱「Agently Mail」内测。新邮箱与用户个人或企业邮箱的数据完全隔离，允许AI使用独立身份进行邮件收发、搜索和附件处理，避免AI因误删、错发或过度读取对用户个人隐私造成安全威胁。此外，Agently Mail还可作为智能体的数字身份证，支持自主注册第三方平台、接收验证码，或在企业间自动完成询价、报价与订单对接等全流程自动化协作。目前，Agently Mail已支持多个主流智能体平台。
谷歌注资A24影业7500万美元，联手DeepMind开发非提示型AI影视工具
13小时前
分享到:

谷歌将向出品过《后室》等影片的独立制片公司A24投资约7500万美元。这是谷歌首次直接持有电影制片厂股份。双方签署了多年期、非排他性合作协议，谷歌不会获得A24旗下电影和电视库等数据的访问权限。谷歌DeepMind部门与A24的合作旨在为电影制作与发行流程开发新工具。A24负责技术与创新的合伙人Scott Belsky表示，目前的AI开发者过于强调通过技术降低电影制作成本和缩短周期，这并不吸引电影人。他认为应当利用AI保留创意控制权并支持创作冒险，双方联合开发的工具不会采用当前令许多创作者反感的提示词生成模式。为了推进向全球化媒体公司扩张的战略，A24正在制作旗下史上预算最高的电影项目，即由Alex Garland执导的《艾尔登法环》（Elden Ring）游戏改编电影，制作预算高达1.75亿美元。

【腾讯云】 4核4G服务器新客 38元/年起，支持 OpenClaw/Hermes 等热门镜像；Token Plan 低至28元/月，多种主流模型极速调用