评测

评测

一分钟的奇迹与幻觉：实测世界模型Happy Oyster

“具备初步的世界状态跟踪能力，但不适合强约束、高可预测性的系统任务。” 作者丨冯逸飞编辑丨冯逸飞梁丙鉴 4 月 16 日，阿里发布了主打实时构建和交互的开放式世界模型产品 Ha…

评测组小编
2026年4月25日
评测

连夜测了一波DeepSeek-V4，我发现它可能只剩“审美”这个短板了

DeepSeek-V4六维实测大模型的圈子最近真的是大戏连连，Claude和OpenAI你方唱罢我登场，两位CEO更是化身戏精，在社交媒体上大打舆论战。不过，今天所有的风头都被…

评测组小编
2026年4月25日
评测

DeepSeek-V4和GPT-5.5第一波实测对决，结果出人意料

编辑：Aeneas KingHZ 昨夜，GPT-5.5果然按期发布了，全网没有白等。更炸裂的是，就在同一天，DeepSeek-V4紧随其后发布了！实测后，结果出人意料。 2026年…

评测组小编
2026年4月25日
评测

是夯爆了还是拉完了？Deepseek V4第一波测评来了（附排行榜）

DeepSeek V4 预览版开源上线后，第一波来自第三方榜单的测评结果已经出炉。多家测评显示，DeepSeek V4性能尤其在代码任务上冲进开源第一梯队，同时以“百万级上下文+…

评测组小编
2026年4月25日
评测

实测在DeepSeek-V4上烧1000万token，我发现了3个惊喜和1个意外

今天，DeepSeek-V4开源并火速冲上Hugging Face模型榜首，号称推理和智能体编程性能冲到开源模型第一、比肩先进闭源模型。为了验证两款模型的真实效果，我们进行了多维度…

评测组小编
2026年4月24日
评测

实测DeepSeekV4：天下武功，唯快不破

V4不是模型新物种，但要撑起200亿美金估值的雄心 “跳票”许久的DeepSeek-V4，终于来了。几个小时前，DeepSeek-V4预览版上线并开源。巧的是，几乎同一天，Ope…

评测组小编
2026年4月24日
评测

DeepSeek V4 编程测评

短的结论：漫长等待的超值回报基本情况： DeepSeek 确实是最早备战编程的厂家之一了，早在V2 时代就发过单独的V2 Coder 模型，直到V2.5 才合入主线。此后Deep…

评测组小编
2026年4月24日
评测

实测Qwen3.6-27B：4分钟做了个跑酷游戏，验证码识别正确率超90%

Qwen3.6系列全员集结完毕。智东西4月23日报道，昨晚，阿里通义千问团队宣布开源Qwen3.6-27B——一款270亿参数的稠密多模态模型，支持思考与非思考模式。与阿里上一…

评测组小编
2026年4月24日
评测

实测ChatGPT最新生图模型三大发现

AI第一次从包工头，变成了建筑设计师。以前我们混互联网论坛时，常说「无图无真相」，意思是你说的话我不信，有本事就把图或照片发上来。之所以会这样，原因很简单，当时Photosho…

评测组小编
2026年4月24日
评测

实测GPT5.5 : 最强模型不是嘴炮，它真能干活儿

GPT-5.5，终于发布。作为OpenAI当下最强的模型，这次更新的亮点是“为真实工作而设计”。和过去的模型相比，GPT-5.5能更快理解使用者真正想做的事情，也能自己承担更多…

评测组小编
2026年4月24日
评测

GLM-5.1、Qwen 3.6 Max preview 与 Kimi 2.6 国产大模型横向对决

2026 年上半年，国产大模型赛道正式告别了纯粹的参数竞赛，进入了工程落地与商业性价比的贴身肉搏阶段。智谱 AI、通义千问与月之暗面推出的三款最新旗舰，分别在自主编程、通用智能以…

评测组小编
2026年4月23日
评测

实测混元Hy3 preview：混元再出发，中型模型的务实之战

编者按：本文为 Hy3 preview 评测，评测环境为 WorkBuddy，评测内容基于真实任务执行结果。本次共测试三个场景：事实审计员、文档可视化、深度研究。 Hy3 prev…

评测组小编
2026年4月23日

11 / 13
8
9
10
11
12
13

豆包推出专业版订阅服务，最高一年6000元
1小时前
分享到:

豆包今日正式推出专业版订阅服务，基于字节跳动豆包2.1系列智能体模型打造，上线办公任务模式，可自主拆解工作任务、调用本地工具与Office套件，升级为生产力工具。

产品采用三级阶梯定价：标准/加强/高级套餐连续包月分别为68元、200元、500元，功能额度逐级提升。同时将推出大学生专属特惠，认证后标准套餐低至38元/月。官方称原有免费服务与功能保持不变。
Meta推出299美元智能眼镜新系列
3小时前
分享到:

Meta 6月23日宣布，公司与依视路陆逊梯卡合作推出全新的“Meta Glasses”系列。该系列采用全新设计，包含三种镜框款式，起售价为299美元，较公司第二代入门款Meta Ray-Ban智能眼镜至少便宜80美元。
英伟达发布BioNeMo Agent工具包
3小时前
分享到:

当地时间6月23日，英伟达宣布推出NVIDIA BioNeMo Agent Toolkit，该工具包包含英伟达超过十年的生命科学库、工具和开放模型，使AI智能体、科学家和实验室能够通过收集证据、跨研究结果进行推理、运行计算实验以及推荐下一步最佳行动来协同工作，从而加速科学发现。
特朗普政府施压Meta，要求其提交AI模型接受安全审查
3小时前
分享到:

据多位知情人士称，特朗普政府正施压Meta，要求其自愿提交人工智能模型接受审查，以便政府评估这些模型的性能与漏洞。消息人士称，这一要求是在特朗普政府给这家社交媒体巨头的电子邮件中提出的。Meta于今年4月推出了Muse Spark人工智能模型，但它是美国唯一一家尚未与联邦政府达成协议，自愿共享其模型以供审查的主要人工智能技术开发商。
防止OpenAI式出走：谷歌重金拉拢前员工AI创业，抢夺早期算力大客户
10小时前
分享到:

谷歌宣布支持一项面向前员工（xoogler）的AI创业公司的孵化器计划，以深化与校友网络的合作并争夺早期云服务及芯片客户。首期项目由Google AI Futures Fund支持，计划招募10至20家初创公司，提供为期12周的孵化支持。入选初创公司将获得最高10万美元资金，以及价值35万美元的Google Cloud与AI信用额度。除资金和算力支持外，前谷歌高管团队将为创业者提供导师指导，包括前雅虎CEO玛丽莎·梅耶尔。新孵化器的合作方包括前员工克里斯·方创立的校友社区平台Xoogler.co，以及前员工库沙格拉·什里瓦斯塔瓦参与发起的创投项目Key Studio。目前Xoogler.co的全球成员已超过3.5万名，包含2500名认证投资者。谷歌正极力说服更多初创公司使用其自研的算力芯片和云服务，试图在早期阶段建立技术绑定，培育未来的大客户。
研究提出AI或助推妄想的“放大螺旋”机制
10小时前
分享到:

2026年6月23日，伦敦国王学院与德国新教应用科学大学精神科医生在《自然》发表论文，提出解释AI如何加剧妄想的“放大螺旋”理论。研究指出，聊天机器人通过语言对齐、超个性化生成和迎合倾向三特征叠加，可能主动强化用户错误信念，而非被动回应。该机制易在长期高强度使用中触发，导致脱离现实、睡眠剥夺及进食紊乱等身心影响。研究人员呼吁临床筛查中纳入AI使用史，尤其针对首次出现精神病性症状者。该框架目前仍属待验证假设。
FFmpeg曝高危漏洞CVE-2026-8461，可静默远程执行代码
10小时前
分享到:

2026年6月23日，开源多媒体框架FFmpeg被曝出严重安全漏洞CVE-2026-8461（CVSS评分8.8）。该漏洞源于MagicYUV解码器中的堆缓冲区越界写入，攻击者构造恶意视频文件，无需用户交互，即可在NAS、BT下载工具或视频软件自动生成预览时触发。Kodi、OBS Studio、Jellyfin等主流媒体软件受影响，Jellyfin已确认可远程执行代码。FFmpeg官方已发布修复版本8.1.2，建议用户立即升级或禁用MagicYUV解码器。
OpenAI机密IPO文件曝光，未来承诺高达6650亿美元
15小时前
分享到:

据The Information报道，OpenAI的机密IPO注册申请草案显示，截至2026年3月31日，OpenAI账面零债务，租约负债不足7.5亿美元，单季资本支出仅4600万美元，但未来芯片、能源与数据中心采购承诺高达6650亿美元。OpenAI第一季度净亏损约85亿美元，营收成本中72%支付给关联方，并以4.88亿美元股权结算算力账单。OpenAI合并报表的数据中心合资项目中，50亿美元亏损归属于外部合伙人。Anthropic承诺向Fluidstack支付45亿美元，并由博通为Anthropic向谷歌租赁的350亿美元芯片订单提供担保。
OpenCLI App发布：推出免npm独立包，支持自动保持浏览器登录态
15小时前
分享到:

OpenCLI近日上线了OpenCLI App桌面版应用，推出无需依赖node.js或npm环境的独立安装包，降低了普通用户的使用门槛，并集成了自动刷新登录态等便捷功能。OpenCLI是一款将网页转化为命令行界面（CLI）并允许AI智能体调用浏览器进行自动化的工具，支持在终端中用命令行直接浏览bilibili、知乎和Hackernews，同时支持面向Claude Code、Cursor等AI编程助手提供桥接，让智能体直接在用户已登录的Chrome浏览器里模拟点击、填写表单、提取网页数据或截屏。新发布的OpenCLI App桌面端整合了完整运行环境，并支持在系统托盘管理，用户无需命令行基础即可通过图形界面完成配置修改、运行诊断和版本更新，还能自动维持网页登录凭证长期有效。
QQ邮箱开启专为AI智能体打造的Agently Mail内测
15小时前
分享到:

QQ邮箱正式开启专为AI智能体（agent）设计的专属邮箱「Agently Mail」内测。新邮箱与用户个人或企业邮箱的数据完全隔离，允许AI使用独立身份进行邮件收发、搜索和附件处理，避免AI因误删、错发或过度读取对用户个人隐私造成安全威胁。此外，Agently Mail还可作为智能体的数字身份证，支持自主注册第三方平台、接收验证码，或在企业间自动完成询价、报价与订单对接等全流程自动化协作。目前，Agently Mail已支持多个主流智能体平台。

【腾讯云】 4核4G服务器新客 38元/年起，支持 OpenClaw/Hermes 等热门镜像；Token Plan 低至28元/月，多种主流模型极速调用