评测

评测

「生物信息学」评测，Claude 反超人类专家

RESEARCH 今天 Anthropic 放出了一项评估数据，对于新的生物信息学评测集 BioMysteryBench：人类能搞定的，Claude 也能搞定；在人类搞不定的，M…

评测组小编
2026年4月30日
评测

谷歌Gemini开启王炸模式：一句话直接生成PDF、Word、Excel，30多种不同格式文件，实用效率神器，改变游戏规则！

今天凌晨，谷歌 Gemini 突然放大招，它在 X 上宣布：现在 Gemini 可以直接生成PDF、Word、Excel 或 Google Workspace 等文件，无需上传模板…

评测组小编
2026年4月30日
评测

DeepSeek识图模式是个新模型？一手实测在此

今天，你被DeepSeek识图模式灰度到了吗？大家对DeepSeek的多模态属实期待了太久太久，如今惊喜紧随V4的发布而来，没等DeepSeek官方释出更多信息，民间已经从各个方…

评测组小编
2026年4月30日
评测

DeepSeek「开眼」引爆AI圈：我用12张刁钻图片，试出了它的能力边界

DeepSeek补齐了最后一块拼图！在DeepSeek一记V4重拳彻底引爆科技圈的五天后，DeepSeek内部负责多模态的研究员陈小康在X上发布了这么一条帖子，并且附上了文字： …

评测组小编
2026年4月29日
评测

我在腾讯 ima 里养了一只二狗

腾讯ima上线了一个新能力，叫copilot。等等，ima全称本来就叫「ima.copilot」啊；对，但你回忆一下，上一次用的时候，注意到后面那个词了吗？大部分人只记住了im…

评测组小编
2026年4月29日
评测

DeepSeek终于能看图了！我第一时间用它算命

刚刚，DeepSeek的多模态能力已经开启灰度测试。现在，被选中的用户会发现，DeepSeek首页多了一个“识图模式”的入口。上传图片后，DeepSeek能像人一样理解画面，不管是…

评测组小编
2026年4月29日
评测

体验完4月最强的三个模型：跑分涨了，却不说人话了

四月真是如风驰电掣：Anthropic 发布了 Opus 4.7，OpenAI 发布了 GPT 5.5，最后，DeepSeek 更新了暌违已久的 V4。三家公司的发布通稿读起来都…

评测组小编
2026年4月28日
评测

阿里HappyHorse突然上线！实测让马斯克和奥尔特曼法庭开撕，还手搓了GTA6

今天，阿里ATH创新事业部的最新视频生成与编辑模型HappyHorse 1.0（官方译名：快乐小马）开启灰度测试。创作者可在阿里云百炼平台和HappyHorse官网注册使用，大众用…

评测组小编
2026年4月27日
评测

实测Claude Design与GPT Image 2.0：设计师的饭碗危险了

AI圈还是太卷了。不到一周时间，两家头部公司先后把新产品对准了设计行业。 4月17日，Anthropic推出Claude Design；4月21日，OpenAI上线GPT Imag…

评测组小编
2026年4月27日
评测

2026年4月主流AI编程模型横评与费用对比

2026年4月，AI大模型战场密集发布前所未有。OpenAI发布GPT-5.5，DeepSeek推出V4 Pro/Flash双版本，Anthropic更新Claude Opus 4…

评测组小编
2026年4月27日
评测

OpenAI GPT-5.5 测评

短的结论：彼可取而代之基本情况：去年10月以来，中美的大模型研发都明显加速了，基本都从原先平均4个月左右的迭代周期，进化到2个月左右，而OpenAI 这一次则进一步的，发布周期…

评测组小编
2026年4月27日
评测

DeepSeek V4 逻辑测评

短的结论：一道清澈而纯粹的光基本情况：作为国产大模型的顶流，DeepSeek V4 在发布后立刻引发了全民关注。面向生产力的编程Coding 场景评估已在先前单独发文，本篇主要…

评测组小编
2026年4月25日

10 / 13
8
9
10
11
12
13

豆包推出专业版订阅服务，最高一年6000元
1小时前
分享到:

豆包今日正式推出专业版订阅服务，基于字节跳动豆包2.1系列智能体模型打造，上线办公任务模式，可自主拆解工作任务、调用本地工具与Office套件，升级为生产力工具。

产品采用三级阶梯定价：标准/加强/高级套餐连续包月分别为68元、200元、500元，功能额度逐级提升。同时将推出大学生专属特惠，认证后标准套餐低至38元/月。官方称原有免费服务与功能保持不变。
Meta推出299美元智能眼镜新系列
2小时前
分享到:

Meta 6月23日宣布，公司与依视路陆逊梯卡合作推出全新的“Meta Glasses”系列。该系列采用全新设计，包含三种镜框款式，起售价为299美元，较公司第二代入门款Meta Ray-Ban智能眼镜至少便宜80美元。
英伟达发布BioNeMo Agent工具包
2小时前
分享到:

当地时间6月23日，英伟达宣布推出NVIDIA BioNeMo Agent Toolkit，该工具包包含英伟达超过十年的生命科学库、工具和开放模型，使AI智能体、科学家和实验室能够通过收集证据、跨研究结果进行推理、运行计算实验以及推荐下一步最佳行动来协同工作，从而加速科学发现。
特朗普政府施压Meta，要求其提交AI模型接受安全审查
2小时前
分享到:

据多位知情人士称，特朗普政府正施压Meta，要求其自愿提交人工智能模型接受审查，以便政府评估这些模型的性能与漏洞。消息人士称，这一要求是在特朗普政府给这家社交媒体巨头的电子邮件中提出的。Meta于今年4月推出了Muse Spark人工智能模型，但它是美国唯一一家尚未与联邦政府达成协议，自愿共享其模型以供审查的主要人工智能技术开发商。
防止OpenAI式出走：谷歌重金拉拢前员工AI创业，抢夺早期算力大客户
10小时前
分享到:

谷歌宣布支持一项面向前员工（xoogler）的AI创业公司的孵化器计划，以深化与校友网络的合作并争夺早期云服务及芯片客户。首期项目由Google AI Futures Fund支持，计划招募10至20家初创公司，提供为期12周的孵化支持。入选初创公司将获得最高10万美元资金，以及价值35万美元的Google Cloud与AI信用额度。除资金和算力支持外，前谷歌高管团队将为创业者提供导师指导，包括前雅虎CEO玛丽莎·梅耶尔。新孵化器的合作方包括前员工克里斯·方创立的校友社区平台Xoogler.co，以及前员工库沙格拉·什里瓦斯塔瓦参与发起的创投项目Key Studio。目前Xoogler.co的全球成员已超过3.5万名，包含2500名认证投资者。谷歌正极力说服更多初创公司使用其自研的算力芯片和云服务，试图在早期阶段建立技术绑定，培育未来的大客户。
研究提出AI或助推妄想的“放大螺旋”机制
10小时前
分享到:

2026年6月23日，伦敦国王学院与德国新教应用科学大学精神科医生在《自然》发表论文，提出解释AI如何加剧妄想的“放大螺旋”理论。研究指出，聊天机器人通过语言对齐、超个性化生成和迎合倾向三特征叠加，可能主动强化用户错误信念，而非被动回应。该机制易在长期高强度使用中触发，导致脱离现实、睡眠剥夺及进食紊乱等身心影响。研究人员呼吁临床筛查中纳入AI使用史，尤其针对首次出现精神病性症状者。该框架目前仍属待验证假设。
FFmpeg曝高危漏洞CVE-2026-8461，可静默远程执行代码
10小时前
分享到:

2026年6月23日，开源多媒体框架FFmpeg被曝出严重安全漏洞CVE-2026-8461（CVSS评分8.8）。该漏洞源于MagicYUV解码器中的堆缓冲区越界写入，攻击者构造恶意视频文件，无需用户交互，即可在NAS、BT下载工具或视频软件自动生成预览时触发。Kodi、OBS Studio、Jellyfin等主流媒体软件受影响，Jellyfin已确认可远程执行代码。FFmpeg官方已发布修复版本8.1.2，建议用户立即升级或禁用MagicYUV解码器。
OpenAI机密IPO文件曝光，未来承诺高达6650亿美元
15小时前
分享到:

据The Information报道，OpenAI的机密IPO注册申请草案显示，截至2026年3月31日，OpenAI账面零债务，租约负债不足7.5亿美元，单季资本支出仅4600万美元，但未来芯片、能源与数据中心采购承诺高达6650亿美元。OpenAI第一季度净亏损约85亿美元，营收成本中72%支付给关联方，并以4.88亿美元股权结算算力账单。OpenAI合并报表的数据中心合资项目中，50亿美元亏损归属于外部合伙人。Anthropic承诺向Fluidstack支付45亿美元，并由博通为Anthropic向谷歌租赁的350亿美元芯片订单提供担保。
OpenCLI App发布：推出免npm独立包，支持自动保持浏览器登录态
15小时前
分享到:

OpenCLI近日上线了OpenCLI App桌面版应用，推出无需依赖node.js或npm环境的独立安装包，降低了普通用户的使用门槛，并集成了自动刷新登录态等便捷功能。OpenCLI是一款将网页转化为命令行界面（CLI）并允许AI智能体调用浏览器进行自动化的工具，支持在终端中用命令行直接浏览bilibili、知乎和Hackernews，同时支持面向Claude Code、Cursor等AI编程助手提供桥接，让智能体直接在用户已登录的Chrome浏览器里模拟点击、填写表单、提取网页数据或截屏。新发布的OpenCLI App桌面端整合了完整运行环境，并支持在系统托盘管理，用户无需命令行基础即可通过图形界面完成配置修改、运行诊断和版本更新，还能自动维持网页登录凭证长期有效。
QQ邮箱开启专为AI智能体打造的Agently Mail内测
15小时前
分享到:

QQ邮箱正式开启专为AI智能体（agent）设计的专属邮箱「Agently Mail」内测。新邮箱与用户个人或企业邮箱的数据完全隔离，允许AI使用独立身份进行邮件收发、搜索和附件处理，避免AI因误删、错发或过度读取对用户个人隐私造成安全威胁。此外，Agently Mail还可作为智能体的数字身份证，支持自主注册第三方平台、接收验证码，或在企业间自动完成询价、报价与订单对接等全流程自动化协作。目前，Agently Mail已支持多个主流智能体平台。

【腾讯云】 4核4G服务器新客 38元/年起，支持 OpenClaw/Hermes 等热门镜像；Token Plan 低至28元/月，多种主流模型极速调用