评测

评测

Opus 4.8编程能力不如GPT-5.5

哈喽，大家好，我是刘小排。从凌晨Opus 4.8发布到现在，我一直在真实任务中使用，今天已经累计消耗了超过618美金，8.4亿Token。我的结论： Opus 4.8编程能力仍…

资讯组小编
2026年5月30日
评测

Claude Opus 4.8 测评

短的结论：冷静与炙热共存的 Token 熔炉基本情况：大模型团队都在加速狂奔，离 Opus 4.7 发布也不过一个半月，Opus 4.8 就如期而至。按官方的说法，Opus 4.…

评测组小编
2026年5月29日
评测

实测 Claude Opus 4.8：活干得更漂亮了，话说得更难听了

今早，，在发布新估值的同时，还发布了前两天就开始有传闻流出的 Claude Opus 4.8，旗舰产品线的最新版本。我们第一时间上手，同时收集了用户社区的早期反馈。先说结论：更能…

评测组小编
2026年5月29日
评测

Claude Opus 4.8实测封神！强到离谱，也贵到肉痛

新智元报道【新智元导读】传说中的Claude Opus 4.8，性能真的如此强大吗？有人高呼封神，直言这是Opus 5，有人吐槽太拉了，还不如Opus 4.7，技术大佬也来拆台。…

评测组小编
2026年5月29日
评测

一句话搞定整套视觉方案，腾讯创意智能体Miora开测

刚刚，腾讯在香港Cloud Day上宣布，全场景创意智能体工作室妙境Tencent Design Miora（简称Miora）国际版开启邀测，图片、视频、UI/UX以及3D等多种模…

评测组小编
2026年5月28日
评测

开源个 Skill｜彻底解决小红、小绿书配图难题

前段时间开源了 guizang-ppt-skill，之后我自己用它做内容的时候发现一件事。用它出的网页，单张截下来发到图文平台，反响和数据比我手工排版还很多。我相信你之前也找到…

资讯组小编
2026年5月28日
评测

马维斯（Marvis）实测：他给了我一些可以独处的时间

一个自媒体人的48小时深度体验最近这两天，微信朋友圈被一个名叫「马维斯」（Marvis）的AI助手刷屏了。这是腾讯应用宝团队推出的新产品，官方给它的定位很激进——「操作系统层级…

评测组小编
2026年5月28日
评测

国产AI编程冲上全球第二，实测五大模型，谁才是Vibe Coding神器

超越 GPT-5.5、Gemini 3.5 Flash、DeepSeek V4 Pro，阿里的最新旗舰模型 Qwen3.7 Max 在编程竞技榜拿下第二名，仅次于 Claude O…

评测组小编
2026年5月28日
评测

腾讯云Token Plan怎么样？28元3500万Token，国产大模型API套餐实测

一、为什么写这篇最近很多人在问：大模型API怎么买最划算？直接调用API，按量计费，单价高、用量波动大，月账单经常超预算。腾讯云出了一个Token Plan套餐包——相当于批…

评测组小编
2026年5月27日
评测

我用AI做了个修仙小游戏：4分钟生成，30秒玩腻，飞剑只砍自己人…

能用，但不好玩。自从 vibe Coding 成了 AI 圈热词之后，用 AI 写程序、做网页已经不是稀奇事了，甚至开发游戏，AI 也能干。不过，相比起做图片或是程序，游戏天然更…

评测组小编
2026年5月27日
评测

Python逆天改命！开源Hermes首次击败OpenAI Codex

一个纯Python写的开源项目，竟把OpenAI用Rust写的王牌给秒了！最终战绩6比5，Hermes直接上演工程暴力美学，解释型语言终于逆天改命。一个纯Python写的开源项目…

资讯组小编
2026年5月27日
评测

AI医生测评：蚂蚁阿福、字节小荷、京东小康、讯飞晓医、安诊儿、好伴AI、百小医、未来医生、DeepSeek、豆包、千问、Kimi、Gemini、Claude

山甲实验室已经连续做了3个月的AI医疗测评，这次是我们正式纳入患者端2C测评视角的开始。我们的测题是一位63岁患者，胸闷近一个月，不是疼，有反酸、气短、乏力；一个月前外院提示冠心…

评测组小编
2026年5月26日

4 / 13
1
2
3
4
5
6

Meta推出299美元智能眼镜新系列
15分钟前
分享到:

Meta 6月23日宣布，公司与依视路陆逊梯卡合作推出全新的“Meta Glasses”系列。该系列采用全新设计，包含三种镜框款式，起售价为299美元，较公司第二代入门款Meta Ray-Ban智能眼镜至少便宜80美元。
英伟达发布BioNeMo Agent工具包
16分钟前
分享到:

当地时间6月23日，英伟达宣布推出NVIDIA BioNeMo Agent Toolkit，该工具包包含英伟达超过十年的生命科学库、工具和开放模型，使AI智能体、科学家和实验室能够通过收集证据、跨研究结果进行推理、运行计算实验以及推荐下一步最佳行动来协同工作，从而加速科学发现。
特朗普政府施压Meta，要求其提交AI模型接受安全审查
17分钟前
分享到:

据多位知情人士称，特朗普政府正施压Meta，要求其自愿提交人工智能模型接受审查，以便政府评估这些模型的性能与漏洞。消息人士称，这一要求是在特朗普政府给这家社交媒体巨头的电子邮件中提出的。Meta于今年4月推出了Muse Spark人工智能模型，但它是美国唯一一家尚未与联邦政府达成协议，自愿共享其模型以供审查的主要人工智能技术开发商。
防止OpenAI式出走：谷歌重金拉拢前员工AI创业，抢夺早期算力大客户
7小时前
分享到:

谷歌宣布支持一项面向前员工（xoogler）的AI创业公司的孵化器计划，以深化与校友网络的合作并争夺早期云服务及芯片客户。首期项目由Google AI Futures Fund支持，计划招募10至20家初创公司，提供为期12周的孵化支持。入选初创公司将获得最高10万美元资金，以及价值35万美元的Google Cloud与AI信用额度。除资金和算力支持外，前谷歌高管团队将为创业者提供导师指导，包括前雅虎CEO玛丽莎·梅耶尔。新孵化器的合作方包括前员工克里斯·方创立的校友社区平台Xoogler.co，以及前员工库沙格拉·什里瓦斯塔瓦参与发起的创投项目Key Studio。目前Xoogler.co的全球成员已超过3.5万名，包含2500名认证投资者。谷歌正极力说服更多初创公司使用其自研的算力芯片和云服务，试图在早期阶段建立技术绑定，培育未来的大客户。
研究提出AI或助推妄想的“放大螺旋”机制
7小时前
分享到:

2026年6月23日，伦敦国王学院与德国新教应用科学大学精神科医生在《自然》发表论文，提出解释AI如何加剧妄想的“放大螺旋”理论。研究指出，聊天机器人通过语言对齐、超个性化生成和迎合倾向三特征叠加，可能主动强化用户错误信念，而非被动回应。该机制易在长期高强度使用中触发，导致脱离现实、睡眠剥夺及进食紊乱等身心影响。研究人员呼吁临床筛查中纳入AI使用史，尤其针对首次出现精神病性症状者。该框架目前仍属待验证假设。
FFmpeg曝高危漏洞CVE-2026-8461，可静默远程执行代码
7小时前
分享到:

2026年6月23日，开源多媒体框架FFmpeg被曝出严重安全漏洞CVE-2026-8461（CVSS评分8.8）。该漏洞源于MagicYUV解码器中的堆缓冲区越界写入，攻击者构造恶意视频文件，无需用户交互，即可在NAS、BT下载工具或视频软件自动生成预览时触发。Kodi、OBS Studio、Jellyfin等主流媒体软件受影响，Jellyfin已确认可远程执行代码。FFmpeg官方已发布修复版本8.1.2，建议用户立即升级或禁用MagicYUV解码器。
OpenAI机密IPO文件曝光，未来承诺高达6650亿美元
13小时前
分享到:

据The Information报道，OpenAI的机密IPO注册申请草案显示，截至2026年3月31日，OpenAI账面零债务，租约负债不足7.5亿美元，单季资本支出仅4600万美元，但未来芯片、能源与数据中心采购承诺高达6650亿美元。OpenAI第一季度净亏损约85亿美元，营收成本中72%支付给关联方，并以4.88亿美元股权结算算力账单。OpenAI合并报表的数据中心合资项目中，50亿美元亏损归属于外部合伙人。Anthropic承诺向Fluidstack支付45亿美元，并由博通为Anthropic向谷歌租赁的350亿美元芯片订单提供担保。
OpenCLI App发布：推出免npm独立包，支持自动保持浏览器登录态
13小时前
分享到:

OpenCLI近日上线了OpenCLI App桌面版应用，推出无需依赖node.js或npm环境的独立安装包，降低了普通用户的使用门槛，并集成了自动刷新登录态等便捷功能。OpenCLI是一款将网页转化为命令行界面（CLI）并允许AI智能体调用浏览器进行自动化的工具，支持在终端中用命令行直接浏览bilibili、知乎和Hackernews，同时支持面向Claude Code、Cursor等AI编程助手提供桥接，让智能体直接在用户已登录的Chrome浏览器里模拟点击、填写表单、提取网页数据或截屏。新发布的OpenCLI App桌面端整合了完整运行环境，并支持在系统托盘管理，用户无需命令行基础即可通过图形界面完成配置修改、运行诊断和版本更新，还能自动维持网页登录凭证长期有效。
QQ邮箱开启专为AI智能体打造的Agently Mail内测
13小时前
分享到:

QQ邮箱正式开启专为AI智能体（agent）设计的专属邮箱「Agently Mail」内测。新邮箱与用户个人或企业邮箱的数据完全隔离，允许AI使用独立身份进行邮件收发、搜索和附件处理，避免AI因误删、错发或过度读取对用户个人隐私造成安全威胁。此外，Agently Mail还可作为智能体的数字身份证，支持自主注册第三方平台、接收验证码，或在企业间自动完成询价、报价与订单对接等全流程自动化协作。目前，Agently Mail已支持多个主流智能体平台。
谷歌注资A24影业7500万美元，联手DeepMind开发非提示型AI影视工具
13小时前
分享到:

谷歌将向出品过《后室》等影片的独立制片公司A24投资约7500万美元。这是谷歌首次直接持有电影制片厂股份。双方签署了多年期、非排他性合作协议，谷歌不会获得A24旗下电影和电视库等数据的访问权限。谷歌DeepMind部门与A24的合作旨在为电影制作与发行流程开发新工具。A24负责技术与创新的合伙人Scott Belsky表示，目前的AI开发者过于强调通过技术降低电影制作成本和缩短周期，这并不吸引电影人。他认为应当利用AI保留创意控制权并支持创作冒险，双方联合开发的工具不会采用当前令许多创作者反感的提示词生成模式。为了推进向全球化媒体公司扩张的战略，A24正在制作旗下史上预算最高的电影项目，即由Alex Garland执导的《艾尔登法环》（Elden Ring）游戏改编电影，制作预算高达1.75亿美元。

【腾讯云】 4核4G服务器新客 38元/年起，支持 OpenClaw/Hermes 等热门镜像；Token Plan 低至28元/月，多种主流模型极速调用