评测
-
「生物信息学」评测,Claude 反超人类专家
RESEARCH 今天 Anthropic 放出了一项评估数据,对于新的生物信息学评测集 BioMysteryBench: 人类能搞定的,Claude 也能搞定;在人类搞不定的,M…
-
谷歌Gemini开启王炸模式:一句话直接生成PDF、Word、Excel,30多种不同格式文件,实用效率神器,改变游戏规则!
今天凌晨,谷歌 Gemini 突然放大招,它在 X 上宣布:现在 Gemini 可以直接生成PDF、Word、Excel 或 Google Workspace 等文件,无需上传模板…
-
DeepSeek识图模式是个新模型?一手实测在此
今天,你被DeepSeek识图模式灰度到了吗? 大家对DeepSeek的多模态属实期待了太久太久,如今惊喜紧随V4的发布而来,没等DeepSeek官方释出更多信息,民间已经从各个方…
-
DeepSeek「开眼」引爆AI圈:我用12张刁钻图片,试出了它的能力边界
DeepSeek补齐了最后一块拼图! 在DeepSeek一记V4重拳彻底引爆科技圈的五天后,DeepSeek内部负责多模态的研究员陈小康在X上发布了这么一条帖子,并且附上了文字: …
-
我在腾讯 ima 里养了一只二狗
腾讯ima上线了一个新能力,叫copilot。 等等,ima全称本来就叫「ima.copilot」啊;对,但你回忆一下,上一次用的时候,注意到后面那个词了吗? 大部分人只记住了im…
-
DeepSeek终于能看图了!我第一时间用它算命
刚刚,DeepSeek的多模态能力已经开启灰度测试。现在,被选中的用户会发现,DeepSeek首页多了一个“识图模式”的入口。上传图片后,DeepSeek能像人一样理解画面,不管是…
-
体验完4月最强的三个模型:跑分涨了,却不说人话了
四月真是如风驰电掣:Anthropic 发布了 Opus 4.7,OpenAI 发布了 GPT 5.5,最后,DeepSeek 更新了暌违已久的 V4。 三家公司的发布通稿读起来都…
-
阿里HappyHorse突然上线!实测让马斯克和奥尔特曼法庭开撕,还手搓了GTA6
今天,阿里ATH创新事业部的最新视频生成与编辑模型HappyHorse 1.0(官方译名:快乐小马)开启灰度测试。创作者可在阿里云百炼平台和HappyHorse官网注册使用,大众用…
-
实测Claude Design与GPT Image 2.0:设计师的饭碗危险了
AI圈还是太卷了。不到一周时间,两家头部公司先后把新产品对准了设计行业。 4月17日,Anthropic推出Claude Design;4月21日,OpenAI上线GPT Imag…
-
2026年4月 主流AI编程模型横评与费用对比
2026年4月,AI大模型战场密集发布前所未有。OpenAI发布GPT-5.5,DeepSeek推出V4 Pro/Flash双版本,Anthropic更新Claude Opus 4…
-
OpenAI GPT-5.5 测评
短的结论:彼可取而代之 基本情况: 去年10月以来,中美的大模型研发都明显加速了,基本都从原先平均4个月左右的迭代周期,进化到2个月左右,而OpenAI 这一次则进一步的,发布周期…
-
DeepSeek V4 逻辑测评
短的结论:一道清澈而纯粹的光 基本情况: 作为国产大模型的顶流,DeepSeek V4 在发布后立刻引发了全民关注。面向生产力的编程Coding 场景评估已在先前单独发文,本篇主要…
