评测
-
Opus 4.8编程能力不如GPT-5.5
哈喽,大家好,我是刘小排。 从凌晨Opus 4.8发布到现在,我一直在真实任务中使用,今天已经累计消耗了超过618美金,8.4亿Token。 我的结论: Opus 4.8编程能力仍…
-
Claude Opus 4.8 测评
短的结论:冷静与炙热共存的 Token 熔炉 基本情况:大模型团队都在加速狂奔,离 Opus 4.7 发布也不过一个半月,Opus 4.8 就如期而至。按官方的说法,Opus 4.…
-
实测 Claude Opus 4.8:活干得更漂亮了,话说得更难听了
今早,,在发布新估值的同时,还发布了前两天就开始有传闻流出的 Claude Opus 4.8,旗舰产品线的最新版本。我们第一时间上手,同时收集了用户社区的早期反馈。 先说结论:更能…
-
Claude Opus 4.8实测封神!强到离谱,也贵到肉痛
新智元报道 【新智元导读】传说中的Claude Opus 4.8,性能真的如此强大吗?有人高呼封神,直言这是Opus 5,有人吐槽太拉了,还不如Opus 4.7,技术大佬也来拆台。…
-
一句话搞定整套视觉方案,腾讯创意智能体Miora开测
刚刚,腾讯在香港Cloud Day上宣布,全场景创意智能体工作室妙境Tencent Design Miora(简称Miora)国际版开启邀测,图片、视频、UI/UX以及3D等多种模…
-
开源个 Skill|彻底解决小红、小绿书配图难题
前段时间开源了 guizang-ppt-skill,之后我自己用它做内容的时候发现一件事。 用它出的网页,单张截下来发到图文平台,反响和数据比我手工排版还很多。 我相信你之前也找到…
-
马维斯(Marvis)实测:他给了我一些可以独处的时间
一个自媒体人的48小时深度体验 最近这两天,微信朋友圈被一个名叫「马维斯」(Marvis)的AI助手刷屏了。 这是腾讯应用宝团队推出的新产品,官方给它的定位很激进——「操作系统层级…
-
国产AI编程冲上全球第二,实测五大模型,谁才是Vibe Coding神器
超越 GPT-5.5、Gemini 3.5 Flash、DeepSeek V4 Pro,阿里的最新旗舰模型 Qwen3.7 Max 在编程竞技榜拿下第二名,仅次于 Claude O…
-
腾讯云Token Plan怎么样?28元3500万Token,国产大模型API套餐实测
一、为什么写这篇 最近很多人在问:大模型API怎么买最划算? 直接调用API,按量计费,单价高、用量波动大,月账单经常超预算。 腾讯云出了一个Token Plan套餐包——相当于批…
-
我用AI做了个修仙小游戏:4分钟生成,30秒玩腻,飞剑只砍自己人…
能用,但不好玩。 自从 vibe Coding 成了 AI 圈热词之后,用 AI 写程序、做网页已经不是稀奇事了,甚至开发游戏,AI 也能干。不过,相比起做图片或是程序,游戏天然更…
-
Python逆天改命!开源Hermes首次击败OpenAI Codex
一个纯Python写的开源项目,竟把OpenAI用Rust写的王牌给秒了!最终战绩6比5,Hermes直接上演工程暴力美学,解释型语言终于逆天改命。 一个纯Python写的开源项目…
-
AI医生测评:蚂蚁阿福、字节小荷、京东小康、讯飞晓医、安诊儿、好伴AI、百小医、未来医生、DeepSeek、豆包、千问、Kimi、Gemini、Claude
山甲实验室已经连续做了3个月的AI医疗测评,这次是我们正式纳入患者端2C测评视角的开始。 我们的测题是一位63岁患者,胸闷近一个月,不是疼,有反酸、气短、乏力;一个月前外院提示冠心…
