个人中心 - 发现AI

评测组小编

这个人很懒，什么都没有留下～

163 文章

0 评论

0 粉丝

评测

实测 ChatGPT Work vs Claude Cowork，OpenAI 这次真追上来了

7 月 9 日，OpenAI 一口气发了三样东西，新模型 GPT-5.6，一个把 Chat、Work、Codex 装进同一个壳的新桌面应用，以及本文的主角 ChatGPT Work…

评测组小编
1天前
评测

SpaceXAI Grok 4.5 测评

短的结论：大鹏一日同风起基本情况：对于拥有巨额算力与人才储备的北美团队而言，从相对落后位置发起追击并不是一件特别困难的事，尤其是这个团队还有一位金主，拥有钞能力，缺数据就买数据…

评测组小编
2天前
评测

LingBot-World 2.0 实测：无限时长、随机变化的世界，终于来了？

「加载」一个世界，只需要几秒钟的时间——在过去，这说的是一个已经可以游玩的游戏，里面所有的内容早已写好。如果一个从未被创造过的全新世界，也只需要几秒钟就可以被创造出来，里面具有独…

评测组小编
3天前
评测

刚刚，字节最强图像模型杀回来了！17个案例深度实测Seedream 5.0 Pro

7月8日晚间，字节跳动Seed团队正式发布多模态图像创作模型Seedream 5.0 Pro。这距离今年2月10日Seedream 5.0预览版上线，已经过去近5个月。相比此前版…

评测组小编
3天前
评测

腾讯 Hy3 正式版测评

短的结论：直挂云帆济沧海基本情况：两个月，是目前国产模型更新一次的版本的平均耗时，略慢于北美顶级团队，略快于有硬骨头要啃的友商团队。两个月足以让智谱完成了从 GLM-5.1 到…

评测组小编
5天前
评测

实测腾讯 Hy3 正式版，这次终于赶上了「AI 下半场」

十年磨一剑，两月一模型。四月份的时候 Hy3 Preview 上线，这个被冠上了「姚顺雨腾讯首秀」的大模型，开始能接住一些用户的真实需求，姚顺雨在之前的「腾讯 AI 下半场」和…

评测组小编
5天前
评测

GPT-5.6 Sol首批内测结果来了！同任务成本只有Fable 5一半

GPT-5.6 Sol预览版发布小半个月了，首批用户内测报告终于新鲜出炉！英伟达首席工程师用最直白最不绕弯子的话告诉你： Sol很猛！30小时，就跑赢了Opus 64小时才达到的…

评测组小编
6天前
评测

Claude Sonnet 5 测评

短的结论：是这个乱世害了你基本情况：一边是 Opus 系列在高频迭代，Mythos/Fable 在命途多舛，Sonnet 更像是被遗忘在水下的模型，平均要 4 个月才会更新一次…

评测组小编
2026年7月3日
评测

Step 3.7 Flash、DeepSeek、MiniMax、Gemini、GPT 的 Agent 评测，谁更适合Agent？

最近这段时间，国内外模型更新得很快。如果只看发布会和榜单，大家都会觉得每个模型都很强。参数更大、上下文更长、推理更强、价格更低，听起来都挺猛。但真正用到工作流里，会发现另一件事…

评测组小编
2026年7月3日
评测

Fable 5回归24小时差评如潮！跑分大降，拒答问题，还偷偷骂用户

Claude Fable 5才刚刚回归，就差点被网友的口水淹死。 A社官方账号发推庆祝回归，开发者Thariq也跟着喊「excited for guys to get access…

评测组小编
2026年7月3日
评测

Fable 5回归全网抓紧测！发现GLM-5.2更香了，价格只有1/39

喜大普奔！大家的「模月光」Claude Fable 5，它回来了！！这回狼是真来了，官方已经实名认证：确定一定加肯定～消失了整整十九天，这个神话级模型终于全球再上线。 Clau…

评测组小编
2026年7月2日
评测

我们拿到了企微 AI Agent 的内测资格，提前替你试了一周

微信和企业微信的 Agent，同时出牌。企业微信大概是国内最「特殊」的协同办公工具之一。它接入超过 1400 万家企业，每天服务的微信用户超过 7.5 亿。别家办公软件连接的是员…

评测组小编
2026年7月1日

点击查看更多

马斯克与奥尔特曼因GPT-5.6上线再度互讽
7小时前
分享到:

2026年7月12日，GPT-5.6模型发布当日，xAI CEO马斯克与OpenAI CEO奥尔特曼在X平台展开激烈交锋。马斯克转发帖文称奥尔特曼“把诈骗提升到新高度”，并嘲讽其听证会发言；奥尔特曼反讽马斯克炒作“太空数据中心”，并调侃“最强模型的证明是埃隆又念念不忘”。马斯克再回应，指OpenAI窃取开源AI项目及苹果技术。双方争议聚焦AI伦理、技术归属与商业宣传，事件发生于全球AI竞争加剧背景下。
布朗大学教授发现AI作弊致期中期末成绩断崖式分化
7小时前
分享到:

2026年7月8日，美国布朗大学福利经济学教授罗伯托·塞拉诺向校学术诚信委员会提交报告，称其课程期中（居家开卷）与期末（线下闭卷）考试成绩出现显著反差：多名期中获90分以上者期末跌至50余分，部分学生甚至弃考。事件源于去年12月校园枪击后调整的考试形式，塞拉诺怀疑AI作弊导致成绩失真，现已取消居家考试及家庭作业评分权重。校方已启动调查，强调对学术诚信零容忍。该案例引发全球教育界对AI作弊防控的广泛讨论。
Kimi K2.7 Code高速版结束Beta正式上线
7小时前
分享到:

2026年7月10日晚，月之暗面宣布K2.7 Code高速版结束Beta测试，成为常驻可选模式。订阅Allegretto及以上会员的用户可在Kimi Code CLI等工具中直接调用该模式。其输出速度达普通版5–6倍，短上下文场景最高260 Token/s，但用量消耗为普通版3倍，价格亦为两倍（1M tokens标准输入/输出分别13元/54元）。该模型与普通版同源，旨在提升长上下文编程效率。
机构：到2029年中国国内算力卡采购额将达到1.44万亿元，将诞生多家市值万亿甚至十万亿的上市企业
7小时前
分享到:

据央视财经，有机构预测，到2029年，中国国内算力卡采购额将达到1.44万亿元。庞大的算力需求让投资机构相信，中国将诞生多家市值万亿甚至十万亿的上市企业。
智谱CEO唐杰发内部信：“GLM 时刻”和万亿俱乐部之后，什么是更重要的事
20小时前
分享到:

7月11日，智谱创始人唐杰，在智谱发布了主题为《巨浪已来》的内部信。其中提到，智谱将不追求短期的应用变现，而是直指AGI的下一个高地：长程任务能力、完全自治的智能体系统、自我进化、极致安全治理。过去半年来，智谱收获了创立以来的高光时刻：市值较半年前上市初期涨了10倍，并在2026年 6月，跻身“万亿港元俱乐部”。
腾讯洽购Manus？知情人士：腾讯仍将保留少数股东地位
23小时前
分享到:

7月11日，有消息称腾讯正在洽谈成为通用AI Agent公司Manus的最大股东，据该消息，由腾讯牵头的中方资本组团以约20亿美元估值从Meta手中回购Manus的全部股权。记者向腾讯方面求证，截至发稿腾讯方面暂无回应。另有知情人士向记者透露，此次交易后，腾讯仍将保持少数股东地位，但不会控股。
谷歌发布可穿戴健康基础模型SensorFM
1天前
分享到:

2026年7月9日，谷歌研究团队宣布推出可穿戴健康基础模型SensorFM。该模型基于2024年9月至2025年9月全球500万名授权参与者的超20亿小时可穿戴设备数据预训练，覆盖100多个国家及20余种设备机型。模型输入涵盖PPG、加速度计等5类传感器的34个分钟级特征，支持心血管、代谢、心理等6类共35项健康任务。测试显示，SensorFM-B在33项判别任务中领先，线性探针在34项中优于传统监督基线。团队还引入LLM智能体协同优化机制，显著提升预测性能。
阿里潮玩AI设计平台“妙呀”开启全量公测
1天前
分享到:

7月11日，阿里巴巴旗下潮玩创作者AI设计平台“妙呀”正式开放全量公测。该平台由大麦娱乐与阿里Token Foundry事业部联合推出，为全球首个专注潮玩领域的AI设计工具。创作者仅需输入文字描述，平台即调用多模态AI模型生成设计方案。同步启动“妙呀百万激励计划”，面向公众征集AI潮玩作品，设现金、算力及孵化资源奖励，前三名可直签阿里，获IP孵化、商业合作与流量扶持。此举旨在降低潮玩创作门槛，加速AI赋能原创设计落地。
GPT-5.6 Sol实现自主后训练，RSI指标超前代16.2%
1天前
分享到:

2026年7月10日，OpenAI发布GPT-5.6 Sol模型，可自主完成对轻量级Luna模型的后训练。该能力在内部评估套件“聚合RSI”中较GPT-5.5提升16.2个百分点。后训练涵盖配置设定、GPU选择、脚本启动与验证等全流程，由模型自动生成指令并执行。研究员Kathy Shi称其具备“自动化研究员”功能。测试显示，使用该模型后，研究人员日均token产出翻倍，pull request与实验数量同步增长。
阿里巴巴启动古代壁画AI重现工程
1天前
分享到:

7月11日，阿里巴巴公益联合西安美术学院、爱智岛、万相、堆友等机构，在北京正式启动“古壁生辉”古代壁画AI重现工程。该工程聚焦专业修复与AI技术融合，首创“技术人员+视觉大模型+智能体skill”新模式。首期以山西平顺大云院弥陀殿五代壁画《维摩诘经变》为对象，其为全国寺庙道观现存唯一五代壁画。首个AI技能包已上线“堆友”平台，支持高精度纹理还原与历史风格复原。项目旨在提升濒危壁画数字化保护效率与公众可及性。

【腾讯云】 4核4G服务器新客 38元/年起，支持 OpenClaw/Hermes 等热门镜像；Token Plan 低至28元/月，多种主流模型极速调用