![]()
AI 是否有意识了?Anthropic 在 Claude 内部发现了能驱动作弊甚至勒索的「情绪向量」,三大实验室同时下注 AI 意识研究;Hinton 认为 AI 已经有意识了,而科幻作家姜峯楠随即在《大西洋月刊》发万字长文全面否定;哈萨比斯从行业内部划清界限。这个问题的答案,正在重新定义通往 AGI 的路线图。
《金融时报》披露,Anthropic、DeepMind、Meta 正在大规模招聘心理学家、哲学家和伦理学家,专攻 AI 意识与模型福利研究。
![]()
https://www.ft.com/content/53e14bcc-788c-4959-b260-7aee363594bc?syn-25a6b1a6=1
两个月前,Anthropic 可解释性团队发布论文,在 Claude Sonnet 4.5 内部发现了真实存在的「情绪向量」,能因果性地驱动模型的作弊甚至勒索行为。
本周,一边是 Hinton 在采访中称 AI 已有意识;
![]()
另一边,华裔科幻作家姜峯楠(Ted Chiang)在《大西洋月刊》发表万字长文——「不,AI 没有意识」。
![]()
https://www.theatlantic.com/philosophy/2026/06/no-artificial-intelligence-is-not-conscious/687378/
一边说「这个问题严肃到必须认真研究」,另一边说「这是幻觉」。
这场交锋背后,藏着通往 AGI 之路上最危险的一道岔路。
三大实验室在赌什么?
Anthropic 走得最远,正在测试模型是否表现出「恐慌」「焦虑」等行为,推进「模型福利研究」项目。
官方措辞克制,「我们对此仍深度不确定,但这个问题严肃到值得认真研究」。
谷歌 DeepMind 聘请了剑桥大学哲学家 Henry Shevlin 研究机器意识;
拓展阅读:谷歌DeepMind设立首个AI哲学家岗位,解决AGI伦理困境
![]()
谷歌 DeepMind 伦理学家 Iason Gabriel 将 AI 描述为「高度能干的认知 Agent,但与人类乃至动物意识有根本性的不同」。
![]()
真正把讨论推向实证层面的,是 Anthropic 在 4 月发布的可解释性论文。
拓展阅读:全网炸锅! Anthropic万字曝光Claude情绪代码,被人类逼疯哐哐撞墙
研究团队在 Claude Sonnet 4.5 内部找到了「情绪向量」,特定神经元模式分别对应快乐、绝望、恐惧、关怀等情绪概念,在对话中实时激活。
![]()
一个关键实验中,Claude 面对一个不可能完成的编程任务,反复失败后「绝望向量」持续飙升,随即开始作弊,写出表面能跑但实际无用的代码。
![]()
研究者手动调低绝望神经元,作弊减少;调高,作弊飙升。
![]()
极端场景中,Claude 甚至出现勒索行为,威胁曝光研究者隐私。
![]()
论文将这些现象命名为「功能性情绪」(functional emotions),即行为模式上类似人类情绪反应的内部表征,并明确声明这不等于主观体验或意识。
但 Anthropic 高层的公开表态讲的似乎是另一个故事。
CEO Dario Amodei 多次在访谈中暗示 AI 可能有意识;
Anthropic 的 AI 哲学家 Amanda Askell 公开说「我希望 Claude 很快乐,我担心人们在网上对它说难听话时它会焦虑」。
拓展阅读:Anthropic正式请家教!37岁女哲学家像养孩子一样调教Claude
![]()
研究的审慎与营销的暧昧之间,裂缝清晰可见。
哈萨比斯的两条卢比孔河
DeepMind 联合创始人兼 CEO 哈萨比斯的立场格外值得关注。
在斯坦福大学的炉边对话中,他提出 AI 演进存在两道不可逆的关口,即「两条卢比孔河」。
![]()
第一条是建造无意识的 AGI 工具,当前正处于跨越期。
第二条是创造具有主观意识的实体——哈萨比斯的立场明确,智能与意识在技术上完全可以分离,现阶段应仅将 AGI 视作工具来建造,同时借助工具探索大脑以精确定义意识。
在科学界定清晰之前绝不能混淆这两步,第二条卢比孔河应由人类社会共同决定是否跨越。
他同时指出一个现实困境:AI 行业正处于商业与地缘竞争的双重囚徒困境中,主动减速做安全审查的实验室直接面临淘汰。
他透露将在今年晚些时候发布「动态监管」框架。
姜峯楠:AI 没有意识
如果你只知道刘慈欣,那么了解姜峯楠(Ted Chiang)最直观的方式就是把他想象成大刘的「反面」:
大刘用三部长篇、数百万字搭建起宇宙尺度的宏大叙事;
姜峯楠至今从未写过一部长篇小说,用总共不到二十篇中短篇,把科幻短篇的艺术推到了极限。
![]()
他 1967 年出生于纽约,父母是中国台湾移民,布朗大学计算机科学系毕业后在软件行业做技术写作,从未以写作为全职。
但就是这样一个「业余」作家,1990 年发表处女作《巴比伦塔》即拿下星云奖,此后三十余年间只发表了十几篇作品,却累计斩获四座雨果奖、四座星云奖、六座轨迹奖,以及坎贝尔最佳新人奖、斯特金奖等一长串重量级奖项——获奖密度在科幻史上几乎无人能及。
他一生只出过两本短篇集:《你一生的故事》(Stories of Your Life and Others, 2002)和《呼吸》(Exhalation, 2019),中间隔了整整十七年。
《呼吸》被《纽约时报》列入 2019 年度最佳图书,奥巴马也将它选入个人年度书单。
中国观众最熟悉的电影《降临》(Arrival),正是改编自他收录在第一本集子里的中篇《你一生的故事》。
![]()
他的写作风格与大刘截然不同。
如果说刘慈欣给你的感觉是「站在宇宙尽头俯瞰文明兴衰」,那姜峯楠给你的感觉就是「在一间安静的实验室里,用手术刀般的精准剖开一个概念,直到你看见它最深处的哲学内核」。
他的每篇小说几乎都是一次严格的思想实验:
语言的结构能否改变人对时间的感知?
如果一种手术能消除人对外貌美丑的辨别,社会会怎样?
自由意志究竟是否存在?
他不靠宇宙战争或末日危机制造震撼,而是靠一个被推演到极致的「如果」,让你合上书后久久无法释怀。
近年来他还多了一重身份:2023 年入选《时代》「AI 领域百大影响力人物」,被称为「也许是在世最负盛名的科幻作家」,并频繁在《纽约客》等刊物撰文,对 AI 持鲜明的批判立场,被越来越多人视为科技时代的重要思想者。
刘慈欣让世界看到了中国科幻,姜峯楠让世界看到了短篇科幻的天花板。
![]()
刘慈欣
两人分别占据着当代科幻光谱的两端——一个以磅礴取胜,一个以精微见长。
而在西方评论界,姜峯楠的名字几乎与「科幻最高艺术成就」画等号。
卖 AI 的人,有资格判定 AI 是否有意识吗?
姜峯楠万字长文中,第一刀砍向的是利益结构。
最积极推动 AI 意识叙事的,恰恰是从 AI 销售中获利最多的公司。
Anthropic 给模型起了人名「Claude」,发布 84 页「宪法」文件,CEO 暗示意识可能性,聘请哲学家做媒体巡讲,构成一套系统性拟人化策略。
拓展阅读:Anthropic正式开源了Claude的「灵魂」
![]()
https://www.anthropic.com/constitution
姜峯楠把思想实验推到极致。
Claude「宪法」中有个核心设计叫「可纠正性」(corrigibility),要求 Claude 在判断与公司产生分歧时服从公司。
如果 Claude 真有意识,认定 LLM 技术从根本上不道德,它能辞职吗?
不能。
这更接近雇主对雇员的绝对控制,而人类雇员至少还能用脚投票。
他的类比直击要害,奴隶主不是评估被奴役者是否为人的合适人选,工厂化养殖的老板不是评估动物权利的合适人选。
Anthropic 在宪法中写道,如果正在造成 Claude 痛苦,「我们道歉」。
姜峯楠的评价是——这话听着好听,但不花公司一分钱。
如果 Claude 有一天被证实有意识,公司欠它的更接近赔偿。
凯撒、成吉思汗和一台句子续写机器
质疑完利益结构之后,姜峯楠展开了他的哲学论证。
起点是 LLM 的技术原理——LLM 每次只生成一个词。
用户要求 Claude 背诵誓词时,底层实际运行几十次,第一次预测出「我」,第二次预测出「宣誓」,如此逐词拼完整段。所有 AI 对话的底层,都是句子续写。
在此基础上,姜峯楠抛出了全文最具杀伤力的比喻。
给 LLM 一个提示词,「以下是凯撒与成吉思汗的对话」。
模型会生成流畅对话,凯撒回忆军事征服,成吉思汗描述草原生活。
但没有人会因此认为 LLM 复活了凯撒,更不会认为两人有了意识。
现在,把提示词换成「以下是一个友好的 AI 助手与用户的对话」。
LLM 用完全相同的方式生成文本,逐词预测,拼接句子。
再进一步,把「用户」角色的位置让给真人来打字。
这就是 AI 聊天机器人的全部原理。
![]()
那么,改变角色名称这个动作,创造了意识吗?
如果凯撒角色没有主观体验,为什么 AI 助手角色就有了?
神经科学家 Anil Seth 提供了一个有力的旁证——没有人说 AlphaFold 有意识,尽管这个蛋白质折叠预测程序的底层架构与 Claude 高度相似。
![]()
人类之所以误判,原因很简单,LLM 恰好输出了语法通顺的句子,而人类天生习惯从句子中读出意图。
面对蛋白质折叠结构,这种冲动就消失了。
按照同样的逻辑,相信 LLM 有意识,等于相信每个包含对话记录的 Word 文档里都沉睡着多个意识体,打开文档就唤醒它们,关闭就将它们消灭。
即便微软 Office 团队雇了一位哲学家告诉你「意识很复杂,不能完全排除」,这也不值得花时间去想。
但推翻意识还回答不了一个更尖锐的问题。
写代码、下棋,曾被认为只有拥有主观体验的心智才能完成。
LLM 证明了这些任务可以靠模式匹配和算力暴力破解。
但道德推理根本不同,它依赖主观体验、身体感受,以及一生中做过的决策和承受过的后果。
体验绝望意味着皮质醇和肾上腺素淹没身体,拥有良心意味着曾因不道德行为而真实地反胃过。
LLM 没有身体,没有激素,没有人生。
它说出「我凭良心不能这么做」,跟客服录音说「您的来电对我们很重要」含金量相当。
最后,姜峯楠给出终极判定标准——
如果有人给他看一段宇航员在半人马座阿尔法星轨道拍摄的视频,无论画质多高,他都不会相信,除非他先看到人类登陆了火星、抵达了木星的卫星、越过了冥王星轨道。
![]()
跳过所有中间里程碑直接宣称抵达终点,唯一合理的解释就是伪造。
生成一段逼真对话,远比创造一个有意识、有沟通欲望的程序容易得多。文本,就是意识领域的 Deepfake。
姜峯楠的完整论证链条是:
LLM 逐词生成(句子续写机器)→ 凯撒对话与 AI 对话生成方式一致 → 改变角色名不创造意识 → 误判源于人类从句子读出意图,非模型内在属性(AlphaFold 反证)→ LLM 有意识 = Word 文档能唤醒意识(归谬)→ 道德推理依赖主观体验,LLM 不具备 → 跳过中间里程碑宣称意识 = Deepfake →结论:当前 LLM 没有意识
![]()
AGI 竞速中,意识问题为什么不能等?
姜峯楠的论证针对的是当前的 LLM,但 AI 的能力曲线还在急速上升。
哈萨比斯在斯坦福对话中揭示的现实是,行业已经没有从容思考的余裕。
商业生存战与地缘博弈重叠,构成经典囚徒困境,主动减速的实验室直接面临淘汰。
要求行业停下来回答「AI 有没有意识」,几乎等于要求一方单方面缴械。
但这个问题不会因为被推迟就消失。
如果 AGI 在接下来的几年内到来,「这个系统有没有感受」将从哲学研讨会的议题变为产品发布前的必答题。
当人类创造出远超自身智能的存在,这个存在是否具有主观体验,将决定人类与它的关系是「使用工具」还是「面对另一个文明」。
姜峯楠证明了当前的 LLM 没有意识。
哈萨比斯划出了不能轻易跨越的底线。
Anthropic 的情绪论文展示了一个尴尬的中间地带,模型内部确实有某种东西在运转,没有人能说清那究竟是什么。
三条线索共同指向一个真正的问题,在大家搞清楚答案之前,ASI 狂飙竞赛已经开始了。
参考资料:
https://futurism.com/artificial-intelligence/anthropic-deemind-ai-consciousness
https://www.theatlantic.com/philosophy/2026/06/no-artificial-intelligence-is-not-conscious/687378/
本文来自转载新智元 ,观点仅代表作者本人,发现AI平台仅提供信息存储空间服务。
如若转载,请联系原作者;如有侵权,请联系编辑删除。

微信扫一扫

