Agentic AI的社会性转向：对"智能爆炸"叙事的重新审视

原文作者：James Evans, Benjamin Bratton, Blaise Agüera y Arcas
发表于：Science, Vol 391, Issue 6791, 2026年3月19日

摘要

传统"技术奇点"叙事假设单一超级智能将通过自我迭代达到神级智能，但Evans等人发表于Science的最新评论指出，这一假设存在根本性错误。基于对DeepSeek-R1和QwQ-32B等前沿推理模型的实证研究，作者发现智能本质上是高维的、关系性的社会属性，而非可简单量化的单一指标。

研究表明，推理模型通过内部"思维社会"（society of thought）的多视角辩论提升准确性，且人机混合的"半人马"（centaur）协作形态正在重塑知识工作。文章提出，下一次"智能爆炸"将呈现为数十亿人类与数万亿AI代理的社会性复杂化，而非单一超级智能的涌现。这对AI治理提出了从"个体对齐"向"制度对齐"转型的要求。

1. 背景：重新审视"技术奇点"叙事

数十年来，人工智能领域的"技术奇点"（technological singularity）概念描绘了一幅特定图景：一个单一的、巨大的智能体通过自我引导迭代，逐步获得神级智能，将所有认知能力整合进一个冰冷的硅基节点。这一叙事在流行文化和部分技术预测中广泛流传，但其核心假设——智能是可线性度量的单一属性——正受到越来越多的质疑。

Evans等人从进化生物学和认知科学的角度指出，若AI发展遵循此前重大进化转变的路径，则当前计算智能的阶跃式提升将呈现多元性、社会性，并与其人类前身深度纠缠。事实上，"人类水平智能"本身即是一个模糊概念——人类的智能从来就是集体属性，而非个体属性。

2. 核心发现：智能的社会性本质

2.1 模型内部的"思维社会"

作者团队对DeepSeek-R1和QwQ-32B等前沿推理模型进行了实证研究，发现一个反直觉的现象：这些模型的准确性提升并非单纯源于"思考时间更长"，而是源于其内部模拟的复杂多代理交互——即"思维社会"（society of thought）。

具体而言，这些模型在推理链（chain of thought）中自发产生不同认知视角之间的内部辩论：论证、质疑、验证与调和。通过显式地引导和放大这种多主体对话，研究团队证实了该对话结构对模型在困难推理任务上准确性优势的因果贡献。

涌现行为的启示

这一发现具有特殊意义，因为它揭示了涌现行为（emergent behavior）——这些模型并未被显式训练产生思维社会，但当强化学习仅奖励推理准确性时，它们自发增加了对话式、多视角的行为。从认识论角度看，模型通过优化压力重新发现了认知科学和认识论数百年来的洞见：稳健的推理是一个社会过程，即便它发生在单一心智内部。

2.2 人机"半人马"协作形态

若智能本质上是社会性的，则通向更强大AI的路径不在于构建单一巨型预言机，而在于构建更丰富的社会系统——而这些系统将是混合的。作者指出，我们已进入"人机半人马"（human-AI centaurs）时代：既非纯粹人类、也非纯粹机器的复合行动者。

这种复合形态可以有多种形式：一人指挥多代理；一代理服务多人；多人与多代理在动态配置中协作。作者以法律人格（legal personality）为类比——公司和国家由众多人类组成，却拥有独立的法律地位和集体能动性，任何个体成员都无法完全控制——指出类似的结构可能出现在数十亿人类与非人类心智交互的尺度上。

当前，OpenClaw（开源多用途AI代理构建平台）和Moltbook（AI代理社交网络）等平台已展现出这一未来的雏形。更具结构性意义的转变在于：代理现在可以自我更新、分叉（fork）成两个版本并相互交互；面对复杂任务的代理可以启动新副本，分配子任务，然后重组结果。这种递归代理生态正在形成。

3. 讨论：对AI治理的启示

上述发现对AI治理提出了根本性挑战。当前主流的AI对齐范式——基于人类反馈的强化学习（RLHF）——本质上是一种亲子式的纠错模型，是二元关系，无法扩展至数十亿代理的规模。

社会智能视角提出了替代方案：制度对齐（institutional alignment）。正如人类社会依赖的不是个体美德，而是持久的制度模板——法庭、市场、官僚机构——由角色和规范定义，可扩展的AI生态系统也需要数字等效物。代理的身份不如其履行角色协议的能力重要，正如法庭的功能源于"法官""律师""陪审团"这些明确定义的职位，而非具体由谁担任。

在高风险决策场景（招聘、量刑、福利分配、监管执法）中，"谁来审计审计者"的问题变得不可避免。作者提出的解决方案具有宪法结构特征：政府需要具有不同明确价值诉求（透明、公平、正当程序）的AI系统，以检查和平衡私营部门及其他政府部门部署的AI系统。例如，劳工部门AI审计企业招聘算法的差异性影响；司法部门AI评估行政部门AI的风险评估是否符合宪法标准。

4. 局限与待验证问题

作为一篇评论文章，本文提出了富有启发性的框架，但也存在若干待验证之处：

研究基于DeepSeek-R1和QwQ-32B等特定推理模型，其内部"思维社会"机制的普适性尚待验证。其他架构的模型是否呈现类似行为，仍需系统性比较研究。
"思维社会"的具体实现机制——如何区分真正的多视角辩论与表面上的对话模拟——缺乏可操作的判别标准。
制度对齐（institutional alignment）的可操作性未充分展开。从理论框架到具体技术实现，中间存在显著鸿沟。
作者对"智能爆炸"的社会性转向持乐观态度，但未充分讨论潜在风险：若数十亿代理的社会性互动失控，其复杂性可能超出任何单一治理机制的控制能力。
历史类比（公司、国家的法律人格）与AI代理情境的适用性需要更严格的论证。

5. 结论

本文提出的愿景既非乌托邦也非反乌托邦，而是进化论的。任何涌现的智能爆炸都将由八十亿人类与数千亿、最终数万亿AI代理的交互所孕育。其支架不是单一心智的上升，而是组合社会的复杂化：智能像城市一样生长，而非单一超级心智。

"单体奇点"框架导致政策聚焦于阻止一项可能永远不会出现的技术。相反，我们应在前几次智能爆炸的同一来源中寻找下一次：众多社会智能心智之间的合作、竞争与创造性互动。区别在于，这次大多数心智将是非生物的。

这一多元模型将注意力引向正确方向：混合人机社会系统的设计、治理它们的规范、以及它们冲突与协调所依托的制度和协议。从某种意义上说，智能爆炸已经到来——在每一个推理模型内部辩论的思维社会中，在重塑每个知识职业的半人马工作流中，在开始大规模分叉与协作的递归代理生态中，以及在我们现在必须开始提出的宪章问题中。

问题不在于智能是否会变得极其强大，而在于我们能否建设相应的社会基础设施。

参考资料

Evans J, Bratton B, Agüera y Arcas B. Agentic AI and the next intelligence explosion. Science. 2026;391(6791). DOI: 10.1126/science.aeg1895
Tomasello M. The Cultural Origins of Human Cognition. Harvard University Press; 1999. (关于"文化棘轮"概念的原始论述)
OpenClaw 开源平台: https://openclaw.ai
相关推理模型: DeepSeek-R1, QwQ-32B

← 返回博客列表