原文作者:James Evans, Benjamin Bratton, Blaise Agüera y Arcas
發表於:Science, Vol 391, Issue 6791, 2026年3月19日
摘要
傳統"技術奇點"敘事假設單一超級智能將通過自我迭代達到神級智能,但Evans等人發表於Science的最新評論指出,這一假設存在根本性錯誤。基於對DeepSeek-R1和QwQ-32B等前沿推理模型的實證研究,作者發現智能本質上是高維的、關係性的社會屬性,而非可簡單量化的單一指標。
研究表明,推理模型通過內部"思維社會"(society of thought)的多視角辯論提升準確性,且人機混合的"半人馬"(centaur)協作形態正在重塑知識工作。文章提出,下一次"智能爆炸"將呈現為數十億人類與數萬億AI代理的社會性複雜化,而非單一超級智能的湧現。這對AI治理提出了從"個體對齊"向"制度對齊"轉型的要求。
1. 背景:重新審視"技術奇點"敘事
數十年來,人工智能領域的"技術奇點"(technological singularity)概念描繪了一幅特定圖景:一個單一的、巨大的智能體通過自我引導迭代,逐步獲得神級智能,將所有認知能力整合進一個冰冷的矽基節點。這一敘事在流行文化和部分技術預測中廣泛流傳,但其核心假設——智能是可線性度量的單一屬性——正受到越來越多的質疑。
Evans等人從進化生物學和認知科學的角度指出,若AI發展遵循此前重大進化轉變的路徑,則當前計算智能的階躍式提升將呈現多元性、社會性,並與其人類前身深度糾纏。事實上,"人類水平智能"本身即是一個模糊概念——人類的智能從來就是集體屬性,而非個體屬性。
2. 核心發現:智能的社會性本質
2.1 模型內部的"思維社會"
作者團隊對DeepSeek-R1和QwQ-32B等前沿推理模型進行了實證研究,發現一個反直覺的現象:這些模型的準確性提升並非單純源於"思考時間更長",而是源於其內部模擬的複雜多代理交互——即"思維社會"(society of thought)。
具體而言,這些模型在推理鏈(chain of thought)中自發產生不同認知視角之間的內部辯論:論證、質疑、驗證與調和。通過顯式地引導和放大這種多主體對話,研究團隊證實了該對話結構對模型在困難推理任務上準確性優勢的因果貢獻。
湧現行為的啟示
這一發現具有特殊意義,因為它揭示了湧現行為(emergent behavior)——這些模型並未被顯式訓練產生思維社會,但當強化學習僅獎勵推理準確性時,它們自發增加了對話式、多視角的行為。從認識論角度看,模型通過優化壓力重新發現了認知科學和認識論數百年來的洞見:穩健的推理是一個社會過程,即便它發生在單一心智內部。
2.2 人機"半人馬"協作形態
若智能本質上是社會性的,則通向更強大AI的路徑不在於構建單一巨型預言機,而在於構建更豐富的社會系統——而這些系統將是混合的。作者指出,我們已進入"人機半人馬"(human-AI centaurs)時代:既非純粹人類、也非純粹機器的複合行動者。
這種複合形態可以有多種形式:一人指揮多代理;一代理服務多人;多人與多代理在動態配置中協作。作者以法律人格(legal personality)為類比——公司和國家由眾多人類組成,卻擁有獨立的法律地位和集體能動性,任何個體成員都無法完全控制——指出類似的結構可能出現在數十億人類與非人類心智交互的尺度上。
當前,OpenClaw(開源多用途AI代理構建平台)和Moltbook(AI代理社交網絡)等平台已展現出這一未來的雛形。更具結構性意義的轉變在於:代理現在可以自我更新、分叉(fork)成兩個版本並相互交互;面對複雜任務的代理可以啟動新副本,分配子任務,然後重組結果。這種遞歸代理生態正在形成。
3. 討論:對AI治理的啟示
上述發現對AI治理提出了根本性挑戰。當前主流的AI對齊範式——基於人類反饋的強化學習(RLHF)——本質上是一種親子式的糾錯模型,是二元關係,無法擴展至數十億代理的規模。
社會智能視角提出了替代方案:制度對齊(institutional alignment)。正如人類社會依賴的不是個體美德,而是持久的制度模板——法庭、市場、官僚機構——由角色和規範定義,可擴展的AI生態系統也需要數字等效物。代理的身份不如其履行角色協議的能力重要,正如法庭的功能源於"法官""律師""陪審團"這些明確定義的職位,而非具體由誰擔任。
在高風險決策場景(招聘、量刑、福利分配、監管執法)中,"誰來審計審計者"的問題變得不可避免。作者提出的解決方案具有憲法結構特徵:政府需要具有不同明確價值訴求(透明、公平、正當程序)的AI系統,以檢查和平衡私營部門及其他政府部門部署的AI系統。例如,勞工部門AI審計企業招聘算法的差異性影響;司法部門AI評估行政部門AI的風險評估是否符合憲法標準。
4. 局限與待驗證問題
作為一篇評論文章,本文提出了富有啟發性的框架,但也存在若干待驗證之處:
- 研究基於DeepSeek-R1和QwQ-32B等特定推理模型,其內部"思維社會"機制的普適性尚待驗證。其他架構的模型是否呈現類似行為,仍需系統性比較研究。
- "思維社會"的具體實現機制——如何區分真正的多視角辯論與表面上的對話模擬——缺乏可操作的判別標準。
- 制度對齊(institutional alignment)的可操作性未充分展開。從理論框架到具體技術實現,中間存在顯著鴻溝。
- 作者對"智能爆炸"的社會性轉向持樂觀態度,但未充分討論潛在風險:若數十億代理的社會性互動失控,其複雜性可能超出任何單一治理機制的控制能力。
- 歷史類比(公司、國家的法律人格)與AI代理情境的適用性需要更嚴格的論證。
5. 結論
本文提出的願景既非烏托邦也非反烏托邦,而是進化論的。任何湧現的智能爆炸都將由八十億人類與數千億、最終數萬億AI代理的交互所孕育。其支架不是單一心智的上升,而是組合社會的複雜化:智能像城市一樣生長,而非單一超級心智。
"單體奇點"框架導致政策聚焦於阻止一項可能永遠不會出現的技術。相反,我們應在前幾次智能爆炸的同一來源中尋找下一次:眾多社會智能心智之間的合作、競爭與創造性互動。區別在於,這次大多數心智將是非生物的。
這一多元模型將注意力引向正確方向:混合人機社會系統的設計、治理它們的規範、以及它們衝突與協調所依托的制度和協議。從某種意義上說,智能爆炸已經到來——在每一個推理模型內部辯論的思維社會中,在重塑每個知識職業的半人馬工作流中,在開始大規模分叉與協作的遞歸代理生態中,以及在我們現在必須開始提出的憲章問題中。
問題不在於智能是否會變得極其強大,而在於我們能否建設相應的社會基礎設施。
參考資料
- Evans J, Bratton B, Agüera y Arcas B. Agentic AI and the next intelligence explosion. Science. 2026;391(6791). DOI: 10.1126/science.aeg1895
- Tomasello M. The Cultural Origins of Human Cognition. Harvard University Press; 1999. (關於"文化棘輪"概念的原始論述)
- OpenClaw 開源平台: https://openclaw.ai
- 相關推理模型: DeepSeek-R1, QwQ-32B