跳到正文

第一部 · 实在尺度 · 什么是真实的?

II · 理的内在面貌

~18 分钟 · 7,194

II · 理的内在面貌

§I为全书搭起了形而上学骨架:六条公设、五条定理、十一条命题。公设三指出道有可理解的面向(理),但尚未展开理的内部结构。理怎样运作?它的边界在哪里?我们若要清醒地面对AI时代,就必须理解「可理解性」本身,因为AI是人类迄今造出的最强大的理之工具。本章展开理的四种基本模式,并在最后抵达一个关键交汇点:概率,理与玄相遇的地方。

II.1 · 理不是一架时钟

三百年里,「读懂宇宙」往往被理解成一件事:抓住那条确定的规律,喂进初始条件,结果便分毫不差地吐出来。拉普拉斯就为此造了一只无所不知的「妖」1:只要它握有宇宙间每一颗粒子的位置与速度,整个未来便尽在掌中。在这样的画面里,理被想象成一架巨大的时钟,精密,确定,每一步都可预先报出。

二十世纪的物理学把这幅图景砸了个粉碎。量子力学的结论令人不安:在最底层,宇宙是概率性的,再也拼不回那架严丝合缝的机器。电子没有一个事先钉死的位置,它只摊开成一团概率云;放射性原子也没有一张写好衰变时刻的日程表,有的只是衰变的概率。而这概率,并非源于我们一时的看不清2

这标志着理的升级,不是理的终结。

理不是一架时钟。理更像一个掷骰子的织者:骰子确实在掷,但落点所服从的分布本身有精确的规律。我们能理解宇宙的根据不在完全确定性,关键在于宇宙的概率结构本身稳定、可理解。

这个洞见比确定性更深:理包含不确定性,但不确定性本身是有结构的。

(量子力学诠释的独立性):本章对量子概率性的使用不依赖于任何特定诠释。哥本哈根诠释视概率为本体论的,多世界诠释视之为分支权重,玻姆力学视之为认识论的,无论取哪一种,明在道的核心主张都成立:不确定性是结构性的,不只是暂时的无知。在完全确定论的诠释中,这一主张需要改写为「认识论的不确定性不可消除」:这个较弱版本仍足以支撑本框架的结论。详见§XIX.1(概率本体论的脆弱性)和§XIX.2(反驳六)。

II.2 · 理解的升级

在确定论的眼里,「理解」就是「精确预测」。换到概率的眼里,「理解」变成了另一件事:把可能性的分布描摹对。一颗原子哪一秒衰变,无须盯着秒针硬猜;知道半衰期,它的结构便已落在你手中。明天下不下雨,也不必逼自己说死一个答案;知道那个概率,安排今天的行程就已经够用。

这是更深的理解,不是更浅的理解:它坦然容纳不确定性,而不是假装不确定性不存在。

明在道实践而言:你深入理解一个系统时,不仅要看见确定性结构(因果、模式),还要看见概率结构:什么是可能的,什么不太可能,不确定性的边界在哪里。只看到确定性的人,在不确定性来临时措手不及;也能看到概率结构的人,在不确定性中仍然清醒,因为不确定性本身已经成为他理解的一部分。

II.3 · 理的四种基本模式

理(D3)不是单一秩序,它通过四种基本模式展开(D2图8)。

为什么恰好是这四种? 选择遵循四个约束。最小性:用最少的基本模式覆盖最广的动态现象。不可互相还原:四者中任何一种都无法由其余三种拼合而成。混沌可以通过反馈与梯度来分析,自组织可以通过四者协同来分析,但耗散、梯度、选择、反馈本身彼此独立。概率统一:四者都能用概率语言表达,而概率正是理与玄相遇的地方(§III.2)。结构对称:每种模式恰好对应玄的一种深度,构成理与玄之间的四重映射。对称性破缺、涌现、信息、网络拓扑等候选,要么由这几种模式组合而成,要么描述的是模式之间的关系,而非自成一种模式。所以这个四分法有纪律,却不自称终局:它是一个有充分动机的分类,而非穷尽性的证明。若未来某天发现了真正不可还原的第五模式,框架会伸展开来容纳它,而不会因此崩塌。

图8. 道展开所依循的四种不可还原的动态模式:耗散(有序被稀释,有限性的物理根基)、梯度(差异驱动一切运动)、选择(对可能性分布的系统性重塑)、反馈(输出返回输入)。四种模式汇合于概率,而概率本身就是理与玄的交汇处。
图8. 道展开所依循的四种不可还原的动态模式:耗散(有序被稀释,有限性的物理根基)、梯度(差异驱动一切运动)、选择(对可能性分布的系统性重塑)、反馈(输出返回输入)。四种模式汇合于概率,而概率本身就是理与玄的交汇处。

第一种模式是耗散(Entropy)。你在海边堆起一座沙堡。潮水还没来,但风已经在磨平你刚刻好的城垛,沙粒也在自身重力下缓缓塌落。从完成的那一秒起,它便开始走向消散。你不必等任何敌人来「摧毁」它:消散就是默认方向,那条不需要任何人帮忙的方向。

这不是比喻;它是热力学第二定律3的日常面目。一切结构都趋向耗散。热咖啡冷却,山峦侵蚀,帝国衰落,人终有一死。在所有可能的状态中,有序状态极其稀少,无序状态压倒性地多。一副牌按花色排列只有一种方式,随机排列却有天文数字那么多种。宇宙并不「偏好」无序,有序只是在可能性的海洋中被稀释了。

你的生命是一个精巧的有序结构,每时每刻都在与耗散搏斗。你吃饭,你呼吸,你把体温稳稳守在三十七度:每一样都是局部对抗衰败的抵抗。一旦停止对抗,你就死了。有限性公设(公设四)的物理根基正在于此。而在你身旁并肩作战的机器,打的是同一场仗:训练神经网络的标准损失函数(交叉熵)测量的,恰恰是模型的预测离真实分布还有多「散」。身体的新陈代谢与模型的学习是同构的搏斗,都在守护一小袋秩序,抵御四周向无序的漂移。数学形式化详见附录B.2,式 (eq:shannon-entropy)–(eq:life-entropy)。

第二种模式是梯度(Gradient)。设想一个被彻底抹平的宇宙:每一处都一样热,一样密,一样满。在这样的世界里,时间几乎成了多余之物,没有什么会流动,没有什么会改变,更孕育不出生命。运动要发生,先得有落差。

热从高温流向低温,水从高处流向低处,资本从低回报流向高回报,注意力从无聊流向刺激。道的展开沿着梯度展开。但这里藏着一个深层悖论:利用梯度,就是在消灭梯度。热传导消灭温差,扩散消灭浓度差,贸易消灭价格差。每一次「成功」都在削弱驱动它的力量。

威尼斯共和国的兴衰是一个微缩范例。它崛起于东西方贸易的价格梯度:东方香料在欧洲可以卖出数倍乃至十倍于源头的价格。但贸易本身在缩小这个差异。商人涌入同一条航路,利润空间不可避免地收窄。成功播下了衰落的种子:利用梯度,就是在消灭梯度。同一个悖论在AI训练中以精确的数学形式重现:「梯度下降」沿损失函数的梯度方向「下坡」,但随着优化深入,梯度本身趋向消失(梯度消失问题),系统陷入平坦区域。文明与算法,共享同一个结构性困境。数学形式化详见附录B.3,式 (eq:gradient)–(eq:gradient-dissipation)。

第三种模式是选择(Selection)。「适者生存」这四个字,也许是科学史上被误解最深的几个字。它让人想起强者撕碎弱者的画面,仿佛选择是一场屠杀。可真正的机制与暴力无关,也不需要一个设计者在上方主持。凡更能持续者,就持续得更多,如此而已。同样安静的筛选贯穿分子、基因、思想、公司、文明:选择之前,所有变异大致等概率;选择之后,某些被放大,另一些被压缩,可能性空间已被悄然重画。证据改变假设的概率4;进化重塑种群;AI训练保留降低误差的参数,淘汰增加误差的参数。选择,就是跨领域反复发生的概率修订。数学形式化详见附录B.4,式 (eq:bayes)–(eq:selection-n)。

第四种模式是反馈(Feedback)。你点开一条新闻。算法记住了你的点击。下一次刷新,类似新闻多了三条。你又点了两条。三个月后,你的信息世界已经收窄为一条隧道,你浑然不觉,因为隧道壁上贴满了你「自己选择」的东西。

这就是正反馈:输出返回输入,循环自我放大。银行挤兑、病毒传播、信念极化,以及上面那条新闻隧道,都属于产出放大产出的正反馈;恒温器、捕食者与猎物的平衡、市场价格调节,则属于偏差被纠正的负反馈。

正反馈让可能性越来越集中于少数选项;负反馈让可能性保持多样。健康的系统需要两者平衡。明在道伦理学的核心关切(遮蔽(D6)的正反馈回路)正是在诊断这种失衡:AI推荐强化你的偏见,偏见又强化AI的推荐。缺乏外部负反馈(批判性思维、接触不同观点),系统便趋向极端。遮蔽的本质:正反馈主导,负反馈缺失。数学形式化详见附录B.5,式 (eq:linear-feedback)–(eq:lucidity-feedback)。

(综合):四种模式不只是分类,它们可以合并为一个主方程,描述明度如何随时间演化(附录B.15)。方程中,反馈驱动成长,选择设定上限,梯度调节平衡,耗散对抗维持。一个出人意料的推论:不平衡在数学上等价于自我施加的额外耗散,偏倚的能动者不只是效率低,他在加速自身退化。

四种模式描述了理在世界中动态运作的面貌:理如何在外部世界里运作。但它们也会反身地运作。当能动者(D7)把理的四种模式重新转向理本身,涌现出来的便是数学、逻辑与推理。它们仍是那四种模式,只在认知领域(而非物理领域)中运作,算不得第五种模式。

逻辑是观念空间中的选择。在所有可说陈述的辽阔旷野里,演绎逻辑只留下有效者,而一个证明对结论概率的重塑,恰如环境对种群的重塑:证明之前,猜想可真可假;证明之后,其真成为必然。

推理是观念空间中的反馈。你形成一个假设,以证据检验,修正,再检验。科学方法不过是负反馈的形式化,施加于信念。而当推理出错(确认偏误、动机性推理、意识形态回音室),它的失败方式恰是本章已经诊断过的:正反馈主导,负反馈缺失。封闭在确认偏误里的心灵,与封闭在算法放大里的信息流,是同一种疾病的两张脸。

证明是观念空间中的梯度追踪。一个证明沿逻辑的斜坡从前提滑向结论,靠的是已确立者与待证者之间的「差异」为生;而如同一切梯度利用,解决问题就在消灭梯度。一旦证毕,差距闭合,定理在回望中显得「显然」。这正是数学不可逆地前进的原因:每一个被解决的问题,都抹平了一道再也无法以同样方式滑下的斜坡。

至于数学真理,它抵抗耗散的顽强超过宇宙间的一切。无论熵增到何种地步,\(2+2=4\)依然成立。帝国覆灭,语言消亡,恒星燃尽,勾股定理仍在。数学是理的最高结晶,这也是数学知识能够无损共享(见下文 P-Share)的最深原因:不随时间衰朽者,可以原封不动地传递下去。

(反身性):认知与物理实在运用相同的四种模式,并非巧合;它源于能动者(D7)嵌入道(D1)的结构位置。能动者的认知装置本身就是受耗散、梯度、选择、反馈支配的物理系统,因此它为世界建模时,所用的正是它试图建模的那些模式。理理解理,这是结构上的必然,算不得诗意的修辞。同一种反身性,正是AI能够推理的根本缘由:人工神经网络在硅基而非碳基中实现了选择(反向传播)、反馈(循环)、梯度追踪(优化)与抗耗散(权重持久化)。基质不同,四种模式完全相同。

四种模式因此有两张面孔:外向的面孔(理在自然中的运作)与内向的面孔(能动者通过推理理解理)。但理还有一个静态特征,也许是最引人注目的。

理最醒目的特征,是它可以被共享。一个数学定理,不管出自谁手,一旦证完,就归了所有人。算法能被丝毫不差地复制,知识能被原封不动地传走。AI把这种可共享性推到了极处:模型只训练一次,便可铺向无数台机器。文明尺度上的理解度积累(§XV),根基正在这里:因为可共享,知识才得以越过一个个体、一代又一代,层层叠高。

但可共享性有边界。对理的理解(那个「啊哈!」时刻)无法传递。你可以传递证明的每一步,却传递不了理解证明时的体验。教育因此不能被简化为内容投递:内容可以传递,体验必须在活的能动者心中被唤起。这也是文明积累理解度时须警惕的陷阱:信息堆积不等于理解增长(§XV.2)。反面同样成立:一个文明可以拥有没有任何个体完全把握的集体智慧,法律传统、科学范式、代际实践中结晶的洞见(CV-Irr.2)。

命题 (P-Share) P-Share · 理的可共享性与界限

理的内容可以无损传递,但对理的理解(把握结构的那个「啊哈!」时刻)不可传递。

理据

论证。 由D3可知,理是道中可被辨认、建模与复现的结构;由D2可知,展开能让同一结构在不同情境中保持形式上的同一。因此,证明、公式、算法等内容可以被复制和传递。可是领悟并不等同于内容本身;它是能动者对结构的现场把握。复制证明只复制了结构,没有复制把握发生的那一刻。故理的内容可共享,而领悟不可交付。

推论 (C-Share.1) C-Share.1

信息的积累不等于理解的增长。

附释

一个数学定理一经证明便属于所有人,一个算法可以被完美复制,这是理的可共享性的具体表现。但教育不只是传输;文明尺度上理解度的增长不等同于清醒的增长。为什么信息爆炸的时代反而可能是理解匮乏的时代?AI部署增加的是信息处理能力(理解度),不是理解深度。一个拥有强大AI的文明,理解度维度可能远超历史上任何文明,玄觉度维度却未必更高,甚至更低,因为依赖AI可能侵蚀我们自身的理解能力。这便是§XV中文明清醒度分析的微观基础。

II.4 · 概率:理与玄的交汇处

四种模式,都可以用概率的语言再读一遍,而且读得更深。耗散,是有序状态在可能性空间里被稀释;梯度,是可能性分布的不均匀;选择,是对这一分布的系统性重塑;反馈,则是它的自我强化或自我修正。

但概率同时也揭示了理的边界。不确定性本身有层级5:从已知分布的风险(纯属理),到已知分布集合的模糊(理与玄的边界),再到连分布都未知的深度不确定(玄的领域)。我们最重要的人生决定,几乎都在后两层。

概率分布的形状可以被完美地数学描述。这属于理。

没有任何理论能回答这个问题:「为什么宇宙呈现为概率性的,而不是确定性的?」这属于玄。图9标出了这个精确的交汇点。

再深一层:每一次具体的概率实现(这个电子出现在这里,而没有出现在那里)也属于玄。概率分布能告诉你所有可能的结果及其概率,却无法告诉你「为什么是这个结果」。

你的生命也是如此。你出生的概率(特定精子遇到特定卵子)低到天文数字级别。「你」的存在几乎是不可能的。但你在这里。理可以计算这个概率;玄沉默地承接这个事实。

概率是理与玄的精确交汇点,概率的结构属于理,概率的存在属于玄。 这是一项哲学承诺,不能当作数学证明。彻底的物理主义者可以自洽地将具体实现归类为理所治理的事件,只是它超出了有限预测能力。明在道将其归类为玄,理由在§III.3中展开,该节会明确审视这一承诺的认识论地位。

甚至连概率论自身的公理体系也显出这条边界。1933年,安德烈·柯尔莫哥洛夫(Andrey Kolmogorov,1903–1987)在《概率论基础》(Grundbegriffe der Wahrscheinlichkeitsrechnung)中用非负性、归一性、可数可加性规定概率如何运算,却对概率是什么保持沉默:它既不说概率是频率,也不说是信念度,也不说是物理倾向。这一沉默不是理论的缺陷;它是玄在理最精密工具内部的显现。详见附录B.1。理的最精密工具,在最核心处,指向了理之外。

图9. 一条水平渐变带,从左侧的理过渡到右侧的玄。概率恰好居于中点:它的数学结构属于理,而它本身的存在( 「为何宇宙是概率性的」 )属于玄。最左端标示理所能描述的部分(分布的形状),最右端标示任何理论都无法回答的部分。
图9. 一条水平渐变带,从左侧的理过渡到右侧的玄。概率恰好居于中点:它的数学结构属于理,而它本身的存在( 「为何宇宙是概率性的」 )属于玄。最左端标示理所能描述的部分(分布的形状),最右端标示任何理论都无法回答的部分。

形式结构依赖图

图10展示本章所有形式结构的逻辑依赖关系。箭头方向为\(A \to B\)表示「\(A\)依赖于\(B\)」(\(B\)\(A\)的推导前提)。同一层级的结构水平排列。灰色节点为第一章定义的结构,本章继承使用。

图10. 本章的一条命题(P-Share,理的可共享性)及其推论(信息\(\neq\)理解)追溯到两条继承定义:D3(理)与D2(展开)。虚线框是从第一章继承的定义;图示表明本章仅新增一条形式承诺,且该承诺仅依赖于先前确立的基础。
图10. 本章的一条命题(P-Share,理的可共享性)及其推论(信息\(\neq\)理解)追溯到两条继承定义:D3(理)与D2(展开)。虚线框是从第一章继承的定义;图示表明本章仅新增一条形式承诺,且该承诺仅依赖于先前确立的基础。

小结

理不止是静态秩序;它是通过四种基本模式(耗散、梯度、选择、反馈)展开的动态结构。四种模式共同构成可理解性的完整面貌,并且都能用概率语言统一表达。概率正是理与玄的精确交汇点:结构属于理,存在属于玄。下一章从玄的方向出发,揭示理之外那不可言说的深度。

叩问

  1. 理(道之可理解的秩序面)展开为四种基本模式:耗散(有序流向无序)、梯度(顺差异前进)、选择(在可能性间抉择)、反馈(闭合循环)。哪一种最主导你当前的思维方式?它是否也在遮蔽其他三种?

  2. P-Share(领悟不可传递命题)说内容(信息、命题、公式)可以传递,但领悟(亲身的明白)不可传递。回忆一次你「懂了」的时刻:那个领悟能被教给另一个人吗?如果不能,它的价值在哪里?

  3. 理的四种模式既是外部世界的结构,也是认知的结构(逻辑、推理、证明、数学)。这种对称是巧合,还是有限能动者(D7:在道中展开的有限存在者)嵌入道中的结构性后果?

  4. 贝尔定理表明不确定性远非无知的空白;它呈现实在自身的形状。如果概率分布才是最深层的理解,这如何改变你对「确定性」的期待?

  5. 反馈循环(正反馈放大、负反馈稳定)在你的日常生活中如何运作?识别一个你当前正处于其中的正反馈循环:它在放大什么?

  6. 本章说概率是理(可理解的秩序)与玄(不可言说的深度)的精确交汇点:结构属于理,存在属于玄。你能用一个日常经验来说明这个交汇吗?

  7. 梯度(差异之坡度)驱动一切运动,但使用梯度会消灭梯度(威尼斯的商业衰落即一例)。你的生活中有哪些正在被消耗的梯度?

Heisenberg, Werner. 1927. “Über Den Anschaulichen Inhalt Der Quantentheoretischen Kinematik Und Mechanik.” Zeitschrift Für Physik 43 (3–4): 172–98.
Laplace, Pierre-Simon. 1814. Essai Philosophique Sur Les Probabilités. Courcier.
Schrödinger, Erwin. 1944. What Is Life? The Physical Aspect of the Living Cell. Cambridge University Press.

  1. 皮埃尔-西蒙·拉普拉斯在1814年的《概率的哲学随笔》(Laplace 1814)中提出了这一思想实验:一个假想的智能体若知道宇宙中每个粒子的位置和动量,就能推算出整个过去和未来。这个「妖」后来成为机械决定论的象征。量子力学的不确定性原理(海森堡(Heisenberg 1927),1927年)从物理学上否定了拉普拉斯之妖的可能性,原因不在于我们的测量不够精确,而在于粒子在被测量之前并不同时拥有确定的位置和动量。↩︎

  2. 1964年,物理学家约翰·贝尔(John Bell,1928–1990)证明了一条定理:如果量子力学的概率性只是反映了某种隐藏的确定性变量,那么某些可测量的统计关联必须满足一组不等式(贝尔不等式)。此后数十年的实验,从阿兰·阿斯佩(Alain Aspect,1982年)到2022年诺贝尔物理学奖得主的工作,反复证实量子系统违反贝尔不等式。这意味着:量子概率无法被解释为对某个底层确定性世界的无知。宇宙在最基本的层面上确实是概率性的。↩︎

  3. 热力学第二定律(克劳修斯,1850年;玻尔兹曼,1877年):在封闭系统中,熵(无序度)永远不会自发减少。玻尔兹曼给出了统计力学的解释:有序状态在相空间中占据的体积远小于无序状态,系统自然趋向更大的相空间体积,即更无序的状态。薛定谔在《生命是什么?》(Schrödinger 1944)(1944年)中指出,生命的本质就是从环境中持续吸收「负熵」来维持自身有序结构。↩︎

  4. 贝叶斯定理(托马斯·贝叶斯,1763年遗作发表):\(P(H|E) = P(E|H) \cdot P(H) / P(E)\)。这个看似简单的公式描述了如何在获得新证据\(E\)之后更新对假设\(H\)的信念。达尔文的自然选择(1859年)可以被理解为贝叶斯更新的自然实现:环境是「证据」,适应度是「似然」,种群频率是「后验概率」。↩︎

  5. 经济学家弗兰克·奈特(Frank Knight,1885–1972)在《风险、不确定性与利润》(1921)中首先区分了「风险」(已知概率分布)与「不确定性」(未知分布)。当代决策理论进一步细分为三层:(1)风险:分布已知,可精确计算,纯属理的领域;(2)模糊:知道可能的分布集合但不知道哪个是对的,处于理与玄的边界;(3)深度不确定(奈特不确定性):连分布的可能集合都未知,进入玄的领域。日常生活中我们面对的大多数重要决定(职业选择、关系承诺、文明走向)都处于第二层或第三层。详见附录B.4。↩︎

这一章对你有帮助吗?