中心极限定理：从高尔顿板到麦克斯韦分布

luyuanhong 发表于 2023-10-6 19:30

中心极限定理：从高尔顿板到麦克斯韦分布

神奇的正态分布源于“加”。

撰文 | 张和持

时隔多年，或许你早就记不得 16 岁那年夏天高中闷热的教室，但可能会记得有一天数学老师说着要给大伙看个稀奇——一块祖传的高尔顿板。尽管班上大多数同学都叫不出它的名字，却也从小到大在科技馆、博物馆见多了，一点都提不起劲儿。老师一本正经地开始讲，这个图形就是正态分布，它有诸多的性质……午后的时光更加昏沉而缓慢地流逝。

不过，这里面蕴含的数学可一点都不无聊，让我们来观察一下高尔顿板的结构。

高尔顿板丨图片来源：维基百科

从最上方的节点往下，是几排交错排列的钉子。从入口扔下的小球撞上一个钉子，就像触网的乒乓球一样，弹向左边和右边的概率相等。咦？这不就是老早学过的杨辉三角吗？最上方只有一种可能，下降之后，左右两边比例变成 1:1 ，继续这个步骤，第 n 行的比例系数其实就是 n 次二项式的展开系数 C(n,k) 。正因如此，这种分布被称为二项分布。

杨辉三角/图片来源：维基百科

二项式系数看起来与正态分布风马牛不相及，但是从高尔顿板的实验看来，要是增加钉子的层数和底部的格子数（也就是增加 n ），那么二项分布将逼近于正态分布：

二项分布逼近正态分布的过程丨图片来源：维基百科

为什么一个离散的分布会跟一个连续的分布扯上关系呢？这个结论最早由法国数学家棣莫弗在 1738 年证明，他发现，如果不断地抛一枚硬币，那么得到的正面次数服从二项分布，只要抛得次数够多，那最终将逼近正态分布。也就是说，假如赌博胜和负的概率是对半分的，那么赌博 n 次的盈亏最终就是上面这个分布。

棣莫弗（Abraham de Moivre 1667-1754）丨图片来源：维基百科

不过这一结论在当时并没有引起重视，毕竟并不是所有赌徒都能像梅雷一样交上帕斯卡这样的朋友。百年之后，拉普拉斯试图挽救这个定理的人气，依然没有成功。为了纪念这对“难兄难弟”，现在人们把这个定理称为棣莫弗-拉普拉斯定理。

这种逼近的本质究竟是什么呢？我们看到，不管是高尔顿板，还是多次赌博，二项分布拆成每一步都是简单的 1:1 概率事件。那么就可以说，二项分布是这样的一步一步“加”起来的。

如果是比 1:1 更复杂的分布，把它们大量加起来是否仍然有类似的性质呢？高斯等人在研究实验物理学时发现，如果对一个物理量进行多次测量，最终的测量误差总是像这样的：

误差演示丨Python 作图

在物理学中，误差来自于无关因素的微小扰动。这些扰动加起来，就是整体的误差。这个整体误差虽然层次不齐，但形状与正态分布还是大致吻合的。从那以后，实验的误差一般都当作是正态分布。为了纪念高斯的贡献，也把正态分布称为高斯分布。

至此，我们已经大概能想象到，正态分布的逼近与这种“加”的性质有关，剩下证明就是数学家的事了。如今，我们把这一系列逼近正态分布的性质称为“中心极限定理”，结论从最初的二项分布，已经扩展到了任意分布（包括同分布和不同分布）的广阔天地。就如同上一段中的误差——即便我们对微观下的扰动一无所知，也能通过这种极限形式，了解大样本下的整体行为。

应用这一思想的最为经典的例子当属统计力学。假如有一大堆粒子，每个都杂乱无章地运动，我们自然无从知晓每一个粒子的运动状况。不过，如果把每一个粒子的动量当作是一个随机分布的话，那就可以把所有这些分布“加”起来当做整体的动量。如此一来，中心极限定理岂不是大有用处？

的确如此。如果对理想气体应用中心极限定理，得到的正是大名鼎鼎的麦克斯韦速度分布：

这正是均值为 0 ，方差为 kT/m 的正态分布。结论并不出乎意料，毕竟速度是矢量，并没有明显的方向取向，所以均值是 0 。方差的意义略微复杂一些，就此略过，不过可以直观地理解：对于温度越高，粒子质量越小的气体，其速度就越不稳定。

要想得到速率（速度大小）的分布，只需要考虑速度分布这个三维空间中的一个球壳就行了。即是说，在上面那个式子基础上乘 4πv^2 。

麦克斯韦速率分布丨图片来源：维基百科

物理学中一般是用玻尔兹曼分布来推导麦克斯韦分布的，但玻尔兹曼分布本身也可以用中心极限定理间接推导出来。之所以说是间接，只需要看它的形式

这根本不是正态分布。归根结底，能量的分布在这里不能相加，但在推导过程中，还是能见到正态分布。具体操作会稍微复杂一些，这里就不扯远了。

参考资料

A. I. Khinchin, Mathematical Foundations of Statistical Mechanics

原创张和持返朴 2020-11-05 08:00

页: [1]

数学中国's Archiver

中心极限定理：从高尔顿板到麦克斯韦分布