神奇的周期三：一个发表在大众杂志上的数学定理

luyuanhong 发表于 2023-5-28 00:45

神奇的周期三：一个发表在大众杂志上的数学定理

1975 年 12 月期的《美国数学月刊》（The American Mathematical Monthly）发表的一篇文章 Period three implies chaos（《周期三则意味着混沌》），在数学上第一次创造了混沌一词，引领了科学界和数学界探索自然演化和函数迭代过程中那些展现出未来不可预测性的新浪潮。该文不仅是从科学领域中提炼出数学洞见的典范之作，而且还以丰富的内涵反哺自然科学和工程技术。

撰文 | 丁玖（美国南密西西比大学数学系教授）

1

我在上一篇《返朴》文章《气象学家与数学家的混沌接力》中讲到，是“混沌之父” 爱德华·洛伦茨揭示出天气变化具有内在“蝴蝶效应”混沌本质的那篇重磅论文《确定性的非周期流》，催生出“李-约克混沌”的数学概念。然而他们据此而写成的文章初稿却差点与《美国数学月刊》（下称“《月刊》”）失之交臂。

李-约克定理被老师提出、学生证明后，文章真的按照李天岩的 “玩笑式建议”投给了《月刊》。为什么这么漂亮的一个数学定理加上一个新定义的数学名词“混沌”要投给一个数学上的“大众杂志”呢？约克自有打算，他深知这个来源于自然科学却反过来又能为自然科学提供广泛服务的数学定理将给科学界传递一个极其重要的信息：确定性的世界中也会隐藏着随机性，所以他想让尽可能多的人了解并领会这个观念。众所周知，越是高深专门的学术期刊，读者人数越是稀少，约克决心要让天下的人都知道他和李天岩关于函数迭代的绝妙想法和惊人结果。《月刊》是全世界读者人数最多的数学期刊，于是约克将希望传播混沌之数学刻画的目光投向了它。

然而，投稿结果却遭遇了滑铁卢，并且之后的故事甚至颇具戏剧性。文章投出去不久就被编辑退回，理由是该文写得过于研究性，不太适合一般读者，尤其是作为主要读者群的大学生。因此编辑建议作者转投研究型专业杂志。或许编辑还是看到了此文数学内容的独具魅力之处，在拒稿信的末尾又加写了一句话：倘若把文章改写到一般学生都能读懂的地步，可以再投回《月刊》考虑。由于这句并非“多余的话”，最后的结局让这份杂志与读者一样也获益甚多：我的韩国裔师兄李弘九教授五年前曾告诉我，李-约克论文在明年将庆祝创刊 130 周年的《美国数学月刊》历史上被引用次数排名第二高；根据“谷歌学术”上的记录，它已被引用了超过 5670 次，这对通常而言引用次数远非生命科学和工程技术等应用学科对手的数学文章而言，是极为罕见的。

但是，当时的李天岩实在太忙。他一生中最显赫的三项数学贡献都是在那两三年做出来的，除了这项“周期三”的工作已写出文章外，他还在继续从事微分方程方面的研究，同时又在自己选修的一门研究生课程《非线性方程组数值解》中获得灵感而穿梭于大学的计算中心和公寓之间，埋首于通过数值逼近构造性证明布劳威尔不动点定理，即将开辟出求解非线性方程组的“现代同伦延拓法”这一崭新的疆场。他既没有工夫修改这篇文章，也不知道怎么改它。由于没有新的应用论题的激励，约克教授一时也缺乏动力按编辑的建议行事，于是乎，这篇文章就被他们放在一旁束之高阁了将近一年。

上天终于赐给他们一个修改文章的契机。1974 年是马里兰大学数学系“情系”生物数学的“特殊年”。这一年里的每个礼拜都有“生物数学”领域里的优秀学者来这里演讲。在五月份的第一个星期，普林斯顿大学冠名为“1977 届”的动物学讲座教授罗伯特·梅被请来演讲一周。在星期五的报告中，梅教授专门讲述了他在种群动力学中迭代那个逻辑斯蒂映射后的种种发现：在繁殖率参数 μ 由 3 变到 4 的过程中，函数迭代点数列之最终性态令人眼花缭乱地愈变愈复杂。他对这一现象深感困惑，难以合理解释，觉得或许是因为计算误差从中作怪。听完梅博士的报告后，约克在送他去往飞机场的途中，把自己和李天岩被冷淡了将近一年的那篇文章递给他看。对方一读到文章中得出的“周期三则乱七八糟”结论后，大为吃惊，马上认定此定理大大解释了他的疑问。（参见《一名生态学家的数学探索》）

约克从梅那里获得了修改文章的动力，他送客归来后立刻跑到李天岩的办公室大叫：“我们应该马上改写这篇文章！”文章在两个星期内以更阐述性的写作方式修改完毕，重新投回《月刊》，三个月后被编辑接受，并最终刊登在第八十二卷第十期上，页码为 985-992 ，仅仅八页长。

《美国数学月刊》1975 年 12 月期

梅幸运地成了李-约克定理的第一个受惠人，所以也理所当然地充当了志愿宣传员的角色。同年夏天他去欧洲讲演时，到处传播李-约克定理，“李-约克混沌”的概念很快四处散开，也让概念的两位提出者声名远播。一篇并非刊登在顶尖数学期刊，而是发表在面向广大读者的阐述性数学杂志上的文章，成了掀起数学界、科学界及工程界对混沌动力系统理论和应用研究新热潮的开路先锋之作。

2

然而，新一波的戏剧性故事出现了。1975 年，还在论文正式问世前，约克参加了在东德柏林举办的第七届国际非线性振荡会议，当他做完关于“李-约克定理”的报告后，便和会议代表一道走上一条游艇集体观赏沿河美景，一个生于乌克兰加盟共和国的苏联参会者发现他近在咫尺，便走了过去想与之交谈，目的是告知对方自己十年前证明的一个定理。但这两个人一个不会俄语，一个英文不佳，让他们难以沟通。于是性急的乌克兰数学家找来一位波兰同行，但波兰人只通法语，最后乌克兰人又找到一个懂英文的法国人加入翻译团队，经过至少三种联合国通用语言俄语、法语和英语的接力棒口译，约克终于听懂对方在向他宣称早已证明了关于周期点模式的更广结果。然而，为了保护神圣的知识产权，此人拒绝提供关于此更多的细节，只说他回国后会寄上论文。四个月以后，约克收到了那篇论文的复印件。果然如此，论文的结果非常漂亮，较李-约克定理中关于周期点的结论(i)更为一般。（参见《周期模式的发现者——纪念乌克兰数学家沙可夫斯基》）

这位讲俄语的数学家就是沙可夫斯基（Oleksandr Mykolayovych Sharkovsky，1936-2022），乌克兰基辅人，于 1964 年在祖国的《乌克兰数学杂志》（Ukrainian Mathematical Journal）第十六卷中刊登了一篇俄语论文，其标题的中文翻译是“实数轴上到自身的连续映射循环之共存性”。在文章中他历史上第一次对所有的自然数给出了如下的排序，现称为沙可夫斯基序列：

3, 5, 7, 9, 11, 13, 15, 17, … ,即除 1 以外的所有奇数；

2^n×3, 2^n×5, 2^n×7, 2^n×9, … ,n = 1, 2, 3, …,即 2n 乘以第一行的每一个数；

…, 2^5,2^4,2^3,2^2,2^1,2^0，即由大到小排列 2 的所有次方。

然后他证明了如下的结果：

沙可夫斯基定理如果将实数轴映到自身的一个连续函数有周期为 m 的周期点，则对在沙可夫斯基序列中排在 m 后面的任一个自然数 n，该函数也有周期为 n 的周期点。

由于在沙可夫斯基序列中，3 是排在首位的自然数，故上述定理的一个特别推论是：如果将实数轴映到自身的一个连续函数有周期为 3 的周期点，则对任一个自然数 n ，该函数也有周期为 n 的周期点。这恰恰是李-约克定理的结论 (i) 。然而，沙可夫斯基的定理就到此为止了，它没有关于在该函数迭代过程中任何不规则行为的结论，而这个根本性的结论出现在李-约克定理的结论 (ii) 和 (iii) 中！

更进一步，真正的李-约克定理并非是几乎所有知道李-约克论文标题或听说过“李-约克混沌故事”却没有读过原始论文的人们或许以为的“若周期三点存在，则结论如何如何”的那个形式，而是其假设条件更广、应用价值更大的一颗数学蓝宝石。在李天岩与约克的论文《周期三则意味着混沌》中，定理的假设远比“存在周期三点”更为宽阔：存在一个点 a，使得该点被给定连续函数持续迭代两次后都变大，但在第三次迭代后却跌落到小于或等于 a ，或 a 在该函数接连迭代两次后都变小，但在第三次迭代后却跳升到大于或等于 a 。如用代数不等式表示，就是

而“周期三点存在”这一假设只是满足如上条件的一个特例而已，亦即上面的广义不等号“≤”或“≥”换成等号“=”。这个特殊的情形成就了文章的四个英文单词精炼标题，但却导致了一个小小的副作用，就是让许许多多没有读过文章主体的人误认为定理只对具有周期三点的连续函数成立。

于是，最准确的李-约克混沌定理是如下的命题表述：

3

在打算用浅显语言论证李-约克定理结论 (i) 之前，我先解释一下结论 (ii) 和 (iii) 中出现的三个数学概念：不可数、上极限及下极限。“不可数”的反义词是“可数”。一个集合如果其所有元素的个数与所有自然数的个数一样多，即这些元素可以像自然数那样排成一个无穷序列，则这个集合被称为是可数的。反之，如果一个集合的元素个数比所有的自然数还要多，同时又至少和所有的无理数一样多，那么我们就说这个集合是不可数的。所有的实数全体，即把所有的有理数和所有的无理数放在一起，是不可数的。同样地，任意两个不同实数之间的所有实数也是不可数的。

定理的后两个结论用到了数列的上极限和下极限概念，它们与理工科大学生熟悉的极限概念密切相关，但一般出现在数学系使用的《数学分析》或《高等微积分》教科书里。一个有界的无穷数列可能不收敛，因而它不一定有极限，如正 1 与负 1 交替出现的数列 {(-1)^(n-1)} 。但根据实数理论中有名的定理——波尔查诺-魏尔斯特拉斯定理，有界数列总有收敛的子数列，其中所有收敛子数列极限中的最大值一定存在，这个数称之为给定数列的上极限，同样，所有收敛子数列极限中的最小值也一定存在，称之为所给数列的下极限。因此数列 {(-1)^(n-1)}的上极限为 1 ，而下极限为 -1 。一个数列收敛的充分必要条件是它的上极限等于下极限。

不太熟悉上极限、下极限概念的读者可以这样直观地理解李-约克定理中的结论 (ii) ：在 n 趋向于无穷大的过程中，分别对应于相异初始点 x0 和 y0 的迭代点 fn(x0) 和 fn(y0) 无穷多次地相互靠近，即它们之间的距离数列有个子数列收敛到 0（“彼此吸引”），却又无穷多次地相互离开，即它们之间的距离数列有个子数列收敛到一个大于 0 的数（“彼此排斥”）。李-约克定理说明，存在比所有的自然数还要多的初始点 x0，不仅由它们出发的迭代点数列 {fn(x0)} 不可能收敛，而且它们的最终性态也是不可预测的，其主要特征表现在迭代点轨道对于初始条件的敏感依赖性。

因为定理的结论 (iii) 中的 p 代表了所有的周期点，这也隐含 A 中没有周期点。结论 (iii) 本质上说，距离数列 {|fn(x0) – fn(p)|} 不可能趋向于 0 。因为 {fn(p)} 是一条周期轨道，这就意味着非周期轨道 {fn(x0)} 不是渐近周期的，即它不能趋向于任一条周期轨道。周期轨道的最终性态是可以预测的，而从 A 中任一点 x0 出发的迭代点轨道的最终走向是不可预测的。

李-约克定理中的那个不可数集合 A 也常被称为一个“乱序集”，这里的“乱序”是英文过去分词 scrambled 的翻译。一对点 x 和 y 被叫作乱序，如果将给定的函数重复应用于这对点，它们会靠得更近，然后分开，然后靠得更近，然后分开，等等，从而使它们可以任意地相互靠近，但又不可能永远靠得很近。人生中这样的经历很多，比如经常吵架的夫妻好起来的时候可以“亲密无间”，但一旦因小事导致彼此怒目而视就可能离得远远的。这和炒鸡蛋是类似的现象，因此英语词组 scrambled eggs 的中文翻译是“炒鸡蛋”。常在家中厨房里大炒鸡蛋的动力系统学者可能最善于吸取李-约克混沌的精髓！如果一个集合的任意两个不同的点都是乱序的，则称该集合是乱序的。这样，李-约克定理结论的第二部分可以简写为“存在定义域内一个不可数的乱序集。”

现在，我开始证明定理的结论 (i) ，但先证明其中 n = 1 的特殊情形，让读者热一热身后慢慢进入角色。然后我们考虑一般的情形，但如同李天岩教授所倡导并于 2017 年他一生中最后一次亲手实践的那样，我不对大于 1 的任意自然数 n 求证，而只对 n = 4 证之，因为思想的火花全在这里闪烁。记 b = f(a) ，c = f(b) 及 d = f(c) 。我只证明：若 d ≤ a < b < c ，则 f 具有一个周期为 4 的周期点。希望好学的读者读完证明后，用类似的方法补证：若 d ≥ a > b > c ，则同样的断言也对。

证明的基础是初等微积分里关于连续函数的“介值定理”；约克教授已在《返朴》文章《一个考分总拿 C 的学生是如何成为著名数学家的？》给出了该定理的证明。没有学过它的人也会懂得它的几何意义：定义在闭区间上的一个连续函数的图象，如果其两端点各在 x-轴的一边，则它一定穿过 x-轴。翻译成代数语言，就是：如果闭区间上的连续函数 f 满足 f(a)f(b) < 0 ，则 f 在开区间 (a, b) 内一定有零点。这条性质有一重要的推论：连续函数将定义域中的区间映成区间。换言之，设 I 是连续函数 f 定义域的一个子区间，则它在 f 下的像 f(I) = {f(x): x∈I} 也是一个区间。这里数学符号“∈”表示“属于”，即它左边的 x 是它右边 I 的一个元素。区间具有“连通性”：如果一个区间包含两点 u < v ，则它包含闭区间。这个性质将会像变魔术一般地在后面李-约克定理的证明中多次被玩。

介值定理的另一个推论是著名的布劳威尔不动点定理在一维情形时的特例：若定义在上的连续函数 f 的值域 f() 包含在内，则 f 在中有不动点。要证明它，定义连续函数 g(x) = f(x) – x 。显然 g(a) = f(a) – a ≥ 0 及 g(b) = f(b) – b ≤ 0 。若 a 或 b 是 f 的不动点，则推论得证，否则的话，必有 g(a)g(b) < 0 ，故由介值定理，开区间 (a, b) 内某个 p 是 g 的零点，它就是 f 的不动点。

上面众所周知的不动点定理在这里用不上，于是，博士生李天岩为了完成导师的光荣任务，用介值定理又造出一个不动点定理：若定义在上的连续函数 f 的值域 f() 包含，则 f 在中有不动点。下面我来证明这个“李天岩不动点定理”：

由假设，闭区间是值域区间 f() 的子集，故数 a 和 b 都在 f() 中，因而存在中的两个数 α 和 β ，使得 a = f(α) 及 b = f(β) 。既然 α 和 β 属于，就有如下的小于或等于关系：a ≤ α ≤ b 及 a ≤ β ≤ b 。定义连续函数 g(x) = f(x) – x ，则

g(α) = f(α) - α = a – α ≤ 0 ， g(β) = f(β) - β = b – β ≥ 0 。

这样，介值定理保证在 α 和 β 之间有 f 的不动点（可能为 α 或 β ）。因为以 α 和 β 为两端点的闭区间 [α, β] 或 [β, α] 是的子区间，这个不动点属于。证毕。

李天岩只需想出最后一个“引理”就可以证明“约克猜想”为真了。它是：设 f 是闭区间 I 上的连续函数且包含在值域 f(I) 之中，则 I 包含一个闭区间 J 使得 f(J) = 。这里我称它为“李天岩引理”，它在后面关于李-约克定理结论 (i) 内 n = 4 时的证明中要被用到三次，而对一般 n 的情形证明时则要用 n-1 次，所以必须要证出它：

因为 f(I) 包含，所以存在 I 中的两点 α 和 β 使得 f(α) = a 及 f(β) = b 。设 α < β 。令 r 为 [α, β] 中所有满足等式 f(r) = a 的 r 中最靠近 β 的那个。它存在的理由是：如果只有有限个等式 f(r) = a ，那么最靠近 β 的那个 r 一定存在（这和命题“有限个实数中有最大数”是同一个道理），如果有无穷多个这样的等式，则需要更高深一点的论据了：存在单调递增数列 {rn} 一步步向 β 挺进且满足 f(rn) = a ，由单调收敛定理知 {rn} 收敛到极限 r ，因为 f 是连续函数，在恒等式 f(rn) ≡ a 中取 n 趋于无穷大时的极限，就有 f(r) = a ，这个 r 最靠近 β 。然后，出于同样的理由，在 r 和 β 之间满足 f(s) = b 的所有 s 中取最靠近 r 的那个。令 J = ，则 f(J) = 。读者可用类似的论据对第二种情形 α > β 写下证明。证毕。

4

看懂如上数学推导过程的读者一定会佩服逻辑推理的处处严密之妙。坚持求证精神，养成质疑习惯，能极大地保护我们不被当今网络世界中的不实信息迷惑，因为逻辑的力量是强大的。这也是为何我写作数学科普文章时不只满足于讲讲故事，而是设法引导读者思考、推理。

上面对于 n = 4 的证明思想对于一般 n 情形的李-约克定理结论 (i) 之证明别无二样。此外结论 (ii) 和 (iii) 的证明思路依然出自上面，不过其演算过程更为繁复，我也不想多花读者的时间了，感兴趣者可以阅读李-约克原始论文的附录 2 。

有趣的是，李-约克定理中的条件无论是“深受束缚”的“周期三点存在”还是“放任自由”的“不等式假设”，定理的证明完全一样，但后者更广的条件就将“李-约克定理关于周期-n 点的存在性结论是沙可夫斯基定理的特例”这一非真判断扫进了垃圾堆。某些关于离散动力系统的教科书在讲到周期点时只提沙可夫斯基定理，不提李-约克定理，作者或许就中了这个论断的毒。

十一年前，当我撰写科普著作《智者的困惑——混沌分形漫谈》时，曾与李天岩教授通信请教几个历史事件的来龙去脉。他在给我的一封信件中这样比较李-约克定理和沙可夫斯基定理：

“我们定理的更一般假设和沙可夫斯基的序列有一个很大的不同，可是这在应用上却有极大的差距。好比说在种群动力学上，种群的第一代和第二代都是在增长，但是在第三代却突然大降，于是乎什么‘鬼现象’都可能发生，但是第三代的种群数要降到和第一代一模一样（意指周期三点存在）恐怕不大可能。从这个角度来看，沙可夫斯基序列也许比较适合放在象牙塔里。”

这里“象牙塔”的意思是为追求数学之美而研究数学，但罔顾其与自然界的深层关系。沙可夫斯基定理确实是离散动力系统这一门现代数学科目中的漂亮结果，但它也折射出一部分数学家的哲学理念。他们为了数学的光荣而做数学，以“数学无用”而自豪。他们当中最著名的代表人物就是上世纪英国杰出的纯粹数学家哈代（Godfrey Harold Hardy，1877-1947）。他在经典随笔《一个数学家的辩白》（A Mathematician's Apology）中称那些在工程技术中应用广泛的微积分是“缺乏美学价值的数学”，在他眼里，最美的数学是没有用途的。然而，正是微积分学中的介值定理，敲出了自然界中“周期三”的外壳紧紧裹住的“拟随机硬核”。

这个表达确定性系统拟随机性的数学名词“混沌”首次被李-约克论文所创建。后人将在周期三的背景下产生的混沌特指为“李-约克混沌”，以别于从 80 年代起离散动力系统教科书中出现的更广泛并且更标准的“混沌”定义。一个常采用的定义如下：函数 f: → 被称为是混沌的，如果它在定义域上具有对初始条件的敏感依赖性，或它在所有的非最终周期点上都具有正的李雅普诺夫指数。这个著名的指数是关于对初始条件敏感依赖性的一个量化。也有一个“强混沌”定义：混沌函数 f: → 被称为是强混沌的，如果它是传递的，并且所有的周期点在定义域中是稠密的。说 f 是“传递的”，意思是任给定义域内的非空开区间 U 和 V ，其中 U 被 f 一次次搬运后的“像序列” f(U), f2(U), f3(U), f4(U), … 不可能都不与 V 相交，换句话说，存在正整数 n ，使得 fn(U) 和 V 有共同的元素。说周期点在定义域中是“稠密的”，意思是定义域中任一点 x 的任意小的一个“开邻域” (x-ε, x+ε) ，都包含 f 的周期点。从这两个数学形容词的解释中就能窥见在强混沌中，迭代过程的有序性态与无序性态纠缠不清的一片混战状况。不过也应当指出，当今并没有“放之四海而皆准”的统一的混沌定义，就如同至今也缺乏“什么是数学”的完美回答一样。

由此看来，对于混沌函数确定性意义下的迭代过程，绝大多数的迭代点轨道未来的走向是不可预测的，呈现出乱七八糟的最终状态，似乎难以遵循普遍规律。然而，我们对此真的是一筹莫展吗？在我们身在其中的自然世界，确定性与随机性是并立于世的两大客观现象；对应地，研究随机现象的数学——概率论，同样在探索混沌迭代的历程中扮演了不凡的角色。这时，一门综合性数学学科——遍历理论——身负重任出征疆场，把混沌这匹野马调教得服服帖帖。

原创丁玖返朴 2023-05-26 09:23 发表于上海

页: [1]

数学中国's Archiver

神奇的周期三：一个发表在大众杂志上的数学定理