Lex Fridman播客:陶哲轩:数学、物理学中最难的问题以及人工智能的未来

这是Lex Fridman播客第472期与陶哲轩(Terence Tao)的访谈文字记录。文字记录中的时间戳是可点击链接,可直接带你跳转到主视频中的相应时间点。请注意,文字记录由人工生成,可能存在错误。以下是一些有用的链接:

目录

以下是对话中大致的“章节”。点击链接可大致跳转到文字记录中的相应部分:

引言

Lex Fridman:

以下是与陶哲轩的对话,陶哲轩被广泛认为是历史上最伟大的数学家之一,常被誉为 “数学界的莫扎特”。他获得过菲尔兹奖和数学突破奖,在数学和物理领域众多方面都做出了开创性的贡献。对我来说,能与他对话是一种莫大的荣幸,原因有很多,其中包括在我们所有的交流过程中,陶哲轩展现出的谦逊和友善。这意义非凡。这里是Lex Fridman 播客。现在,亲爱的朋友们,欢迎陶哲轩。

第一个难题

Lex Fridman:

你遇到的第一个真正有难度的研究级数学问题是什么,有没有哪个问题曾让你踌躇不前?

Terence Tao:

嗯,在本科学习中,你会接触到一些极其困难甚至看似无解的问题,比如黎曼假设、孪生素数猜想。你可以把问题设置得任意困难,这其实不算什么。事实上,甚至存在一些我们已知无法解决的问题。真正有趣的是那些处于我们能轻松解决和毫无希望解决之间边界上的问题,也就是那些现有技术能解决90%,而你只需要攻克剩下10%的问题。我记得在读博的时候,卡基雅问题(Kakeya Problem)就特别吸引我。实际上这个问题已经被解决了。这是我早期研究中投入了大量精力的一个问题。从历史渊源来讲,它源自1918年左右日本数学家挂谷宗一提出的一个小谜题。这个谜题是这样的,假设有一根针在平面上,或者想象成在路上开车之类的场景,你想让它掉头,把针转个方向,但你希望在尽可能小的空间内完成。所以,你想用尽可能小的一块区域来完成转向,而且这根针可以进行无限灵活的操作。你可以想象让它旋转。作为单位长度的针,你可以让它绕中心旋转,这样会形成一个面积为π/4的圆盘。或者你可以像驾校教的那样,通过三点掉头的方式。这样实际所需的面积是π/8,所以比旋转的方式效率更高一点。有一段时间,人们认为这就是最有效的掉头方式了,但贝西科维奇证明了实际上你可以用任意小的面积来让针掉头。比如说0.01,通过一些非常巧妙的来回多次掉头操作,你可以让针掉头,并且在这个过程中它会经过每一个中间方向。

Lex Fridman:

这是在二维平面中吗?

Terence Tao:

这是在二维平面中。所以,我们从二维的角度理解一切。那么,下一个问题是:在三维空间中会发生什么呢?假设哈勃太空望远镜在太空中是一根管子,而你想要观测宇宙中的每一颗恒星,所以你想转动望远镜以对准每一个方向。这里有一个不切实际的设定,假设空间非常宝贵(实际上并非如此),为了转动你的“指针”(即望远镜)以便看到天空中的每一颗恒星,你希望占用尽可能小的空间。那么你需要多小的空间才能做到这一点呢?你可以修改贝西科维奇构造。如果你的望远镜厚度为零,那么你就可以根据需要使用尽可能小的空间。这是对二维构造的一个简单修改。但问题是,如果你的望远镜厚度不为零,只是非常非常薄,有一定厚度δ,作为δ的函数,能够看到每一个方向所需的最小空间是多少呢?

所以,随着增量变小,随着针变得更细,体积应该会下降。但它下降得多快呢?有一种猜想认为,大致说来,它下降得非常、非常缓慢,近乎对数级别的缓慢,经过大量研究后这一点得到了证明。所以,这看起来像是一个谜题。为什么它有趣呢?结果发现,它惊人地与偏微分方程、数论、几何、组合数学中的许多问题相关联。例如,在波的传播中,你向周围泼水,就会产生水波,它们向各个方向传播,但波既表现出粒子特性又表现出波动特性。所以,你会得到所谓的波包,它是一种在空间上高度集中且随时间朝特定方向移动的波。因此,如果你在空间和时间上绘制它,它会占据一个看起来像管子的区域。可能出现的情况是,一开始波非常分散,但在稍后的某个时刻,它会全部聚焦到一个点上。你可以想象往池塘里扔一块小石子,涟漪向外扩散,但如果你把这个场景时间倒转,而且波动方程是时间可逆的,你可以想象涟漪汇聚到一个点上,然后可能会出现巨大的水花,甚至可能出现奇点。所以这是有可能发生的。从几何角度来看,也存在光线,例如,如果这个波代表光,你可以把这个波想象成所有以光速传播的光子的叠加。

它们都沿着这些光线传播,并且都聚焦在这一点上。所以,你可以让一个非常分散的波在空间和时间的某一点聚焦成一个非常集中的波,但随后它又会散焦,再次分开。但如果这个猜想存在负解,这意味着有一种非常有效的方法,可以将指向不同方向的管道集中到一个非常非常狭窄的区域、非常小的空间里。那么你也能够创造出这样的波,一开始……会有一些波的排列方式,它们一开始非常非常分散,但随后会集中起来,而且不仅仅是集中在一个点上,而是在空间和时间上会有很多个集中点。你可以创造出所谓的“爆聚”,在这种情况下,这些波的振幅变得如此之大,以至于支配它们的物理定律不再是波动方程,而是更复杂的非线性方程。

纳维 - 斯托克斯奇点

因此在数学物理学中,我们非常关心某些方程和波动方程是否稳定,它们是否会产生这些奇点。有一个著名的未解难题叫纳维-斯托克斯正则性问题。纳维-斯托克斯方程是描述水等不可压缩流体流动的方程。问题是:如果从水的一个平滑速度场开始,它是否会高度集中,以至于在某一点速度变为无穷大?这就叫做奇点。在现实生活中我们看不到这种情况。如果你在浴缸里玩水,水不会突然爆炸,也不会以光速飞溅而出,但从理论上来说这是有可能的。

事实上,近年来,人们的共识逐渐倾向于这样一种观点,即对于某些非常特殊的初始状态,比如说水的初始状态,奇点是有可能形成的,但人们尚未能真正证实这一点。克雷数学研究所设立了七大千禧年难题,若能解决其中任何一个问题,就能获得100万美元的奖金,而这就是其中之一。在这七个问题中,只有庞加莱猜想(听不清00:07:18)被解决了。所以,挂谷猜想与纳维-斯托克斯方程问题并没有直接关联,但对它的理解将有助于我们理解波的聚焦等方面的问题,这可能会间接地帮助我们更好地理解纳维-斯托克斯方程问题。

Terence Tao:

对,没错。所以说,这确实是个价值百万美元的问题。这就是数学家与其他大多数人的区别所在。如果某件事在99.99%的情况下成立,对大多数事情来说那就足够了。但数学家是极少数真正在意是否100%的情况都涵盖在内的人群之一。所以,大多数流体,大多数时候水不会爆炸,但你能不能设计出一种非常特殊的初始状态来让它爆炸呢?

Lex Fridman:

或许我们应该说,这是一组用于流体动力学领域的方程式,旨在理解流体的行为。实际上,事实证明这是一个非常…… 要对流体进行建模是极其复杂的事情。

Terence Tao:

是的,所以它具有实际重要性。这个克雷奖问题涉及所谓的不可压缩纳维 - 斯托克斯方程,它用于描述诸如水这类物质的运动。还有一种叫做可压缩纳维 - 斯托克斯方程,用于描述像空气这类物质,这对天气预报尤为重要。天气预报运用了大量的计算流体动力学知识。实际上,很多工作就是尽最大努力求解纳维 - 斯托克斯方程。同时还要收集大量数据,以便对方程进行初始化。这里面有很多可变因素,所以从实际角度来说它非常重要。

Lex Fridman:

为什么很难证明关于这组方程的一般性问题,比如它不会失控?

Terence Tao:

简单来说,是麦克斯韦妖。麦克斯韦妖是热力学中的一个概念。假设有一个装有氧气和氮气两种气体的盒子,一开始可能所有氧气在一侧,氮气在另一侧,但它们之间没有屏障。然后它们会混合,并且应该会保持混合状态。没有理由会自行分离。但从理论上讲,由于它们之间的碰撞,可能会出现某种奇特的情况,比如有一个微观的“妖”,即麦克斯韦妖,每次氧原子和氮原子碰撞时,它们会以某种方式弹开,使得氧气慢慢漂移到一侧,氮气则移到另一侧。这样就会出现一种极不可能出现的分布状态,这是我们从未见过的,从统计学角度来说极不可能发生,但从数学角度来讲,这种情况有可能发生,我们不能排除这种可能性。

而这种情况在数学中经常出现。一个基本的例子就是圆周率π的数字3.14159等等。这些数字看起来没有规律,而且我们也认为它们没有规律。从长远来看,你应该看到1、2、3的出现次数和4、5、6的出现次数一样多,圆周率的数字中不应该对某一个数字有所偏好,比如说偏好7而不是8。但也许圆周率的数字中存在某种“恶魔”,每次你计算出越来越多的数字时,它会使某个数字比另一个数字出现得更频繁。这是一种不应该发生的“阴谋”。没有理由会发生这种情况,但以我们目前的技术也无法证明它不会发生。那么,回到纳维-斯托克斯方程,流体具有一定量的能量,并且由于流体在运动,能量会四处传递。

而且水也具有黏性,所以如果能量分散在许多不同的位置,流体的自然黏性就会消耗掉这些能量,使其变为零。这就是我们在对水进行实际实验时所发生的情况。你四处泼水,会产生一些湍流和波浪等等,但最终它会平静下来,振幅越低,速度越小,就会变得越平静。但有可能存在某种 “恶魔”,持续将流体的能量推向越来越小的尺度,这样流体就会流动得越来越快。而在速度更快时,黏性的影响就相对较小。所以有可能会出现一种所谓的自相似团块情景,即流体的能量最初分布在某个大尺度上,然后所有能量都以某种方式转移到流体的一个较小区域,接着以快得多的速度转移到一个更小的区域,依此类推。

每次这样做时,所需时间可能只有上一次的一半左右,然后实际上在有限时间内所有能量就能汇聚到一个点上。这种情况被称为有限时间爆聚。实际上,这种情况不会发生。所以,水具有所谓的湍流特性。的确,如果有一个大的水涡,它往往会分裂成较小的水涡,但不会将所有能量从一个大水涡转移到一个小水涡中。能量可能会转移到三四个小水涡中,然后这些小水涡又各自分裂成三四个更小的水涡。因此,能量会分散到一定程度,使得黏性力能够控制住一切。但如果能以某种方式将所有能量集中起来,并且速度足够快,以至于黏性效应没有足够时间使一切平静下来,那么就可能发生这种爆聚现象。

所以,有些论文声称:“哦,你只需要考虑能量守恒,仔细运用粘性,这样不仅对于纳维 - 斯托克斯方程,对于很多很多类似的方程,你都能掌控一切。” 过去有很多人尝试得到所谓的纳维 - 斯托克斯方程的全局正则性,这与有限时间爆破相反,即速度保持平滑。但都失败了。总是会出现一些符号错误或一些细微的失误,而且无法挽回。

所以,我感兴趣的是尝试解释为什么我们无法证伪有限时间爆破。对于实际的流体方程,我做不到这一点,因为它们太复杂了,但如果我能对纳维 - 斯托克斯运动方程进行平均化处理,基本上就是如果我能关闭水相互作用的某些方式,只保留我想要的那些。所以,具体来说,如果有一种流体,它可以将能量从一个大漩涡转移到这个小漩涡或另一个小漩涡,我会关闭将能量转移到这个小漩涡的能量通道,只让能量流向这个更小的漩涡,同时仍然保持较低层次的能量守恒。

Lex Fridman:

所以,你是想让它爆炸吗?

Terence Tao:

是的,是的。所以,我基本上是通过改变物理规则来制造一场爆炸,这是数学家被允许做的一件事。我们可以改变方程式。

Lex Fridman:

这如何帮助你更接近对某个事物的证明呢?

Terence Tao:

对。所以,它在数学上构成了一种阻碍。所以,我所做的基本上是,如果我关闭方程的某些部分,通常当你关闭某些相互作用时,会使方程的非线性程度降低,使其更规则,更不容易出现爆破解。但我发现,通过关闭一组精心设计的相互作用,我可以迫使所有能量在有限时间内爆聚。所以,这意味着如果你想证明纳维 - 斯托克斯方程实际方程的正则性,你必须使用真实方程的某些特性,而我构造的方程并不满足这些特性。所以,它排除了某些方法。

所以,数学这门学科,并不只是采用一种可行的方法并加以应用,你还得避开那些行不通的方法。对于真正棘手的问题,往往你可能会想到几十种自认为或许能用来解决问题的方法,但只有在积累了大量经验之后,你才会意识到这些方法根本行不通。所以,针对相近的问题找出这些反例,能够排除……这能为你节省大量时间,因为你不会再在那些你现在知道绝不可能有用的方法上白费精力。

Lex Fridman:

它与流体动力学的那个具体问题有多大关联,还是说这是你对数学形成的某种更普遍的直觉?

Terence Tao:

对。是的。所以,我的技术所利用的关键现象被称为超临界性。在偏

听不清00:15:46

方程中,这些方程往往就像不同作用力之间的拔河比赛。以纳维 - 斯托克斯方程为例,其中有由粘性产生的耗散力,这一点我们已经非常了解。它是线性的,会使情况趋于稳定。如果只有粘性力,那么不会出现任何问题,但还有输运现象,即空间中某一位置的能量会因为流体的运动而被输运到其他位置。这是一种非线性效应,会引发各种问题。所以在纳维 - 斯托克斯方程中有这两个相互竞争的项,耗散项和输运项。如果耗散项占主导,数值较大,那么基本上就会有规律性。而如果输运项占主导,那我们就不知道会发生什么了。这是一种高度非线性的情况,不可预测,呈现湍流状态。

所以,有时候这些力在小尺度上是平衡的,但在大尺度上不平衡,反之亦然。纳维 - 斯托克斯方程属于所谓的超临界情况。因此,在越来越小的尺度下,输运项比粘性项强得多。粘性项是使事物趋于平稳的因素。这就是这个问题棘手的原因。在二维空间中,苏联数学家拉杰任斯卡娅在20世纪60年代证明了二维情况下不会出现爆破解。在二维空间中,纳维 - 斯托克斯方程属于所谓的临界情况,即使在非常非常小的尺度下,输运效应和粘性效应的强度大致相同。我们有很多技术来处理临界以及亚临界方程,并证明其正则性。但对于超临界方程,情况就不太明朗了。我做了大量研究,随后也有很多后续研究表明,对于许多其他类型的超临界方程,可以构造出各种各样的爆破解例子。

一旦非线性效应在小尺度上主导了线性效应,就可能会出现各种糟糕的情况。所以,这一系列研究的主要见解之一是,超临界状态与临界状态以及亚临界状态相比,差异巨大。这是一个关键的定性特征,它使得一些方程具有良好的可预测性……比如行星运动,有些方程可以让我们预测数百万年甚至至少数千年后的情况。再者,这其实并非真正的问题所在,但我们之所以无法预测两周以后的天气,是因为描述天气的方程是超临界的。在非常精细的尺度上会发生许多极其奇怪的现象。

Lex Fridman:

所以,每当出现一些巨大的非线性因素时,这会给预测未来走向带来大麻烦吗?

Terence Tao:

是的。而且如果非线性在小尺度上不知为何变得越来越有特点且有趣。有很多方程是非线性的,但在许多方程中,你可以从整体上对事物进行近似处理。比如说,对于行星运动,如果你想了解月球或火星之类的轨道,你并不真的需要知道月球地震学的微观结构,或者质量具体是如何分布的。基本上,你几乎可以把这些行星近似为质点,重要的只是其总体行为。但如果你想对流体进行建模,比如天气,你不能只是说,“在洛杉矶温度是这样,风速是这样”。对于超临界方程,精细尺度的信息真的很重要。

Terence Tao:

对,是的。所以,这源于构建这个会发散的平均方程的工作。在我必须完成这项工作的过程中,有一种简单的方法,就是不断推进。每次得到一个尺度,就尽可能快地立即将其推进到下一个尺度。这算是一种强行引发发散的简单方法。结果发现,在五维及更高维度中,这种方法可行,但在三维空间中,我发现了一个有趣的现象,即如果你改变物理定律,一直试图将能量推向越来越小的尺度,会发生的情况是能量开始同时分散到多个尺度上,所以在一个尺度上有能量。你把它推向了下一个尺度,而一旦它进入那个尺度,你又把它推向再下一个尺度,但前一个尺度仍会剩下一些能量。

你试图一次性完成所有事情,这会过度分散能量。结果是,这使得它很容易受到粘性的影响,实际上会抑制所有的能量。所以,事实证明这种直接的方法实际上并不奏效。其他一些作者发表的另一篇论文在三维空间中证明了这一点。所以,我需要编写一个延迟程序,有点像气闸。所以,我需要一个方程,从流体在一个尺度上的某种运动开始,它会将能量传递到下一个尺度,但能量会在那里停留,直到更大尺度的所有能量都被转移过来。只有在你将所有能量都传递进去之后,才打开下一道门,然后再将能量传递进去。

所以,通过这样做,能量逐步推进,逐尺度地推进,以至于它每次都始终局限在一个尺度上,然后它就能抵抗黏性的影响,因为它没有分散。所以,为了实现这一点,我必须构建一个相当复杂的非线性关系。它基本上……它的构建方式就像一个电子电路。实际上,我为此要感谢我的妻子,因为她是一名训练有素的电气工程师,她谈到自己必须设计电路之类的。如果你想要一个能实现特定功能的电路,比如说有一盏灯闪烁,亮了又灭,灭了又亮。你可以用更基础的元件来构建它,比如电容器、电阻器等等,而且你必须绘制一个电路图。

而对于这些图表,你可以顺着图表看,然后说:“哦,对,电流会在这里增强,然后停下来,接着又会那样。” 所以,我知道如何制作基本电子元件的类似物,比如电阻器、电容器等等。我会把它们以某种方式组合起来,创造出能打开一个门的东西。然后会有一个时钟,当时钟达到某个阈值时,它就会关闭这个门。这会变成一个鲁布·戈德堡式的装置,但能用数学方式描述。结果证明这行得通。所以,我意识到如果你能对实际的方程式做同样的事,也就是说,如果水的方程式支持某种计算…… 所以,你可以想象一种蒸汽朋克风格,但实际上是 “水朋克” 风格的东西,在那里…… 现代计算机是电子的,它们靠电子通过非常细的电线并与其他电子相互作用等来运行。

但你可以想象,这里不是电子,而是以一定速度移动的水脉冲。也许存在两种不同的状态,对应于比特的“1”或“0”。很可能,如果让两个这样移动的水体相互碰撞,它们会产生某种新的状态,类似于“与门”或“或门”,其输出会以一种非常可预测的方式取决于输入。你可以将这些组合起来,也许就能创造出一台图灵机。然后,你就有了完全由水构成的计算机。如果你有了计算机,那么也许就能做机器人技术,比如液压技术等等。所以,你可以创造出某种基本上是流体模拟的机器,也就是所谓的冯·诺依曼机。

所以,冯·诺伊曼提出,如果你想殖民火星,用机器将人类运送到火星的成本高得离谱,但如果你能把一台机器运送到火星,而且这台机器有能力在火星上采矿、制造更多材料、冶炼这些材料并制造出更多相同的机器,那么随着时间推移,你就可以殖民整个星球。所以,如果你能制造一种流体机器,也就是一种流体机器人。它的使命是,按照程序设定,在某种低温状态下制造出一个更小版本的自己。这个小机器人暂时不会启动。一旦准备就绪,由水构成的大型机器人形态会将其所有能量转移到这个较小的形态中,然后关闭。之后,它会自我清理,剩下的这个最新形态就会启动并重复同样的过程,只不过体型更小、速度更快。

然后这个方程具有某种标度对称性。一旦你做到这一点,它就可以不断迭代。所以,原则上,这会给实际的纳维 - 斯托克斯方程带来爆破解。这就是我在这个平均纳维 - 斯托克斯方程上所取得的成果。所以,它为解决这个问题提供了一种路线图。现在,这只是一个空想,因为要让它成为现实还缺少很多东西。所以,我无法制造出这些基本逻辑门。我没有水的这些特殊配置。有一些候选方案,其中包括可能可行的涡环。但与数字计算相比,模拟计算真的很棘手,因为总是存在误差。在这个过程中你必须进行大量的误差校正。

我不知道如何完全关闭那台大型机器,这样它就不会干扰小型机器的运行,但原则上一切皆有可能。这并不与任何物理定律相悖,所以这在某种程度上证明了这件事是可行的。现在还有其他团队在研究如何让纳维 - 斯托克斯方程出现爆破解,他们的方法远没有这个这么复杂得离谱。实际上,他们研究的内容更接近直接自相似模型,这个模型…… 就目前而言还不太有效,但他们可能会想出一些更简单的方案来实现这个目标。

生命游戏

Terence Tao:

所以,这是有先例的。数学的妙处在于,它很擅长发现那些你可能认为完全不同的问题之间的联系,但如果数学形式是相同的,你就能建立起一种关联。所以,之前有很多关于细胞自动机的研究,其中最著名的就是康威生命游戏。有一个无限的离散网格,在任何给定时间,网格要么被一个细胞占据,要么是空的。有一个非常简单的规则来告诉你这些细胞是如何演化的。所以,有时候细胞存活,有时候细胞死亡。我上学的时候,让这些动画运行作为屏保非常流行,它们看起来非常混乱。事实上,有时候它们看起来有点像湍流,但在某个时候,人们在这个生命游戏中发现了越来越多有趣的结构。比如说,他们发现了一种叫做“滑翔机”的东西。

所以,“滑翔机”是一种由四五个“自身”组成的非常小的构型,它会演化并朝着某个方向移动。这就好比那些涡环(此处听不清

00:27:0900:27:09

)。是的,这是一种类比,生命游戏是一个离散方程,而流体的纳维 - 斯托克斯方程是一个连续方程,但从数学角度看,它们有一些相似的特征。随着时间推移,人们发现可以在生命游戏中构建出越来越多有趣的东西。生命游戏是一个非常简单的系统。它只需要三到四条规则就能运行,但你可以在其中设计出各种有趣的构型。有一种叫“滑翔机枪”的东西,它唯一的功能就是一次吐出一个“滑翔机”。经过大量努力,人们成功为“滑翔机”创造出了与门和或门。

有这样一个巨大而荒诞的结构,如果你让一组滑翔机从这里进入,另一组滑翔机从这里进入,那么就可能产生高速滑翔机从这里飞出。也许如果两组都有滑翔机进入,就会有一组输出,但如果只有一组有,那就什么也不会出来。所以,他们可以构建这样的东西。一旦你能构建这些基本的门电路,那么仅从软件工程的角度,你几乎就能构建任何东西。你可以构建一台图灵机。它们是非常庞大的蒸汽朋克风格的东西。它们看起来很荒诞。但后来人们还在《生命游戏》中创造出了自我复制的物体,一个巨大的机器,一台

听不清00:28:31

机器,经过很长时间,它内部看起来总是像滑翔机枪一样,进行着这些非常蒸汽朋克风格的计算。它会创造出自身的另一个版本,这个版本也能进行复制。

Lex Fridman:

这太不可思议了。

Lex Fridman:

这些元胞自动机的局部规则会产生一种涌现现象……也许它和流体有些类似,我不太确定,但大规模运行的局部规则能够创造出这些极其复杂的动态结构。你觉得这其中有哪些是适合进行数学分析的吗?我们有没有工具能就此得出一些深刻的结论呢?

Lex Fridman:

我想知道是否有可能证明……的反面,基本上就是证明只有通过工程学才能创造出有趣的东西。

Terence Tao:

是的。这是数学中一个反复出现的难题,我称之为结构与随机性之间的二分法,即你在数学中能生成的大多数对象都是随机的。它们看起来是随机的,比如数字序列,嗯,我们认为这就是个很好的例子。但具有模式的事物数量非常少。不过现在,你可以通过构造来证明某事物具有某种模式……如果某事物有一个简单的模式,而且你能证明它会时不时地自我重复之类的,你就能做到,并且可以证明……例如,你可以证明大多数数字序列没有模式。所以,如果你只是随机选取数字,有一种叫做低阶大数的概念。它表明从长远来看,你得到的1和2的数量会一样多。但我们用来……的工具要少得多。

如果我给你一个特定的模式,比如圆周率的数字,我如何证明它没有某种奇怪的模式呢?我花了大量时间研究的其他一些工作是证明所谓的结构定理或逆定理,这些定理给出了判断某些事物何时具有高度结构性的测试方法。所以,有些函数被称为加法函数。如果你有一个关于自然数的函数,比如2映射到4,3映射到6,依此类推,有些函数被称为加法函数,这意味着如果你把两个输入相加,输出也会相加。例如,乘以一个常数。如果你将一个数乘以10……如果你将A加B乘以10,这与将A乘以10、B乘以10,然后将它们相加是一样的。所以,有些函数是加法函数,有些函数有点像加法函数,但不完全是加法函数。

比如说,如果我取一个数字,然后乘以2的平方,再取其整数部分。比如10乘以根号2,结果大概是14点多,所以10对应的结果就是14,20对应的结果就是28。在这种情况下,可加性成立,10加10等于20,14加14等于28。但由于这种取整操作,有时会出现舍入误差。有时当你计算A加A时,这个函数给出的结果并非两个单独输出的和,而是和加上或减去1。所以,它近乎可加,但并非完全可加。

所以,数学中有很多有用的结论,我在研究这类问题上花了很多功夫,大意是如果一个函数呈现出这样的某种结构,那么它成立基本上是有原因的。原因在于存在某个与之相近的函数,这个函数实际上具有完整的结构,它解释了你所看到的这种部分模式。所以如果你有这些逆定理,就会产生一种二分法:你所研究的对象要么完全没有结构,要么以某种方式与具有一定结构的事物相关联。无论哪种情况,你都能取得进展。一个很好的例子是数学中有这样一个古老的定理——

无穷大

Terence Tao:

一个很好的例子是,数学中有一个古老的定理,叫做塞迈雷迪定理(Szemerédi’s Theorem),它在20世纪70年代得到证明。该定理旨在寻找一组数字中的某种特定模式,即等差数列模式。比如3、5、7 或者10、15、20这样的数列,恩德雷·塞迈雷迪(Endre Szemerédi)证明了,任何足够大的数字集合,也就是所谓的正密度集合,其中都包含任意长度的等差数列。

例如,奇数的密度为二分之一,且其中包含任意长度的等差数列。所以在这种情况下,这很明显,因为奇数的结构非常规整。我可以取11、13、15、17,我能很容易在这个集合中找到等差数列,但塞迈雷迪定理也适用于随机集合。如果我取一组奇数,然后对每个数抛硬币,只保留抛出正面的数…… 所以我只是抛硬币,随机去掉一半的数,保留一半。这是一个完全没有规律的集合,但仅由于随机波动,在这个集合中你仍然会得到很多等差数列。

Lex Fridman:

你能证明在一个随机的……中存在任意长度的等差数列吗?

Terence Tao:

是的。你听说过无限猴子定理吗?通常,数学家们会给定理取些枯燥的名字,但偶尔也会取些生动有趣的名字。

Lex Fridman:

是的。

所以基本上,这个定理是说,如果你取一个无限长的数字字符串或其他什么,最终你想要的任何有限模式都会出现。这可能需要很长时间,但最终会发生。特别地,任意长度的等差数列最终都会出现,但这需要一个极其长的随机序列才会发生。

Lex Fridman:

我觉得这很直观。它只是无穷而已。

Terence Tao:

是的,无穷能掩盖很多问题。

Lex Fridman:

是啊。我们人类该如何应对无穷大呢?

Terence Tao:

嗯,你可以把无穷大看作是对一个没有界限的有限数的一种抽象。所以现实生活中没有什么是真正无穷无尽的,但你可以问自己一些问题,比如,“如果我有想要的那么多钱会怎样?”,或者,“如果我能随心所欲地快速移动会怎样?”,而数学家将其形式化的一种方式是,数学找到了一种形式体系,将事物理想化,不是让它极其大或极其小,而是让它实际上恰好是无穷大或零,而且当你这样做时,数学往往会变得简洁得多。我的意思是,在物理学中,我们会开玩笑说假设奶牛是球形的,现实世界的问题存在各种各样的现实世界效应,但你可以理想化,将一些东西设为无穷大,将一些东西设为零,这样数学运算就会变得简单得多。

Lex Fridman:

我想知道,使用无穷的概念会在多大程度上使我们偏离现实世界的物理规律。

Terence Tao:

所以存在很多陷阱。因此,我们在本科数学课上花了大量时间教授分析学,而分析学通常涉及如何求极限以及是否……

比如说,A加B永远等于B加A。所以当你只有有限个项并对它们求和时,你可以交换它们的顺序,这不会有问题,但当你有无限个项时,就会出现一些微妙的情况。你可能会遇到这样一个级数,它收敛于某个值,但你重新排列这些项后,它却突然收敛到另一个值,这样就可能出错。当你处理无穷的情况时,你必须清楚自己在做什么。你得引入这些ε和δ,并且有一种特定的推理方式能帮助你避免出错。

近年来,人们开始采用在无限极限下成立的结果,并对其进行所谓的有限化处理。所以你知道某件事最终会是真的,但你不知道何时会成真。现在给我一个比率。比如说…… 如果我没有无穷多只猴子,而是有数量庞大但有限的猴子,那么我要等多久才能等到《哈姆雷特》问世呢?这是一个更具量化性质的问题,而这类问题你可以通过纯有限方法来解决,并且可以运用你的有限直觉。在这种情况下,结果表明等待时间与你试图生成的文本长度呈指数关系。

所以这就是为什么你永远看不到猴子创作出《哈姆雷特》。你可能会看到它们拼凑出一个四个字母的单词,但绝不是那么长篇的作品。所以我个人觉得,一旦你把一个无限的陈述限定范围,它就会变得直观得多,也不再那么奇怪了。

Lex Fridman:

所以,即使你在研究无穷的概念,将其有限化以便获得一些直观认识,也是有益的,对吗?

Terence Tao:

是的,不利之处在于有限化的群要复杂得多。所以通常先找到无限群,要早几十年,然后人们才对其进行有限化。

数学与物理学

Lex Fridman:

既然我们提到了很多数学和物理知识,那么作为学科,作为理解世界、看待世界的方式,数学和物理之间的区别是什么呢?或许我们也可以把工程学纳入讨论,你提到过你的妻子是一名工程师,她在电路方面有新的见解。鉴于你研究过数学物理,涉足过各个领域,那么这种看待世界的不同方式是怎样的呢?

Terence Tao:

对。所以我认为一般来说,科学是三件事之间的相互作用。一是现实世界,二是我们对现实世界的观察,即观测结果,三是我们关于世界运行方式的心智模型。

我们无法直接接触现实。我们所拥有的只有观测结果,而这些观测结果既不完整又存在误差。而且在很多很多情况下,我们想知道,比如明天的天气如何,但我们还没有相关观测数据,可我们又很想知道。这就需要预测。

然后我们有这些简化模型,有时会做出不切实际的假设,比如 “球形奶牛” 这类东西。这些就是数学模型。

数学关注的是模型。科学收集观测结果,并提出可能解释这些观测结果的模型。而数学所做的是,我们在模型内部进行研究,我们探究该模型会产生什么结果?该模型对未来的观测或者过去的观测会做出什么样的预测?它是否合适?是否与数据相符?

所以这绝对是一种共生关系。我想数学在其他学科中很不寻常的一点在于,我们从假设出发,比如一个模型的公理,然后探究从这个模型能得出什么结论。而在几乎任何其他学科中,人们都是从结论出发。“我想做这件事。我想建一座桥,我想赚钱,我想做这个”,然后再去寻找达成目标的途径。很少有人会去推测 “假设我这么做了,会发生什么?”。规划和建模。也许科幻小说算是另一个(有这种思维方式的)领域,但实际上也就仅此而已。我们生活中做的大多数事情都是结果驱动的,包括物理学和其他科学领域。我的意思是,他们想知道 “这颗小行星会飞向哪里?明天天气会怎样?”,但数学还有从公理出发的另一个方向。

Lex Fridman:

你怎么看……物理学中理论与实验之间存在着这种张力。你认为发现关于现实的真正新颖想法的更有力方式是什么?

Terence Tao:

嗯,你需要自上而下和自下而上这两种方式。实际上这是所有这些因素之间的一种相互作用……所以随着时间推移,观察、理论以及建模都应该更接近现实,但一开始,情况总是如此,它们一开始总是相差甚远,但你需要借助一方来弄清楚该往哪个方向推动另一方。

所以,如果你的模型预测出了实验未预测到的异常情况,这就会告诉实验人员去哪里寻找更多数据来优化模型。如此循环往复。

在数学领域本身,也存在理论和实验两个部分。只是直到最近,理论几乎完全占据主导地位。99% 的数学内容属于理论数学,而实验数学的占比极少。不过确实有人在做实验数学。如果他们想研究质数或其他什么,他们可以生成大量数据集。

所以,一旦我们有了计算机,就必须稍微做些尝试。尽管甚至在……嗯,比如高斯,他发现了一个重新猜想,这是数论中最基本的定理,叫做素数定理,它可以预测到一百万、一万亿以内有多少个素数。这可不是个显而易见的问题,基本上他所做的是,大部分靠自己计算,但也雇了些计算员,也就是那些以做算术为职业的人,去计算前十万个左右的素数,然后制作表格并做出预测。这是实验数学的一个早期例子,但直到最近,它还不是……

我的意思是,理论数学取得的成果要多得多。当然,直到最近,进行复杂的数学计算才变得可行,即便在如今,虽然我们有强大的计算机,但也只有部分数学问题能够通过数值方法进行探索。

有一种现象叫做组合爆炸。比如说,如果你想让我们研究塞迈雷迪定理(Szemerédi’s theorem),你就得研究从1到1000所有可能的数字子集。毕竟只有1000个数字,能有多难呢?但事实证明,1到1000的不同子集数量是2的1000次方,这远远超出了目前任何计算机的枚举能力。

所以,有些数学问题如果直接用暴力计算的方式来解决,很快就会变得难以处理。国际象棋是另一个著名的例子。棋盘上可能出现的局面数量众多,我们无法让计算机全面探索,但现在我们有了人工智能,有了探索这个空间的工具,虽然不能保证百分百成功,但可以通过实验来进行。所以我们现在可以凭经验解决国际象棋相关问题。例如,我们有非常非常优秀的人工智能,它们不会探索博弈树中的每一个局面,但它们找到了一些很好的近似解法,人们实际上正在使用这些国际象棋引擎来进行实验性的棋局分析。他们重新审视古老的国际象棋理论,比如“哦,当你采用这种开局……这是一步好棋,这步棋不好”,他们可以利用这些国际象棋引擎来完善这些理论,在某些情况下,甚至推翻关于国际象棋的传统认知。我真心希望未来数学领域能有更多实验性的内容,或许可以由人工智能来推动。

Lex Fridman:

当然,我们会谈到这一点,但以国际象棋为例,数学中也有类似的情况,我认为它并没有对不同局面给出一种形式化的解释。它只是在说,作为人类凭直觉就能判断哪个局面更好,然后基于此,我们人类可以构建出关于这个问题的理论。

现实的本质

你提到了柏拉图的洞穴寓言。以防有人不知道,这个寓言讲的是人们观察到的是现实的影子,而非现实本身,而他们却认为自己观察到的就是现实。从某种意义上说,数学家,或许还有所有人,都是在观察现实的影子吗?我们有可能真正触及现实吗?

Terence Tao:

嗯,存在这三种本体论层面的事物。有客观现实、观测结果以及我们构建的模型,严格来说,它们是不同的,而且我认为它们永远都会有所不同,但随着时间推移,它们可以相互靠近,而这种靠近的过程往往意味着你必须摒弃最初的直觉。天文学就提供了很好的例子,比如最初对世界的模型认知是它是平的,因为它看起来是平的,而且面积很大,而宇宙的其他部分,天空,并非如此。例如,太阳看起来真的很小。

所以你从一个模型开始,这个模型实际上与现实相差甚远,但它与你已有的观测结果相符。所以一切看起来都不错,但随着时间推移,当你进行越来越多的观测,让模型更贴近现实时,模型也会随之调整。所以随着时间推移,我们不得不认识到地球是圆的,它在自转,它围绕太阳系运转,太阳系围绕银河系运转,诸如此类,而且宇宙在膨胀。宇宙的膨胀是自我膨胀且不断加速的,事实上,就在今年…… 所以,甚至宇宙本身的加速,现在的证据表明它也不是恒定的。

Lex Fridman:

其背后的原因在于……

Terence Tao:

它正在跟上。

Lex Fridman:

它正在跟上。我的意思是,仍然是暗物质、暗能量这类东西。

Terence Tao:

我们有一个模型,它能够解释现象,并且与数据拟合得非常好。它只需要你指定几个参数。所以人们会说:“哦,那是人为调整的因素。有了足够多的人为调整因素,你就能解释任何事情。” 但这个模型在数学层面的意义在于,你希望模型中的参数更少,而观测集中的数据点更多。

所以如果你有一个包含10个参数的模型来解释10个观测结果,那这是一个完全没用的模型,这就是所谓的过拟合。但如果你有一个只有两个参数的模型,却能解释一万亿个观测结果,暗物质模型基本上就是这样,我记得它有14个参数,却能解释天文学家们积累的千万亿字节的数据。

你可以思考一种理论。思考物理数学理论的一种方式是,它是对宇宙的一种压缩,也是一种数据压缩。所以你有这些拍字节的观测数据,你希望将其压缩成一个模型,这个模型你可以用五页纸描述,并指定一定数量的参数,如果它能以合理的精度拟合几乎所有的观测数据,你压缩得越多,你的理论就越好。

Lex Fridman:

事实上,宇宙及其万物中最令人惊讶的事情之一,就是宇宙竟然是可压缩的。这就是数学那不可思议的有效性。

Terence Tao:

是的,爱因斯坦有句类似的话。“宇宙中最不可理解的事情就是它是可以理解的。”

Lex Fridman:

对,而且不仅仅是可以理解。你还可以用一个方程式来表达,比如e=MC² 。

Terence Tao:

实际上对此有一些可能的解释。在数学中有一个现象叫普遍性。许多复杂系统在宏观尺度上是由微观尺度上大量微小的相互作用产生的,通常,由于组合爆炸,你会认为宏观尺度的方程一定比微观尺度的方程复杂无数倍、呈指数级地复杂,如果你想完全精确地求解,确实如此。如果你想对一盒空气中的所有原子建模……

就像阿伏伽德罗常数非常巨大。粒子的数量极其庞大。如果你真的试图追踪每一个粒子,那将是荒谬的,但在微观尺度上会出现一些定律,这些定律几乎不依赖于宏观尺度上发生的事情,或者只依赖于极少数参数。

所以如果你想对盒子里千万亿亿个粒子组成的气体进行建模,你只需要知道温度、压力和体积,以及几个参数,比如五六个,它就能模拟出关于这10的23次方个或其他数量粒子你需要了解的几乎所有情况。所以从数学角度而言,我们对普适性的理解远未达到我们期望的程度,但在一些简单得多的简化模型中,我们确实很好地理解了普适性产生的原因。最基本的一个例子就是中心极限定理,它解释了为什么钟形曲线在自然界无处不在,为什么这么多事物都呈现所谓的高斯分布,也就是著名的钟形曲线。现在甚至有关于这条曲线的梗图。

Lex Fridman:

甚至这个梗也有广泛的适用性。这个梗的普遍性。

Terence Tao:

是的,如果你愿意,你可以进行元分析,但这涉及很多很多过程。例如,你可以获取大量独立随机变量,并以各种方式对它们求平均值。你可以取简单平均值,也可以取更复杂的平均值,而且在各种情况下,我们都能证明这些钟形曲线,即高斯分布,会出现,这是一种令人满意的解释。

有时并非如此。所以,如果你有许多不同的输入数据,并且它们都以某种系统性的方式相互关联,那么你可能会得到与钟形曲线相差甚远的结果,当

听不清00:49:55

失效时,了解这一点也很重要。所以普遍性并非100%可靠的依据。全球金融危机就是一个著名的例子。人们认为抵押贷款违约呈现出某种高斯型行为,即如果有十万名有抵押贷款的美国人,问其中有多大比例的人会拖欠抵押贷款,如果一切都是不相关的,那将会是一个资产钟形曲线,这样你就可以管理期权和衍生品等的风险,而且有一套非常完美的理论。但如果经济中存在系统性冲击,可能会导致所有人同时违约,这就是非常不符合高斯分布的行为,而在2008年,这一点并未得到充分考虑。

现在我认为,人们有了更多的认识,即这种系统性风险实际上是一个大得多的问题,而且仅仅因为模型看起来精巧美观,并不意味着它就符合现实。因此,弄清楚模型的运行原理在数学层面上非常重要,同时,验证模型何时与现实相符、何时不符,这一科学层面的工作也同样重要…… 这两方面都不可或缺,而数学能提供帮助。例如,这些中心极限定理表明,如果你有诸如非相关性之类的特定公理,即所有输入之间互不相关,那么就会呈现高斯分布,一切都会正常。它能告诉你从何处寻找模型的弱点。

所以,如果你从数学角度理解塞迈雷迪定理,而有人提议用这些高斯(音频00:51:32处听不清)之类的东西来为违约风险建模,如果你受过数学训练,你会说:“好吧,但你所有输入之间的系统相关性是什么?” 然后你就可以问经济学家:“这有多大风险?” 接着你就可以去研究这个问题。所以,科学和数学之间总是存在这种协同作用。

Lex Fridman:

关于普遍性这个话题,有一点值得一提,你因在数学领域的广泛涉猎而闻名并广受赞誉,这让人想起一个世纪前的希尔伯特。事实上,伟大的菲尔兹奖得主数学家蒂姆·高尔斯曾说,你是最接近希尔伯特的人。他是你的同事。

Terence Tao:

哦,没错,好朋友。

Lex Fridman:

但无论如何,你以能够在数学领域进行深入且广泛的研究而闻名。所以你是最合适的询问对象。你认为是否存在一些线索,将数学中所有不同的领域联系起来?整个数学是否有一种深层次的潜在结构?

Terence Tao:

当然,数学中有很多相互关联的线索,而且数学的很多进展可以通过以下方式体现:讲述两个此前毫无关联的数学领域的故事,然后发现它们之间的联系。

一个古老的例子是几何学和数论。在古希腊时期,人们认为这是不同的学科。我的意思是,数学家们同时研究这两个领域。欧几里得最为著名的是对几何学的研究,但他也研究数论,但当时人们并不认为它们之间有真正的联系。我的意思是,有一点联系,比如你可以说这个长度是那个长度的五倍,因为你可以用五个这样的长度来度量,诸如此类,但直到笛卡尔发明了解析几何,人们才可以用两个实数来参数化平面这个几何对象。这样一来,几何问题就可以转化为数字问题。

如今,这感觉几乎微不足道。这其中并无实质内容。当然,一架飞机具有X和Y属性,因为这是我们所教授的知识,并且已深入人心,但这两个领域的统一是一项重要进展,而这一过程在整个数学领域反复上演。代数和几何曾相互分离,如今我们有了灵活的代数几何将它们联系起来,这种情况一再出现,而这无疑是我最喜欢的数学类型。

我认为数学家有不同的风格。我觉得就像刺猬和狐狸……狐狸略知许多事,而刺猬对一件事了解得极为透彻。在数学领域,肯定既有刺猬型的,也有狐狸型的,还有一些人能同时扮演这两种角色。我认为理想的合作,以英国数学家为例,非常……你需要一定的多样性,比如一只狐狸与许多刺猬合作,或者反过来。但我觉得自己主要是狐狸型的。不知为何,我喜欢套利。了解一个领域的运作方式,掌握那个领域的诀窍,然后进入另一个人们认为与之无关的领域,但我可以应用这些诀窍。

Lex Fridman:

所以要看到各个领域之间的联系。

Terence Tao:

是的。所以还有其他比我深刻得多的数学家。他们真的像刺猬一样。他们对某一个领域了如指掌,在这个领域里,他们反应更快,效率也更高,但我能给他们提供这些额外的工具。

Lex Fridman:

我的意思是,你说过根据不同的情境和合作情况,你既可以像刺猬,也可以像狐狸。那么如果有可能的话,你能讲讲这两种思考问题的方式有何不同吗?比如说,当你遇到一个新问题时,寻找事物之间的联系与只关注单一重点这两种方式的区别。

Terence Tao:

我对狐狸范式更得心应手。没错。所以,是的,我喜欢寻找类比和叙述方式。我花很多时间…… 如果有一个成果,我在某个领域看到它,而且我喜欢这个成果,它是个很酷的成果,但我不喜欢它的证明过程,它用到了一些我不太熟悉的数学类型,我常常会尝试用自己喜欢的工具重新证明一遍。

通常,我的证明更差,但通过他们正在做的练习,我可以说:“哦,现在我能明白另一个证明想做什么了”,从这当中,我能对该领域使用的工具有所了解。所以这是非常具有探索性的,非常…… 在疯狂的领域里做疯狂的事,还经常重复造轮子,而刺猬式的方法,我认为,更具学术性。你非常依赖知识储备。你紧跟该领域的所有进展,了解所有历史,对每种特定技术的优缺点都有很好的理解。我觉得你更多依靠计算,而不是试图去寻找脉络。所以,是的,我也能做到,但其他人在这方面极其擅长。

Lex Fridman:

让我们退一步,不妨看看数学稍微理想化的一面。我想你说过,在你早年生活中,小时候数学更像是一种解谜活动。你第一次遇到某个问题或证明,意识到数学可以有一种优雅和美感,是在什么时候呢?

Terence Tao:

这是个好问题。我来普林斯顿读研究生的时候,约翰·康威当时也在那里,他几年前去世了,但我记得我参加的最早的学术报告之一,就是康威关于他所谓“极端证明”的报告。

所以康威有一种奇妙的思考方式,能从非同寻常的角度去思考各类事物。他认为证明本身占据着某种空间。比如说,要是你想证明存在无穷多个质数,你会有各种各样的证明方法,但你可以从不同维度对它们进行排序。有些证明很优雅,有些证明冗长,有些证明很基础等等,于是就有了这样一团 “云”,也就是说所有证明构成的空间本身具有某种形状,而他对这个形状的极值点很感兴趣。在所有这些证明中,牺牲其他所有条件,哪一个是最短的,或者哪一个是最基础的,诸如此类的?

所以他列举了一些著名定理的例子,然后他会给出他认为在这些不同方面最为极致的证明。我发现这真的让人大开眼界,不仅仅是得到一个有趣结论的证明,而且一旦你有了这个证明,尝试以各种方式对其进行优化,证明过程本身就有一定的技巧性。

这无疑影响了我的写作风格,就好比你在做数学作业时,作为一名本科生,做家庭作业之类的,大家会鼓励你只要写出任何可行的证明然后交上去就行,只要能得个勾,你就可以继续往下做,但如果你希望自己的成果真的能产生影响并被人阅读,那就不能仅仅做到正确。它还应该读起来赏心悦目,有内在逻辑,能适用于其他情况的推广。在很多其他学科中也是如此,比如编程。数学和编程之间有很多相似之处。如果你没注意到的话,我很喜欢类比。你可以编写出一种 “意大利面条式代码”,它能完成某项任务,虽然又快又糙但确实能用,然而,要编出好的代码,有很多不错的原则,这样其他人就能使用它、在其基础上进行开发,让代码的漏洞更少等等,数学方面也有类似的情况。

Lex Fridman:

是的,首先,那里有很多美好的事物,而且

听不清00:59:42

是有史以来数学和计算机科学领域最伟大的智者之一,仅从证明空间的角度思考并提出“好吧,这个空间是什么样的,它的极限在哪里?”这样的问题。

正如你提到的,将编码类比为一种活动很有趣,因为还有一种叫做代码高尔夫的活动,我觉得它既美妙又有趣。在这个活动中,人们使用不同的编程语言,尝试编写能够完成特定任务的尽可能简短的程序。我相信甚至还有这方面的竞赛。这也是一种很好的压力测试方式,不仅可以测试程序,在这种情况下也可以测试证明过程,还能测试不同的语言。也许完成不同的任务需要使用不同的表示法或其他方式。

Terence Tao:

是的,你能学到很多东西。我的意思是,这可能看起来像是一项无足轻重的活动,但它能产生所有这些深刻见解,要是没有这个人为设定的目标去追求,你可能就不会发现……

Lex Fridman:

对你来说,数学中最优美或最优雅的方程式是什么?我的意思是,人们常常追求的美感要素之一是简洁性。所以,如果你看看E=mc²……所以当几个概念结合在一起时,这就是为什么欧拉恒等式常被认为是数学中最美的方程式。你觉得欧拉恒等式美吗?

Terence Tao:

是的。嗯,就像我说的,我觉得最吸引人的是不同事物之间的联系,就是那种…… 所以如果你…… 圆周率等于负一。所以,没错,人们用到了所有基本常数。好吧。我的意思是,这挺有意思的,但对我来说……

所以,由欧拉提出的指数函数是用来衡量指数增长的。比如复利计算或衰减,任何持续增长、持续减少、增长与衰减,或者扩张与收缩的情况,都可以用指数函数来建模,而圆周率π则源于圆形和旋转,对吧?例如,如果你想把一根针旋转100度,就需要旋转π弧度。而虚数单位i,也就是复数中的概念,代表着90度旋转时虚轴的变换。所以它代表着方向的改变。

所以指数函数表示沿着你已有的方向进行增长或衰减。当你在指数中加入一个“i”,此时运动方向不再与当前位置的方向相同,而是与当前位置成直角。所以这就产生了旋转,然后,epii=1e^{\\pi i} = -1 表明如果你旋转时间为 pi\\pi,最终会到达相反的方向。所以它通过伸缩变换和指数增长统一了几何,或者通过这种复数化的操作,即乘以 pii\\pi i 进行旋转,统一了动力学。所以它将数学、动力学、几何和复数这两者联系在了一起。它们几乎都被认为…… 由于这个恒等式,它们在数学领域就像邻居一样紧密相关。

Lex Fridman:

你认为你提到的被称为Q的情况,即这些不同领域符号的碰撞,仅仅是一种无关紧要的副作用,还是你认为当符号…… 尽管我们的老朋友们在夜晚相聚时,其中存在着真正的价值?

Terence Tao:

嗯,这证明你掌握了正确的概念。所以当你刚开始学习任何东西时,你必须对事物进行衡量,并给它们命名,最初有时候,因为你的模型,再说一次,与现实相差太远,你给错误的事物取了最好的名字,而你只有到后来才会发现真正重要的是什么。

Lex Fridman:

物理学家有时会这么做,但结果还不错。

Terence Tao:

所以实际上,物理学(音频1小时3分19秒处听不清)质能公式E=MC²。其中很重要的一项就是E,对吧?当亚里士多德最初提出他的运动定律,然后伽利略、牛顿等人相继研究,他们观察到可以测量的事物,比如质量、加速度、力等等。例如,牛顿力学中,F=ma,这就是著名的牛顿第二运动定律。这些就是主要研究对象。所以在理论中它们被视为核心内容。

直到后来人们开始分析这些方程时,才发现似乎总有一些量是守恒的。特别是动量和能量,而且物体具有能量这一点并不明显。它不像质量和速度那样可以直接测量,但是随着时间的推移,人们意识到这实际上是一个非常基本的概念。

直到19世纪,哈密顿将牛顿的物理定律重新表述为所谓的哈密顿力学,其中能量(现在称为哈密顿量)成为核心要素。一旦你知道如何测量任何系统的哈密顿量,就可以完整描述系统的动力学,即所有状态的变化。哈密顿量实际上是核心要素,虽然一开始并不明显,而这种视角的转变在量子力学出现时发挥了重要作用。因为早期研究量子力学的物理学家很难将牛顿力学的思维方式(一切都是粒子等)应用到量子力学中,毕竟在量子力学中一切都是波,这看起来非常奇怪。

你问:“F=ma的量子版本是什么?”,要回答这个问题真的非常非常难,但事实证明,哈密顿量在经典力学中一直暗中起着作用,它同样也是量子力学中的关键对象,也就是说,量子力学中也有一个叫做哈密顿量的对象。不过这是一种不同类型的对象。它被称为算符,而非函数,但同样,一旦你确定了它,就确定了整个动力学。

所以,有个叫薛定谔方程的东西,一旦你有了哈密顿量,它就能准确地告诉你量子系统是如何演化的。所以,这两者表面上看起来完全不同。一个涉及粒子,一个涉及波等等,但基于这种核心联系,你实际上可以开始将大量的直觉和事实从经典力学转移到量子力学。例如,在经典力学中,有个叫诺特定理的东西。每当物理系统存在一种对称性时,就会有一个守恒定律。所以物理定律具有平移不变性。比如说,如果我向左移动10步,我体验到的物理定律和我在这里时是一样的,这对应于动量守恒。如果我旋转某个角度,同样,我体验到的物理定律也是一样的。这对应于角动量守恒。如果我等10分钟,物理定律依然不变。

Terence Tao:

如果我等待10分钟,物理定律依然不变。这就是时间平移不变性。这与能量守恒定律相对应。所以对称性和守恒性之间存在这种根本联系。在量子力学中也是如此,尽管方程完全不同,但因为它们都源自哈密顿量,哈密顿量决定一切,每当哈密顿量具有对称性时,方程就会有一个守恒定律。一旦掌握了正确的表述方式,实际上会让事情变得简洁得多。

我们无法将量子力学和广义相对论统一的问题之一是,我们还没有弄清楚基本的研究对象是什么。例如,我们不得不放弃时空近乎欧几里得空间的概念,而且我们知道,在非常小的尺度上会存在量子涨落。存在时空泡沫,试图使用笛卡尔坐标X、Y、Z。这根本行不通,但我们不知道用什么来取代它。实际上,我们没有相应的概念,即那种能将一切组织起来的类似哈密顿量的东西。

万物理论

Lex Fridman:

你的直觉是否认为存在一种万有理论,所以将广义相对论和量子力学统一起来,找到这种统一的语言,这甚至是有可能的?

Terence Tao:

我想是的。这些年来,物理学的历史就像数学一样,一直处于寻求统一的进程中。(音频1小时7分26秒处听不清)磁学曾经是相互独立的理论,后来麦克斯韦将它们统一了起来。牛顿将天体运动与地球上物体的运动统一了起来,诸如此类。所以这种统一应该会发生。只是,再次回到观测和理论的这个模式上,我们面临的部分问题在于,物理学是自身成功的受害者。我们物理学的两大理论,广义相对论和量子力学,如今非常完善,它们共同涵盖了我们所能进行的99.9% 的观测。为了找出这两个理论之间的偏差,从而弄清楚如何将它们结合起来,你要么得进行极其疯狂的粒子加速实验,要么就得研究早期宇宙,或者去研究那些极难测量的事物。但我相信,几个世纪以来我们一直在做这件事,而且之前也取得过进展。我们没有理由就此停下。

Lex Fridman:

你认为自己会成为一名提出万有理论的数学家吗?

Terence Tao:

通常情况是,当物理学家需要某种数学理论时,数学家往往早就得出了一些前期成果。所以当爱因斯坦开始意识到空间是弯曲的时候,他去找了一些数学家并问道:“有没有数学家已经提出的某种关于弯曲空间的理论可能会有用呢?” 然后数学家回答说:“哦,有啊,我想黎曼提出过一些东西。” 没错,黎曼发展出了黎曼几何,这正是一种关于以各种一般方式弯曲的空间的理论,而事实证明,这几乎正是爱因斯坦的理论所需要的。这又回到了数学的弱点和不合理的有效性这个话题上。我认为,那些能够很好地解释宇宙的理论,往往也涉及到同样能很好地解决数学问题的数学对象。归根结底,它们只是以有用的方式组织数据的两种途径。

Lex Fridman:

感觉你可能需要去一些难以凭直觉理解的奇怪领域。你有字符串T=理论。

Terence Tao:

是的,几十年来它一直是主要的候选理论。但我认为它正逐渐过时,因为它与实验不符。

Lex Fridman:

所以,当然,正如你所说,其中一个巨大的挑战是实验非常困难,因为这两种理论都非常有效。但另一个挑战是,你所谈论的不仅仅是偏离时空。你正在进入一些疯狂的维度数量。你在做各种奇怪的事情,对我们来说,就像你提到的,我们已经从最初的 “平地” 概念走得太远了,现在很难用我们作为猿类后代有限的认知去直观地理解那个现实到底是什么。

Terence Tao:

这就是为什么类比如此重要。没错,地球是圆的这一点并不直观,因为我们身处其中。但总体而言,对于圆形物体,我们有相当不错的直观认知,而且我们对光的原理等也感兴趣。实际上,通过地球和月球是圆形的模型来解释日食、月食以及太阳和月亮的相位变化等现象,是一项很好的实践。你可以拿一个篮球、一个高尔夫球和一个光源,自己来做这些演示。所以直观认知是存在的,但你得将其迁移运用。

Lex Fridman:

对我们来说,从认为地球是平的转变到认为地球是圆的,这在认知上是一个巨大的飞跃,因为我们的生活大多是在平地上度过的。要接受这个信息,我们往往会觉得这是理所当然的。我们把太多事情视为理所当然,因为科学已经为这类事情建立了大量证据,但我们其实是在一块穿越太空飞行的圆形岩石上。没错,这是一个巨大的飞跃。而且你必须经历一系列这样的飞跃。随着我们的不断进步,

Terence Tao:

对,没错。所以现代科学或许又一次成为了自身成功的受害者,为了更加精确,它不得不越来越偏离你最初的直觉。因此,对于没有接受过完整科学教育的人来说,科学看起来就更可疑了。所以我们需要更多的基础讲解。有些科学家在科普方面做得非常出色,但也有很多科学实验你可以在家里做。我最近在YouTube上做了很多视频,格兰特·桑德森(Grant Sanderson),我们之前聊过他,他讲了古希腊人是如何测量月球距离、地球距离之类的,而且用的方法你自己也能复制。并不一定非得用高端的太空望远镜和让人望而生畏的数学知识。

Lex Fridman:

是的,我强烈推荐这样做。我记得你做过一次讲座,还和格兰特一起制作了一个非常精彩的视频。尝试站在那个充满神秘色彩时代的人的角度去思考,是一种美妙的体验。你身处这个星球,却不知道它的形状和大小。你看到一些星星,看到一些事物,然后试图在这个世界中确定自己的位置,并对遥远的地方做出一些大致的判断。

Terence Tao:

视角的转变非常重要。你说旅行开阔眼界,这就是一种知识之旅。设身处地从古希腊人或其他时代的人的角度思考,提出假设,比如关于球体的(听不清01:12:41)等等,进行推测。这就是数学家以及实际上一些艺术家所做的事。

Lex Fridman:

令人难以置信的是,即便面临极大的限制,你依然能说出极具力量的话语。这就是它鼓舞人心的原因。回顾历史,当可利用的资源不多时,究竟能弄清楚多少东西呢。

Terence Tao:

如果你提出公理,那么数学就会应运而生。你遵循这些公理得出结论,有时你可以从最初的假设推导出相当深入的内容。

广义相对论

Lex Fridman:

如果我们能继续探讨这个奇妙的领域。你提到了广义相对论。你对广义相对论的数学理解,也就是爱因斯坦场方程,做出了贡献。你能解释一下这项工作吗?从数学角度来看,广义相对论的哪些方面让你感兴趣?又有哪些方面对你来说具有挑战性?

Terence Tao:

我研究过一些方程。有一种叫做波映射方程或西格玛场模型的东西,它不完全是时空引力本身的方程,而是关于可能存在于时空之上的某些场的方程。所以爱因斯坦的相对论方程只是描述时空本身。但除此之外,还有其他存在于时空之上的场。有电磁场,有所谓的杨 - 米尔斯场,还有一整套不同层次的方程,其中爱因斯坦的方程被认为是最非线性且最难的方程之一,但在这个层次结构中相对较低的是这个叫做波映射方程的东西。所以它是一种波,在任何给定的点都被固定在一个球面上。所以我可以想象在时空中有一堆箭头。是的,它们指向不同的方向,但它们像波一样传播。如果你摆动一个箭头,它会传播开来,使所有箭头的运动有点像麦田里的麦束。

我对全局正则性问题很感兴趣。同样对于这个问题,这里的能量有没有可能集中在一个点上呢?所以我考虑的方程实际上是所谓的临界方程,在这个方程中,所有尺度下的行为大致相同。我勉强能够证明,实际上不可能出现所有能量都集中在一个点上的情况,在某个时刻能量必须稍微分散一点,哪怕只是一点点。这样它就会保持正则。是的,这是2000年的事了。实际上,这也是我后来对

听不清01:14:58

感兴趣的部分原因。所以我开发了一些技术来解决这个问题。这个问题的一部分实际上非常非线性,因为球体的曲率。存在某种非线性效应,这是一种非微扰效应。当你以某种常规方式去看它时,它看起来比波动方程的线性效应更大。所以即使能量很小,也很难控制住局面。

但我提出了一种所谓的规范变换。这个方程有点像小麦束的演化,它们都在来回弯曲,所以有很多运动。但如果你想象通过在空间的不同点安装小型摄像头来稳定这种流动,这些摄像头试图以捕捉大部分运动的方式移动,在这种稳定的流动下,流动就变得更加线性。我发现了一种变换方程的方法,以减少非线性效应的数量,然后我就能求解这个方程了。我是在澳大利亚拜访姑姑时发现这种变换的,当时我试图理解所有这些场的动力学,我无法通过纸笔计算,而且我也没有足够的计算机设备来进行任何计算机模拟。

所以最后我闭上眼睛,躺在地上,想象自己真的变成了这个向量场,还翻来滚去,试图看看如何通过改变坐标,让各个方向的情况都能以一种合理的线性方式表现出来。没错,就在我这么做的时候,我姑姑进来了,她问我:“你在干嘛呢?”

Lex Fridman:

这和答案一样复杂。

Terence Tao:

“好吧,好吧。行,没问题。你是年轻人,我就不多问了。”

解决难题

Lex Fridman:

我得问一下,如果有可能进入你的思维过程,你是如何解决难题的呢?当你思考的时候,你会在脑海中想象数学对象、符号之类的吗?通常你思考时,脑海中会浮现什么呢?

Terence Tao:

很多笔和纸。作为一名数学家,你会学到的一件事,我称之为策略性作弊。数学的美妙之处在于,你可以按照自己的意愿改变问题和规则。在其他任何领域你都做不到这一点。如果你是一名工程师,有人说:“在这条河上建一座桥。” 你不能说:“我想在那边建这座桥。” 或者 “我想用纸而不是钢材来建桥。” 但作为一名数学家,你可以随心所欲。这就好比玩一款电脑游戏,有无限的作弊码可用。所以你可以设定,这里有一个维度很大。我把它设为一。我先解决一维问题。这里有一个主项和一个误差项。我要做一个球形近似假设(听不清01:17:45)该项为零。

所以,解决这些问题的方法不应是像钢铁侠那样,把事情搞得极其困难。实际上,处理任何一道合理的数学题,应该这样做:如果有10个因素让你觉得棘手,那就找到一个版本的问题,把其中9个难点排除掉,只保留一个,然后解决这个问题。这样你就解决了9个 “取巧点”。好吧,你解决了10个 “取巧点”,那么这个问题就变得微不足道了,但你先解决9个 “取巧点”。你解决一个问题,这个问题教会你如何应对那个特定的难点。然后你把这个难点排除,再开启另一个难点,接着解决这个新问题。当你知道如何分别解决这10个问题、10个难点之后,你就得开始每次把其中几个难点合并起来解决。

小时候,我看了很多我们文化中的香港动作片,其中一个特点是,每次到打斗场景,比如说英雄被上百个坏人围攻之类的,但动作设计总会让他一次只和一个人打,打败这个人后再继续对付下一个。正因为如此,他才能打败所有人。但如果那些坏人能更聪明一点,一拥而上,虽然这样拍出来的电影观赏性会差很多,但他们就能赢了。

Lex Fridman:

你通常是用笔和纸(来解题)吗?还是用电脑和LaTeX?

Terence Tao:

实际上大多是通过纸笔。所以在我的办公室里,我有四块巨大的黑板,有时我得把自己所知道的关于这个问题的所有内容都写在这四块黑板上,然后坐在沙发上,纵观全局。

Lex Fridman:

它全是像符号标记那样的内容,还是会有一些绘图呢?

Terence Tao:

哦,有很多绘图和很多只有我自己能看懂的定制涂鸦。黑板的美妙之处在于你可以擦掉内容,这是一种非常自然随性的东西。我开始越来越多地使用电脑,部分原因是人工智能让做一些简单的编程工作变得容易得多。要是以前我想绘制一个函数,这有点复杂,还涉及一些迭代之类的操作,我就得记住如何设置一个Python程序,完整的循环是怎么运行的,还要调试,这得花上两个小时左右。而现在我差不多10到15分钟就能完成。我越来越多地使用电脑来进行简单的探索。

人工智能辅助定理证明

Lex Fridman:

如果可以的话,我们来稍微谈谈人工智能。也许一个不错的切入点是先泛泛地讲讲计算机辅助证明。你能介绍一下Lean形式化证明编程语言,以及它作为证明辅助工具能起到什么作用,或许还可以讲讲你是如何开始使用它的,以及它对你有什么帮助吗?

Terence Tao:

所以Lean是一种计算机语言,与Python和C等标准语言非常相似,不同之处在于大多数语言侧重于使用可执行代码。代码行实现具体功能,比如翻转二进制位、控制机器人移动、在互联网上传输文本等等。Lean也能实现这些功能。它既可以像标准传统语言一样运行,还能生成证明。像Python这样的软件语言可能会进行计算,然后告诉你答案是7。好的,3加4的和等于7吗?

但Lean不仅能给出答案,还能给出证明,说明它是如何得出7等于3加4这个答案的,以及所涉及的所有步骤。所以它创建的这些对象更为复杂,不只是陈述,而是附有证明的陈述。每一行代码都只是一种将先前的陈述拼凑起来以创建新陈述的方式。所以这个想法并不新鲜。这些东西被称为证明辅助工具,它们提供了一些语言,借助这些语言你可以创建相当复杂的数学证明。它们生成这些凭证,如果你信任Lean的编译器,这些凭证就能100%保证你的论证是正确的,而且Lean的编译器做得非常精简,并且有好几种不同的编译器可供使用。

Lex Fridman:

你能给大家讲讲在纸笔上书写和使用Lean编程语言之间的区别吗?将陈述形式化的难度有多大?

Terence Tao:

所以,Lean(一种定理证明辅助工具),很多数学家都参与了Lean的设计。它的设计理念是让代码的每一行都类似于数学论证的每一行。你可能想要引入一个变量,想要证明矛盾。有各种你可以做并且有明文规定的标准操作。所以理想情况下,它们应该是一一对应的。但在实际中并非如此,因为Lean是在向一位极其迂腐的同事解释一个证明,这位同事会指出:“好吧,你真的是这个意思吗?如果这个为零会怎样?好吧,你如何证明这一点?” 所以Lean中有很多自动化功能,尽量减少这种烦扰。例如,每一个数学对象都必须有一个类型。如果我说X,X是有理数、自然数、函数还是其他什么?如果你非正式地书写内容,通常在有上下文的情况下,你会说:“显然X等于Y与Z的和,且Y和Z已经是有理数,所以X也应该是有理数。” 所以Lean可以处理很多这样的情况,但时不时地它会说,等一下,你能告诉我更多关于这个对象的信息吗?它是什么类型的对象?你必须从更哲学的层面去思考,不仅仅是思考你正在做的计算,还要思考从某种意义上说每个对象实际上是什么。

Lex Fridman:

他是在使用类似大语言模型(LLMs)的工具来进行类型推断,还是说你要和实数进行匹配?

Terence Tao:

它使用的是更为传统的所谓“老式人工智能”。你可以将所有这些内容表示为树状结构,而且总有算法可以将一棵树与另一棵树进行匹配。

Lex Fridman:

所以实际上,判断某个数是实数还是自然数是可行的。

Terence Tao:

每一个对象都有其来源的历史,你在某种程度上可以追溯它。

Lex Fridman:

哦,我明白了。

Terence Tao:

是的。所以它是为可靠性而设计的。现代人工智能并不用于此,这是一种截然不同的技术。人们开始在Lean之上使用人工智能。所以当一位数学家试图在Lean中编写经过验证的程序时,通常会有一个步骤。好的,现在我想使用微积分的基本内容来进行下一步。因此,Lean的开发者们构建了这个庞大的项目,叫做Mathlib,它收集了成千上万关于数学对象的有用事实。

在这其中的某个地方存在着基础微积分知识,但你需要去找到它。所以现在很多瓶颈实际上在于引理搜索。你知道某个工具就在那里的某个地方,你得把它找出来。所以有各种专门针对Mathlib的搜索引擎可供使用,但现在也有这些大语言模型,你可以说:“此刻我需要基础微积分知识。” 比如说,当我编程的时候,我在我的集成开发环境(IDE)中安装了GitHub Copilot插件,它会扫描我的文本,了解我需要什么。比如说我甚至可能输入 “现在我需要使用基础微积分知识”。然后它可能会建议:“好的,试试这个”,大概25% 的时候它给出的建议完全可行。另外10% - 50% 的时候,它给出的建议不太能直接用,但已经足够接近,以至于我可以说,哦对,如果我在这儿和那儿改一下,就可以用了。还有一半的情况,它给我的完全是垃圾内容。但人们开始在一定程度上使用人工智能,主要是在高级自动补全的层面上,你可以输入半行证明内容,它就会找到相关内容并告诉你。

Lex Fridman:

是的,但“花哨”,尤其是首字母大写的那种“花哨”,能消除一些数学家从纸笔计算转向形式化时可能会感受到的障碍。

Terence Tao:

是的。没错。所以现在我估计,将其形式化并加以证明所花费的时间和精力,大约是把它写出来的10倍。所以这是可行的,但很烦人。

Lex Fridman:

但这难道不会破坏数学家的整体氛围吗?有一个迂腐的同事?

Terence Tao:

对吧?是的,如果只是这一方面的问题,倒也罢了,但实际上在某些情况下,正式地做事反而更令人愉快。所以我形式化了一个定理,最终的表述中出现了某个常数12。于是在整个证明过程中都带着这个12,而且必须检查所有其他数字,确保它们与这个最终的数字12一致。所以我们基于这个带有数字12的定理写了一篇论文。几周后,有人说:“哦,通过修改其中一些步骤,我们实际上可以把这个12改进为11。” 当用传统的纸笔方式进行证明时,每次更改参数,你都必须逐行检查证明中的每一行是否仍然成立。可能会有一些你没有完全意识到的微妙之处,比如某些性质,并非数字12本身,而是你甚至没有意识到自己一直在利用的一些性质。所以一个证明可能会在某个微妙的地方出现问题。

所以我们用常数12将证明形式化,然后当这篇新论文发表时,我们说,“哦”,所以将最初的证明形式化花了三周时间,动用了20个人。我说,“现在让我们把证明更新到11。”而使用Lean,你可以在你的核心定理中,把12改成11,运行编译器,在数千行代码中,90%的代码仍然有效,只有几行代码标红了。现在,我无法解释这些步骤,但它能立刻找出你需要修改哪些步骤,而且你可以跳过所有正常运行的部分。

而且如果你用良好的编程习惯正确地编写程序,你的大多数代码行都不会变红。而且只有少数地方,如果你不硬编码常量,而是使用巧妙的策略等等,你就能在很短的时间内定位需要修改的内容。所以在一两天内,我们就更新了证明,因为这个过程非常快,你做一个修改。现在有10处地方出了问题。针对每一处,你做一个修改,然后又有5处地方出问题,但这个过程比用笔和纸顺畅得多。

Lex Fridman:

所以这是用于写作的吗?你能读懂它吗?如果其他人有一份证明,你能,与论文相比又如何呢?

Terence Tao:

是的,所以证明过程更长,但每一个单独的部分更容易读懂。所以如果你拿起一篇数学论文,翻到第27页,看第六段,有一行数学文本,我往往不能马上读懂,因为它假定了各种定义,我得往回翻,可能在10页之前定义了这些内容,而且证明内容分散在各处,基本上你不得不按顺序阅读。这不像读小说,理论上你可以从小说中间翻开开始读。这里面有很多上下文关联。但是当使用Lean(一种定理证明辅助工具)时,如果你把光标放在一行代码上,那里的每一个对象,你都可以悬停查看,它会显示这是什么,从哪里来,依据是什么。比起翻阅数学论文,你可以更容易地追溯相关内容。

因此,精益(Lean)真正实现的一点是,能够在非常基础的层面上就证明过程展开协作,这在过去是无法做到的。传统上,使用纸笔进行数学研究时,当你想与另一位数学家合作,如果不在黑板前进行真正的互动交流,而是通过电子邮件之类的方式,基本上,你必须划分任务。比如说,“我来完成第三节,你来做第四节”,但你们无法真正同时就同一内容开展协作。

但使用Lean,你可以尝试将证明的某些部分形式化,然后说:“我在第67行卡住了。我需要证明这个东西,但不太顺利。这是我遇到问题的三行代码。” 但由于所有上下文都在,其他人可以说:“哦,好的,我知道你需要做什么。你需要应用这个技巧或这个工具。” 你们可以进行极其细致的交流。所以,因为有了Lean,我可以与世界各地的几十个人合作,他们中的大多数我从未见过面,实际上我甚至可能不知道他们在证明领域的可靠程度如何,但Lean给了我一种信任证明,所以我可以进行无需信任的数学研究。

Lex Fridman:

所以这里有很多有趣的问题。其中一个是,你以出色的合作者而闻名。那么,当你在合作解决数学难题时,正确的方法是什么呢?你们是采用分而治之的方式吗?还是专注于某个特定部分并进行头脑风暴呢?

Terence Tao:

首先总会有一个头脑风暴的过程。没错,对于数学研究项目而言,从本质上讲,当你刚开始的时候,你其实并不知道该如何解决问题。这不像工程项目,在工程项目中,相关理论可能已经确立了几十年,主要的困难在于实施。在数学研究中,你甚至得弄清楚什么才是正确的路径。这就是我先说的 “取巧” 的做法。这就好比回到建桥的类比。首先假设你有无限的预算和无限的劳动力等等。现在你能建成这座桥吗?好,现在有无限的预算,但只有有限的劳动力,对吧?现在你能做到吗?诸如此类。当然,实际上没有工程师会这么做。就像我说的,他们有固定的要求。是的,一开始总会有这样的 “即兴讨论”,你尝试各种疯狂的想法,做出各种不切实际的假设,但你打算之后再修正。

然后你试着看看是否哪怕有一种可能奏效的大致思路。然后,希望能把这个问题分解成更小的子问题,虽然你不知道该怎么做。但接着你专注于这些子问题。有时候,不同的合作者在某些方面更擅长。所以,我为人所知的一个成果是与本·格林(Ben Green)合作的,现在被称为格林 - 陶定理。这是一个关于素数包含任意长度的等差数列的命题。所以这已经是对他(此处听不清01:31:26)的一种改进。我们合作的方式是,本已经证明了关于长度为三的等差数列的类似结果。他表明,比如说素数包含无穷多个长度为三的等差数列,甚至素数的某些子集也包含,但他的方法只适用于长度为三的等差数列。对于更长的数列就不适用了。

但我这些方法源自一种【听不清 01:31:48】理论,当时我一直在研究这个理论,而且我比本更了解它。所以,如果我能证明与质数相关的某个集合的某些随机性性质,存在一个特定的技术条件,如果我能具备这个条件,如果本能为我提供这一事实,我就能证明这个定理。但我提出的是数论中一个非常难的问题,他说:“我们没办法证明这个。” 所以他说:“你能不能用一个我有可能证明的弱假设来证明你那部分定理呢?” 然后他提出了一个他能证明的东西,但对我来说太弱了。我没法用这个。于是就有了这样来回的讨论,一个黑客——

Lex Fridman:

不同的取巧方法来 -

Terence Tao:

是的,是的,我想多走些捷径。他则想少走捷径,但最终我们找到了一个性质,一方面,他能证明这个性质,另一方面,我能加以利用,然后我们就能证明我们的定理了。所以这里面有着各种微妙的互动。每一次合作都有其故事。没有两次合作是完全相同的。

Lean编程语言

Lex Fridman:

从另一方面来说,就像你提到的Lean编程,这几乎是另一回事了。因为我认为你可以为一个问题创建一个蓝图,然后利用Lean进行分治,即分别处理不同部分,同时利用计算机系统的证明检查器来确保整个过程一切正确。

Terence Tao:

所以它让一切都变得兼容且可信。是的,目前只有少数数学项目可以用这种方式进行拆分。就当前的技术水平而言,Lean的大部分工作是将人类已经证明的内容形式化。从某种意义上说,一篇数学论文基本上就是一份蓝图。它把一个像大定理这样的难题,分解成上百个小引理,但通常并非所有内容都写得足够详细,无法直接将每一个都形式化。

蓝图是一种对论文极为详尽的编写版本,其中每一步都尽可能详细地加以解释,并试图使每一步都相对独立,或者仅依赖于特定数量已被证明的前期论述,这样生成的蓝图图表中的每个节点都能独立处理,彼此互不影响。你甚至无需了解整体是如何运作的。这就好比现代供应链。如果你想制造一部iPhone或其他复杂物件,没有一个人能独自打造出整个产品,但你可以让专家们来完成,如果他们从其他公司获得某些部件,就可以将这些部件组合起来,形成一个稍大的部件。

Lex Fridman:

我认为这是一种非常令人兴奋的可能性,因为如果你能找到可以用这种方式分解的问题,就会有成千上万个贡献者参与,对吧?这将是完全分布式的。

Terence Tao:

所以我之前跟你们讲过理论数学和实验数学之间的这种区分。目前,大多数数学研究是理论性的,只有一小部分是实验性的。我认为,Lean 以及 GitHub 之类的其他软件工具所构成的平台,将使实验数学在规模上得到比我们现在所能做到的大得多的提升。所以现在,如果你想对某种数学模式或其他东西进行任何数学探索,你需要编写一些代码来呈现这个模式。我的意思是,有时候有一些计算机代数软件包可能会有所帮助,但通常只是一位数学家编写大量的 Python 代码或其他代码。而且由于编码是一项极易出错的活动,让其他人与你合作编写代码模块并不现实,因为如果其中一个模块有 bug,那么整个代码就不可靠了。所以你会看到这些由非专业程序员(也就是数学家)编写的定制化、杂乱无章的代码,它们既笨重又缓慢。正因为如此,很难真正大规模地产生实验结果。

但我认为,借助Lean,我已经启动了一些项目,在这些项目中,我们不仅进行数据实验,还进行证明实验。所以我有一个名为“等式理论项目”的项目。基本上,我们在抽象代数中生成了大约2200万个小问题。也许我应该回过头来告诉你这个项目是什么。好的,抽象代数研究诸如乘法、加法之类的运算以及抽象性质。例如,乘法是可交换的。X乘以Y总是等于Y乘以X,至少对于数字来说是这样。而且它也是可结合的。X乘以Y再乘以Z与X乘以(Y乘以Z)是一样的。所以这些运算遵循一些规律,而不遵循其他规律。例如,X乘以X并不总是等于X。所以这个规律并不总是成立。所以对于任何一种运算,它遵循某些规律,而不遵循其他规律。于是我们生成了大约4000条代数中特定运算可能满足的这类规律。

我们的问题是,哪些定律能推导出哪些其他定律,例如,交换律能推导出结合律吗?答案是否定的,因为可以描述一种运算,它遵循交换律但不遵循结合律。所以通过给出一个例子,就能表明交换律并不意味着结合律。但其他一些定律通过代换等方式确实能推导出别的定律,并且你可以写下一些代数证明。所以我们研究这4000条定律之间的所有两两组合,这样的组合多达2200万对。对于每一对,我们都会问,这条定律能推导出那条定律吗?如果能,给出证明。如果不能,给出反例。所以这有2200万个问题,每个问题都可以交给一个本科代数专业的学生,他们有相当大的机会解决这个问题,尽管至少有2200万个问题中有一百个左右确实相当难,但很多问题还是容易的。这个项目就是要弄清楚整个关系图,即哪些定律能推导出哪些其他定律。

Lex Fridman:

顺便说一句,这是个了不起的项目。想法很棒,测试也很棒,我们一直在讨论的事情能以如此规模开展,令人瞩目。

Terence Tao:

所以这本来是不可行的。文献中的技术水平大概是15个方程以及它们的应用方式,这已经是人类用纸笔所能做到的极限了。所以你需要扩大规模。所以你需要众包,但你也需要相信所有人,没有人能检查2200万个这样的证明。你需要将其计算机化。所以只有借助Lean才成为可能。我们也希望大量使用人工智能。所以这个项目几乎完成了。在这2200万个证明中,除了两个之外都已解决。

Lex Fridman:

哇。

Terence Tao:

嗯,实际上,对于这两个(成果),我们已经有了纸笔证明,并且正在将其形式化。事实上,今天早上我还在努力完成这项工作,所以我们差不多快完成了。

Lex Fridman:

这太不可思议了。

Terence Tao:

是的。太棒了。

Lex Fridman:

你们能召集到多少人?

Terence Tao:

大约50人,在数学领域这被认为是一个庞大的数字。

Lex Fridman:

这是个庞大的数字。太不可思议了。

Terence Tao:

是的。所以我们将发表一篇有50位作者的论文,并附上一份详细的附录,说明每个人的贡献。

Lex Fridman:

这里有个问题,或许不用更笼统地谈论它。当你有这样一群人时,有没有办法根据这些人、这些贡献者的专业水平来整理他们的贡献呢?好吧,我在这里问了很多奇葩问题,但我在设想一群人,也许未来还会有一些人工智能,能不能有一种类似Elo评级的机制呢?

Lex Fridman:

能否出现一种类似Elo评级的情况,将此进行游戏化。

Terence Tao:

这些精益项目的美妙之处在于,你会自动获得所有这些数据,所以所有内容都会上传到这个GitHub上。GitHub会追踪谁贡献了什么。所以你可以在之后的任何时间生成统计数据。你可以说,“哦,这个人贡献了这么多行代码” 之类的话。这些都是非常粗略的衡量标准。我绝对不希望这成为你任期评估之类事情的一部分。但我的意思是,我认为在企业计算领域,人们已经在使用其中一些指标作为评估员工绩效的一部分。再说一次,这个方向对学术界来说有点可怕。我们不太喜欢衡量标准。

Lex Fridman:

然而,学者们也会使用衡量标准。他们只是沿用旧的标准,比如论文数量。

Terence Tao:

是的,确实……

Lex Fridman:

感觉这个指标虽然有缺陷,但在朝着更正确的方向发展。对吧。

Terence Tao:

是的。

Lex Fridman:

这很有意思。至少这是一个非常有趣的衡量指标。

Terence Tao:

是的,我认为研究这个很有趣。我觉得你可以研究一下这些是否是更好的预测指标。有个问题叫古德哈特定律。如果一个统计数据被实际用于激励绩效,它就会被人操纵,这样一来它就不再是一个有用的衡量标准了。

Lex Fridman:

哦,人类。总是在钻……的空子

Terence Tao:

这是合理的。所以我们为这个项目所做的是自我申报。实际上,科学领域对于人们做出的贡献类型有标准的分类。比如有概念、验证、资源、编码等等。大概有一个包含十二个左右类别的标准列表,我们只需要让每位贡献者……有一个涵盖所有作者和所有类别的大矩阵,他们只需在自认为有贡献的类别处打勾,给出一个大致的说明。比如说,你做了一些编码工作,还提供了一些计算资源,但你没有进行任何书面验证之类的工作。

我认为这样做是可行的。传统上,数学家们只是按姓氏字母顺序排列。所以我们不像科学界那样有 “第一作者”“第二作者” 之类的传统,我们对此感到自豪。我们让所有作者地位平等,但这种方式并不完全适用于这么大规模的合作。所以十年前,我参与了一些叫做 “众包数学项目” 的事情。这是一种众包数学研究,但没有精简的环节。所以它受到限制,需要人工审核员来实际检查所有提交的内容是否确实有效。实际上,这是一个巨大的瓶颈,但即便如此,我们还是有一些大约10位作者参与的项目。但当时我们决定,不去试图确定谁做了什么,而是采用一个单一的笔名。所以我们本着

听不清 01:41:51

的精神,创造了这个虚构的角色,叫DHJ Polymath。这是20世纪一群著名数学家使用的笔名。

于是这篇论文是以笔名发表的,所以我们都没有获得作者署名。实际上,由于几个原因,这样做的结果并不太好。其一,如果你真的想获得终身教职之类的,你不能把这篇论文列入你的…… 当你提交自己的出版物时,因为它没有正式的作者署名。但我们很久之后才意识到的另一件事是,当人们提到这些项目时,他们自然会提到参与项目的最知名的人。所以就会说 “这是蒂姆·高尔斯(Tim Gower)的季后赛项目。” “这是陶哲轩(Terence Tao)的季后赛项目”,而不会提及其他19位或更多参与其中的人。

Lex Fridman:

哦,对。

Terence Tao:

所以这次我们尝试一些不同的做法,每个人都是作者,但我们会有一个包含这个矩阵的附录,看看效果如何。

深度思维公司的AlphaProof

Lex Fridman:

所以这两个项目都令人惊叹,光是你参与到如此大规模的合作中这一点就很了不起。但我记得几年前我还看过凯文·巴扎德(Kevin Buzzard)关于Lean编程语言的演讲,而你说这可能是数学的未来。所以看到你,以及世界上最伟大的数学家之一,都欣然接纳它,感觉就像是在为数学的未来铺路,这也很令人兴奋。

所以我得在这儿问问你关于将人工智能融入整个过程的问题。DeepMind的AlphaProof是通过强化学习对国际数学奥林匹克(IMO)问题的成功和失败的形式化Lean证明进行训练的。这算是高中高级水平的内容吗?

Terence Tao:

哦,非常高深的,没错。

Lex Fridman:

非常高层次的、高中水平的数学问题。你对这个系统有什么看法,以及能够证明高中水平问题的这个系统与渐进难度问题的系统之间可能存在什么差距?

Terence Tao:

是的,随着证明步骤数量的增加,难度呈指数级增长。这是一种注释爆炸。所以大语言模型的问题在于它们会犯错,因此如果一个证明有20个步骤,而你的

听不清01:44:01

在每一步出错的概率为10%,那么实际上极不可能得出最终结果。

Lex Fridman:

实际上,在此稍微岔开一下话题,将自然语言映射到形式化程序这个问题的难度有多大呢?

Terence Tao:

哦,是的。实际上,这极其困难。自然语言的容错性很强。你说第二语言时,即便犯一些小的语法错误,人们也能大概明白你在说什么。但形式语言就不同了,只要出一点小错,整个内容就毫无意义。甚至从一种形式语言转换到另一种形式语言也非常困难。存在不同且不兼容的序言和语言。有Lean,还有Cox和Isabelle等等。而且,从形式行为转换为形式语言仍是一个尚未解决的问题。

Lex Fridman:

这很有意思。好的。但一旦有了一种非正式语言,他们就会使用强化学习训练的模型,类似于他们曾用来开发工具的AlphaZero,这也是一个模型。我认为这是一个用于解决几何问题的独立模型。

Terence Tao:

是的。

Lex Fridman:

那么这个系统有哪些地方让你印象深刻,你认为它还存在哪些差距?

Terence Tao:

是的,我们之前谈到过,那些随着时间推移令人惊叹的事物,渐渐会变得习以为常。所以现在,不知为何,当然,几何学并非万能之法。

Lex Fridman:

对。没错,没错。我的意思是,…… 仍然很美妙。

Terence Tao:

是的,这些都是很棒的成果,展示了可能性。但目前这种方法无法规模化。在那里,谷歌服务器运行三天才能解决一道高中数学题。这不是一个可扩展的前景,尤其是随着问题复杂性的增加,所需资源呈指数级增长。

Lex Fridman:

我们应该提到,他们取得了银牌级别的表现。相当于银牌级别的表现。

Terence Tao:

所以首先,他们花费的时间比规定的要多得多,而且他们得到了这样的帮助,即人类开始通过形式化来提供协助,但他们还为自己的解决方案打了满分,我猜这是经过形式验证的。所以我觉得这还算公平。有人在努力,未来某个时候会有一个提议,真正举办一场人工智能数学奥林匹克竞赛,届时人类参赛者拿到实际的奥数题目时,人工智能也会拿到相同的题目、相同的时间,而且其输出将由同样的评委打分,这意味着必须用自然语言而非形式语言来书写。

Lex Fridman:

哦,我希望那能实现。我希望这次国际数学奥林匹克竞赛能出现这种情况。我希望下一次能实现。

Terence Tao:

在这次国际数学奥林匹克竞赛(IMO)中,这种情况不会发生。在规定时间内,(AI的)表现还不够好。但有一些规模较小的竞赛,在这些竞赛中,答案是一个数字,而非长篇证明。实际上,在有具体数值答案的问题上,人工智能表现得要好得多,因为对这类问题进行强化学习很容易。” 对,答案要么正确,要么错误。” 这是一个非常明确的信号,但长篇证明要么得是形式化的,这样Lean(一种定理证明辅助工具)就能给出肯定或否定的评价;要么是非形式化的,但这就需要人来判断。如果你要进行数十亿次强化学习,你雇不起足够多的人来批改这些证明。仅对人们日常接触的普通文本进行强化学习,对语言模型来说就已经够难了。但现在我们实际上要雇人,不仅要给出肯定或否定的评价,还要从数学角度检查输出结果,没错,这成本太高了。

人类数学家与人工智能对决

Lex Fridman:

所以,如果我们来探讨一下这个可能的未来,在数学领域,人类所做的、且在一段时间内人工智能难以企及的最特别的事情是什么呢?是发明新理论?提出新猜想而非证明猜想?构建新的抽象概念?创造新的表示方法?又或许是像人工智能那样,发现不同领域之间的新联系?

Terence Tao:

这是个好问题。我认为随着时间推移,数学家工作的性质发生了很大变化。比如在一千年前,数学家得计算复活节的日期,他们要进行非常复杂的计算,但如今这一切都实现了自动化,经过几个世纪的发展,我们不再需要人工计算这些了。过去他们还得进行球面导航,运用圆三角学来计算如何从旧大陆航行到新大陆之类的,那是非常复杂的计算。同样,这些也都实现自动化了。甚至在人工智能出现之前,很多本科数学内容就已经能通过工具解决了,比如Wolfram Alpha。它不是语言模型,但能解决很多本科水平的数学问题。所以在计算方面,像验证常规问题,比如提出一个问题,说“这是一个偏微分方程的问题,你能用20种标准方法中的任何一种来解决它吗?”然后回答说“可以,我试过了所有20种方法,这里有100种不同的排列方式以及我的结果”。

而且我认为,一旦你解决了一个问题,让人工智能去处理一百个相关问题,这种规模扩展的方式会非常有效。人类所做的事情仍然…… 所以人工智能目前真正面临的难题在于,它不知道自己何时走入了歧途。它可能会说:“哦,我要解决这个问题。我要把这个问题分解成这两种情况。我要尝试这种方法。” 有时候,如果你运气好,遇到的是个简单问题,采用的方法正确,问题就能得到解决;但有时候,它会提出一种完全荒谬的方法,可看起来却像个证明。

所以这就是大语言模型生成数学内容时令人头疼的一点。没错,人类生成的数学内容质量也可能很低,比如那些没有经过正规训练的人提交的内容等等,但如果一个人类给出的证明很糟糕,你很快就能看出来。它会犯一些非常基础的错误。但人工智能生成的证明,表面上看可能无懈可击。部分原因在于强化学习实际训练它们做的事情,就是让生成的内容看起来是正确的,这在很多应用场景中已经足够好了。所以错误往往很隐蔽,而当你发现这些错误时,会觉得它们愚蠢得离谱。就好像实际上没有人类会犯那种错误。

Lex Fridman:

是的,在编程环境中这实际上真的很令人沮丧,因为我经常编程,而且,当人类编写低质量代码时,有一种叫做“代码异味”的东西,对吧?你能立刻察觉到有迹象,但对于人工智能生成的代码……

Terence Tao:

听不清01:50:53

Lex Fridman:

你说得对,最终你会发现一件明显愚蠢的事情,而它看起来却像是不错的代码。

Terence Tao:

是的。

Lex Fridman:

必须工作这件事,不知为何,也非常棘手,令人沮丧。

Terence Tao:

所以嗅觉,这是人类具备的一种能力,而有一种隐喻性的数学“嗅觉”,目前还不清楚最终如何让人工智能复制这种能力。因此,像阿尔法零(AlphaZero)等在围棋和国际象棋等方面取得进展的方式,从某种意义上说,它们已经培养出了对围棋和国际象棋局面的一种“嗅觉”,即判断这个局面对白方有利,还是对黑方有利。它们无法解释原因,但仅仅拥有这种“嗅觉”就能让它们制定策略。所以,如果人工智能获得了对某些证明策略可行性的感知能力,比如我打算把这个问题分解成两个小的子任务,它们就能说:“哦,这看起来不错。这两个任务看起来比你的主要任务更简单,而且它们仍然很有可能成立。所以值得一试。” 或者说:“不,你把问题弄糟了,因为这两个子问题实际上比你最初的问题更难。” 实际上,如果你随意尝试,通常很容易把一个问题转化为一个更难的问题。很少能转化为一个更简单的问题。所以,如果它们能培养出这种 “嗅觉”,那么它们也许就能开始与人类水平的数学家竞争了。

Lex Fridman:

所以这是个难题,但不是竞争而是合作。好,假设一下。如果我给你一个 “神谕”,它能完成你所做工作的某些方面,而且你可以和它合作,你希望这个 “神谕” 能做什么呢?你希望它成为一个验证者,比如检查代码,然后说 “是的,陶教授,没错,这是一个有前景且富有成效的方向” 吗?还是希望它生成可能的证明,然后你去判断哪个是正确的?又或者你希望它生成不同的表征,用完全不同的方式看待这个问题?

Terence Tao:

是的,我认为上述所有原因都有。很大程度上是因为我们不知道如何使用这些工具,因为这是一种……我们过去从未有过的范式。这些系统足够强大,能够理解复杂的指令,并且可以大规模运行,但同时也不可靠。这是一种很有意思的……在一些微妙的方面不可靠,但却能提供足够好的输出。这是一种有趣的组合。我的意思是,你和一些研究生合作时,他们有点喜欢这种情况,但规模不大。而我们之前的软件工具虽然可以大规模运行,但功能非常有限,所以我们必须弄清楚如何使用,所以蒂姆·高尔斯(Tim Gowers)实际上,你提到他在2000年就预见到了。他当时设想了在25年后数学会是什么样子。

Lex Fridman:

这很有意思。

Terence Tao:

是的,他写了一篇文章,内容是未来的数学助手与他自己之间的一场假设性对话。他试图解决一个问题,他们会展开交谈。有时人类会提出一个想法,人工智能会对其进行评估,有时人工智能会提出一个想法,有时还需要进行竞赛,人工智能可能会直接说:“好的,我已经检查了这里所需的100个案例”,或者“首先你对所有N进行这样的设定,我已经检查了N直到100,目前看起来不错”,又或者“等一下,在N等于46时有个问题”。所以这只是一场自由形式的对话,你事先不知道事情会如何发展,只是基于“我认为双方都会提出想法”。双方都可能提出计算方法。

我和人工智能交流时会说:“好的,我们要合作解决这道数学题。” 而这是一道我已经知道答案的题,所以我试着引导它。“好的,这就是题目。” 我建议用这个工具,然后它就能找到答案。” 好的,它可能会开始用这个工具,接着又会回到它之前想用的工具上。你得一直把它引导到你想要的方向上,最终我能迫使它给出我想要的证明,但这就像赶猫一样难。而且我不仅要引导它,还得检查它的输出,为此付出了大量个人精力,因为很多时候看起来行得通,但我知道第17行有问题,基本上就是在和它争论。这比我自己独立完成还要累人,但这就是目前的技术水平。

Lex Fridman:

我想知道是否会出现一个阶段转变,让事情不再感觉像赶猫一样困难(注:herd cats 比喻做某事像赶猫一样困难,因为猫通常较难被集体驱使)。也许转变到来的速度之快会让我们大吃一惊。

Terence Tao:

我想是这样的。在形式化方面,我之前提到过,将一个证明形式化所花费的时间是手写证明的10倍。有了这些现代人工智能工具以及更好的工具,Lean的开发者们在不断添加越来越多的功能并使其更易于使用方面做得非常出色,从9倍时间降到8倍再到7倍…… 好吧,这没什么大不了的,但总有一天这个倍数会再降一点。这将是一个重大转变,因为突然间,当你写一篇论文时,先在Lean中撰写,或者通过与通常能实时与你交流的人工智能进行对话来完成,就变得合理了,而且期刊也会自然地接受这种方式。也许他们会提供快速评审服务。如果一篇论文已经在Lean中完成形式化,他们只会要求评审人员对结果的重要性以及其与文献的关联进行评论,而不必太担心其正确性,因为这已经经过验证了。数学论文越来越长,除非是非常重要的论文,否则很难为那些篇幅很长的论文找到好的评审。这实际上是一个问题,而形式化正好在这个时候出现来解决这个问题。

Lex Fridman:

而且由于工具和其他所有因素,猜测变得越来越容易,那么你会看到类似数学库这样的东西可能会呈指数级增长,因为这是一个良性循环。

Terence Tao:

我的意思是,过去发生的这类转变之一就是LaTeX的采用。LaTeX是一种现在所有数学家都在使用的排版语言。过去,人们使用各种文字处理器、打字机之类的工具,但在某个时候,LaTeX变得比其他所有竞品都更易用,于是人们在几年内纷纷改用它。这就是一次巨大的基础性转变。

人工智能获得菲尔兹奖

Lex Fridman:

这是一个大胆、超前的问题,但到底在哪一年,距离我们拥有一个能作为合作者,助力完成一项赢得菲尔兹奖的数学证明的人工智能系统还有多远呢?就是要达到这种程度。

Terence Tao:

好吧,这取决于合作的程度,对吧?

Lex Fridman:

不,它理应获得菲尔兹奖。所以可能性各占一半。

Terence Tao:

已经是这样了。我能想象,如果这是一篇有望获奖的论文,在写作过程中得到一些人工智能的协助,就像自动补全功能一样,这已经很不错了。我使用它来加快自己的写作速度。你可能有一个定理及证明,证明分为三种情况,我写下第一种情况的证明后,自动补全功能就给出了提示。它会指出第二种情况的证明该如何进行,而且完全正确。这太棒了,为我节省了大概5到10分钟的打字时间。

Lex Fridman:

但在这种情况下,获得菲尔兹奖的不是人工智能系统。我们说的是20年、50年还是100年呢?你怎么看?

Terence Tao:

好的,所以我曾公开预测,到2026年,也就是明年,将会出现与人工智能合作完成的数学研究成果,虽不至于达到获得菲尔兹奖的水平,但会是真正达到研究水平的论文。

Lex Fridman:

部分由人工智能生成并发表的观点。

Terence Tao:

或许不是思路,但至少是部分计算和验证工作。

Lex Fridman:

这已经发生了吗?

Terence Tao:

这种情况已经发生了。有些问题是通过与人工智能进行复杂的对话过程来解决的,由人工智能提出方案,然后人类去尝试,但方案并不奏效,不过它可能会提出一个不同的想法。要确切厘清其中的关系很难。肯定有一些数学成果的取得离不开人类的验证和人工智能的参与,但很难分清功劳归属。我的意思是,这些工具并不能复制做数学所需的所有技能,但它们能复制其中相当一部分,30%、40%,所以它们可以填补空白。编程就是一个很好的例子。对我来说,用Python编程很烦人。我不是母语使用者,我是一名专业程序员,但有了人工智能,编程的摩擦成本大大降低了。所以它为我填补了这个空白。人工智能在文献综述方面也越来越出色了。

我的意思是,它仍然存在虚构出不存在参考文献的问题,但我认为这是一个可以解决的问题。如果你以正确的方式进行训练等等,并利用互联网进行验证,那么几年后,当你遇到一个需要的引理时,你可以问:“之前有人证明过这个引理吗?” 它基本上会进行一次高级网络搜索,然后说,是的,有六篇论文出现过类似情况。我的意思是,你现在就可以问它,它会给你六篇论文,其中可能一篇是真实且相关的,一篇存在但不相关,还有四篇是虚构的。它现在有一定的成功率,但其中有太多无用信息,信噪比太差,所以当你已经对相关关系有所了解,只是需要被提示唤起潜意识中已有的某篇论文的记忆时,它才最有用。

Lex Fridman:

相比之下,它(大语言模型)可以帮助你发现一些你甚至没有意识到,但却是正确的引用。

Terence Tao:

是的,它有时会这样,但出现这种情况时,它会隐藏在一系列选项中,而其他——

Terence Tao:

是的,不,目前有一个很大的障碍需要克服。我的意思是,这就像自动驾驶汽车。要使其可行,安全系数必须非常高。所以,没错,很多人工智能应用都存在一个【02:01:54听不清】——莫罗问题,即它们开发的工具在20%、80%的情况下能正常工作,但这仍然不够好。事实上,在某些方面甚至比不好还要糟糕。

Lex Fridman:

我的意思是,换一种方式来问菲尔兹奖相关问题就是,你觉得在哪一年你一觉醒来会感到非常惊讶?你看到新闻标题,或者人工智能取得了真正的突破性进展。诸如此类的事情。比如菲尔兹奖,哪怕只是一个假设。可能就像当年AlphaZero在围棋领域取得突破那样的时刻。

Lex Fridman:

哦,有意思。提出一个猜想。这是个很棒的猜想。

Terence Tao:

是的。而且实际上很有可能是正确且有意义的。

Lex Fridman:

因为我觉得这实际上还是有点可行的,但数据显示……

Terence Tao:

是的。

Lex Fridman:

不,那可真是太惊人了。

Terence Tao:

目前的模型面临诸多困难。我的意思是,就像这样…… 物理学家们梦想着让人工智能发现物理学的新定律。这个梦想是,你只需向它输入所有这些数据,然后就会出现一项我们之前从未见过的新专利,但实际上,即使是目前最先进的模型,也很难从数据中发现物理学的旧定律。或者即便它做到了,也存在一个很大的问题,即数据污染,也就是说它能做到只是因为在训练数据的某个地方,以某种方式存在着要重建的内容,比如波义耳定律或其他任何你试图重建的定律。

部分原因是我们没有适用于此的正确类型的训练数据。比如说对于物理定律,我们并没有一百万个不同的宇宙,每个宇宙有着一百万个不同的自然法则。在数学领域,我们缺失的很多内容实际上是……的空白部分。所以我们已经发表了人们能够证明的成果,以及最终得到验证的猜想,或者是我们给出的反例,但我们没有关于那些被提出且看似值得一试的想法的数据,不过人们很快就意识到那是错误的猜想,然后他们会说:“哦,但我们实际上应该这样修改我们的主张,让它变得更合理。”

这是一个反复试验的过程,它是人类数学发现中真正不可或缺的一部分,但我们不会记录这个过程,因为它令人尴尬。我们会犯错,而我们只愿意公布成功的成果。而人工智能无法获取这些数据来进行训练。我有时开玩笑说,基本上人工智能得去读研究生,真正去上研究生课程,完成作业,去教授的答疑时间,犯错,获得关于如何纠正错误的建议并从中学习。

格里戈里·佩雷尔曼

Lex Fridman:

如果可以的话,我想问一下关于格里戈里·佩雷尔曼(Grigori Perelman)的事。你提到在工作中要谨慎,不要因为太热爱某个问题,就完全沉浸其中,不解决就无法安心。但你也赶紧补充说,有时这种方法实际上非常有效,你举的一个例子就是格里戈里·佩雷尔曼,他证明了庞加莱猜想,为此独自工作了七年,基本上与外界很少接触。你能解释一下这个已经被解决的千禧年大奖难题——庞加莱猜想吗?或许也谈谈格里戈里·佩雷尔曼所经历的历程?

Terence Tao:

好的,这是一个关于弯曲空间的问题。地球就是一个很好的例子。我们可以把地球看作一个二维表面。你周围的空间可能是一个带有一个洞的环面,也可能有很多洞,而且原则上,即使你假设一个表面是有边界且光滑的等等,它也可能有许多不同的拓扑结构。所以,作为初步近似,我们已经弄清楚了如何对表面进行分类。一切都由所谓的亏格决定,也就是它有多少个洞。所以一个球体的亏格为零,而一个甜甜圈(环面)的亏格为一,以此类推。有一种方法可以区分不同的表面,比如球体具有一种叫做单连通的性质。如果你在球体上取任何一个闭合回路,比如一大圈闭合的绳子,你可以在保持在球表面的情况下将它收缩成一个点。球体有这个性质,但环面没有。如果你在环面上,拿一根绳子绕着环面的外径,没办法……它无法穿过那个洞。没办法把它收缩成一个点。

结果表明,在球体的连续变形下,球体是唯一具有这种可收缩性质的曲面。也就是说,那些在拓扑学上与球体等价的物体。于是庞加莱提出了同样的问题,但针对更高维度,这就变得很难想象了,因为我们可以把曲面想象成嵌入三维空间中,但对于弯曲的三维空间,我们对容纳它的四维空间并没有很好的直观认识。而且还有一些三维空间甚至无法嵌入四维空间,可能需要五维、六维或更高维度。但无论如何,从数学角度你仍然可以提出这个问题,即如果现在有一个有界的三维空间,它也具有单连通性质,即每个环路都可以收缩,那么能否将它变成三维版本的球体呢?这就是庞加莱猜想。

奇怪的是,在更高维度中,四维和五维的情况实际上更容易。所以它首先在更高维度上得到了解决,在某种程度上,进行变形的空间更大。把物体移动到你的球面上更容易。但三维的情况真的很难。所以人们尝试了很多方法。有一种组合方法,你把表面切割成小三角形或四面体,然后尝试根据面与面之间的相互作用来论证。还有代数方法,有各种代数对象,比如所谓的基本群,你可以将其与这些同调、上同调以及所有这些非常精妙的工具联系起来。这些方法也不太奏效,但理查德·汉密尔顿提出了一种偏微分方程的方法。

所以问题在于…… 假设有一个物体,实际上它是个球体,但呈现给你的方式很奇怪。我想象有个球被揉皱、扭曲了,乍一看不像是个球。但如果你有某种变形的球面,比如说可以把它想象成气球的表面,你试着给它充气,随着空气注入,褶皱自然会逐渐展开,最终变成一个漂亮的圆球,当然,除非它原本是个环面之类的,那样的话在充气过程中就会卡在某个状态。

如果你给一个环面充气,当内环收缩到零时,中间会出现一个点,这时就产生了奇点,你无法再继续充气,也无法再让其流动。于是他创造了这种流,现在被称为里奇流,这是一种将任意曲面或空间进行平滑处理,使其越来越圆,最终看起来像一个球体的方法。他想证明,这个过程要么会得到一个球体,要么会产生一个奇点,这其实很像偏微分方程,要么具有全局正则性,要么在有限时间内爆破。基本上,两者几乎完全一样。它们都是相互关联的。他证明了对于二维曲面,如果从单连通开始,就不会形成奇点,不会遇到问题,并且可以进行流动,最终会得到一个球体。所以他得到了二维情形下的一个新证明。

Lex Fridman:

不过顺便说一句,这是对里奇流在这种情况下的应用的一个精彩解释。对于二维情况,这里的数学难度有多大呢?难吗?

Terence Tao:

是的,这些方程相当复杂,与爱因斯坦方程不相上下。稍微简单一些,但它们曾被认为是难以求解的非线性方程,二维空间中有许多特殊技巧可以提供帮助。但在三维空间中,问题在于这个方程实际上是超临界的。这与

听不清02:09:48

中的问题相同。随着情况恶化,曲率可能会集中在越来越小的区域,看起来越来越非线性,情况也越来越糟。可能会出现各种奇点。有些奇点,比如所谓的颈缩奇点,此时曲面的表现就像杠铃,在某一点收缩。有些奇点足够简单,你大致能看出下一步该怎么做。你只需剪一刀,然后就能把一个曲面变成两个,再分别处理。但也有可能出现一些极其棘手的打结奇点,你完全不知道如何解决,无法进行任何处理。所以你需要对所有奇点进行分类,比如可能出现问题的所有方式有哪些?佩雷尔曼所做的是,首先,他将问题从超临界问题转化为临界问题。我之前提到过能量(哈密顿量)的发明是如何真正阐明牛顿力学的。所以他引入了一些现在被称为佩雷尔曼约化体积和佩雷尔曼熵的东西。他引入了新的量,有点像能量,在每个尺度上看起来都一样,并将问题转化为临界问题,此时非线性突然看起来比以前不那么可怕了。然后他必须解决……他仍然必须分析这个临界问题的奇点。而这本身实际上是一个与我研究的波映射问题类似的问题。难度级别与之相当。

所以他成功地对这个问题的所有奇点进行了分类,并展示了如何对每一个奇点进行处理。通过这些,他得以解决庞加莱猜想。这一系列步骤确实雄心勃勃,而如今的大语言模型,比如,是无法做到的…… 我最多能想象一个模型把这个想法作为数百个不同尝试方向之一提出来,但其他99个方向很可能完全行不通。但你只有经过数月的研究才能发现这一点,而他当时肯定已经意识到这是值得追寻的正确方向。从A点走到B点需要数年时间。

Terence Tao:

嗯,对我来说,我会转而研究另一个问题。所以我是一只狐狸,而不是刺猬。

Lex Fridman:

但一般来说,你可以稍作休息,比如暂时放下手头的问题,去看看其他问题?

Terence Tao:

是的,是的。你也可以修改问题。我的意思是,如果你遇到了某个特定的阻碍,某个糟糕的情况不断出现,导致你的工具不起作用,你可以问问那些耍小聪明的人。你可以干脆假定这种糟糕的情况不会发生。所以你得有点奇思妙想,但从策略上来说,为了看看论证的其余部分是否可行,这样做是可以的。如果你的方法存在多个问题,那或许你就只能放弃了。但如果这是唯一的问题,而其他方面都没问题,那么仍然值得努力解决。所以说,有时候你也得提前做些侦察工作。

Lex Fridman:

有时候,做这样的假设是否也有成效呢,比如 “好吧,我们最终总会解决这个问题的”?

Terence Tao:

哦,对,没错。有时候犯错实际上甚至是有成效的。有一个项目,我和另外四个人一起做,还得了些奖。我们研究的是一个偏微分方程问题。同样,这是一个爆破解正则性类型的问题,被认为非常难。让·布尔吉尼翁(Jean Bourgiugnon)是另一位研究过该问题一个特殊情况的菲尔兹奖数学家,但他没能解决一般情况。我们研究这个问题研究了两个月,觉得我们解决了。我们有个巧妙的论证,一切似乎都说得通,我们很兴奋,计划着庆祝,大家聚在一起喝香槟之类的,然后我们开始把成果写下来。然后我们中的一个人,其实不是我,而是另一位合著者说:“哦,在这个引理中,我们得估计在这个展开式中出现的这13项。”

我们估算了其中12项,但在笔记里,我找不到第13项的估算。有人能提供一下吗?” 我说,“当然,我来看看。” 是的,我们没考虑到这项,完全遗漏了。结果发现,这一项比其他12项加起来还糟糕。事实上,我们无法估算这一项。我们又花了几个月时间,尝试了各种不同的排列组合,但总有这一项我们控制不了。这非常令人沮丧。但因为我们已经在这件事上投入了好几个月的精力,所以我们坚持了下来,尝试了越来越极端和疯狂的办法。两年后,我们找到了一种略有不同的方法,与最初的策略有很大差异,这种方法实际上不会产生这些有问题的项,并且真的解决了问题。

所以我们在两年后解决了这个问题,但如果没有一开始那种几乎要解决问题的虚假曙光,我们可能在第二个月左右就放弃了,转而去做一个更简单的问题。如果我们早知道要花两年时间,不确定我们是否还会启动这个项目。有时候,实际上存在错误认知也有好处,就像哥伦布在新大陆挣扎探索一样,他们对地球大小的测量有误。他以为自己会找到一条通往印度的新贸易路线,至少他在计划书里是这么宣传的。我的意思是,也有可能他其实心里暗自明白,但……

Lex Fridman:

仅仅从心理层面来讲,在那样的时刻,你是否会被强烈的情绪或自我怀疑所笼罩?因为数学这东西,它实在是太引人入胜了,以至于当你在某个问题上投入太多,最后却发现做错了,就会深受打击。你可能会开始…… 就像国际象棋曾让一些人崩溃那样。

Terence Tao:

是的,我认为不同的数学家对他们所做的事情有不同程度的情感投入。我的意思是,对有些人来说,这只是一份工作,遇到一个问题,如果解决不了,就接着做下一个。所以,你总能转向另一个问题,这就减少了情感联系。我的意思是,也有这样的情况,有些问题被称为数学“顽疾”,有些人就执着于那一个问题,年复一年,除了那个问题什么都不想。也许他们的职业生涯会因此受到影响等等,但他们会说:“好吧,我要是能大获成功。一旦我解决了这个问题,就能弥补这些年错失的机会。”我的意思是,偶尔这样做会成功,但我真的不建议没有足够毅力的人这么做。

孪生素数猜想

Lex Fridman:

但我肯定,对你来说,也存在这样的问题。你在攻克数学史上最难的问题方面已经取得了很大进展。那么,有没有一个问题一直萦绕在你心头呢?它就静静地待在黑暗的角落里,比如孪生素数猜想、黎曼假设、哥德巴赫猜想?

Terence Tao:

孪生素数,这听起来……听着,我想说,像黎曼假设这样的问题,实在是遥不可及。

Lex Fridman:

你这么认为吗?

Terence Tao:

是的,甚至没有可行的思路。即使我使出这本书里我所知道的所有“歪招”,也完全没办法从A推导到B。我认为首先需要在数学的另一个领域取得突破,并且得有人意识到把这个突破运用到这个问题上会很有用。

Lex Fridman:

所以我们或许应该稍微退一步,只谈谈质数。

Terence Tao:

好的。

Lex Fridman:

所以它们通常被称为数学的原子。你能讲讲这些原子所构成的结构吗?

Terence Tao:

所以自然数有两种基本运算,加法和乘法。所以如果你想生成自然数,你可以做两件事之一。你可以从1开始,不断地将1加到自身上。这样就能生成自然数。所以从加法的角度看,生成1、2、3、4、5很容易。或者如果你想从乘法的角度生成,你可以取所有质数,2、3、5、7,然后将它们相乘。这样可以得到除了1以外的所有自然数。所以从加法和乘法这两个不同的角度来思考自然数。分开来看,它们并不难。所以任何只涉及加法的关于自然数的问题,都相对容易解决。

任何仅涉及乘法的问题相对来说都比较容易解决。但令人沮丧的是,当你把乘法和加法结合在一起时,情况就变得极其复杂…… 我的意思是,我们知道在数论中,有些命题实际上是不可判定的。存在一些含有若干变量的多项式。在自然数范围内是否有解呢?答案取决于一个不可判定的命题,即数学公理是否一致。但即使是最简单的问题,比如把像质数这样更具应用性的概念,与像加二这样的加法运算结合起来,单独来看,我们对这两者都很了解,但如果你问,把质数加二,结果会怎样?多久能得到另一个质数?将这两者联系起来竟然极其困难。

Lex Fridman:

我们应该说,孪生素数猜想就是这样,它假定存在无穷多对相差为2的素数。有趣的是,你在推动这个领域发展、回答这类复杂问题方面非常成功。就像你提到的格林 - 陶定理。它证明了素数包含任意长度的等差数列。

Terence Tao:

对。

Lex Fridman:

你竟然能证明这样的东西,这简直令人难以置信。

Terence Tao:

对。是的。所以通过这类研究我们意识到,不同的模式具有不同程度的不可破坏性。孪生素数问题之所以困难,是因为如果你考虑世界上所有的素数,3、5、7、11 等等,其中存在一些孪生素数,11 和 13 就是一对孪生素数,诸如此类。但如果你想去掉这些孪生素数,你可以很容易地对素数进行编辑。孪生素数会不断出现,而且有无穷多个,但实际上它们相当稀疏。我的意思是,一开始有不少,但一旦数字达到百万、万亿,它们就变得越来越稀少。实际上,如果有人能够访问素数数据库,你只需在这里或那里删掉几个素数就行。

他们只需去掉0.01%的质数之类的,而且只要挑选得当,就能使孪生素数猜想不成立。所以你可以给出一个经过筛选的质数数据库,它能通过所有关于质数的统计检验。它遵循诸如多项式定理以及质数的其他性质,但不再包含任何孪生素数。这是孪生素数猜想面临的一个真正障碍。这意味着,任何在实际质数中寻找孪生素数的证明策略,应用到这些稍有改动的质数上时必然会失败。所以,必然存在质数的某些非常微妙、精巧的特性,而这些特性无法仅通过总体统计分析得到。

Lex Fridman:

好吧,所以这个方法行不通。

Terence Tao:

是的。另一方面,事实证明等差数列要稳健得多。实际上,你可以取质数,然后去掉其中99% 的质数,而且你可以随意去掉其中90% 。结果是,我们还证明了另一件事,即你仍然能得到等差数列。等差数列就像蟑螂一样,生命力顽强。

Lex Fridman:

不过长度是任意的。

Terence Tao:

是的。是的。

Lex Fridman:

这太不可思议了。

Terence Tao:

是的。

Lex Fridman:

所以对于不了解的人来说,等差数列是指一系列数字,相邻两个数字之间的差值是固定的。

Terence Tao:

是的。但这又像是一种无限猴子定理式的现象。对于你设定的任何固定长度,你都不会得到任意长度的序列。你只会得到相当短的序列。

Lex Fridman:

但你说孪生素数问题并非“无限猴子”现象。我的意思是,它是一只非常狡猾的“猴子”。它仍然是一种“无限猴子”现象。

Terence Tao:

对。没错。如果质数真的是随机的,如果质数是由猴子随机生成的,那么事实上,无限猴子定理会——

Lex Fridman:

哦,但你是说孪生素数,不能用同样的方法。它几乎不像是随机的。

Terence Tao:

嗯,我们并不确定。我们认为质数的分布类似于随机集合。因此,我们关注孪生素数猜想,是将其作为一个测试案例,检验我们是否真能毫无误差地确信质数的分布类似随机集合。我们知道,在随机版本的质数中,至少有100%的可能性存在孪生素数,或者随着范围不断扩大,这个概率趋向于100%。所以,我们认为质数是随机分布的。等差数列之所以普遍存在,是因为无论它看起来是随机的,还是像周期函数那样有规律,在这两种情况下,等差数列都会出现,只是原因不同。基本上,这就是……这类等差数列型定理有很多证明方法。

而且它们都可以通过某种二分法来证明,即你的集合要么是有结构的,要么是随机的,在这两种情况下你都能得出一些结论,然后将两者结合起来。但在孪生素数问题中,如果素数是随机的,那么你就成功了,你就赢了。如果素数是有结构的,它们可能以一种特定的方式构成,从而排除了孪生素数的存在。而我们无法排除这种可能的情况。

Lex Fridman:

然而据我所知,你在K元组版本上取得了进展。

Terence Tao:

对。没错。关于阴谋论,有趣的一点是,任何一个阴谋论实际上都很难被证伪。比如说,如果你相信世界是由蜥蜴人统治的,即便有证据表明这不是真的(此处听不清02:24:32),只是有人在谈论蜥蜴人而已。你可能遇到过这种现象。

Lex Fridman:

是的。

Terence Tao:

几乎没有办法彻底排除阴谋论。在数学领域也是如此。对于一个专门致力于消除孪生素数的阴谋,你还必须涉足数学的其他领域,但至少就我们所知,它可以做到前后一致。但有一种奇怪的现象,即你可以用一种阴谋论排除其他阴谋论。所以,如果这个世界是由蜥蜴人掌控的,那就不可能同时由外星人掌控,对吧?

Lex Fridman:

对。

Terence Tao:

所以,一件不合理的事很难证伪,但要是不止一件,就有办法了。所以,比如说,我们知道存在无穷多个质数,其中任意两个…… 所以存在无穷多对质数,它们的差值最多为246,实际上这就是关键数字。

Lex Fridman:

哦,所以在这方面似乎有一个界限——

Terence Tao:

对。有孪生素数,还有一种叫表亲素数,它们相差4。还有一种叫六素数,它们相差6 。

Lex Fridman:

什么是性感素数?

Terence Tao:

相差为6的素数。这个名字远没有…… 它引发的兴奋程度远低于名字所暗示的。

Lex Fridman:

明白了。

Terence Tao:

所以你可以通过一个阴谋论排除其中之一,但一旦有50个,结果是你无法一次性排除所有。在这个阴谋论的范畴里,不知为何这需要消耗太多精力。

Lex Fridman:

你是如何做界定部分的呢?你是如何为不同的团队存款制定一个界限的呢?

Terence Tao:

好的。

Lex Fridman:

……存在无穷多个?

Terence Tao:

所以这最终基于所谓的鸽巢原理。鸽巢原理指出,如果你有若干只鸽子,它们都要飞进鸽巢,且鸽子的数量比鸽巢多,那么其中一个鸽巢里至少得有两只鸽子。所以必然有两只鸽子离得很近。例如,如果你有100个数字,它们都在1到1000的范围内,那么其中至少有两个数字的差值最多为10,因为你可以把1到1000的数字划分成100个“鸽巢”。假设你有101个数字,那么其中至少有两个数字的距离小于10,因为其中至少有两个数字属于同一个“鸽巢”。所以这是数学中一个基本原理的基本特征。

所以这对于质数来说并不完全适用,因为随着数字增大,质数变得越来越稀少,也就是说质数的数量越来越少。但事实证明,有一种方法可以给数字赋予权重。有些数字几乎可以算是质数,尽管它们除了1和自身之外并非完全没有其他因数,但它们的因数非常少。结果表明,我们对“几乎质数”的理解比对质数的理解要深入得多。例如,长期以来人们就知道存在孪生“几乎质数”。这一点已经研究清楚了。所以“几乎质数”是我们能够理解的概念。实际上,你可以将注意力集中在一组合适的“几乎质数”上。与质数相比,质数总体上非常稀少,而“几乎质数”实际上没那么稀少。

你可以构建一组几乎是素数的数集,其中素数的密度比如说为1%。这样一来,通过运用某种鸽巢原理,你就有机会证明存在间隔仅为100的素数对。但为了证明孪生素数猜想,你需要将素数的密度提高到甚至50%的阈值。一旦达到50%,你就能得到孪生素数。但不幸的是,存在着障碍。我们知道,无论你挑选出多么好的几乎是素数的数集,素数的密度永远无法超过50%。这就是所谓的奇偶性障碍,而我很想攻克它。所以我长期以来的梦想之一,就是找到突破这一障碍的方法,因为这不仅能解决孪生素数猜想,还能解决哥德巴赫猜想。

而且数论中的许多其他问题目前也陷入了困境,因为我们现有的技术需要突破这一理论上的奇偶性障碍。这就好比要达到光速一样困难。

Lex Fridman:

是的。所以我们应该提到孪生素数猜想,这是数学史上最大的难题之一。还有哥德巴赫猜想。它们感觉就像隔壁邻居。有没有那么些日子,你觉得自己看到了解决问题的路径?

Terence Tao:

哦,对。没错。有时候你尝试做某件事,结果非常顺利。你又一次体会到了我们之前谈到的那种数学直觉。当事情进展得过于顺利时,你会从经验中学习,因为有些困难是你必然会遇到的。我想我的同事可能会这么说:如果你在纽约街头,被蒙上眼睛,送上一辆车,几个小时后眼罩摘下,你发现自己到了北京。我的意思是,这不知怎的太容易了。中间都没有跨越大洋。即便你不太清楚具体发生了什么,你也会怀疑有些地方不对劲。

Lex Fridman:

但这仍萦绕在你脑海深处吗?你是否偶尔会回过头去研究那些质数,看看有什么新发现?

Terence Tao:

是的,当我没什么更重要的事可做时(这种情况越来越少了)。我最近忙得不可开交。但当我有空,却又不想做正事的时候,我沮丧得无法投入到真正的研究项目中,也不想处理行政事务,或者给家里跑腿办事。我可以拿这些事情消遣一下。通常情况下,你不会有什么成果。你只能说:“好吧,行吧。又一次,毫无进展。我得继续前进了。” 偶尔,其中某个问题真的能得到解决。嗯,就像你说的,有时候你觉得自己解决了问题,然后推进了大概15分钟,接着你就会想:“我得检查一下。这太容易了,好得让人不敢相信。” 而事实往往就是如此。

Lex Fridman:

你直觉认为孪生素数猜想和哥德巴赫猜想这两个问题什么时候能被解决?

Terence Tao:

孪生素数,我想我们会——

Lex Fridman:

10年?

Terence Tao:

……不断得到更多的部分结果。它确实至少需要一个…… 这种奇偶性障碍是目前最大的剩余障碍。对于这个猜想,我们有一些更简单的版本,并且已经非常接近答案了。所以我认为在10年内,我们会得到更多更接近的结果,尽管可能还无法完全解决。孪生素数猜想在某种程度上已经很接近了。但对于黎曼假设,我毫无头绪。我想这一切都有点偶然。

Lex Fridman:

所以黎曼假设是一种关于质数分布的更普遍的猜想,对吗?

Terence Tao:

对。是的。也就是说,对于仅涉及乘法而不涉及加法的问题,从乘法的角度来看,质数的表现确实如你所愿的那样具有随机性。在概率论中有一个现象叫做平方根抵消,比如说,如果你想就某个问题对美国民众进行民意调查,只询问一两个选民,你可能得到的样本不好,那么你对整体平均值的测量就会非常不精确。但是,如果你调查的人越来越多,准确性就会越来越好。而且准确性会随着你所调查人数的平方根而提高。所以,如果你调查1000个人,误差范围可能在2% 到3% 之间。同样地,如果你从某种乘法意义上去衡量质数,就有一种特定的统计量,你可以对其进行测量,它被称为黎曼ζ函数,它会上下波动。

但在某种意义上,随着你不断进行越来越多的平均操作,如果你进行越来越多的采样,波动应该会下降,就好像它们是随机的一样。而且有一种非常精确的方法来量化这一点。黎曼假设就是一种非常巧妙的捕捉这种现象的方式。但和数学中的许多其他方法一样,我们几乎没有工具来证明某事物确实表现得完全随机。实际上,这不仅仅是有点随机,而是要求它的表现和真正的随机集合一样随机,也就是这种平方根抵消。而且由于与奇偶性问题相关的一些原因,我们知道我们大多数常用的技术都无法解决这个问题。证明必须来自意想不到的方向。但具体是什么,还没有人提出任何靠谱的建议。解决方法有很多种。就像我说的,你可以对质数做一些小的修改,这样就能推翻黎曼假设。

所以它必须非常精细。你不能采用误差范围很大的方法。它必须刚好能勉强奏效。而且还有各种陷阱,你得非常熟练地避开。

Lex Fridman:

质数真的很迷人。

Terence Tao:

是的。没错,没错。

Lex Fridman:

关于质数,你觉得最神秘的地方是什么?

Terence Tao:

这是个好问题。据推测,我们对它们有一个不错的模型。我的意思是,就像我所说的,它们有特定的模式,比如说质数通常是奇数。但除了一些明显的模式之外,它们的表现非常随机,只能假设它们就是这样表现的。所以有一种叫做质数的克莱默随机模型,在某个点之后,质数的表现就像一个随机集合。并且对这个模型有各种细微的修改。但这一直是个很不错的模型。它与数值相匹配。它告诉我们该预测什么。我可以完全肯定地告诉你,孪生素数猜想是正确的。随机模型给出了极大的可能性表明它是正确的,只是我无法证明。我们的大多数数学方法都是为了解决有模式的问题而优化的。

而且素数存在这种反模式,实际上几乎所有事物都是如此,但我们无法证明这一点。我想,素数具有随机性并不奇怪,因为它们没有理由存在任何秘密模式。但奇怪的是,究竟是什么机制真正导致了这种随机性的产生呢?这一点完全不清楚。

考拉兹猜想

Lex Fridman:

另一个极其出人意料的难题是考拉兹猜想。

Terence Tao:

哦,是的。

Lex Fridman:

表述简单,其简洁性在直观呈现上很美,但却极难解决。然而你们已经取得了进展。保罗·埃尔德什(Paul Erdos)在谈到考拉兹猜想(Collatz conjecture)时表示,数学或许还未准备好应对这类问题。其他人则称这是一个极其困难的问题,完全无法解决,这是在2010年,当时的说法是这个问题超出了当代数学的能力范围,然而你们却取得了一些进展。为什么解决这个问题如此困难呢?你们真的能解释这是为什么吗,这才是关键所在——

Terence Tao:

哦,对。所以这是一个你可以解释的问题。借助一些视觉辅助工具会有帮助。不过,没错,你取任意一个自然数,比如说13,然后对它应用以下步骤。如果这个数是偶数,就将它除以2;如果是奇数,就将它乘以3再加1。所以偶数会变小,奇数会变大。13就会变成40,因为13乘以3是39,再加1就得到40。这是个简单的过程。对于奇数和偶数,这两个操作都很简单。然后把它们组合起来,仍然相当简单。但接着你会问,当你不断重复这个过程会发生什么呢?你把刚刚得到的结果作为输入再放回去。13变成40,40是偶数,除以2得20。20还是偶数,再除以2得10,5,然后5乘以3再加1得16,接着是8、4、2、1。然后从1开始,又变成1、4、2、1、4、2、1,就这样永远循环下去。我刚刚描述的这个序列,13、40、20、10等等,这些就是所谓的冰雹序列,因为有一个关于冰雹形成的过度简化模型,这个模型实际上并不完全正确,但不知为何在高中教学中,它仍被作为一阶近似教给学生。这个模型是说,一个小冰晶形成并在云层中聚集。由于风的作用,它上下移动。有时在寒冷的时候,它会增加一点质量,也许还会融化一点。这种上下移动的过程会产生这种部分融化的冰,最终形成冰雹,最后落到地面。所以猜想是,无论你从多大的数开始,取一个数百万甚至数十亿的数,这个上升(如果是奇数)和下降的过程,最终总会落到“地面”。

Lex Fridman:

无论你从多么简单的算法入手,最终都会归结到一个。而且你可能会钻研一段时间——

Terence Tao:

对。

Lex Fridman:

……你降下来。

Terence Tao:

是的。所以,没错,如果你绘制这些序列,它们看起来就像布朗运动。它们看起来就像股市行情。它们只是以一种看似随机的模式上下波动。事实上,通常情况就是这样,如果你输入一个随机数,你实际上可以证明,至少在最初阶段,它看起来就像随机游走。而这实际上是一种带有向下漂移的随机游走。这就好比你一直在赌场的轮盘赌上赌博,赔率对你稍有不利。所以有时你赢,有时你输。但从长远来看,你输的比赢的要多一点。所以如果你一直不停地玩下去,通常你的钱包最终会归零。

Lex Fridman:

所以从统计学角度来看,我们来这里是有道理的吗?

Terence Tao:

是的。所以,大致来讲,我证明的结果是,从统计数据上看,99%的输入最终的值可能不会一直减小到1,但会远小于初始值。这就好比我告诉你,如果你去赌场,只要你玩得够久,大多数时候你钱包里最后剩下的钱会比开始时少。这差不多就是我证明的结果。

Lex Fridman:

那么为什么会有这样的结果呢……你能顺着这个思路继续去证明整个猜想吗?

Terence Tao:

嗯,问题在于我运用了概率论的论据,而总会存在这种特殊事件。所以在概率论中,我们有大数定律,它告诉我们,比如如果你在赌场玩一个长期预期会输的游戏,几乎可以肯定,概率能达到你想要的接近100%,你肯定会输钱。但总会有这种特殊的异常情况。从数学角度来说,即使游戏的胜算不大,你也有可能赢的次数比输的次数略多一些。这很像在纳维 - 斯托克斯方程中,大多数时候波会消散,但可能仅有一种异常的初始条件选择,会导致波幅激增。也可能存在一种特殊数字的异常选择,当其他所有数字都趋于稳定(比如趋于1 )时,这个特殊数字却趋于无穷大。

事实上,有些数学家,比如亚历克斯·康托罗维奇,他们提出实际上这些坍缩迭代类似于某种自动机。实际上,如果你观察它们在二进制中的表现,它们看起来确实有点像生命游戏类型的模式。就像生命游戏可以创造出这些大规模自我复制的物体等等一样,也许你可以创造出某种比空气重的飞行器。有一个数字实际上是对这个飞行器进行编码的,其作用就是编码,目的是创造出一个更大版本的东西。

Lex Fridman:

编码在数字中的比空气重的机器 -

Terence Tao:

是的。

Lex Fridman:

……能永远飞行。

Terence Tao:

所以事实上,康威也研究过这个问题。

Lex Fridman:

哇哦。

Terence Tao:

事实上,康威(Conway)的研究与之非常相似,甚至可以说他的研究对纳维 - 斯托克斯项目(Navier-Stokes project)有更多启发。康威研究了坍缩问题的一般化情况,在这种情况下,不是乘以三再加一或除以二,而是有更复杂的分支列表。但不是只有两种情况,也许会有17种情况,然后数值会上下波动。他证明了,一旦迭代足够复杂,实际上就可以对图灵机进行编码,并且可以使这些问题变得不可判定,还能做类似这样的事情。事实上,他为这类分数线性变换发明了一种编程语言。他把它叫做frac - trat,这是对full - trat的一种戏仿。他还证明了这个语言是图灵完备的,你可以编写一个程序,如果你输入的数字被编码为一个质数,它就会归为零。

它会下降,否则就会上升,诸如此类。所以这类问题的普遍情况实际上和所有数学问题一样复杂。

Lex Fridman:

我们所讨论的细胞自动机存在一些奥秘,若要建立一个数学框架来阐述细胞自动机的相关内容,或许就需要这样一种框架。没错,就像哥德巴赫猜想。

Terence Tao:

是的。如果你想这么做,不是从统计角度,而是希望地球上所有输入都能达到100%。是的。所以可行的办法可能是,从统计角度来说,99% 归为一类,但所有情况都考虑进来的话,这看起来很难。

Lex Fridman:

在这些触手可及的著名难题中,你认为哪一个是我们如今面临的最困难的问题?是黎曼假设吗?

Terence Tao:

嗯,就在那里。“P是否等于NP” 就是个很好的问题,因为这是一个元问题。如果你能肯定地解决这个问题,即找到一个证明P等于NP的算法,那么理论上,这也能解决许多其他问题。

Lex Fridman:

并且我们应该提及一些我们一直在讨论的猜想。现在很多东西都是建立在它们之上的。这会产生连锁反应。P=NP问题产生的连锁反应基本上比其他任何——

Terence Tao:

对。如果黎曼假设被证伪,这将对数论学家造成巨大的精神冲击。但它也会对密码学产生后续影响,因为许多密码学都用到数论,采用涉及质数等的数论构造。而且它在很大程度上依赖于经过多年积累形成的数论直觉,即哪些涉及质数的运算表现得随机,哪些不是。特别是,加密方法旨在将文本形式的信息转化为文本,这种文本与随机噪声无法区分。因此,我们认为至少从数学角度来说,破解几乎是不可能的。但如果像黎曼假设错误这样的事情颠覆了我们的认知,那就意味着存在我们尚未意识到的质数实际模式。

如果出现了一个(漏洞),很可能还会有更多。突然间,我们的很多加密系统都令人存疑。

Lex Fridman:

是的。但话说回来,你要怎么描述素数相关的内容——

Terence Tao:

是的。

Lex Fridman:

… 你又因为考拉兹猜想而朝着那个方向研究了?因为,你希望它是随机的,对吧?

Terence Tao:

是的。

Lex Fridman:

你希望它是随机的吗?

Terence Tao:

是的。所以更广泛地说,我只是在寻找更多工具、更多方法来表明事情是随机发生的。你要如何证明一场阴谋并不存在呢?

Lex Fridman:

对。在你看来,P有没有可能等于NP呢?你能想象一个可能存在这种情况的宇宙吗?

Terence Tao:

这是有可能的。我的意思是,存在各种情况。我的意思是,有一种情况从技术上来说是可能的,但实际上却永远无法实现。证据在某种程度上略微倾向于否定,即很可能P不是一个好的NP问题。

Lex Fridman:

我的意思是,这似乎是类似于黎曼假设的情况之一。我认为证据非常倾向于否定的答案。

Terence Tao:

当然,否定的证据比肯定的更多。关于P是否等于NP这个问题,有趣的是,与几乎任何其他问题相比,我们遇到的阻碍也要多得多。所以,虽然有一些证据,但我们也有很多结果排除了许多种解决这个问题的方法。这实际上是计算机科学非常擅长的一件事。它实际上是在说某些方法行不通。这就是 “不可能定理”。这个问题可能是不可判定的,是的,我们不知道。

菲尔兹奖

Lex Fridman:

我读过一个有趣的故事,当你获得菲尔兹奖时,有网友写信问你,赢得了这个享有盛誉的奖项后,你打算做什么?然后你很快且非常谦逊地说,一块闪亮的金属解决不了我目前正在研究的任何问题,所以我会继续钻研这些问题。首先,我觉得你在那种情况下还回复邮件很有意思,其次,这也体现了你的谦逊。不过,不管怎样,或许你可以谈谈菲尔兹奖,但这也是我询问关于格里戈里·佩雷尔曼的一种方式。他拒绝接受菲尔兹奖和附带100万美元奖金的千禧年大奖,这事很出名,你怎么看?他说:“我对金钱和名声不感兴趣。这个奖对我来说完全无关紧要。如果证明是正确的,那就不需要其他认可了。”

Terence Tao:

是的,不,他算是个异类,即便在那些往往持有某种理想主义观点的数学家中也是如此。我从未见过他。我想有一天要是能见到他,我会很感兴趣,但一直没机会。我认识见过他的人。他对某些事情总是有强硬的观点。我的意思是,他并非完全与数学界隔绝。我是说,他会做讲座、写论文之类的,但在某个时候,他就决定不这么做了。

Terence Tao:

… 他会进行交流、撰写论文等等,但在某个时候,他决定不再与社区中的其他人互动。也许他是幻想破灭了还是怎样,我不清楚。然后他决定退出,去圣彼得堡采蘑菇之类的。这也没什么,你可以这么做。这是另一种情况。我们解决的很多问题,其中一些确实有实际应用,这很棒。但如果你不再思考某个问题,所以他从那以后就没在这个领域发表过文章了,但这也没关系。还有很多很多其他人也在继续研究。

是的。所以我想一开始我没有意识到的一点是,菲尔兹奖某种程度上会让你成为体制的一部分。所以大多数数学家,纯粹的职业数学家,只是专注于发表下一篇论文,或许晋升一个职级,启动几个项目,可能还会带几个学生之类的。但突然之间,人们会想听你对某些事情的看法,而你就得稍微思考一下那些你可能会不假思索就说出来的事情,因为你知道现在没人会随便听你讲了,这些话变得更重要了。

Lex Fridman:

这对你来说有束缚吗?你还能玩得开心、叛逆一下、尝试疯狂的事情并玩味各种想法吗?

Terence Tao:

我现在的空闲时间比以前少了很多,这大多是我自己的选择。我总是说我可以选择拒绝,所以我拒绝了很多事情。我本可以拒绝更多,不然就可能会落得个不可靠的名声,以至于人们都不再来问我了。

Lex Fridman:

我喜欢这里各种各样的算法。这太棒了。

Terence Tao:

这始终是一种选择,但有些事情我不会像做博士后时那样花那么多时间,比如一次只专注于一个问题,或者随便捣鼓点什么。我现在还是会稍微做一点。但没错,随着你职业生涯的发展,软技能变得越来越重要,所以数学在某种程度上把所有技术技能都集中在职业生涯的早期阶段。所以作为博士后,你要么发表成果,要么面临淘汰。从激励机制上来说,你基本上要专注于证明非常技术性的定理,既要证明自己,也要证明算法。但随着你资历渐深,你就得开始指导他人、进行面试,并尝试从研究角度塑造该领域的发展方向,有时还得做各种行政工作。这算是一种合理的社会契约,因为你需要深入基层,了解什么能帮助数学家。

Lex Fridman:

另一方面,真正积极的一点是,你可以成为一盏明灯,激励许多年轻的数学家或仅仅对数学感兴趣的年轻人。就好像——

Terence Tao:

是的,是的。

Lex Fridman:

……人类思维究竟是如何运作的。在这一点上,我可能会说我喜欢菲尔兹奖,它确实在某种程度上激励了许多年轻人。人类大脑就是这样运作的。与此同时,我也想对像格里戈里·佩雷尔曼这样批评奖项的人表达某种敬意。在他看来,这些是他的原则,而任何一个人,只要能够秉持自己的原则去做大多数人做不到的事情,看到这样的情景都是很美好的。

Terence Tao:

一些认可很有必要,也很重要,但是,同样重要的是,不要让这些东西主宰你的生活,不要一门心思只想着拿下下一个大奖之类的。所以,你又会看到有些人只试图去解决真正重大的数学问题,而不去钻研那些没那么吸引人的问题,如果你愿意这么说的话,但实际上这些问题依然很有趣,也很有启发性。就像你说的,按照人类的思维方式,当事物与人类相关联时,我们会理解得更好,而且如果它们与少数几个人相关联,效果更佳。按照人类的思维模式,我们能够理解10到20个人之间的关系。但一旦人数超过100人左右,就会有个限度,我想这是有个说法的,超过这个限度,就变得不一样了。

所以你必须简化(听不清,02:49:21),99.9% 的人类变成了另一种情况。通常这些模式是不正确的,这就会引发各种问题。所以,是的,要使一个主题人性化,如果你确定少数几个人,并说这些人是某个主题的代表人物,比如说榜样,那是有一定作用的,但过多这样做也可能有害,因为我首先要说,我自己的职业道路并非典型数学家的道路。我接受的是非常快速的教育,跳过了很多课程。我觉得我一直很幸运能有指导机会,而且我觉得自己在正确的时间出现在了正确的地方。仅仅因为某人没有我这样的轨迹,并不意味着他们不能成为优秀的数学家。他们可以成为优秀的数学家,但风格会截然不同,而我们需要不同风格的人。

而且有时候,人们过于关注那个在数学或其他领域完成项目最后一步的人,而实际上这个项目历经了几个世纪或几十年,建立在大量前人的工作基础之上。但如果你不是专家,就很难讲清楚这个故事。简单地说某一个人做了某件事会更容易。这样讲述历史要简单得多。

Lex Fridman:

我认为总体而言,这是一件非常积极的事情。说到史蒂夫·乔布斯作为苹果公司的代表,我个人了解,当然大家也都知道,那些令人惊叹的设计、卓越的工程团队,以及团队中的每一个人。他们不仅仅是一个团队,而是一个个有血有肉的个体组成的团队,其中蕴含着无数的智慧。不过,用史蒂夫·乔布斯来代表苹果就像用π来表示圆周率一样,是一种很简洁的说法。

Terence Tao:

是的,作为一个起点,作为第一近似值,你可以这样——

Lex Fridman:

然后阅读一些传记,接着对初步近似进行更深入的研究。

安德鲁·怀尔斯与费马大定理

Terence Tao:

是的。

Lex Fridman:

没错。所以你提到你也在普林斯顿大学。当时的安德鲁·怀尔斯——

Terence Tao:

哦,对。

Lex Fridman:

……他当时是那里的一名教授。历史就是这样奇妙地相互关联着,就在那时,他宣布自己证明了费马大定理。现在,回顾这段数学史上的时刻,结合更多背景信息,你有什么想法呢?

Terence Tao:

是的,当时我还是一名研究生。我隐约记得这件事引起了媒体的关注,我们都在同一个收发室有自己的信箱,所以我们都会收到邮件,突然安德鲁·怀尔斯(Andrew Wiles)的信箱被邮件塞得满满当当。

Lex Fridman:

这是个不错的衡量标准。

Terence Tao:

是的。我们在喝茶之类的时候都讨论过这个。我们不理解。我们大多数人有点不理解这个证明。我们理解高层次的细节。事实上,有一个正在进行的项目,要用Lean语言将其形式化。凯文·巴扎德实际上——

Lex Fridman:

是的。我们可以稍微偏题一下吗?这有多难呢,因为据我了解,费马大定理的证明涉及极其复杂的内容。

Terence Tao:

是的。

Lex Fridman:

现在要将其形式化真的很困难。

Terence Tao:

是的,我想是这样。没错,你说得对。他们使用的对象,是可以定义的。所以这些对象在Lean中已有定义,也就是说,定义它们是什么是可以做到的。这绝非易事,但已经实现了。不过,关于这些对象有很多非常基础的事实,在各类数学论文中,花了几十年才得以证明。所以,其中很多内容也必须形式化。凯文·巴扎德(Kevin Buzzard)的目标是,实际上他获得了一笔为期五年的资助,用于将费马大定理形式化,他的想法是,他认为自己无法一直追溯到基本公理,但他希望将其形式化到这样一个程度:他唯一需要依赖的 “黑匣子”,是1980年时一些理论家就已经知晓的内容,然后从这一步开始,还需要其他人或其他工作来推进。

所以这是一个与我所习惯的数学领域不同的数学领域。在我所研究的分析领域中,我们研究的对象更接地气一些。我研究的东西,比如质数、函数,至少是在高中数学教育范畴内可以定义的东西。但是,数论还有非常高深的代数方面,在这方面,人们长期以来一直在构建层层叠叠的结构,这是一个非常稳固的结构。它已经非常……至少从基础层面来说,它已经通过教科书等方式得到了极为完善的发展。但情况确实会发展到这样一种程度:如果你没有经过多年的学习,而想要了解这个知识体系第六层的内容,那你必须花费大量时间,才能达到能够理解一些你所熟悉内容的程度。

Lex Fridman:

是什么让你对他的这段历程深受启发呢?就像我们谈到的,他在长达七年的时间里大多都在秘密工作。

Terence Tao:

是的,所以在某种程度上,这与我认为人们对数学家的浪漫想象是相符的,他们觉得数学家都是那种古怪的奇才之类的。所以这肯定强化了那种看法。这是一项伟大的成就。他解决问题的方式与我截然不同,这很棒。我们需要这样的人。

Terence Tao:

如果一个问题太难,我就会选择跳过它,继续做别的事。

Lex Fridman:

明白了。

Terence Tao:

但你需要那些有坚韧不拔精神且无所畏惧的人。我曾与这样的人合作,在合作过程中我一度想放弃,因为我们尝试的第一种方法行不通,第二种也不行。但他们坚信能成功,于是又尝试了第三种、第四种,直到第五种方法成功了。我不得不收回自己的话,说:“好吧。我之前觉得这不会成功,但没错,你一直都是对的。”

生产力

Lex Fridman:

对于不了解的人,我们应该说,你不仅以卓越的工作成果闻名,而且创作力惊人,论文数量众多,且每一篇质量都很高。所以,能够在不同主题间自如切换,这一点值得一提。

Terence Tao:

是的,这对我有效。但也有一些人效率极高,他们能做到深度专注。我认为每个人都得找到适合自己的工作方式。在数学领域,遗憾的是,数学教学采用一种一刀切的方式,我们有特定的课程体系等等。也许如果你参加数学竞赛之类的,会有略有不同的体验。但我觉得很多人直到很晚,或者通常是太晚了,才找到适合自己的数学学习方式。所以他们不再学习数学,而且因为老师用一种他们不喜欢的方式教数学,他们留下了不好的体验。

我的理论是,人类并非生来就具备(数学能力),进化并没有直接赋予我们大脑一个数学中心。我们有视觉中心、语言中心以及其他一些中心,这些都是经过进化磨练而来的,但我们并没有天生的数学感知能力。不过,我们其他的大脑中心足够复杂精妙,以至于我们能够重新利用大脑的其他区域来进行数学运算。所以,有些人找到了如何利用视觉中心来做数学的方法,因此他们在做数学题时会从视觉角度思考问题。有些人则重新利用了他们的语言中心,所以他们思考时非常注重符号。还有些人,如果他们极具竞争意识并且热衷于玩游戏,他们大脑中有一部分区域非常擅长解谜和玩游戏,这部分区域也可以被重新利用。

但当我和数学家们交流时,我能感觉到他们并不完全认同这一点,我能看出他们采用了一些不同的思维方式,虽然并非完全不同,但他们可能更倾向于形象思维。实际上,我并没有那么偏好形象思维。我自己需要大量的可视化辅助工具。数学提供了一种通用语言,所以即使我们思考方式不同,仍然可以相互交流。

Lex Fridman:

但你能看出在思考过程中使用了不同的子系统吗?

Terence Tao:

是的,他们选择不同的路径。他们在我苦苦挣扎的事情上非常迅速,反之亦然,但他们最终仍能达成相同的目标。

Lex Fridman:

这太美妙了。

Terence Tao:

但我们的教育方式,除非你有私人教师之类的,否则像金融技能这类教育只能大规模开展,你得同时教30个孩子。如果他们有30种不同的学习风格,你不可能用30种不同的方式去教。

给年轻人的建议

Lex Fridman:

关于这个话题,对于那些在数学学习上遇到困难,但又对数学感兴趣并希望有所提高的年轻学生,你会给出什么建议呢?在这种复杂的教育环境中有什么方法吗?你会给出什么建议?

Terence Tao:

是的,这是个棘手的问题。好在现在课堂之外有很多丰富数学知识的渠道。在我那个时候,有数学竞赛,图书馆里也有热门的数学书籍。但现在有了YouTube。还有专门用来解数学谜题的论坛。而且数学在其他地方也有体现。比如说,有些爱好者为了好玩而打扑克,出于某些特定原因,他们对某些特定的概率问题很感兴趣。实际上,在扑克、国际象棋、棒球领域都有业余概率学家群体。数学无处不在,实际上我希望借助Lean等新工具,能让更多普通大众参与到数学研究项目中。目前这几乎还从未发生过。

所以在科学领域,公民科学还是有一定空间的,比如天文学领域。有业余爱好者发现了彗星,也有民众能协助生物学家识别蝴蝶等等。在数学领域,也有一些活动,业余数学家可以发现新的质数等等。但在此之前,由于我们必须验证每一项贡献,所以对大多数数学研究项目来说,来自普通大众的意见并无帮助。事实上,这只会耗费时间,因为要进行错误检查等等。但这些形式化项目的一个特点是,它们吸引了更多人参与。所以我相信已经有高中生为其中一些形式化项目做出了贡献,比如为数学库(mathlib)做出了贡献。你不需要拥有博士学位就能从事其中某一项基础工作。

Lex Fridman:

这里的形式化还有一个作用,作为第一步,它也向编程社区敞开了大门。面向那些已经熟悉编程的人。编程在某种程度上可能只是一种感觉,但相比数学,它似乎对人们来说更容易上手。数学被视为一门高深的学科,尤其是现代数学,被看作是一个极难涉足的领域,而编程并非如此。所以这可能只是一个切入点。

Terence Tao:

你可以执行代码并获得结果。你可以很快地打印出“世界”。如果编程被当作一门几乎完全理论化的学科来教授,只传授计算机科学、函数和程序等理论,而且除了一些非常专业的家庭作业外,你实际上并不编程,比如在周末出于兴趣编程,那么编程就会被认为和数学一样难。所以正如我所说,有一些非数学专业的群体,他们为了某些特定目的运用数学知识,比如优化他们的扑克游戏,对他们来说,数学就变得有趣了。

Lex Fridman:

对于年轻人如何选择职业、如何找到自我以及发现自己擅长什么,你一般会给出什么建议?

Terence Tao:

这是个非常非常难的问题。没错,当今世界存在很多不确定性。战后有一段时期,至少在西方,如果你出身良好,就有一条非常稳定的道路通往好的职业发展。你上大学,接受教育,选择一个职业并坚持下去。但这越来越成为过去式了。所以我认为你得有适应能力,懂得随机应变。我觉得人们得掌握可迁移的技能,比如学习一门特定的编程语言,或者某一特定的数学学科之类的。这本身并非一项具有很强可迁移性的技能,但要知道如何运用抽象概念进行推理,或者在出现问题时如何解决问题。不管怎样,我认为即便我们的工具变得更先进,即便你会与人工智能辅助工具等一起工作,这些技能依然是我们所需要的。

Lex Fridman:

但实际上,你是一个有趣的研究案例。你是在世的伟大数学家之一,你本来有自己做事的一套方式,然后突然之间你开始学习。首先,你不断学习新的领域,而且还学习了Lean。这可不是一件容易学的东西。对很多人来说,迈出这一步极其困难,对吧?

Terence Tao:

是的。

Lex Fridman:

很多数学家。

Terence Tao:

首先,我一直对做数学研究的新方法很感兴趣。我觉得我们目前很多做事的方式效率不高。我的很多同事花大量时间做非常常规的计算,或者做一些其他数学家一眼就能知道怎么做,但我们却不知道该怎么做的事情,比如如何进行搜索并快速得到答案等等。所以这就是为什么我一直热衷于探索新的工作流程。

大概在四五 年前,我加入了一个委员会,我们需要征集在一家数学研究所举办有趣研讨会的点子。当时,彼得·舒尔茨(Peter Scholze)刚刚将他的一个新定理形式化,并且在计算机辅助证明方面也有一些其他相当有趣的进展。我就说:“哦,我们应该就此举办一个研讨会。这会是个好主意。” 然后我对这个想法有点过于热情了,结果我被主动告知要实际负责组织。于是我和其他一些人,凯文·巴扎德(Kevin Buzzard)、乔丹·埃伦伯格(Jordan Ellenberg)以及其他一群人一起做了这件事,而且取得了不错的成功。我们召集了一群数学家、计算机科学家和其他人士,了解了最新的进展情况,这真的是非常有趣的发展,大多数数学家都不知道正在发生这些事,有很多很好的概念验证,只是暗示了未来可能会发生什么。这就在ChatGPT出现之前,但即便在那时,也有一场关于语言模型及其未来潜在能力的演讲。

这让我对这个主题兴奋不已。所以在我组织并举办了这场会议后,我开始四处演讲,称这是我们更多人应该关注的东西。后来ChatGPT问世,突然间人工智能无处不在。于是,我多次接受关于这个主题的采访,尤其是关于人工智能与

听不清03:04:33

之间的相互作用。我说:“没错,它们应该结合起来。这将产生完美的协同效应。” 在某个时刻,我意识到自己不能只说不做。我既不从事机器学习工作,也不做证明形式化的工作,而且我不能仅仅凭借权威说 “我是数学家,相信我,这会改变数学”,而自己却不付诸实践,这样做是有局限性的。所以我觉得自己必须切实证明这一点。

实际上,我参与的很多事情,事先我都不太清楚自己会在上面花多少时间,往往是在项目进行到一定程度后我才意识到,但到那时,我已经全身心投入了。

Lex Fridman:

嗯,你愿意投身其中,在某种程度上成为初学者,或者面临初学者会遇到的一些挑战,这真的非常令人钦佩,对吧?

Terence Tao:

是的。

Lex Fridman:

新的概念、新的思维方式,还有在某件事上不如别人……我觉得在那种交流中,就算你是获得过菲尔兹奖的数学家,本科生也可能在某些方面比你懂得多。

Terence Tao:

是的,我认为就数学本身而言,如今数学的范畴极为广泛,以至于没有人知晓现代数学的全部内容。不可避免地,我们会犯错,而且你不能仅靠虚张声势来掩盖错误,因为人们会要求查看你的证明,如果拿不出证明,那就是拿不出。

Lex Fridman:

我热爱数学。

Terence Tao:

是的,所以它确实让我们保持诚实。这不是一个完美的万能药,但我认为我们确实有更多承认错误的文化,因为我们一直被迫这样做。

有史以来最伟大的数学家

Lex Fridman:

这问题太荒谬了。我再次为此感到抱歉。有史以来最伟大的数学家是谁呢,也许是一位已经离世的?有哪些人选呢?欧拉、高斯、牛顿、拉马努金、希尔伯特?

Terence Tao:

所以首先,正如之前提到的,这存在一定的时间相关性。

Lex Fridman:

在那天。

Terence Tao:

是的。比如说,如果你按时间进行累积绘图,欧几里得是主要的竞争者之一,然后在那之前可能还有一些不知名的匿名数学家,也就是任何提出数字概念的人。

Lex Fridman:

如今的数学家们是否仍能感受到希尔伯特的影响,只是——

Terence Tao:

哦,对。

Lex Fridman:

直接受什么的影响?20世纪发生的所有事情吗?

Terence Tao:

是的,希尔伯特空间,当然有很多东西是以他的名字命名的。仅仅是数学的架构以及某些概念的引入,还有那23个问题,都极具影响力。

Lex Fridman:

声明哪些问题难以解决,即对开放性问题的阐述,这其中蕴含着某种奇特的力量。

Terence Tao:

是的,这就是无处不在的旁观者效应。如果没人说你应该做X,每个人就只是在周围闲逛,等着别人去做点什么,结果什么也做不成。而实际上,你必须教给数学专业本科生的一件事是,你应该总是尝试做点什么。所以你会看到很多本科生在尝试解一道数学题时陷入停滞。如果他们意识到有一种特定的技巧可以应用,他们就会去尝试。但有些题目,他们一看,发现自己的标准技巧显然都用不上,常见的反应就是陷入停滞,“我不知道该怎么办”。我记得《辛普森一家》里有句话:“我什么都没试过,却已经没主意了。”所以下一步就是,不管多蠢,去尝试任何方法,事实上,越蠢越好,从技术上来说,这几乎肯定会失败,但失败的方式会给人启发。失败是因为你完全没有考虑到这个假设。哦,这个假设肯定有用。这就是一条线索。

Lex Fridman:

我记得你在某个地方也提到过这种有趣的方法,在他们使用的时候,这个方法就深深印在了我的脑海里,而且它确实有效。我记得你说这叫“结构化拖延”。

Terence Tao:

不,是的。

Lex Fridman:

当你实在不想做某件事的时候,你会想象出一件比它更糟糕、你更不想做的事,然后通过不做那件更糟糕的事来拖延。这是个不错的策略,实际上还挺管用。

Terence Tao:

是的,是的。对于任何事情来说,心理因素都非常重要。你和像马拉松运动员之类的运动员交谈,他们会谈到什么是最重要的,是训练方案还是饮食等等?其中很大一部分是心理因素,就是哄骗自己去认为这个问题是可以解决的,这样你就有动力去做这件事。

Lex Fridman:

是否存在人类思维永远无法理解的事物?

Terence Tao:

嗯,作为一名数学家,(音频03:09:23处听不清)。肯定存在一些你无法理解的大数。这是我首先想到的。

Lex Fridman:

所以,即便宽泛地说,是否我们的思维存在某些方面,即便借助数学的帮助,我们仍会受到限制呢?

Terence Tao:

嗯,好吧,你愿意接受多大程度的辅助呢。比如说,如果我连纸笔都没有,如果我完全没有任何技术手段,也就是说不允许使用黑板、纸笔——

Lex Fridman:

你已经比你原本的受限程度要高得多了。

Terence Tao:

……极其有限。甚至语言,英语,也是一种技术。它是一种已经高度内化的技术。

Lex Fridman:

所以你说得对,这个问题的表述不正确,因为实际上已经不再只是一个以极其复杂精细的方式得到增强的个体人类了,对吧?

Terence Tao:

对。对。

Lex Fridman:

所以这就像是一种集体智慧?

Terence Tao:

是的。嗯,我想,从原则上来说,人类整体在状态良好的时候,比个体人类的智慧总和要高得多。也可能更低,但确实,数学界作为一个整体是极其超级智能的实体,没有任何一位人类数学家能够接近它的能力。在一些问题分析网站上你能略微看到这一点。比如这个Math Overflow,它是数学领域的Stack Overflow,有时候社区会对非常难的问题给出非常快速的回应,作为专家,看着这一切其实很令人愉悦。

Lex Fridman:

我是那个网站的忠实观众,看着形形色色的人展现出的才华,以及他们所具备的深度和知识。还有大家愿意深入探讨特定问题的严谨态度和细微差别,看着真的很酷。几乎可以说,这很有意思。对于人类文明的发展,是什么让你感到充满希望呢?

Terence Tao:

我认为年轻一代总是充满创造力、热情和创新精神。与年轻学生共事是一种乐趣。科学的进步告诉我们,曾经非常棘手的问题如今可能变得轻而易举就能解决。比如导航,过去仅仅是弄清楚自己在地球上的位置就是个极其棘手的问题。人们因为无法导航而丧命或倾家荡产。而现在我们口袋里的设备就能自动为我们完成导航,仿佛这个问题已经彻底解决了。所以,那些我们现在看似不可行的事情,也许将来只是家庭作业练习而已。

Lex Fridman:

是的。生命有限,其中一件让我深感难过的事是,我无法见证我们人类文明创造出的所有精彩事物,因为想象一下,在未来100年、200年后出现的那些东西,200年后的世界啊。

Terence Tao:

是啊,嗯,已经发生了很多事。如果你能回到过去,和十几岁的自己聊聊之类的,互联网,还有现在的人工智能,再说一次,它们正变得越来越内化,当然,人工智能能听懂我们的话,还能对任何问题给出看似合理但略有偏差的答案。但没错,即便在两年前,这也令人惊叹。

Lex Fridman:

此刻,在网上看这类戏剧性事件之类的还挺滑稽的。人们很快就把一切都视为理所当然,然后我们人类似乎就靠这类戏剧性事件来娱乐自己。在任何新创造出来的事物上,总有人会持一种观点,另一个人则持相反观点,然后为此争论不休。但当你纵观事物的发展轨迹,哪怕只是看看机器人技术的发展历程,退一步思考,你会惊叹:“哇,我们人类竟能创造出这样的东西,真是了不起。”

Terence Tao:

当基础设施和文化处于良好状态时,人类群体能够比其中的个体更加聪慧、成熟和理性。

Lex Fridman:

嗯,有一个地方我总能指望看到理性的言论,那就是你博客的评论区,我可是你博客的忠实粉丝。那里有很多非常聪明的人。当然,也感谢你在博客上分享那些观点。你今天愿意花时间和我交流,我真的深感荣幸,难以言表。我期待这一刻已经很久了。特里,我是你的超级粉丝。你激励着我,也激励着数百万人。非常感谢你抽出时间。

Terence Tao:

谢谢你。这是我的荣幸。

Lex Fridman:

感谢收听与陶哲轩的这次对话。若想支持本播客,请查看视频简介中的赞助商信息,或访问lexfridman.com/sponsors。现在,让我以伽利略·伽利雷的一句话作为结束语:“数学是上帝用来书写宇宙的语言。”

感谢聆听,希望下次再见。