演讲者:丘成桐
时间:2018年7月6日
地点:天文数学馆国际会议厅
内容来自《数学传播》42卷4期
爱因斯坦的广义相对论的根源, 是意图统合其发展的狭义相对论与牛顿重力理论。他在1915年完成这项艰巨的任务。大多数物理学家认为这是人类历史上最具创造力的科学工作。容我在此阐释这个理论的一部分。
爱因斯坦
一个重大要素是“等效原理(equivalence principle)”的概念, 其发展之历史至为悠久。伽利略曾以实验验证:物体因重力引起的加速度, 与质量无关。克卜勒曾说:“任意放置的相邻两块石头, 若不在其他同类物体的影响范围, 则它们会如两根磁针聚拢于中间点, 而一块石头朝对方趋近的量, 会与对方的质量成正比。”
爱因斯坦在1970 年说道:
“我们假设重力场与参考系统的相应加速度在物理上完全等效。 小测试物体的重力运动, 仅取决于它在时空的初始位置及速度, 而与它的构造无关。 在自由落体实验室里的任何实验(无论有无重力) 结果, 与实验室的速度及实验室在时空中的位置无关。”
因此, 爱因斯坦意识到, 在他想发展的新重力理论中, 重力定律应与观察者无关。但他需要一个框架来构建此种重力理论, 联系起哲学与观察。由于重力等价于参考系统的加速度, 且质点的加速度可藉由其轨迹的曲率来描述, 爱因斯坦推测:新的重力概念应该与新的空间概念有关。他知道(有固定的坐标系的) 静态空间是不适用的。
爱因斯坦的伟大工作受益于许多几何学家的帮助。他和Grossmann同受业于杰出的几何学家兼物理学家Minkowski。他也与Levi-Civita 长期交流, 后来与Hilbert 和Noether 也时有互动。但最重要的是, 19 世纪大数学家黎曼的空间概念, 对爱因斯坦划时代的贡献居功厥伟。
在黎曼之前, 只有三种类型的空间: 欧几里德空间、 球面空间及双曲空间; 它们都由单一坐标系统描述, 类似当年牛顿所设想的静态宇宙。
然而黎曼在1854 年发表著名的论文“关于几何基础的假说”, 彻底改变了空间的概念。他的空间与上述三种空间全然不同, 且在无固定参考坐标系的情况下仍可存在。他也知道: 当两点非常靠近时, 我们感觉不到加速度, 所以在一阶效应下, 我们感受不到曲率的存在。因此, 在无限小的尺寸, 空间应看似平坦的欧几里德空间。另一方面, 重力的二阶效应必来自质点的加速度。因此, 用于描述重力的动态时, 空间应展现曲率。
我们不确知大域空间是何样貌。另一方面, 空间应该具有足够的一般性, 能在不改变重力的物理本质之下, 容许不同的观察者, 并让他们得以互通信息。因此, 黎曼要求: 我们可使用各种不同的座标系来观察空间的基本属性, 但空间有意义的属性应与坐标系的选取无关。这种空间观点至关紧要, 因为它正是广义相对论中关键的等效原理。
黎曼
在引入抽象空间时, 黎曼定义了曲率的概念。事实上, 广义相对论中重力场的推展是由曲率来量度, 而物质分布是由曲率的一部分来表示; 随着时间推移, 曲率也会随着物质分布的变化而起伏。
曲率的动态显示了时空振动的效应。正因如此, 爱因斯坦得出结论: 重力波尽管微弱, 必当存在。在爱因斯坦方程, 重力场与时空几何不可分割, 浑然一体。
值得注意的是, 在1854 年的演讲中, 黎曼开发新的空间概念, 是为了要理解物理现象。他甚至建议用不同的方式描述空间中至小和极大的部分。从现代物理的角度来看, 黎曼正在寻找量子空间的可能结构!黎曼曾考虑使用离散空间来阐释这个问题。
黎曼自25 岁开始科学著述, 39 岁时因肺疾辞世。过世之前的三年, 他每年都前往意大利避寒, 从而影响了意大利和瑞士的诸多几何学家, 包括Christoffel、 Ricci及Levi-Civita。
他们推广了黎曼的想法, 严格定义了张量和连络(connections), 两者都是广义相对论和规范场理论所不可或缺。Ricci 引入了Ricci 曲率张量, 并证明此张量可产生一个满足守恒律的张量。这些由几何学家在19 世纪中后期完成的工作, 为广义相对论提供了至关紧要的工具。
爱因斯坦在1934 年撰写了题为“广义相对论起源札记(Notes on the origin of the general theory of relativity)” 的文章(见Mein Weltbild, 阿姆斯特丹: Querido 出版社) , 回顾了广义相对论的发展。第一阶段当然是狭义相对论。除了爱因斯坦本人, 该理论的主要创始人还包括Lorentz 和Poincaré。
一个最重要的结果是: 距离受时间影响。但爱因斯坦知道: 狭义相对论与牛顿重力理论的远距离作用(action at a distance)并不相容, 必须予以修正。
牛顿
起初, 物理学家没有意识到: 黎曼做了突破后, 空间概念已发生了根本性的变化。他们试图在三维空间的框架内修正牛顿的重力理论, 使之与甫发现的狭义相对论一致。这个想法导致爱因斯坦误入歧途三年。
爱因斯坦在“广义相对论起源札记” (第286-287 页) 中说:
我当然熟悉Mach的观点;根据该观点,似可想像惯性阻力的反作用不属此类加速度, 而是关乎他物之质量的加速度。这个想法有令我着迷之处,但它没有为新理论提供可行的基础。最简单的方法当然是保留重力的Laplacian纯量位能, 并藉由某个对时间微分的项,以明显的方式完整写下Poisson方程,从而满足特殊相对论。重力场中质点的运动定律也必须因狭义相对论而做修改。其取径并未明确标出,原因是物体的惯性质量可能取决于重力位能。事实上, 基于能量惯性原理,这是合乎预期的。然而, 这些研究结果令我强烈怀疑。惯性和重力质量的等效原理现可极为清楚地陈述如下:在均匀的重力场中,相对于均匀加速的座标系,所有运动都如同发生在无重力场处。这个原则(“等效原则”)若适用于任何事件,就显示出:要获致自然的重力场理论, 相对论的原则需扩展至相互之间非均匀运动的坐标系。1908年至1911年, 这类思考使我烦劳不已…
Minkowski
爱因斯坦在苏黎世求学时, 他的数学教授Minkowski 是与Hilbert 和Poincaré 齐名的大数学家。Minkowski 曾说: ”我的班上有位懒惰的学生, 最近完成了一项重要的工作, 而我已对此提出了几何解释“。
Minkowski 的物理师承Helmholtz、 JJ Thomson 及Heinrich Herz。他认为: 由于“数学与自然之间先定的和谐”, 几何学可作为物理洞察力的关键。他把物理实相归结为时空几何。
1908 年9 月21 日, Minkowski 在科隆自然科学家和医师大会第八十次会议上发表了题为“空间和时间"的演讲, 其中所发展的空间及时间的想法, 随后被应用在他于1908年发表的论文"运动物体之电磁现象的基本方程"; 这是他在电动力学定律的主要工作。(Minkowski 于1909 年辞世) 。这篇生前最后的论文, 对有重量的介质, 提出了第一个相对论上正确的Maxwell 方程表述, 及其以张量运算表达的数学形式。实际上, 爱因斯坦与普朗克(Planck) 就Minkowski 的这项工作写了几篇论文。
普朗克与爱因斯坦
Minkowski 写道:
我想要铺陈的空间和时间观点, 已从实验物理学的土壤中迸现出来, 含藏着它们的力量。 它们很激进。 尔后, 空间及时间本身注定要消没于阴影, 惟有结合两者才能保有独立的实相。
有趣的是, Minkowski 承认: 在很大程度上, 他的时空概念归功于Poincaré 在1906 年的工作; Poincaré 当时注意到: 借着将时间取为虚数, Lorentz 变换会成为旋转。然而, Poincaré 并不认为四维表示具有太多物理意义。直到1908 年, Poincaré 仍表示: "三维语言似乎更适合用来描述世界, 尽管这种描述可改采另一种严谨的风格。"
这与Minkowski 的观点截然不同。他直言:
在某种意义上, 空间和时间的世界是四维的非欧流形。 事实上, 我们所处理的不仅是一种新的空间和时间概念。 我声称的是: 它是一个非常具体的自然法则, 由于它的重要性(因为它涉及所有自然知识的原初概念, 即空间和时间), 它堪称所有自然法则之首。
在1908 年的文章中, Minkowski 构建了一个四维空间, 仿效黎曼引入一个度量张量, 提出狭义相对论的几何意义。作为狭义相对论中基本对称群的Lorenzian群, 就成了Minkowski时空的等距群(group of isometries)。破天荒地, 我们从Minkowski 得知自己生活在四维时空中。于是, 在1908 年, 爱因斯坦从Minkowski 获得广义相对论最重要的灵感: 他必须根据空间应是四维的这一事实, 来构建他的新重力理论。
一般认为, 在这一年里, 爱因斯坦最重要的作为就是他的思考实验(thought experiment)。思考实验让爱因斯坦知道等效原理的重要性, 也让他了解以新几何展现重力的需要。他知道他需要新的空间概念来达成目的。牛顿重力的静态空间不复适用。
Minkowski 的文章为何如此重要?从三维空间至四维空间, 不仅是概念上的突破, 而且也唯有在四维空间内, 重力才能有足够的空间来展现它的动态性质!牛顿的重力理论是静态的, 单一函数即足以描述重力现象。
Minkowski 时空提出了最重要的概念, 即我们需要一个张量来描述重力。张量是甫发明的概念; 组成张量的众多函数协同一致地转换, 从而遵循等效原理。
Minkowski 的张量完美地描述了狭义相对论, 但爱因斯坦希望进一步将牛顿力学与Minkowski 空间结合起来。因此, 在无限小的尺度, 他的新时空理论应等同于Minkowski 时空。也因此, 当两点非常靠近时, 若仅虑及一阶效应, 掌控它们的重力规则应即Minkowski 时空的规则。然而, 考量重力的二阶效应时, 这不复属实, 曲率变得重要。当时, 物理学家对张量概念一无所知(事实上, 也只有少数几何学家了解张量分析。)
爱因斯坦由等效原理得知, 新的重力位能应取决于一点及该点之切空间的切线向量(速度向量), 但他不知道有何可用的数学工具。于是他求助于同窗Marcell Grossmann, 终于发现重力场应该用度量张量来描述。此张量在时空中不断变化, 但在每一点都可用一阶Minkowski 度量来作逼近。
Grossmann 是一位几何学家, 在苏黎世时曾帮爱因斯坦写几何作业。他在图书馆发现了张量的想法。然而, 单独引入度量张量的想法并不足以描述重力场。我们需要知道如何在弯曲的空间对张量做微分, 并希望微分的结果也与坐标系的选取无关(等效原理的要求)。这正是Christoffel 和Levi-Civita 的连络理论。
爱因斯坦在上述的广义相对论回忆录中说,这是他的第一个问题, 发现到已被Levi-Civita 和Ricci 解决。爱因斯坦的第二个问题是, 如何在这个新框架中推广牛顿的重力定律。牛顿方程很简单, 即重力位能的二阶导数等于物质密度。
当时, 爱因斯坦和Grossmann 都不知道该如何微分度量张量, 好让微分所得仍是与座标选取无关的张量。在爱因斯坦一再央求下, Grossmann 勉为其难去了图书馆, 找到Ricci 的工作。结果Ricci 早已将黎曼的曲率张量收缩为对称的二阶张量; 它与度量张量有相同的自由度, 可视为度量张量的二阶导数。爱因斯坦立即意识到: 它必定是场方程的左侧, 而右侧是一般物质分布的张量(在平坦空间中, 该张量已被深入研究。) 在两篇分别发表于1912 年及1913 年的文章中, 爱因斯坦和Grossmann 提出了这个方程式。
然而, 当爱因斯坦试图藉由渐近方法解此方程时, 并未重现他试图解释的天文现象(例如光偏折、 水星在近日点的偏移) 。这让他非常沮丧。
随后的几年里, 他为了解释天文现象, 试图选取特殊坐标, 实质上放弃了珍贵而简洁的等效原理。他与Levi-Civita 之间的诸多交流也无所助益。
为佐证我的陈述, 兹援引爱因斯坦的论文: 广义相对论起源札记(1934年, 第288-289页)
我很快就发现:等效原理所要求计入的非线性变换, 与坐标的简单物理诠释势必无法共存;亦即, 坐标差异不再彰显理想尺度或时钟的直接测量结果。
我对此认知深感困扰, 因为我花了很长的时间, 才了解物理学中坐标的意涵。直到1912 年, 我才找到摆脱此困境的方法, 它是做以下考虑之后的心得: 必须找到一个新的惯性定律; 当没有"实存的重力场"时, 若以惯性系统为座标系, 该新定律即为伽利略的惯性原理。伽利略所陈述的是: 一个未受力的质点, 在四维空间中将表征为一直线, 亦即一段最短的线, 或者更确切地说, 一条极值线(extremal line)。
该概念预先假定线元的长度,亦即度量。在狭义相对论中,如Minkowski所示,该度量为拟欧几里德(quasi-Euclidean),亦即线元『长度』 的平方是座标微分的某个二次函数。如果藉由非线性变换引入其他座标,则 仍是座标微分的齐次函数,但函数的系数不再是常数,而是座标的某个函数。在数学术语中,这意味着物理(四维)空间具有黎曼度量。对于除了重力之外未受他力作用的质点,该度量的类时(timelike)极值线提供了质点的运动定律,而该度量的系数以选取的座标系来描述重力场。如是, 等效原理的自然表述已被找到, 它可扩展到任何重力场, 形成完全自然的假设。
因此, 上述困境的解决方案如下: 物理意义无关乎坐标的微分, 而仅与相对应的黎曼度量相关。现已找到了广义相对论的可行基础。然而, 还有两个待解决的问题:
1.若根据狭义相对论来陈述场律, 如何将其转移到黎曼度量的情况?
2.什么微分定律决定了黎曼度量(即 )?
就问题2而言,其解决方案显然需要藉由来构造二阶微分不变量。我们很快看出这些已由黎曼(曲率张量) 建立。在发表广义相对论的两年之前, 我们已经考虑了正确的重力场方程, 但无法看出它们如何用于物理。
爱因斯坦在1913 年至1915 年间持续拼搏。有趣的是, 在没有物质分布时, 爱因斯坦和Grossmann 写下的方程式其实是正确的。事实上, 在爱因斯坦和Hilbert 写下正确的场方程之后, Schwarzschild 在1916 年对球状恒星得到爱因斯坦方程的解。
Schwarzschild
Schwarzschild 的解假设物质不存在, 且该解足以计算由太阳的重力引起的光偏折。因此, 如果爱因斯坦和Grossmann 找到精确的球对称解, 他们大可在1913 年进行观察。显然, 当近似解未能提供与物理观察相符的正确答案时, 爱因斯坦气馁了。他非常沮丧, 并试图使用特殊座标, 放弃等效原理。以下的文字透显了他的沮丧:
相反地, 我确信它们未能妥当处理实验结果。更甚者, 我相信我可以在一般性的考虑下证明: 在座标变换下保持不变的重力定律, 与因果律不一致。 这些是思维上的错误, 致使我耗时两年过于艰苦地工作, 1915 年底才终于辨识出错误, 懊恼地回到黎曼曲率, 随即成功地将理论与天文观测的结果联系起来。
由最终的理解看来, 喜悦的成果似乎理所当然, 任何聪明的学生都能毫不费力地掌握它。但在黑暗中焦虑探索的岁月, 内中强烈的渴望、 交替更迭的信心与疲惫, 以及最终涌现的光亮- 只有经历过的人才能理解。
现在让我们回溯广义相对论的最后工作阶段发生的事。1915 年春, 爱因斯坦造访哥廷根的大数学家David Hilbert。Hilbert 当然深谙几何, 但最重要的是, 他是当代几何不变量理论的奠基者。他在哥廷根邀集了大批杰出的数学家, 其中的一些如下述: Felix Klein 是援用对称群来分类几何的先驱, Hilbert 的学生Hermann Weyl 是规范场理论的奠基者, Emmy Noether 堪称史上最伟大的女性数学家。在1915 年至1918 年期间, Noether 发展了她的流(current) 理论, 据此我们可使用连续对称来推导运动方程。(在广义相对论中, 连续的对称群是坐标变换的群。)
爱因斯坦的访问恰逢其时!Hilbert 在同年11月发现了Hilbert作用量(action), 借之迅即推导出正确的重力方程。获悉此事并收到Hilbert 关于方程式的明信片后, 爱因斯坦也快速获得他的方程式, 且据此推算出他一直试图解读的天文现象。
起初, 爱因斯坦不满Hilbert抢得头筹。但Hilbert旋即宣称这项工作应该完全归属于爱因斯坦, 让爱因斯坦宽了心。这是一项划时代的工作。后代物理学家和数学家都应向爱因斯坦致以最崇高的敬意。但我希望历史记住那群几何学家, 莫忘他们曾帮助爱因斯坦完成伟大的重力理论。凡此所述大都出自爱因斯坦的文章。遗憾的是, 在那篇文章中, 他并未提到Hilbert的贡献。
回头看, Hilbert 和爱因斯坦导出的正确运动方程, 其实Grossmann 及爱因斯坦在1913 年早能发现。1913 年之方程式左侧是Ricci 曲率, 右侧是物质张量。右侧是吾人所熟悉的, 符合守恒定律。但方程式左侧是不满足守恒律的Ricci 张量。所以两侧不会相等。因此, 左侧应该置换为满足守恒律的某种曲率张量。事实上Ricci 早已用Bianchi 恒等式发现了此种张量, 亦即把度量张量乘上Ricci 张量的trace, 而后将Ricci 张量减去此乘积。如果爱因斯坦和Grossmann 信赖几何的美, 并试图根据其内在一致性完成方程式, 就不必等到1915 年才写下正确的方程式。
完成广义相对论后, 爱因斯坦认为: 物理学最基本的部分应由思考实验及数学的优雅来主导。在文章的最后, 他说: 在找到广义相对论的方程之后, 一切都来得如此自然而简单, 对有能力的学者来说轻而易举。然而, 在找到真理之前, 他殚精竭虑, 经年劳瘁, 日夜承受煎熬, 箇中艰辛难以言说。爱因斯坦的工作堪称人类所曾完成的最伟大科学工作。
广义相对论的成功留给我们另一项艰巨的任务: 解释重力的自然现象。任务之所以困难, 是因方程组为十足地非线性, 且背景时空呈动态变化。对此复杂的非线性系统, 重力物理学无法准确描述其初始数据或边界条件。
动态变化的时空没有全域的对称性。全域时间不存在, 亦即类时的平移对称性不存在, 致使牛顿力学的许多重要物理量难以定义。如果类时平移能让系统保持不变, 则Noether 的流理论允许我们定义质量及线性动量之四维向量。但广义相对论的一般系统不存在连续的对称群。
不存在连续对称性, 致使我们难以定义经典概念, 诸如质量、 线性动量和角动量, 这些是理解重力物理学的基础。观看两颗中子星相互作用时, 我们需要知道每颗星球的质量及整个系统的束缚能(binding energy), 将物质和重力的贡献加总。这个问题出现在广义相对论, 因为该理论不容许能量密度的概念; 理由如下述: 如果存在密度, 它将仅取决于作为重力位能之度量张量的一阶讯息。然而, 我们总能找到一个座标系, 其度量张量的一阶微分在某点为零; 这意味着能量密度为零。
一百年前, 爱因斯坦已经意识到这些问题。基于模拟牛顿力学的拟张量(pseudo-tensor)概念, 他提出了能量的定义。Arnowitt, Deser 和Misner 在1962 年更精确地阐明此定义, 现今称之为ADM 质量。该定义适用于孤立的物理重力系统, 其总质量可被定义。从Noether 的观点来看, 这是很自然的, 因为对于孤立的物理系统, 我们期望在无穷远处存在渐近对称性, 且无穷远处的时间平移捕获系统的总能量。这是总能量的一个良好定义。但是, 它仅捕获总能量, 而我们需要探索部分能量的详细讯息。
再次, 这个至关紧要的问题可回溯至爱因斯坦。他曾提出重力辐射的概念: 时空的振动会辐射出提供能量的波。该能量来自系统的束缚能。Bondi、 van der Burg、 Metzner 及Trautman 澄清了此概念, 在一些迷矢超曲面( hypersurface) 上定义质量, 称之为Bondi 质量。它具有很好的特性, 会随零超曲面移往未来而减少。减少的Bondi 质量被诠释为重力辐射带走的能量。Bondi 质量的定义很重要, 因为它描述了时空的动态。然而, 该定义预设某些取决于爱因斯坦方程动态的时空结构。
ADM和Bondi质量本质上都是总质量,无法捕捉到与他物作用中的物体之质量。一个重要的问题是:如何定义两个相互作用的中子星之束缚能。因此,我们需要一个拟局部(quasilocal)质量的概念:在时空中给定一个封闭的二维(类空间)曲面 S,它包含的总能量是多少?如果 S 是时空中某三维的类空间流形 M的边界,我们想测量 M 中 S 所包围的总质量。既然我们想确保能量守恒,那么我们想要的量应该完全取决于时空中 S 的讯息,而与 M的选取无关。这是拟局部质量的守恒律。
长久以来, 这个量的存在性一直是个严肃的问题。爱因斯坦和广义相对论领域的后继学者最感兴趣的是: 孤立物理系统的ADM 质量总量是否为正?
事实上, 在1957 年, Bondi 和其他著名的物理学家曾聚会, 讨论广义相对论中负质量的可能性。爱因斯坦的理论无法判断这是否可能。但如果总质量为负, 则系统可能会崩塌, 这意味着: 对不稳定系统, 爱因斯坦的重力理论可能会产生相当让人困扰的效应。
Schoen 和我在1979 年证明了ADM 质量为正, 并于1981 年发表完整的证明。我们的证明较为几何性。随后, Witten 藉由Dirac 算子给出了另一个证明; 它对物理学家来说更易了解。不久之后, Bondi 质量也被证明为正。于是, 在重力作用下, 孤立物理系统总质量的情况非常令人满意。
Schoen和我用我们的方法有效地证明:黑洞会在物质密度足够大时形成。关于物质密度很大时黑洞的形成, 这可能是第一个严谨的陈述。
证明拟局部质量的良好定义存在, 耗时甚久, 涵盖的工作分属多人, 包括Penrose、 Hawking、 Brown-York、 Geroch、 Horowitz 和史宇光-- 谭联辉。对平坦的Minkowski 时空中的任何封闭曲面, 这应该是零, 而对一般时空它是非负。因此, 如此的定义可存在, 且与ADM和Bondi 的既有结果相容, 实属奇迹。有两个重要的定义被提出: 其一是由Robert Bartnik, 另一个是由王慕道和我。
拟局部质量允许我们定义与双联(binary)黑洞相关的束缚能, 它与重力辐射的能量有关。王慕道和我利用我们的方法, 与陈泊宁(Po-Ning Chen)定义了拟局部角动量, 有助于澄清之前的总角动量定义。
经由Richard Schoen 及他的共同作者的工作, 我们知道Bartnik 定义的质量不同于王慕道与我定义的。去了解何者对描述重力的物理动态较有裨益, 会是有趣的工作。
其他许多关于重力的重要经典概念, 在广义相对论中有其对应物, 然而广义相对论的非线性性质使其难以被定义。但我认为: 诸多几何分析学家近日取得的进展, 将非常重要。
拟局部质量和拟局部角动量的概念, 打开了一扇研究时空物理和时空几何的窗口。更多的努力需要投注于其研究。
对孤立物理系统中的物体, 这些定义最有成效。而在理解更一般的情况, 以涵盖更高维度的类似物时, 它们仍然有用。这些概念的研究涉及相当复杂的几何。
在上个世纪, 藉由物理洞察力, 爱因斯坦的重力理论开启了我们对几何的深刻理解, 反之亦然。我们预计这在本世纪将被延续。Stony Brook 的会议中, 有极为有趣的活动, 展现了几何、 分析和物理相互作用的未来, 令人兴奋。
* 回复“丘成桐”可获取本文PDF文档
传播数学,普及大众
长按识别二维码关注我们
欢迎把我们推荐给你身边的朋友
▼
▼▼▼点击阅读原文发现更多好玩的数学。