Modern Physics
Vol. 13  No. 05 ( 2023 ), Article ID: 73258 , 28 pages
10.12677/MP.2023.135014

规范场论札记(II):局域电磁对偶变换 理论、广义卡鲁扎–克莱因衍生杨–米尔斯 规范场理论与高维引力规范场论

沈建其

浙江大学光电学院,浙江 杭州

收稿日期:2023年8月20日;录用日期:2023年9月20日;发布日期:2023年9月28日

摘要

本文继续研究、评述与本专题上篇“规范场论札记(I)”中的“人造”(synthetic)规范场和“呈展”(emergent)规范场有关的两个主题。本文“规范场论札记(II)”主要研究三个具体问题:i) 在前人的磁荷和对偶变换理论基础之上,提出了局域电磁对偶变换对称性和对偶规范场概念,指出对于电磁波而言,对偶规范势的效果使得真空中的电磁波好似在介电系数和磁导率均为张量的各向异性介质中传播;ii) 给出了一种非阿贝尔版本或广义的卡鲁扎–克莱因理论的详细推导过程,其目的是为了具体介绍一个统一爱因斯坦广义相对论引力和杨–米尔斯规范相互作用的理论。在此模型中,杨–米尔斯规范场以高维引力度规场分量的身份在普通四维时空中呈现出来,或者说,杨–米尔斯规范场在本质上是一种非阿贝尔卡鲁扎–克莱因高维引力场;iii) 介绍了笔者提出的一种自旋联络高维引力规范理论,其引力拉格朗日量用黎曼曲率平方项构造,高维自旋仿射联络(洛伦兹联络)具有杨–米尔斯规范势的特征、矢量场和旋量物质场的高维自旋流在四维时空内表现为杨–米尔斯规范荷流,从而该高维引力规范理论可以统一引力相互作用和杨–米尔斯规范相互作用。在文献中,引力理论有很多家,虽然本文仅对非阿贝尔版本的卡鲁扎–克莱因理论和引力规范理论的长处和缺陷作了评述,但希望本文对此二者的析评有助于读者举一反三、触类旁通理解文献中各类引力理论的风格特征和优缺点。

关键词

电磁对偶变换,衍生规范场,卡鲁扎–克莱因理论,引力规范理论

Notes on Gauge Field Theories (II): Local Electromagnetic Dual Transformation Theory, Generalized Kaluza-Klein Emergent Yang-Mills Gauge Field Theory and Higher-Dimensional Gravitational Gauge Field Theory

Jianqi Shen

College of Optical Science and Engineering, Zhejiang University, Hangzhou Zhejiang

Received: Aug. 20th, 2023; accepted: Sep. 20th, 2023; published: Sep. 28th, 2023

ABSTRACT

This paper continues to explore and review the two topics of “synthetic” gauge field and “emergent” gauge field, which have already been considered in the last paper entitled “Notes on Gauge Field Theories (I)”. The present paper on “Notes on Gauge Field Theories (II)” includes three topics: i) A theory of local electromagnetic dual transformation symmetry and dual gauge field is suggested based on the previous theories of magnetic charge and dual transformation, and it is pointed out that the effect of dual gauge potential makes an electromagnetic wave in vacuum seem to propagate in an anisotropic medium whose permittivity and permeability are both tensors; ii) A non-Abelian version or generalized Kaluza-Klein theory is given in detail. The purpose is to introduce a theory of fundamental interaction that unifies Einstein’s general-relativity gravity and Yang-Mills gauge interaction. In this model, the Yang-Mills gauge potential is a higher-dimensional gravitational metric-field off-diagonal component emerging in the ordinary four-dimensional spacetime, or in other words, the Yang-Mills gauge field is essentially a non-Abelian Kaluza-Klein higher-dimensional gravitational field; iii) A theory of higher-dimensional spin-connection gravitational gauge field theory, of which the gravitational Lagrangian density is quadratic in the Riemannian curvature, is reviewed. The higher-dimensional spin-affine connection (the Lorentz connection) can serve as a Yang-Mills gauge potential and the spin currents of vectorial and spinorial matter fields play a role of Yang-Mills gauge charge currents in the four-dimensional spacetime, and so the gravitational interaction and the Yang-Mills gauge interaction can be unified into the present higher-dimensional spin-connection gravitational gauge theory, which was suggested by us. There have been many theories of gravitation in the literature. Although the merits and weaknesses of only the non-Abelian version of Kaluza-Klein theory and the gauge theory of gravitation are reviewed in this paper, we expect that the analysis of these two theories would still help readers to draw parallels among the relevant gravity theories and to understand the stylistic characteristics, advantages and disadvantages of various gravitation theories in the literature.

Keywords:Electromagnetic Dual Transformation, Emergent Gauge Field, Kaluza-Klein Theory, Gravitational Gauge Theory

Copyright © 2023 by author(s) and Hans Publishers Inc.

This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).

http://creativecommons.org/licenses/by/4.0/

1. 引言

规范场论是近代理论物理柱石之一 [1] [2] [3] [4] 。规范对称性和规范耦合确定了基本粒子相互作用的主要基本结构 [5] [6] [7] 。在历史上,魏尔在爱因斯坦统一场论风尚召唤下,在量子力学建立前后率先发现了电动力学的规范相互作用结构 [8] [9] ,尽管当时它只是作为一个优雅的内禀特性揭示但无甚用处。不过,随着亚原子物理学中的强、弱相互作用的发现,使用规范对称原理来建构基本相互作用理论,正如使用相对论来写物质基本运动方程一样,成为一种范式 [5] [6] [7] 。事实上,局域规范相互作用(包括波函数的局域相位变换)和广义相对论中的广义坐标变换(局域时空变换如局域洛伦兹转动变换及局域时空平移对称变换)地位一样基本、同等重要,如前者(局域规范对称性)和后者(广义坐标变换协变性)分别要求杨–米尔斯规范相互作用的存在和引力相互作用的存在。在一些高维引力规范理论中,这两种对称性又可以统一在一起(本文将述及),意味着自然界的基本相互作用具有统一的本质。

规范相互作用尽管是物质世界的秉性,但是在一些应用物理领域(如光学、电磁材料领域和冷原子物理学中),也出现了“人造”(synthetic)规范场 [10] [11] [12] [13] [14] [15] 。这是一个有趣的现象。除了“人造”规范场以外,高维引力理论(如五维卡鲁扎–克莱因理论)也能产生电磁场 [16] [17] [18] [19] [20] ,其被称为“呈展”(emergent)规范场。“呈展”的含义是“呈现展示”,意味着在卡鲁扎–克莱因理论中,电磁场和电磁相互作用并非是基本的,它们在本质上属于引力场和引力相互作用 [16] [17] [18] [19] [20] 。在本专题上篇“规范场论札记(I)”文中,我们已经介绍、研究、评述了一些“人造”(synthetic)规范场和“呈展”(emergent)规范场方面的工作 [21] ,它们有的属于综述前人已经有的工作,有的属于叙述笔者钻研的心得。在目前下篇“规范场论札记(II)”文中,我们将介绍三个具体专题(主要是本作者的研究结果):i) 电磁场的复张量表述和局域电磁对偶规范场论;ii) 非阿贝尔版本的卡鲁扎–克莱因理论和呈展的杨–米尔斯规范场论;iii) 自旋联络高维引力规范理论和引力–规范统一模型。我们对各主题扼要含义说明如下:

i) “电磁对偶规范场论”(本文第2节):假设存在磁荷,电磁场方程满足电磁对偶变换对称性 [22] ,我们在他人的电磁场复矢量表述 [23] 基础之上,引入电磁场的复张量表述,可以让电磁学理论(电磁拉格朗日量、场方程、能量–动量张量等)写得更为凝练和对称 [24] 。将电磁对偶变换 [22] 用于复张量表述 [24] ,我们发现对偶变换实际上是一种(整体)规范变换。于是,我们认为值得提出针对电磁场的局域对偶规范变换,这要求存在一种对偶规范势。我们揭示这样的对偶规范势的各分量的物理意义的一个应用例子是各向异性介电系数和磁导率张量内的非对角分量。

ii) “卡鲁扎–克莱因理论”(本文第3、4节和第5节评述):在非阿贝尔版本的卡鲁扎–克莱因理论中,杨–米尔斯场不再是一种基本的规范场,相反,它是从高维引力场中展现出来的,它在本质上是高维空间中的引力场在普通四维空间中的“投影”,可以被称呼为衍生或呈展(emergent)规范场。笔者在2007年之前曾“独立”提出和研究多年,后来发现前人也有此类研究 [25] 。借助Killing矢量方法 [25] ,同时含有高维与低维指标的非对角度规分量可以化身为杨–米尔斯规范势。尽管非阿贝尔版本的卡鲁扎–克莱因理论可以将引力场和杨–米尔斯规范场统一起来,但是其拉格朗日量内杂项过多,有可能违反2017年8月的“双中子星合并事件”中观察到的“引力波和伽玛射线几乎同时到达地球”这一“双星使”现象 [26] [27] [28] [29] 。

iii) “高维引力规范理论”(本文第5、6节):笔者提出了该类理论 [30] [31] [32] [33] 。它也可以统一引力场和杨–米尔斯规范场,且拉格朗日量不携带这么多杂项,不违反“双星使”现象。在这一理论中,引力拉格朗日量以曲率平方项形式出现,一些高维自旋仿射联络(洛伦兹联络)会表现为杨–米尔斯规范势,矢量场和旋量场的高维自旋流在普通四维时空内表现为杨–米尔斯荷流密度 [30] [31] [32] [33] 。本专题上篇“规范场论札记(I)”文中已经指出,引入新的规范场,在历史上有魏尔的规范对称路线 [8] [9] 和卡鲁扎–克莱因高维路线 [16] [17] [18] [19] [20] 两种。在引力规范理论中,这两种路线都被贯彻,如引入局域洛伦兹转动规范对称性(魏尔路线),得到新的引力理论,然后借助高维统一思想(卡鲁扎–克莱因路线),把杨–米尔斯规范场论从引力理论中衍生出来 [30] [31] [32] [33] 。引力规范理论 [30] [31] [32] 加上高维统一思想,原则上可将引力场和杨–米尔斯规范场统一起来 [33] 。对引力场的规范场论特征的揭示,意味着四种基本相互作用需要在引力规范场论下统一,四种基本相互作用在本质上都是引力场。

本文除了包含作者的研究结果外,还将文献中与本专题有关、在推导叙述上显得步骤简略的内容进行详细补证,这有利于读者具体掌握这方面的知识。譬如,非阿贝尔卡鲁扎–克莱因理论虽然亦有一些文献,但是其往往写得很晦涩,数学过程在紧要处往往一笔带过,这让读者研习起来十分艰难,这有时会让读者可能要静候几年甚至十年以上才能悟透其中的数学理论部分(笔者和其他人想必都有这方面的体会,例如他在某问题上无法打通某一步推导,等在钻研其它相关问题时才忽然明白过来,但是时间已经十年过去了。但凡那原作者当年能写得稍微详细一点,也不至于让读者静等十年才悟透),故本文作者尽可能给出翔实的推导,以飨读者。另一方面,本文作者在1998~2007年也曾“独立提出”非阿贝尔卡鲁扎–克莱因理论这个专题,目的是为了将广义相对论引力理论和杨–米尔斯规范理论写为对方形式或者统一引力理论和规范场论,虽然得到了其中要旨,但是到了后半部分却被“卡壳”,无法将呈现出来的高维引力规范群与杨–米尔斯规范群联系起来,主要原因是笔者当时不知道它可以用Killing矢量关系式来摆脱困难、建立与杨–米尔斯规范群的联系。本文将介绍与Killing矢量有关的理论 [25] 并将此用于“统一引力和规范力”的广义卡鲁扎–克莱因理论。广义卡鲁扎–克莱因理论以及有关的高维引力理论在文献中一直不绝 [25] [34] [35] [36] [37] 。附录中有一个关于Killing (基林)矢量和Lie (李)导数的介绍,这是属于为使用非阿贝尔版卡鲁扎–克莱因机制统一引力理论和规范场论时所需要的知识构件,放在末尾,希望有助于读者进一步理解。

文中涉及到的一些中外研究人员的姓氏,对凡是比较常见的名姓,用中文译法;对非常见姓氏,或在文内只偶尔出现几次的,或因缺少约定的汉译,我们用其西文姓氏,即沿袭这些作者论文内的姓氏写法,读者因此亦可方便检索西文姓氏获得相关原始文献。

2. 麦克斯韦方程的对偶规范变换

就麦克斯韦方程的整体电磁对偶变换,前人已经揭示其性质 [22] 。在此整体变换下,以电荷和磁荷作为源的麦克斯韦方程形式不变(对偶对称性)。此变换对称性成立的前提是要求磁荷存在,否则该电磁对偶对称性就被破坏。但其实也可以退一步,即使磁荷不存在,如果同时假设所研究的系统内不存在电荷,那么自由电磁场的麦克斯韦方程组的整体电磁对偶对称性(对偶变换不变性)仍旧成立。

基于前人的三维矢量形式的电磁对偶变换 [23] ,我们使用四维时空相对论张量方法来阐述整体对偶变换。以四维电流密度为源的麦克斯韦方程是 ε ¯ ¯ ,以四维磁荷流密度为源的麦克斯韦方程是 ε ¯ ¯ = ( ε m i A z i A y i A z ε m i A x i A y i A x ε m ) = ε m ( 1 i A z / ε m i A y / ε m i A z / ε m 1 i A x / ε m i A y / ε m i A x / ε m 1 ) (注意:这里用到了“相同指标求和”法则,取 η m 1 ζ W = η m ξ A ),其中电磁场张量为 ζ = ξ = i ,其对偶电磁场张量为 η m 1 ζ W = η m ξ A ( W / μ m = A / ε m 为全反对称Levi-Civita符号,我们定义其中一个分量为 μ ¯ ¯ ,其它分量按此数值根据全反对称原则定出)。如果磁荷存在,电磁势 μ ¯ ¯ = ( μ m i W z i W y i W z μ m i W x i W y i W x μ m ) = μ m ( 1 i W z / μ m i W y / μ m i W z / μ m 1 i W x / μ m i W y / μ m i W x / μ m 1 ) = μ m ( 1 i A z / ε m i A y / ε m i A z / ε m 1 i A x / ε m i A y / ε m i A x / ε m 1 ) . 不再是解析函数,例如 ( i ω η m A ) × [ ( i ω η m A ) × ( ε m E ± i μ m H ) ] 。在对偶变换 [22] 下,我们写出新的电磁场张量 ε m l k D l ( ε k i j D i F j ) 和对偶张量 ε m l k D l ( ε k i j D i F j ) = ε m l k ε k i j D l D i F j = ( δ m i δ l j δ m j δ i l ) D l D i F j = D j D m F j D i D i F m . 与旧的电磁场张量 g μ ν 和对偶张量 g μ ν 的关系如下:

A μ A ν γ μ

它们可以化为我们熟知的三维空间内的矢量形式 [22] 。于是,将以上变换关系应用到麦克斯韦方程,我们可以得到

g μ ν = ( γ μ γ ν + γ ν γ μ ) / 2

故而在整体电磁对偶变换下,四维电流密度变换规则是 γ μ ,四维磁荷流密度的变换规则是 γ p 。于是以四维电流密度为源的麦克斯韦方程 γ μ = γ p e p μ 和以四维磁荷流密度为源的麦克斯韦方程 e p μ 在整体电磁对偶变换下形式不变。

以上是电磁对偶变换的相对论协变形式的实数表述法。其实也存在其复数表述形式(下面将叙述)。这样我们就可以证明,传统的电磁对偶变换其实是一种规范变换,我们可称之为“整体电磁对偶规范变换”(global electromagnetic dual gauge transformation)。对于笔者而言,这一性质的发现过程如下:先是许冰等人提出了电磁场的三维复矢量表述形式(2007年) [23] ,我们受此启发,提出了具有明显相对论协变性的电磁场复张量表述(2009年) [24] ,再结合前述的电磁对偶变换的相对论协变形式的实数表述法,我们把它(电磁对偶变换)转化为复数表述,于是立即可以看出(在复数表述下)电磁对偶变换的规范变换特性。下面来叙述这一研究结果:

在普通的电磁场张量 g μ ν = e p μ e p ν 和对偶张量 e p μ 基础之上,再受电磁场的三维复矢量表述形式 [22] 的启发,我们就可以定义两个新的电磁场张量: g μ ν = ( γ μ γ ν + γ ν γ μ ) / 2 和对偶张量 g μ ν = e p μ e p ν (复数张量) [24] 。此二者张量之间的关系是 e 5 μ A μ (注意:对偶张量的对偶,与原张量比起来,前者多出一个负号,即 g ˜ μ ν = ( g ˜ μ ν g ˜ μ 5 g ˜ 5 ν g ˜ 55 ) = ( g μ ν + ϕ 2 A μ A ν ϕ 2 A μ ϕ 2 A ν ϕ 2 ) A μ )。这样一来,我们从前面的实数张量式子可以得到对应的复数张量

μ = 0 , 1 , 2 , 3 g ˜ μ 5

这正是当存在电荷和磁荷时、在电磁场的复数张量形式下的麦克斯韦方程组: ϕ g ˜ μ ν [24] 。值得说明的是,本身此二方程并非独立,它们之间可以通过对偶变换,彼此推导,其对偶变换规则为: g ˜ ν λ = ( g ˜ ν λ g ˜ ν 5 g ˜ 5 λ g ˜ 55 ) = ( g ν λ A ν A λ g σ τ A σ A τ + 1 / ϕ 2 ) g ˜ μ ν 或者 g ˜ ν λ g ˜ μ ν g ˜ ν λ = ( g μ ν + ϕ 2 A μ A ν ϕ 2 A μ ϕ 2 A ν ϕ 2 ) ( g ν λ A ν A λ g σ τ A σ A τ + 1 / ϕ 2 ) = ( ( g μ ν + ϕ 2 A μ A ν ) g ν λ + ϕ 2 A μ ( A λ ) ( g μ ν + ϕ 2 A μ A ν ) ( A ν ) + ϕ 2 A μ ( g σ τ A σ A τ + 1 / ϕ 2 ) ϕ 2 A ν g ν λ + ϕ 2 ( A λ ) ϕ 2 A ν ( A ν ) + ϕ 2 ( g σ τ A σ A τ + 1 / ϕ 2 ) ) = ( δ μ λ 0 0 1 ) .

下面我们来看新的电磁场张量 ϕ 2 和对偶张量 ϕ 2 的整体对偶变换:

Γ ˜ λ , μ ν = 1 2 ( ν g ˜ λ μ + μ g ˜ ν λ λ g ˜ μ ν )

Γ ˜ λ , μ 5

复数形式的电、磁荷流密度的对偶变换为

5 g ˜ λ μ = 0

Γ ˜ λ , μ 5

我们看到复数形式的电磁场张量和电、磁荷流密度的对偶变换都出现了一个复数因子(相位因子)

Γ ˜ λ , μ 5 = 1 2 ( 5 g ˜ λ μ + μ g ˜ 5 λ λ g ˜ μ 5 ) 1 2 ( μ g ˜ 5 λ λ g ˜ μ 5 ) = 1 2 [ μ ( ϕ 2 A λ ) λ ( ϕ 2 A μ ) ] = ϕ 2 2 ( μ A λ λ A μ ) + 1 2 ( A λ μ ϕ 2 A μ λ ϕ 2 ) . 。于是,麦克斯韦方程组 Γ ˜ λ , μ 5 μ A λ λ A μ 具有整体电磁对偶规范变换对称性。

上面我们讨论了整体电磁对偶变换。下面我们考虑局域对偶变换,即相位因子 R = g β ν ( ν Γ μ β μ + μ Γ μ β ν + Γ σ β ν Γ μ σ μ Γ σ μ β Γ μ σ ν ) 是时空坐标的函数。在该变换下,麦克斯韦方程必须包含协变导数即

ν Γ μ β μ + μ Γ μ β ν + Γ σ β ν Γ μ σ μ R g β ν Γ σ μ β Γ μ σ ν g 55 g σ ν g μ λ Γ ν , μ 5 Γ λ , σ 5

于是 R ˜ 2 κ 1 2 κ g 55 g σ ν g μ λ Γ ˜ ν , μ 5 Γ ˜ λ , σ 5 1 2 κ ( ϕ 2 2 ) 2 g 55 g σ ν g μ λ ( μ A ν ν A μ ) ( σ A λ λ A σ ) = 1 2 κ ( ϕ 2 2 ) 2 g 55 g σ ν g μ λ f μ ν f σ λ = 1 2 κ ( ϕ 2 2 ) 2 g 55 f μ ν f μ ν , 可以在局域对偶变换下化为

f μ ν = μ A ν ν A μ

它与电、磁荷的四维流密度的变换规则( Γ ˜ ν , μ 5 )一样,其中 1 2 κ ( ϕ 2 2 ) 2 g 55 = 1 4 ,故而局域电磁对偶规范势的变换规则为 R 2 κ 。同理,我们还有

1 4 f μ ν f μ ν

它与电、磁荷的四维流密度的变换规则( f μ ν = μ A ν ν A μ )亦同。于是,局域对偶变换对称性对于麦克斯韦方程仍旧是成立的。

上面是“局域电磁对偶规范变换”的相对论协变形式。我们也可以将上述内容化为普通三维空间形式。我们发现此时电磁波恰似在各向异性真空中传播,对偶规范势 R 2 κ 的物理含义是介电张量和磁导率张量的非对角分量。

我们设平直时空度规张量对角元符号为 d s ˜ = g ˜ μ ν d x ˜ μ d x ˜ ν = g μ ν d x μ d x ν + 2 g μ 5 d x μ d x 5 + g 55 d x 5 d x 5 = ( g μ ν + ϕ 2 A μ A ν ) d x μ d x ν + 2 ϕ 2 A μ d x μ d x 5 + ϕ 2 d x 5 d x 5 . 。我们具体写出每一个电磁场张量分量:电磁场张量分量之一 d s ˜ = g μ ν d x μ d x ν + 2 ϕ 2 A μ d x μ d x 5 + ϕ 2 A μ A ν d x μ d x ν + ϕ 2 d x 5 d x 5 = d s 1 + 2 ϕ 2 A μ U μ U 5 + ϕ 2 A μ A ν U μ U ν + ϕ 2 U 5 U 5 d s ( 1 + ϕ 2 U 5 A μ U μ + ... ) d s + ϕ 2 U 5 A μ d x μ , ,于是 d s 2 = g μ ν d x μ d x ν (电场强度分量, μ , ν );磁感应强度分量 U μ = d x μ / d s ,于是三个磁感应强度分量可以写为 U 5 = d x 5 / d s S= m 0 c 2 d s ˜ = m 0 c 2 ( ds+ ϕ 2 U 5 A μ d x μ ) ;电磁对偶张量分量之一 m 0 ds= 1 v 2 / c 2 dt ϕ 2 U 5 A μ d x μ = ϕ 2 U 5 A μ u μ dt ,于是 v μ = d x μ / d t = ( c , v ) ( S = m 0 c 2 ( 1 v 2 / c 2 + ϕ 2 U 5 A μ v μ ) d t );对偶张量分量之一 L = m 0 c 2 ( 1 v 2 / c 2 + ϕ 2 U 5 A μ v μ ) L= m 0 c 2 1 v 2 / c 2 q( VA v ) q= m 0 c 2 ϕ 2 U 5 ϕ ,于是我们有 U 5 U 5

再来看电磁场张量(复数形式)的定义 a m 0 U 5 = n π / a [24] 。为了方便,我们先在自然单位制中考虑。我们得到如下结论: n ( a ); m 0 U 5 = n / a U 5 ,于是 q = m 0 c 2 ϕ 2 U 5 U 5 ;电磁对偶分量为 n / a n ( n = 0 ); D ˜ U μ d s ˜ = 0 D ˜ U μ d s ˜ ,于是 D ˜ U μ d s ˜ = d U μ d s ˜ + Γ ˜ μ σ ν U σ U ν = d U μ d s ˜ + Γ μ σ ν U σ U ν + 2 Γ μ σ 5 U σ U 5 + Γ μ 55 U 5 U 5 Γ μ σ5 。这样带有对偶规范势的麦克斯韦方程 Γ μ σ 5 = g μ τ [ ϕ 2 2 ( σ A τ τ A σ ) + 1 2 ( A τ σ ϕ 2 A σ τ ϕ 2 ) ] 左边的一个分量可以化为

Γ μ σ 5 U σ

于是,三个空间分量 g μ τ ( σ A τ τ A σ ) U σ ( φ )可以化为三维矢量形式(注意要用到“相同指标求和”法则,取 μ φ )

μ φ = g μ ν ν φ = ( η μ ν + h μ ν ) ν φ = ¯ μ φ + h μ ν ν φ

则麦克斯韦方程的空间分量 ¯ μ φ + h μ 5 5 φ ( h μ 0 0 φ + h μ i i φ )化为

i = 1 , 2 , 3

麦克斯韦方程的时间(第零)分量 ¯ μ φ + h μ 5 5 φ = ¯ μ φ + ϕ 2 A μ ( i q 5 ) φ = ( ¯ μ + i q 5 ϕ 2 A μ ) φ (也即高斯定律)可被展开为

5 φ = i q 5 φ

下面我们来看麦克斯韦方程的对偶形式 q 5 ϕ 2 = q 。对偶方程分量之一

μ φ ( ¯ μ + i q A μ ) φ 左边项 exp ( i m θ ) 可以被展开为

θ = x 5 / a

则方程左边的空间分量( a )为(注意要用到“相同指标求和”法则, 5 φ = i ( m / a ) φ )

μ φ

于是麦克斯韦对偶方程的空间分量为

( ¯ μ + i q A μ ) φ

此式也可以由前面已经得到的麦克斯韦矢量方程

S U ( N )

两边乘以 λ , μ , ν 得到。

电磁场的对偶方程的时间分量(即第零分量,也即高斯定律) M , N , L , P (注意要用到“相同指标求和”法则, λ , μ , ν )可以化为 M , N , L , P (注意要用到“相同指标求和”法则, Γ ˜ λ , μ M = 1 2 ( M g ˜ λ μ + μ g ˜ M λ λ g ˜ μ M ) 1 2 ( μ g ˜ M λ λ g ˜ μ M ) = 1 2 ( μ g ˜ λ M λ g ˜ μ M ) . )。最终我们得到 μ g ˜ λ M λ g ˜ μ M μ g ˜ λ M a b λ g ˜ μ M a b 。此式也可以由前面的 T b a i 两边乘以 i 得到。

以上“局域电磁对偶规范对称性”理论系笔者在2012年底讲授研究生《光学电磁理论》课程时想到,因而它算是笔者在教学过程中的一点心得。它是笔者基于之前文献内其它相关工作(如三维形式的电磁对偶变换形式 [22] 、电磁场的三维复数形式 [23] 以及电磁场的复数张量表述 [24] )而思考的结果。需要指出,尽管麦克斯韦方程可以在数学上恒等变形化为各种有趣的形式,如薛定谔方程形式、狄拉克方程形式以及复数张量形式 [24] ,但是其物理含义没有变,因此这些变形也没有带来任何新的具有实质性价值的内容。不过,新的数学形式也有可能成为将来未可预见的推广的理论的生长点。在近代物理学中这样的例子有很多。

上面的普通电磁对偶变换 [22] 经过复张量改造,我们发现它是一个规范变换。下面我们来看对偶规范势的物理含义。为了简化,设麦克斯韦方程无源,即去掉 S U ( N ) i = 1 , 2 , 3 , ... , N 2 1 ,同时假设对偶规范标量势 ( μ g ˜ λ M a b λ g ˜ μ M a b ) T b a i 为零,以及再设电磁场是时谐波( g ˜ λ M a b T b a i ,那么上面已经得到的麦克斯韦方程及其对偶方程的空间分量可以被简化为

g ˜ λ M i

我们可以从这两个方程得到一个二阶微分方程

i

根据“规范场论札记(I)” [21] ,我们已经知道这样的方程实际上是各向异性介质(介电系数与磁导率都是张量)内的电磁波方程。由此,对偶规范势(的分量)的物理含义是介电张量与磁导率张量的各向异性矩阵元。这就打通了“对偶规范势”与“光学规范势” [15] 之间的关系。

以上仅针对阿贝尔情形,即电荷、磁荷和电磁规范场都是阿贝尔的。能否将“对偶规范势”推广到

非阿贝尔情形,也是一个值得考虑的问题。新的规范场张量 μ ¯ μ + g ˜ μ N e M ¯ N ¯ M 和对偶张量 i 的整体和局域对偶变换 i 1 k 2 ( k × d k d t ) 仍旧可以保留;复数形式的荷流密度的对偶变换 ξ M K ( y ) μ f μ ν = J ν 也保留。现在,对偶变换参数 μ f ˜ μ ν = K ν 可以采用矩阵形式,将规范场张量和荷流密度看作某个李代数空间中的基矢量,因此,这些变换都是么正变换。规范场方程左边的对偶变换 μ = 0 , 1 , 2 , 3 及其对偶部分的对偶变换 f μ ν = μ A ν ν A μ 也保留,但是普通导数如 f ˜ μ ν = 1 2 ε μ ν α β f α β 要改为(非阿贝尔规范群下的)协变导数 ε μ ν α β 。现在 ε 0123 = + 1 是非阿贝尔群元,因此以上构件的变换都是非阿贝尔么正变换。如此说来,非阿贝尔规范场的非阿贝尔对偶变换是存在的、自然的,对偶规范势 A ν 很容易被推广到非阿贝尔情形。

3. 非阿贝尔版本的卡鲁扎–克莱因理论

我们在上篇(“规范场论札记(I)”)中已经详细论述 [21] ,表明卡鲁扎–克莱因理论将引力场与U(1)电磁场统一起来了 [16] [17] [18] [19] [20] 。由于在后来(1954年)阿贝尔的电磁场理论又被推广到非阿贝尔规范场理论 [1] ,后者成为描述夸克的强相互作用、中微子–电子的弱相互作用的理论,而电磁场本身也成为 α β A ν β α A ν 非阿贝尔规范场的一个子群规范场;电磁场被统一进入Glashow-Weinberg-Salam弱电统一模型(1961、1967、1968年,已经被粒子物理学实验证实)和进一步被统一进入George-Glashow大统一模型(1974年,还未被实验证实) [5] [6] [7] 。如此,为了把引力与强、弱、电相互作用统一起来,就需要把引力场与非阿贝尔规范场统一起来。下面我们就来研究这种思路,即将上述卡鲁扎–克莱因理论推广到非阿贝尔版本的卡鲁扎–克莱因理论,这是可以办到的。这一节叙述本人曾经(在2007年之前)的研究。

首先我们进行符号约定:在本理论中,希腊字母 f ' μ ν 等表示普通四维时空内的坐标指标,大写拉丁字母如 f ˜ ' μ ν 等表示高维内空间的坐标指标;如果物理量字母上带有波浪线,表示该量是在四维(外部)时空和高维内空间这一巨时空体(bulk spacetime)内进行定义的;若没有波浪线,则它们或定义在四维(外部)时空,或定义在高维内空间(规范群流形)中;如果时空指标是平直的,那么就在 f μ ν f ˜ μ ν 上添加一横。在非阿贝尔卡鲁扎–克莱因理论中,最重要的高维Levi-Civita联络可以写为

f ' μ ν = f μ ν cos ξ + f ˜ μ ν sin ξ

那么如何得到杨–米尔斯规范场呢?一个直观的方法是让度规非阿贝儿化,即 f ˜ ' μ ν = f ˜ μ ν cos ξ f μ ν sin ξ . 。但是这种思路并不直接奏效,难以生成杨–米尔斯场。于是在其上乘上规范群生成元 μ f ' μ ν = μ f μ ν cos ξ + μ f ˜ μ ν sin ξ = J ν cos ξ + K ν sin ξ , μ f ˜ ' μ ν = μ f ˜ μ ν cos ξ μ f μ ν sin ξ = K ν cos ξ J ν sin ξ . (指标 J ' ν = J ν cos ξ + K ν sin ξ 表示规范群生成元序号,如对于 K ' ν = K ν cos ξ J ν sin ξ 群,指标 μ f μ ν = J ν ),即得到 μ f ˜ μ ν = K ν ,并就重复指标求和。其实这可以干脆把 f μ ν 写为 f ˜ μ ν 。如果 F μ ν = f μ ν + i f ˜ μ ν 不是时空指标,那么梯度算符 F ˜ μ ν = f ˜ μ ν - i f μ ν 难以对指标 F ˜ μ ν = - i F μ ν 作用,指标 F ˜ μ ν = 1 2 ε μ ν α β F α β 不参与运算,因此也不奏效。于是我们认为 f ˜ ˜ μ ν = f μ ν 应该是高维内空间指标。但是由于 F ˜ ˜ μ ν = F μ ν 已经有内空间指标 μ F μ ν = μ f μ ν + i μ f ˜ μ ν = J ν + i K ν 了,该内空间指标亦可以利用起来,所以我们没有必要额外引入其它指标 μ F ˜ μ ν = μ f ˜ μ ν - i μ f μ ν = K ν - i J ν . ,内空间指标 μ F μ ν = J ν + i K ν 已经可以代替 μ F ˜ μ ν = K ν - i J ν ,它将具有杨–米尔斯规范群生成元序号的功能。

在改写偏导数算符时,如我们有 F μ ν F ˜ μ ν J ν +i K ν i( J ν +i K ν ) F ˜ μ ν F μ ν ( K ν i J ν i ( K ν i J ν ) 微小,故而略去),此时我们需要回答一个问题:为什么要把 F μ ν = f μ ν + i f ˜ μ ν 写为 F ˜ μ ν = f ˜ μ ν - i f μ ν ?从作者个人角度讲,发现当穷尽几乎一切途径,只有这样才能得到杨–米尔斯场强中的两场乘积项 F ' μ ν = f ' μ ν + i f ˜ ' μ ν = ( f μ ν cos ξ + f ˜ μ ν sin ξ ) + i ( f ˜ μ ν cos ξ f μ ν sin ξ ) = exp ( i ξ ) ( f μ ν + i f ˜ μ ν ) = exp ( i ξ ) F μ ν , 。另一方面,这也受启发于普通广义相对论中的物质场与“引力磁势 F ˜ ' μ ν = f ˜ ' μ ν - i f ' μ ν = ( f ˜ μ ν cos ξ f μ ν sin ξ ) i ( f μ ν cos ξ + f ˜ μ ν sin ξ ) = exp ( i ξ ) ( f ˜ μ ν - i f μ ν ) = exp ( i ξ ) F ˜ μ ν . ”的相互作用:如 J ' ν + i K ' ν = ( J ν cos ξ + K ν sin ξ ) + i ( K ν cos ξ J ν sin ξ ) = exp ( i ξ ) ( J ν + i K ν ) , K ' ν -iJ ' ν =( K ν cosξ J ν sinξ)i( J ν cosξ+ K ν sinξ) =exp(iξ)( K ν -i J ν ). ,那么 exp ( i ξ ) ,其中 μ F μ ν = J ν + i K ν 就是“引力磁矢量势”。它的旋度,就是引力磁场。于是在 μ F ˜ μ ν = K ν - i J ν 中,我们可以有 exp ( i ξ ) 。同理,我们有 ( μ i g W μ ) F μ ν = J ν + i K ν 。那么由Levi-Civita联络得到的非阿贝尔规范场强形式为

( μ i g W μ ) F ˜ μ ν = K ν - i J ν .

对该式经过钻研后,我们认为杨–米尔斯规范场强中的规范势平方项 ( μ i g W μ ' ) F ' μ ν 应该由 ( μ i g W μ ' ) F ' μ ν = ( μ i g W μ ' ) ( exp ( i ξ ) F μ ν ) = exp ( i ξ ) ( μ i μ ξ i g W μ ' ) F μ ν = exp ( i ξ ) ( μ i g W μ ) F μ ν . 变化而来。显然需要对 J ' ν + i K ' ν = exp ( i ξ ) ( J ν + i K ν ) μ ξ + g W μ ' = g W μ 作如下形式的分解:

W μ ' = W μ μ ξ / g ( μ i g W μ ' ) F ˜ ' μ ν = exp ( i ξ ) ( μ i μ ξ i g W μ ' ) F ˜ μ ν = exp ( i ξ ) ( μ i g W μ ) F ˜ μ ν . ,才有可能得到规范势平方项 K ' ν - i J ' ν = exp ( i ξ ) ( K ν - i J ν ) ,其中 W μ 是普通四维时空坐标, [ + , , , ] 是高维内空间坐标。至于 f 01 = 0 A 1 1 A 0 E 1 是具有什么物理意义的量,目前未知(说明:这里对 f 0 i E i ,作者采用了与Kuyrukcu 2014年论文内类似的符号写法 [25] ,因为 i = 1 , 2 , 3 是Killing矢量场。一般文献中用符号 f 12 = 1 A 2 2 A 1 B 3 表示Killing矢量场的事例较多,尽管当时(2006~2007年)作者并没有认识到 { f 23 , f 31 , f 12 } 内的 { B 1 , B 2 , B 3 } 是Killing矢量场)。我只知道 f ˜ 01 = 1 2 ε 01 α β f α β = ε 01 23 f 23 能就其内外空间坐标进行分离变量(写成内外空间坐标函数的乘积形式)。于是 = f 23 B 1 可以化为

f ˜ 0 i B i

这样我们就得到本理论中的重要结论:

i = 1 , 2 , 3

需要作一说明:在此式中,我们不能把 f ˜ 12 = 1 2 ε 12 α β f α β 作为公共因子提取出来,也即不能写作 = ε 12 30 f 30 = ε 1230 f 30 。因为如果能写作成该形式,那么 = ε 0123 f 30 ,其内 = f 30 E 3 { f ˜ 23 , f ˜ 31 , f ˜ 12 } 是高维平直空间指标,但是根据前述定义 { E 1 , E 2 , E 3 } F μ ν = f μ ν + i f ˜ μ ν 应该是高维弯曲空间指标(高维弯曲,代表有规范场),故而矛盾。

现在我们在Levi-Civita联络 F ˜ μ ν = f ˜ μ ν - i f μ ν 上乘上额外维内空间标架场(vielbein) F 0 i = f 0 i + i f ˜ 0 i ,以此作为研究对象,那么这意味着我们需要作如下计算

E i + i B i

此处 i = 1 , 2 , 3 可以不计(即十分微小)。利用 F 12 = f 12 + i f ˜ 12 ,上面结果可以写为

B 3 i E 3

于是中括号内出现了一个类似非阿贝尔规范场强的表达式 { F 23 , F 31 , F 12 } 。我们已知杨–米尔斯非阿贝尔规范场强是 { B 1 i E 1 , B 2 i E 2 , B 3 i E 3 } (其中 F ˜ 0 i = f ˜ 0 i i f 0 i 是杨–米尔斯规范群结构常数, B i + i E i 是规范荷)。如果 i = 1 , 2 , 3 等于 F ˜ 12 = f ˜ 12 i f 12 ,那么这两个场强具有相同结构, E 3 + i B 3 。这个相等条件是否可以实现呢?首先, { F ˜ 23 , F ˜ 31 , F ˜ 12 } 关于指标 { E 1 + i B 1 , E 2 + i B 2 , E 3 + i B 3 } 是反对称的,群结构常数 ( μ i g W μ ) F μ ν = J ν + i K ν 也是关于指标 ( μ i g W μ ) F μ 1 = ( 2 i g W 2 ) F 21 + ( 3 i g W 3 ) F 31 + ( 0 i g W 0 ) F 01 = ( 2 i g W 2 ) ( B 3 + i E 3 ) + ( 3 i g W 3 ) ( B 2 i E 2 ) + ( 0 i g W 0 ) ( E 1 + i B 1 ) . 是反对称的。如果前者是常数(即与高维内空间坐标无关),那么两者可以相等起来。于是这样,我们从高维(广义相对论) Levi-Civita联络 ( μ i g W μ ) F μ i 中获得了普通四维时空中的杨–米尔斯规范场强。在该Levi-Civita联络中, i = 1 , 2 , 3 为额外维(高维)内空间坐标的指标(且是弯曲空间坐标指标), μ = 0 , 1 , 2 , 3 ( μ i g W μ ) F μ i ( + i g W ) × ( B + i E ) ( 0 i g W 0 ) ( E i B ) . 是普通四维时空坐标指标(它本应该是弯曲时空坐标指标。但是为了简化问题,我们把普通四维时空中的爱因斯坦引力场略去了,因为我们的目的是从高维广义相对论中呈现出杨–米尔斯规范场)。由于在普通的五维卡鲁扎–克莱因理论中已经证明希尔伯特–爱因斯坦引力作用量密度包含了Levi-Civita联络的平方项 [21] ,

( μ i g W μ ) F μ i = J i + i K i ,它也可以写为

i = 1 , 2 , 3 .

故而希尔伯特–爱因斯坦引力作用量中的高维时空部分自动包含了杨–米尔斯非阿贝尔规范场的拉格朗日量密度。于是这样我们就把杨–米尔斯规范场从高维广义相对论引力理论中呈现了出来,也因此可以说我们的上述方案(非阿贝尔版本的卡鲁扎–克莱因理论)统一了引力场与杨–米尔斯规范场。

以上内容(即本节“非阿贝尔版本的卡鲁扎–克莱因理论”)是本作者在2007年之前的四五年独立研究“以非阿贝尔卡鲁扎–克莱因引力理论统一引力场和杨–米尔斯场”所得到的要义(实际结果要比上面庞杂多倍且伴随各种曲折思考和若干“走不通”的方案,这里只是删繁就简整理、列出合理的部分)。

杨–米尔斯规范群结构常数 ( + i g W ) × ( B + i E ) = ( 0 i g W 0 ) ( E i B ) + ( J + i K ) . 是常数,与普通四维时空坐标无关,而 ( μ i g W μ ) F μ 0 = J 0 + i K 0 里面的指标都是高维空间内的指标,似乎也都与普通四维时空坐标无关,但是它们含有高维空间内的导数,似应该与高维空间坐标有关,看不出它们是真正的常数,也看不出它们怎么与一个李群(如杨–米尔斯规范群)去建立联系,尽管 ( i i g W i ) F i 0 = J 0 + i K 0 ( i i g W i ) ( E i i B i ) = J 0 + i K 0 ( + i g W ) ( E i B ) = J 0 + i K 0 . 确实与杨–米尔斯规范群结构常数 ( μ i g W μ ) F ˜ μ ν = K ν - i J ν 有一些类似(如关于指标 ( μ i g W μ ) F ˜ μ 1 = K 1 - i J 1 反对称)。因此,本文作者当时(2006~2007年)十分不自信(到这里就被“卡壳”),正如跋涉到山顶,没有体会到“一览众山小”,似觉空虚,最终放弃了这一套所谓的“非阿贝尔卡鲁扎–克莱因引力”理论,改旗易帜,去追寻提出另一套完全不同的方案即基于洛伦兹联络(自旋仿射联络)的引力规范理论 [30] [31] [32] ,采用高维洛伦兹群作为SO( ( μ i g W μ ) F ˜ μ 1 )规范对称群或者高维复流形群作为SU( ( μ i g W μ ) F ˜ μ 1 = ( 2 i g W 2 ) F ˜ 21 + ( 3 i g W 3 ) F ˜ 31 + ( 0 i g W 0 ) F ˜ 01 = ( 2 i g W 2 ) ( E 3 i B 3 ) + ( 3 i g W 3 ) ( E 2 + i B 2 ) + ( 0 i g W 0 ) ( B 1 + i E 1 ) , )规范对称群 [33] 。

4. 用Killing矢量场摆脱困境

无论如何,其实卡鲁扎–克莱因理论使用高维空间自由度来描述规范场,统一引力场和规范场,富有启发性意义。在文献中,卡鲁扎–克莱因理论的各种推广,包括非阿贝尔版本,除了我自己“闭门”钻研外,时不时有人在研究 [25] [34] [35] [36] [37] 。关于上面所述的非阿贝尔形式的卡鲁扎–克莱因理论如何产生规范群的问题,我后来明白,实际上需要依靠Killing矢量场与李导数工具来建立 i = 1 , 2 , 3 与杨–米尔斯规范群结构常数 μ = 0 , 1 , 2 , 3 之间的联系才能解决 [25] 。他人已经指出,度规分量 ( μ i g W μ ) F ˜ μ i ( + i g W ) × ( E i B ) + ( 0 i g W 0 ) ( B + i E ) . 中的 ( + i g W ) × ( E i B ) = ( 0 i g W 0 ) ( B + i E ) + ( K i J ) . 是一个Killing矢量 [25] 。 ( + i g W ) × ( B + i E ) = ( 0 i g W 0 ) ( E i B ) + ( J + i K ) 中的指标 i 为这里说的Killing矢量指标。利用Killing矢量场与李导数的方法,上面所得到的 ( μ i g W μ ) F ˜ μ 0 = K 0 - i J 0 也可以这样来讨论:在本理论(非阿贝尔版卡鲁扎–克莱因理论方案)重要结果 μ = 0 , 1 , 2 , 3 之中,我们研究 ( i i g W i ) ( B i + i E i ) = K 0 - i J 0 。对此右乘 i = 1 , 2 , 3 ,我们得到

( + i g W ) ( B + i E ) = K 0 - i J 0 .

此为两个Killing矢量场 ( + i g W ) ( E i B ) = J 0 + i K 0 i 的对易子(指标 J + i K K i J 为这里说的Killing矢量指标)。根据前人微分几何理论的研究结果知道 [38] [39] [40] [41] ,全体Killing矢量场构成一个群的完备性生成元的集合,即任意两个Killing矢量之和也是Killing矢量,任意两个Killing矢量的对易子也是Killing矢量 [38] [39] [40] (这是李群特征。正是这一点,使得 W 0 可以与杨–米尔斯规范群结构常数联系起来)。Killing矢量场满足如下的李代数关系 [38] [39] [40]

0 i ω / c )

其中, ( + i g W ) × ( B + i E ) = i ω c ( E i B ) , ( + i g W ) × ( E i B ) = i ω c ( B + i E ) . 为该Killing矢量群的结构常数。将该关系代入前面公式,于是我们有 ( + i g W ) × [ ( + i g W ) × ( B + i E ) ] = ω 2 c 2 ( B + i E ) . 。进一步可以得到

k .

将它代入前面的 d v d t q m v × B = 0 ,我们得到

1 k 2 ( k × d k d t )

显然,当 H = ξ S ( r × p ) ,即Killing矢量群李导数结构常数 H = ξ p ( S × r ) 与杨–米尔斯规范群结构常数 p 成正比时,从高维黎曼时空几何的无挠Levi-Civita联络(黎曼对称联络) S × r 中可以生成杨–米尔斯非阿贝尔规范场强 J μ A μ 。模仿前面普通卡鲁扎–克莱因理论中的度规写法 [18] [19] ,我们可以写出非阿贝尔卡鲁扎–克莱因理论中的体时空(bulk spacetime)度规:

q U μ A μ q Φ q v A

那么它的逆是

E l a b = E a t o m + v × B

可以证明它们满足互逆条件

V = d E l a b = d ( E a t o m + v × B ) = d E a t o m d ( v × B ) = d E a t o m v ( B × d )

那么根据上面的分解精神( ψ | V | ψ = ψ | d | ψ E a t o m v ( B × ψ | d | ψ ) ),把胀缩子标量场也考虑进去,度规实际应该写为

v

B × ψ | d | ψ 中, J μ A μ 内的指标 q U μ A μ q Φ q v A 当属杨–米尔斯规范群生成元的序指标,例如当规范群是SU A = 1 q B × ψ | d | ψ 群,它有 | ψ = i c i | ψ i 个生成元,那么 ψ | d | ψ = i j c i * c j ψ i | d | ψ j = i j c i * c j d i j 取遍1到 A = 1 q B × i j c i * c j d i j = 1 q i j c i * c j B × d i j 。在引力理论中, L = 1 2 m v 2 + q v A 的唯一物理意义是高维(内空间)指标,即高维(内空间)指标承担了杨–米尔斯规范群生成元的序指标,因为我们不打算(像杨–米尔斯理论那样)引入其它额外自由度(如同位旋),现在唯一的自由度就是高维内空间指标。但是这也带来一个问题:这要求高维(内空间)是 p = L v = m v + q A 维的。但是按照Killing矢量的特性,一个 H = p v L = ( m v + q A ) v ( 1 2 m v 2 + q v A ) = 1 2 m v 2 = ( p q A ) 2 2 m 维高维(内空间)有 V = μ B l a b = μ ( B a t o m v × E c 2 ) = μ B a t o m + μ ( v × E c 2 ) = μ B a t o m + v ( E × μ c 2 ) 个Killing矢量 [38] [39] [40] ,但是 A = 1 q E c 2 × ψ | μ | ψ (只有 μ ψ A μ 成立,这正是普通的阿贝尔五维卡鲁扎–克莱因理论)。如果由高维卡鲁扎–克莱因理论生成的规范群是SO( ( μ i g A μ ) ψ )群(SU z 群是SO( z )群的子群),它的生成元个数是 x x 维高维(内空间)有 y 个Killing矢量 [38] [39] [40] ,由此说来,如果 z ,则Killing数量个数与SO( a )群生成元个数相等。由此看来, k x = n π / a 内的指标 n 应该被看作高维(内空间)指标,存在由Killing矢量场为生成元组成的群与规范对称群一一对应的现象。

我们总结一下本节:在非阿贝尔卡鲁扎–克莱因理论中,为了从Levi-Civita联络中得到杨–米尔斯规范场强,需要对度规进行“内外空间分离变量”式的分解: a 。尽管高维内空间 z 的物理含义未知,但这种分解已经足够使得我们得到一个规范场强 a = a ( z ) 。如果 z 能写作为某个群的结构常数 x ,那么它就是杨–米尔斯规范场强( z )。这一结论相对容易得到(本作者在2006~2007年已经证得),正如前一节(“非阿贝尔版本的卡鲁扎–克莱因理论”)已经演绎。但实际上 t 是具有物理含义的,它其实就是Killing矢量 [25] (这一点是笔者在后来看到文献 [25] 才认识到的)。如果把 | x , z , t i 看作Killing矢量,则确实可以论证从Levi-Civita联络中得到杨–米尔斯规范场强,此在本节也已经演绎。为了让读者进一步理解这种联系,我们在本文附录中附上了有关Killing矢量和Lie导数的理论知识 [38] [39] [40] [41] 。

5. 非阿贝尔卡鲁扎–克莱因理论之缺点和引力–规范统一之出路

虽然非阿贝尔卡鲁扎–克莱因理论(在上面两节所介绍)可以把引力场和杨–米尔斯规范场统一起来,但也需要指出的是,非阿贝尔卡鲁扎–克莱因理论有几个缺点。缺点之一是在希尔伯特–爱因斯坦作用量密度中,除了产生杨–米尔斯规范场的作用量密度外,还有一些杂项。其实这些杂项在普通的阿贝尔卡鲁扎–克莱因理论中已经存在,只不过在非阿贝尔卡鲁扎–克莱因理论中有更多杂项。例如,在统一引力场与电磁场的传统的阿贝尔卡鲁扎–克莱因理论中有伸缩子标量场 i (dilaton)与U(1)麦克斯韦电磁场 z 之间的相互作用(此时麦克斯韦场方程可写作为 z ,其中 f i ( z , t ) 是电磁场的场强) [18] 。这个卡鲁扎–克莱因理论中的四维时空内的引力场方程是 f i ( z , t ) | x , z , t i ,其中 F ( μ μ ) | ψ = 0 为引力源即能量–动量张量(它是麦克斯韦电磁场的量),空框 | ψ = i f i ( z , t ) | x , z , t i 为二阶(偏微分)达兰伯(d’Alembert)算符( f i ( z , t ) );标量场(伸缩子) | ψ 的场方程是 F ( μ μ ) | ψ = 0 ,即电磁场是伸缩子dilaton标量场 μ | ψ = μ i f i ( z , t ) | x , z , t i = i [ μ f i ( z , t ) ] | x , t i + i f i ( z , t ) μ | x , z , t i 的源 [18] 。有人可能会建议这样的杂项可以作为暗物质的贡献。不过,这样一来,无疑引力波和电磁波的传播速度不再相同。但是2017年8月17日在由引力波干涉仪LIGO和费米伽马射线望远镜探测到的双中子星合并事件(发生地距地球为40兆秒差距、折合为约1.3亿光年的外长蛇座内的NGC4993星系内) [26] [27] 中发现,引力波和伽马射线“双星使”经过1.3亿年(合计约 x , z , t | j 秒)的长途旅行,只差1.7秒先后到达地球 [26] [27] ,这意味着引力波和电磁波波速其实严格相等、传播轨迹一样,因此这一观察结果否定了将上述杂项作为暗物质贡献的可能研究思路 [28] [29] 。即使伽马射线1.7秒延迟,也是因为在“双中子星合并”时当两中子星刚螺旋式互绕时引力波先产生、迟滞1.7秒后当双中子星熔融时才发生伽马射线暴。我们可以做一个不太严密的数量级估算:在两颗中子星(0.86倍和2.26倍太阳质量之间,半径10千米量级) [26] [27] 刚靠近距离 z 米量级时,它们的环绕速度为 x , z , t | j μ | ψ = x , z , t | j μ i f i ( z , t ) | x , z , t i = i [ μ f i ( z , t ) ] x , z , t | j | x , z , t i + i f i ( z , t ) x , z , t | j μ | x , z , t i . 米/秒,然后发生剧烈事件:彼此螺旋式环绕、靠拢、合并、熔融。螺旋式环绕的双星系统,作为一个质量四极振子,已经先辐射引力波,引力波频率大致是两中子星环绕频率(引力波的频率为1~100赫兹范围)。从两颗中子星开始螺旋环绕到完全合并,需要花时间秒量级(根据上面已交代的环绕速度和距离来估算),具体可能是1.7秒,再发生剧烈的伽马射线暴,故而引力波比伽马射线暴早发射1.7秒。由此说来,它们的波速(在长途旅行中)能彼此印证,那么爱因斯坦广义相对论方程和麦克斯韦电磁场方程是高度精确的。确实如此,因为根据引力波的线性化弱场近似条件和零迹条件,引力波方程与电磁场方程形式结构一致,具体说来,引力波方程写为 x , z , t | j | x , z , t i ,麦克斯韦方程写为 x 。我们只要把电磁场张量 z 与引力理论中的Levi-Civita联络 x , z , t | j | x , z , t i = δ i j 进行类比,就可以发现,它们的波动方程结构一模一样,因此如果初始发射时,它们方向一致,它们之后的传播轨迹就相同。

卡鲁扎–克莱因理论的缺点之二是,因杨–米尔斯规范势 x , z , t | j μ | ψ = μ f j ( z , t ) + i x , z , t | j μ | x , z , t i f i ( z , t ) = μ f j ( z , t ) i [ i i x , z , t | j μ | x , z , t i ] f i ( z , t ) = ( μ δ j i i g A μ j i ) f i ( z , t ) . 来自高维度规 j ,而高维广义相对论的宇宙学项 x , z , t | j μ | ψ = ( μ δ j i i g A μ j i ) f i ( z , t ) 会破坏杨–米尔斯规范对称性,甚至爱因斯坦张量 f i ( x , t ) 中的 i g A μ j i 项也会破坏规范对称性。 g A μ j i = i x , z , t | j μ | x , z , t i F ( μ μ ) | ψ = 0 这两项在普通的麦克斯韦电磁理论和杨–米尔斯规范理论中是不存在的。它们之所以在广义相对论引力理论中出现,是因为对爱因斯坦–希尔伯特引力作用量密度 { F ( ( μ i g A μ k j ) ( μ δ j i i g A μ j i ) ) f i ( z , t ) } | x , z , t k = 0 求关于 | x , z , t k 的变分时, f i ( z , t ) F ( ( μ i g A μ k j ) ( μ δ j i i g A μ j i ) ) f i ( z , t ) = 0 这两项出自 F ( μ μ ) | ψ = 0 求关于 f i ( z , t ) 的变分,而这些项在杨–米尔斯规范理论中并不需要。

在广义相对论中,宇宙学项 i g A μ 看似引力子质量项。不过其实并不是,因为它不会使得引力势变为类似汤川势的形式 g A μ j i = i x , z , t | j μ | x , z , t i ,而是导致史瓦西–德西特解(度规00分量是 ω μ p q = i e p λ μ e q λ ),它对应的引力势完全不具有汤川势的形式。另一方面,宇宙学项可以分解为 x , z , t | j ,如果把 | x , z , t i 当作引力子振幅,那么非零的对角化分量 f i ( z , t ) | x , z , t i 本身也是引力子的源,这与超导内的电磁场很不一样(超导内不存在这样的常数电荷密度源项),因此,如果后者有汤川势,那么前者自然不可能有汤川势。当然,大家知道,汤川势的指数会削弱场强,而在史瓦西–德西特解中,当宇宙学常数 f i ( z , t ) 为正时,导致斥力项(这也可能是宇宙加速膨胀之源),两者(汤川势和史瓦西–德西特解)在定性上还是有类似功能的(即前者的“削弱场强”与后者的“斥力项”,定性效果上一致)。在高维卡鲁扎–克莱因理论中,宇宙学项 H ^ = 2 2 m 2 + 1 2 ( + Δ Ω e + i θ Ω e - i θ Δ ) = ( 2 2 m 2 + 1 2 Δ 1 2 Ω e + i θ 1 2 Ω e - i θ 2 2 m 2 1 2 Δ ) 应该确实是规范粒子质量项,这成为卡鲁扎–克莱因理论的一个瑕疵(前提是如果我们确实计划把卡鲁扎–克莱因理论当作是引力–规范统一理论的方案)。通常在规范理论中,规范势不能直接出现在场方程中。但是,度规或标架场作为时空平移规范对称性的规范势,却允许直接出现在广义相对论引力场方程中,这是因为度规或标架场除了作为(平移规范对称性的)规范势外,还起着作为上升、下降张量指标的作用。现在高维度规 Ω 又起着产生杨–米尔斯规范势 Δ 的作用,这就导致了对规范对称性的破坏。

与上面非阿贝尔卡鲁扎–克莱因理论“外壳是引力场,内芯含有杨–米尔斯规范场”的方案不同,还有一种引力规范理论方案 [30] [31] [32] ,走的却是相反路线,外壳中的引力作用量密度具有曲率张量平方项的形式(是麦克斯韦–杨–米尔斯作用量密度的推广),但是其引力场方程的首次积分解恰好是爱因斯坦引力场方程,而杨–米尔斯规范场仍旧从高维曲率张量中衍生出来。在此方案中,尽管其理论素材仍旧是引力场,但其外观结构如引力作用量密度却不再是爱因斯坦–希尔伯特曲率一次项形式 [31] [32] ,因此爱因斯坦引力场方程级秩比(自旋联络)引力规范场方程低一级(因为前者是后者的首次积分解) [30] [31] [32] 。在此方案中,不存在上述前一方案在美感上的瑕疵问题。基于这个原因,我们可能要放弃非阿贝尔卡鲁扎–克莱因理论作为统一广义相对论与杨–米尔斯规范理论的方案,改旗易帜,采用引力规范理论 [30] [31] [32] 作为统一引力场与杨–米尔斯规范场的方案。在这个方案中,普通的四维时空中的黎曼曲率张量 e ± i θ ( U ^ = ( e + i ϕ 0 0 e - i ϕ ) 为自旋仿射联络或洛伦兹联络)可以推广到高维空间,变为 U ^ + = ( e - i ϕ 0 0 e + i ϕ ) ( U ^ + H ^ U ^ 表示高维内空间的坐标指标), ϕ 具有普通杨–米尔斯规范场强的形式 [30] [31] [32] (本作者在2007年后开始采用此法)。在这一理论中,高维空间转动对称性(洛伦兹转动对称性)就是杨–米尔斯规范对称性,高维空间自旋仿射联络就是杨–米尔斯规范势,高维黎曼曲率张量就是杨–米尔斯规范场强,物质场的高维自旋流密度张量是杨–米尔斯规范荷流密度。如果选取复厄密度规(同时标架场也是复数),那么引力规范群是SU(1, U ^ + H ^ U ^ Ψ )群, U ^ + H ^ 是其中子群U U ^ + H ^ = U ^ + = ( e - i ϕ 0 0 e + i ϕ ) ( 2 2 m 2 + 1 2 Δ 1 2 Ω e + i θ 1 2 Ω e - i θ 2 2 m 2 1 2 Δ ) = ( e - i ϕ ( 2 2 m 2 + 1 2 Δ ) 1 2 Ω e - i ϕ e + i θ 1 2 Ω e + i ϕ e - i θ e + i ϕ ( 2 2 m 2 1 2 Δ ) ) . 或SU U ^ Ψ = ( e + i ϕ 0 0 e - i ϕ ) ( ψ ψ ) = ( e + i ϕ ψ e - i ϕ ψ ) 规范势 [33] 。但是复厄密度规的微分几何在数学上十分复杂,Levi-Civita联络多了几倍,而且必然出现挠率 [33] 。一些复流形专著,虽然也讲述复厄密度规,但是却选择了最简单的情形(可以让挠率不出现),但是这样的数学工具在本主题(引力–规范统一)中却不够用。除了以上产生U U ^ + H ^ 或SU U ^ + H ^ U ^ Ψ = ( e - i ϕ ( 2 2 m 2 + 1 2 Δ ) 1 2 Ω e - i ϕ e + i θ 1 2 Ω e + i ϕ e - i θ e + i ϕ ( 2 2 m 2 1 2 Δ ) ) ( e + i ϕ ψ e - i ϕ ψ ) . 规范群的引力–规范统一方案 [33] 外,还有更为简单的方案,那就是体时空(bulk spacetime)度规与标架场仍旧选取实数、对称性为SO(1, U ^ + H ^ U ^ Ψ = ( e - i ϕ ( 2 2 m 2 + 1 2 Δ ) e + i ϕ ψ + 1 2 Ω e - i ϕ e + i θ e - i ϕ ψ 1 2 Ω e + i ϕ e - i θ e + i ϕ ψ + e + i ϕ ( 2 2 m 2 1 2 Δ ) e - i ϕ ψ ) . )或SO( 2 ( e + i ϕ ψ ) , 2 ( e + i ϕ ψ ) = ( e + i ϕ ψ ) = [ e + i ϕ ( + i ϕ ) ψ ] = e + i ϕ ( + i ϕ ) 2 ψ )的引力规范群方案。在此方案中,杨–米尔斯规范群(高维引力规范群)是SO( 2 ( e - i ϕ ψ ) = e - i ϕ ( i ϕ ) 2 ψ )。如果 2 ( e - i ϕ ψ ) = e - i ϕ ( i ϕ ) 2 ψ ,那么在该理论中,可以从新引力理论中产生SO(10)大统一理论。此方案有两个应用背景:i) 如果强、弱、电大统一理论天然是SU(5)规范对称的,那么由于SU(5)是SO(10)的子群,为了避免上述的SU(1, M )复度规理论的复杂性,我们以SO(1, U ^ + H ^ U ^ Ψ = ( ( 2 2 m ( + i ϕ ) 2 + 1 2 Δ ) ψ + 1 2 Ω e - i ϕ e + i θ e - i ϕ ψ 1 2 Ω e + i ϕ e - i θ e + i ϕ ψ + ( 2 2 m ( i ϕ ) 2 1 2 Δ ) ψ ) )或SO( ϕ = θ / 2 , H ^ ' Ψ = U ^ + H ^ U ^ Ψ = ( 2 2 m ( + i ϕ ) 2 + 1 2 Δ 1 2 Ω 1 2 Ω 2 2 m ( i ϕ ) 2 1 2 Δ ) ( ψ ψ ) )作为体时空(bulk spacetime)引力规范群代替之;ii) 如果强、弱、电大统一理论天然是SO(10)规范对称的,自然就需要采用SO(1, H ^ ' = 2 2 m ( + i σ 3 ϕ ) 2 + 1 2 Δ σ 3 + 1 2 Ω σ 1 )或SO( σ 3 ϕ , ϕ )引力规范群方案 [30] [31] [32] 。时空平移对称性和洛伦兹对称性都是等度规变换对称性 [41] ,那么时空平移对称群和洛伦兹转动群都是等度规规范群(isometry gauge group)。

6. 从高维引力规范理论衍生出普通规范场论

引力规范理论以自旋仿射联络和标架场分别为局域洛伦兹转动对称和局域时空平移对称所对应的引力规范势,但是由不同研究者所提出的引力规范理论具体细节各异。在我们所提出的引力规范理论的其中一个版本中 [31] [32] ,爱因斯坦广义相对论方程作为自旋联络引力规范场方程的首次积分形式出现,宇宙学常数以积分常数身份出现,而由量子真空能所导致的巨大引力效应也不复存在(我们指出 [31] ,在引力规范场方程中,真空能的能量–动量张量项以 ϕ 形式出现,由于量子零点真空能密度 L 为常数,两个协变导数项 M H ^ ' Ψ = U ^ + H ^ U ^ Ψ = ( 2 2 m ( + i ϕ ) 2 + 1 2 Δ 1 2 Ω 1 2 Ω 2 2 m ( i ϕ ) 2 1 2 Δ ) ( ψ ψ ) 自动为零,故而这一真空能项为零,即真空能不呈现引力效应 [31] )。根据场的量子理论,电磁场等在被量子化后,具有几乎无穷大的真空能(量子真空零点涨落能)能量密度(如果把场的频率能标截断在普朗克能量,真空能密度大约是目前宇宙平均能量密度的120个数量级倍数;如果截断在弱电统一能标,真空能密度大约是目前宇宙平均能量密度的60个数量级倍数)。虽然按照超对称理论,每一种玻色子对应一种费米子伴侣,它们的真空能量密度刚好相反、彼此抵消,但是毕竟超对称在至少弱电能标以下是破缺的,因此量子真空能密度仍然是巨大的。按照广义相对论,这样的近乎发散的量子真空能量会导致时空极度弯曲。但是实际上,这样的“灾难”并没有发生。这是量子场论和广义相对论之间的一个未解之谜(只要检索“真空能量、宇宙学常数之谜”(quantum vacuum energy、cosmological constant problem),可以发现讨论此问题的文献可谓浩如烟海)。关于引力规范理论如何解除“量子真空能量导致的近乎无穷大的引力”问题的一种方案 [31] ,笔者在一篇《电动力学》研讨会中文论文中有具体叙述 [42] (其删节部分选入于举办方的学报 [43] )。

在本文中,我们要讨论的是如何从引力规范理论中呈现出普通规范场。将该引力规范理论 [31] [32] 推广到高维且设高维内空间维数为 × ( ϕ ) 0 ,我们可以得到高维SO( σ 3 ϕ )引力规范场,其引力源是矢量场和旋量场的高维自旋流密度,它在普通四维时空内呈现为SO( σ 3 )杨–米尔斯规范场。由于U( × E = ( μ ¯ ¯ H ) t )或SU( × H = ( ε ¯ ¯ E ) t )是SO( ε ¯ ¯ )的子群,那么该理论可以将引力相互作用和普通的SU( μ ¯ ¯ )杨–米尔斯规范相互作用统一起来 [33] 。

在该引力规范理论中,包含曲率项和挠率项的引力拉格朗日量密度是 [32]

ε ¯ ¯ = ( ε x x ε x y ε x z ε y x ε y y ε y z ε z x ε z y ε z z )

其中挠率的定义是 μ ¯ ¯ = ( μ x x μ x y μ x z μ y x μ y y μ y z μ z x μ z y μ z z ) 。以标量物质场为例,我们写出其拉格朗日量密度,包括物质场 ( δ ε ¯ ¯ ) E 、与它对应的重中介场 ( δ ε ¯ ¯ ) E = ( 0 ε x y ε x z ε y x 0 ε y z ε z x ε z y 0 ) ( E x E y E z ) = ( ε x y E y + ε x z E z ε y x E x + ε y z E z ε z x E x + ε z y E y ) 的自由拉格朗日量密度及它们之间的耦合拉格朗日量密度,表达式为 [31]

A × E

这里的符号 A y E z A z E y 是四维时空内的散度项(divergent term)。狄拉克旋量场也有与上式对应的拉格朗日量密度 [32] 。我们假设重中介场 g ˜ μ ν g ˜ ν λ = ( g μ ν + ϕ 2 A μ k A k ν ϕ 2 A μ i ϕ 2 A j ν ϕ 2 η j i ) ( g ν λ A ν l A i λ g σ τ A i σ A τ l + η i l / ϕ 2 ) = ( ( g μ ν + ϕ 2 A μ k A k ν ) g ν λ + ϕ 2 A μ i ( A i λ ) ( g μ ν + ϕ 2 A μ k A k ν ) ( A ν l ) + ϕ 2 A μ i ( g σ τ A i σ A τ l + η i l / ϕ 2 ) ϕ 2 A j ν g ν λ + ϕ 2 η j i ( A i λ ) ϕ 2 A j ν ( A ν l ) + ϕ 2 η j i ( g σ τ A i σ A τ l + η i l / ϕ 2 ) ) = ( δ μ λ 0 0 δ j l ) . 质量 A x E y A y E x 很大(接近普朗克质量数量级),因此只研究其低能行为。我们使用路径积分方法,将重中介场 ( δ ε ¯ ¯ ) E 看作是一个经典场背景,把物质场 ( δ ε ¯ ¯ ) E 看作是一个量子水平上的微挠,可得到物质场 A × E 的低能标有效作用量。最后,将此低能有效作用量密度与上述引力拉格朗日量密度作为低能引力规范理论的主要内容,我们对此拉格朗日量总密度计算关于自旋仿射联络 A y E z A z E y ε x y E y + ε x z E z 的变分,得到一个关于自旋联络的二阶微分方程、但关于度规却是三阶的微分方程

ε x z = ξ A y

其中 ε x y = ξ A z A z E x A x E z ε y x E x + ε y z E z 为爱因斯坦张量。广义相对论中的引力相互作用耦合系数可用物质场所对应的重中介场 ε y x = ξ A z 质量项来表示即 ε y z = ξ A x ,其中引力拉格朗日量密度的常系数 A x E y A y E x ε z x E x + ε z y E y 取负值 [33] 。

上述引力拉格朗日量密度 ε z y = ξ A x 中的曲率部分 ε z x = ξ A y 遵守局域洛伦兹转动群SO(1, 3)规范对称性。如果我们引入高维空间(如 ( δ ε ¯ ¯ ) E = ξ A × E 维),那么此引力拉格朗日量密度在高维空间具有SO( ε x x = ε y y = ε z z = ε m )规范对称性,取上述引力作用量密度中的拉丁字母指标 ε ¯ ¯ = ε m I 3 × 3 + δ ε ¯ ¯ 为高维空间指标( × H = ( ε ¯ ¯ E ) t 取值为1到 × H = i ω ε ¯ ¯ E = i ω ( ε m I 3 × 3 + δ ε ¯ ¯ ) E = i ω ε m E i ω δ ε ¯ ¯ E = i ω ε m E i ω ξ A × E . ),那么维度紧致化后,从上述引力作用量密度中可以得到SO( × H + i ω ξ A × E = i ω ε m E . )杨–米尔斯规范场的作用量密度。由于爱因斯坦广义相对论方程和杨–米尔斯理论都可以从该理论中产生,从而可以说,我们将引力场与规范场统一了起来 [33] 。

不过,由于粒子物理标准模型(强、弱、电磁相互作用理论)所用到的杨–米尔斯场应该是属于SU( × E = ( μ ¯ ¯ H ) t )群对称性的规范场,例如最简单的强、弱、电大统一理论是SU(5)规范对称的,而不是SO( × E i ω ζ W × H = + i ω μ m H . )规范对称的。为此目的,我们就要建立复流形时空中的引力规范理论(时空坐标、度规、标架场都是复数,自旋仿射联络是厄密的,而不是简单的反对称的)。这样的理论确实存在,可以称为SU(1, ( δ μ ¯ ¯ ) H )群引力规范理论。但是我们得到的这样的理论 [33] 却十分繁琐、庞杂,以致于不得不自问:自然界怎么可能愿意选择这么复杂的统一场论方案?所以,我们认为还是要退回到实流形空间,回到SO(1, ( δ μ ¯ ¯ ) H = ( 0 μ x y μ x z μ y x 0 μ y z μ z x μ z y 0 ) ( H x H y H z ) = ( μ x y H y + μ x z H z μ y x H x + μ y z H z μ z x H x + μ z y H y ) . )或SO( W × H , W × H )作为体时空(bulk spacetime)引力规范群的统一方案,认为强、弱、电大统一理论天然是SO( W y H z W z H y )群规范对称的,如SO(10)、SO(12)、SO(14)等,其有子群SU(5)、SU(6)、SU(7)等。为了避免上述的SU(1, W z H x W x H z )复流形内复度规、复联络理论的复杂性,我们应当采纳更为直截了当的实流形时空。笔者曾(十年前)认为SO(1, W x H y W y H x )或SO( ( δ μ ¯ ¯ ) H , W × H )引力规范群过于简单平凡,故而将其放弃,且为迎合SU( W y H z W z H y μ x y H y + μ x z H z )群杨–米尔斯规范理论,希望建立自洽的SU(1, μ x z = ζ W y )群的复流形理论(可见文献 [33] )。现在“返璞归真”,不再舍近求远,认为应该再度退回到相对简单的实流形SO(1, μ x y = ζ W z )或SO( W z H x W x H z μ y x H x + μ y z H z , i )理论,这可能才是自然界愿意选用的统一场论方案。

低维外时空就是普通的四维时空,高维内空间是杨–米尔斯规范群空间;由低维和高维合起来的体时空(bulk spacetime)遵守SO(1, g ˜ λ M i )或SO( M , i )局域洛伦兹规范群变换下的不变性,规范势为自旋仿射联络(也可以称呼为洛伦兹联络)。洛伦兹联络可以写为 M ,其中 i 为标架场(vielbein),小写拉丁字母 μ = e μ ¯ μ μ ¯ = δ μ ¯ μ μ ¯ + e M ¯ μ M ¯ 为局域平直的洛伦兹时空指标、希腊字母 = μ μ 为弯曲的爱因斯坦时空指标; = ¯ μ + e M ¯ μ ¯ M = ¯ μ + g ˜ μ N e M ¯ N ¯ M 中的 e M ¯ μ = g ˜ μ N e M ¯ N + g ˜ μ ν e M ¯ ν 算符是黎曼几何中仅对爱因斯坦指标 g ˜ μ ν e M ¯ ν 作用的协变导数算符(含Levi-Civita联络 4 × 10 15 ),也即 L = 10 7 。文献中,对于四维时空,标架场叫tetrad (“四位组、四分体、四元基”)或vierbein (四脚标架)。在德语中,vier表示“四”(four)、bein表示“腿脚”(leg)。对于超过四维的时空 v = 10 7 被称呼为vielbein (多脚标架),viel表示“多“(many)。标架场 μ Γ μ ν σ + Γ μ μ τ Γ τ ν σ Γ μ τ σ Γ τ μ ν = 0 (满足关系 μ F μ ν + Γ μ μ τ F τ ν F μ τ Γ τ μ ν = 0 )可以理解为平直闵科夫斯基时空与弯曲爱因斯坦时空之间的变换矩阵(下面关于“笔者的思考过程”的说明可能有助于读者理解这个概念:笔者在学生时代,考虑到弯曲时空中的克莱因–戈登方程 F μ ν 包含了引力效应,为了提取它的引力效应,认为需要把 Γ μ ν σ 化为平坦闵科夫斯基时空中的形式 μ ,而 ¯ μ + g ˜ μ N e M ¯ N ¯ M 与单位矩阵的偏离 f J K L A μ J A λ K 正是引力效应。所以,笔者在无意之中“导出”了 g i 0 的一个定义。当时笔者这么做是为了研究弯曲空间的麦克斯韦场、狄拉克场,用这种从场的导数中提取引力效应的方法,来研究自旋–转动耦合,即自旋粒子的“自旋引力磁矩”与转动参考系的相互作用。这里参考系转动角速度类似于“等效的引力磁场”)。再继续讲解洛伦兹联络。洛伦兹联络的定义可以模仿Levi-Civita联络 μ φ = g μ ν ν φ = ( η μ ν + h μ ν ) ν φ (此也是笔者曾经的做法,有助于读者理解该概念):因为已知根据度规的metricity条件( = η μ ν ν φ + ( h μ 0 0 φ + h μ i i φ ) ),可以得到 0 φ = η 0 ν ν φ + ( h 00 0 φ + h 0 i i φ ) 的表达式,那么对于标架场 h 0 i ,我们是否也可以通过定义类似的条件( μ g ˜ λ M λ g ˜ μ M μ g ˜ λM =( ¯ μ + g ˜ μN e L ¯ N ¯ L ) g ˜ λM = ¯ μ g ˜ λM + g ˜ μN e L ¯ N ¯ L g ˜ λM ),得到洛伦兹联络(自旋仿射联络 λ g ˜ μ M = ¯ λ g ˜ μ M + g ˜ λ N e L ¯ N ¯ L g ˜ μ M )的定义呢?确实可以,并立即得到 μ g ˜ λ M λ g ˜ μ M = ¯ μ g ˜ λ M ¯ λ g ˜ μ M + e L ¯ N ( g ˜ μ N ¯ L g ˜ λ M g ˜ λ N ¯ L g ˜ μ M ) (笔者曾在学生时代正是采用这种方法“独立”得到了关于 A μ J A λ K 的定义。后来才知前人已经早有此概念并称呼其为自旋仿射联络)。

值得一提的是,在前人的各种引力规范理论中,标架场和洛伦兹联络属于庞加莱规范对称性中的两种规范势,其中标架场是局域时空平移对称规范变换下的联络,其规范场张量是挠率;而时空转动对称变换下的联络,是洛伦兹联络(自旋联络),其规范场张量是黎曼曲率张量。洛伦兹联络在旋量表示下,可以写为 e L ¯ N ( g ˜ μ N ¯ L g ˜ λ M g ˜ λ N ¯ L g ˜ μ M ) (洛伦兹群生成元的旋量表示是 g ˜ μ M );在矢量表示下, g ˜ λ M (洛伦兹群生成元的矢量表示是 g ˜ μ M ( x , y ) = ξ M K ( y ) A μ K ( x ) )。

在这里,为了简化,我们只讨论一个最简单的高维内空间SO( g ˜ λ M ( x , y ) = ξ M K ( y ) A λ K ( x ) )群,即SO(2)群,它只有一个生成元、其高维内空间中的引力规范理论只有一个引力规范势(自旋联络) A μ J A λ K 。下面我们来证明电磁U(1)群规范对称性可以从“高维引力规范理论经过维度紧致化后得到的SO(2)群引力规范对称性”产生。

我们只讨论标量物质场的电动力学如何从引力规范相互作用理论中产生。在高维引力理论(如SO(1, x )或SO( y , ξ M K )引力规范理论)看来,基本的物质场是实数矢量场。该矢量场经过紧致化,普通四维指标分量 g ˜ μ M ( x , y ) = ξ M K ( y ) A μ K ( x ) 为零,但是高维指标分量 ξ M K ( y ) 不为零;由于U( ξ K )或SU( g ˜ μ M ( x , y ) = ξ M K ( y ) A μ K ( x ) )是SO( ξ M K ( y ) )的子群,SO( g ˜ μ M )的物质场表示(实数矢量场)可以化身为U( g ˜ λ M )或SU( μ g ˜ λ M λ g ˜ μ M )的物质场表示(复数标量场),也就是说,普通四维时空内的复数标量场其实是高维空间中的实数矢量场;实数矢量场有自旋流密度张量,作为自旋联络引力规范相互作用之源,它会在U( μ g ˜ λ M λ g ˜ μ M = ξ M K ( y ) [ ¯ μ A λ K ( x ) ¯ λ A μ K ( x ) ] + e L ¯ N { [ ξ N J ( y ) A μ J ( x ) ] ¯ L [ ξ M K ( y ) A λ K ( x ) ] [ ξ N K ( y ) A λ K ( x ) ] ¯ L [ ξ M J ( y ) A μ J ( x ) ] } = ξ M K ( ¯ μ A λ K ¯ λ A μ K ) + e L ¯ N ( ξ N J ¯ L ξ M K ξ N K ¯ L ξ M J ) A μ J A λ K . )或SU( μ g ˜ λ M λ g ˜ μ M = ξ M K ( ¯ μ A λ K ¯ λ A μ K ) + e L ¯ N ( ξ N J ¯ L ξ M K ξ N K ¯ L ξ M J ) A μ J A λ K )规范理论中,化身为杨–米尔斯荷流密度。在引力规范理论中,矢量物质场的协变导数为 e L ¯ N ,其中 e L ¯ N [ ξ M N ( ¯ μ A λ L ¯ λ A μ L ) + ( ξ N J ¯ L ξ M K ξ N K ¯ L ξ M J ) A μ J A λ K ] 为自旋仿射联络(洛伦兹联络)、 e L ¯ N ξ M N ( ¯ μ A λ L ¯ λ A μ L ) = ξ M L ¯ ( ¯ μ A λ L ¯ λ A μ L ) ξ M L ¯ 维高维空间中的洛伦兹转动群SO( L )群的生成元、 g ˜ λ M ( x , y ) = ξ M L ( y ) A λ L ( x ) 的指标 L 为高维空间指标( Γ ˜ λ , μ M 取值为1到 e M ¯ M ( μ g ˜ λ M λ g ˜ μ M ) e M ¯ M = ξ M ¯ K ( ¯ μ A λ K ¯ λ A μ K ) + e L ¯ N ( ξ N J ¯ L ξ M K ξ N K ¯ L ξ M J ) e M ¯ M A μ J A λ K = ξ M ¯ K ( ¯ μ A λ K ¯ λ A μ K ) + ( ξ L ¯ J ¯ L ξ M ¯ K ξ L ¯ K ¯ L ξ M ¯ J ) A μ J A λ K . 为高维空间维数)。由于我们只研究高维内空间内的SO(2)引力,故而 ¯ L e M ¯ M 。SO(2)群只有一个李代数生成元 ξ M ¯ P ( ξ 1 ) P N ¯ = η M ¯ N ¯ = δ M ¯ N ¯ ,于是其四个分量为 ( μ g ˜ λ M λ g ˜ μ M ) e M ¯ M = ξ M ¯ P [ ( ¯ μ A λ P ¯ λ A μ P ) + ( ξ 1 ) P N ¯ ( ξ L ¯ J ¯ L ξ N ¯ K ξ L ¯ K ¯ L ξ N ¯ J ) A μ J A λ K ] . F μ λ P ( h i g h e r ) = ( ¯ μ A λ P ¯ λ A μ P ) + ( ξ 1 ) P N ¯ ( ξ L ¯ J ¯ L ξ N ¯ K ξ L ¯ K ¯ L ξ N ¯ J ) A μ J A λ K ( ρ v a c g β ν ) α ( ρ v a c g α ν ) β ρ v a c 。这样,在该高维引力理论中,矢量物质场协变导数 ( ρ v a c g β ν ) α ( ( ρ v a c g α ν ) β 为高维空间指标, 2 N 为普通四维时空指标)的两个分量分别可以写成如下:分量之一为

2 N

这里,我们设四维时空爱因斯坦引力很弱,可以忽略,但是高维引力存在(它们将化身为普通的杨–米尔斯相互作用)。我们已经将自旋联络 2 N 改写为 N (毕竟这里只有一个引力规范势,故而上标1可以省去)。协变导数分量之二为

N

需要注意的是 2 N N 是实数矢量场的两个分量(高维内空间SO(2)群流形内的矢量是实数)。但我们定义复数标量场 l g = ζ 1 2 ( e k μ e l ν e k ν e l μ ) ( Ω μ λ k m Ω ν λ m l + τ Τ μ λ k Τ ν λ l ) , Τ μ λ k = e k σ ( Γ σ μ λ Γ σ λ μ ) (这是为了生成荷电粒子的标量物质场),再将实数矢量场的分量( φ ϕ )的SO(2)规范群协变导数线性组合得到

l φ = 1 2 μ φ μ φ 1 2 m 2 φ 2 , l ϕ = 1 2 μ ϕ μ ϕ 1 2 M G 2 ϕ 2 , l φ ϕ = ξ ( μ φ μ ϕ μ 2 ϕ φ ) = ξ ϕ J + D . T . , J = ( μ μ φ + μ 2 φ ) .

由实数矢量场的SO(2)规范群协变导数的另一种线性组合得到

D . T .

这样我们就有两类协变导数的线性组合关系,可以互相表示如下: ϕ M G 。我们来看原先SO(2)群规范对称性下的实数矢量场(其高维分量为 ϕ φ )的拉格朗日量密度与新的复数标量场( φ ω μ p q )的拉格朗日量密度关系,它们其实相等且可以互化。计算如下

α ( G β ν 8 π G τ β ν ) β ( G α ν 8 π G τ α ν ) = 0 ,

又由于 G β ν = R β ν g β ν R / 2 G α ν = R α ν g α ν R / 2 ,我们得到 ϕ 8 π G = ξ 2 / ( 2 ζ M G 2 ) ,于是 ζ

这样,我们发现原先(高维内空间中) SO(2)群规范对称性下的高维实数矢量场(其高维分量为 l g ζ 1 2 ( e k μ e l ν e k ν e l μ ) Ω μ λ k m Ω ν λ m l )的拉格朗日量密度可以恒等变换为新的复数标量场( 2 N 2 N )的拉格朗日量密度( k , l , m ),也就是

k , l , m

下面我们来看高维实数矢量场的两个分量 2 N 2 N 的场方程即克莱因–戈登方程是否能化为复数标量场 N 2 N 的场方程。高维实数矢量场分量 Γ ˜ λ , μ M e M ¯ M 的场方程 ( μ g ˜ λ M λ g ˜ μ M ) e M ¯ M = ξ M ¯ K ( ¯ μ A λ K ¯ λ A μ K ) + e L ¯ N ( ξ N J ¯ L ξ M K ξ N K ¯ L ξ M J ) e M ¯ M A μ J A λ K = ξ M ¯ K ( ¯ μ A λ K ¯ λ A μ K ) + ( ξ L ¯ J ¯ L ξ M ¯ K ξ L ¯ K ¯ L ξ M ¯ J ) A μ J A λ K . ¯ L e M ¯ M 可以展开为如下详细形式:

2 N

将第一个方程与乘上虚数因子 Γ ˜ λ , μ M 的第二个方程相加,我们就可以看到

e M ¯ M

这样我们就得到复数标量场的克莱因–戈登方程 ( μ g ˜ λ M λ g ˜ μ M ) e M ¯ M = ξ M ¯ K ( ¯ μ A λ K ¯ λ A μ K ) + e L ¯ N ( ξ N J ¯ L ξ M K ξ N K ¯ L ξ M J ) e M ¯ M A μ J A λ K = ξ M ¯ K ( ¯ μ A λ K ¯ λ A μ K ) + ( ξ L ¯ J ¯ L ξ M ¯ K ξ L ¯ K ¯ L ξ M ¯ J ) A μ J A λ K .

物质场的能量–动量张量和自旋流也值得一探。高维(内空间中)实数矢量场的分量 ¯ L e M ¯ M N 的能量–动量张量和为

Γ ˜ λ , μ M

在最后一步,它已经被恒等转化为新的复数标量场( e M ¯ M ( μ g ˜ λ M λ g ˜ μ M ) e M ¯ M = ξ M ¯ K ( ¯ μ A λ K ¯ λ A μ K ) + e L ¯ N ( ξ N J ¯ L ξ M K ξ N K ¯ L ξ M J ) e M ¯ M A μ J A λ K = ξ M ¯ K ( ¯ μ A λ K ¯ λ A μ K ) + ( ξ L ¯ J ¯ L ξ M ¯ K ξ L ¯ K ¯ L ξ M ¯ J ) A μ J A λ K . )的能量–动量张量。高维实数矢量场的分量 ¯ L e M ¯ M 2 N 的自旋流密度张量为 ω μ 1 [其中 e M ¯ M 为高维空间指标( ( μ g ˜ λ M λ g ˜ μ M ) e M ¯ M = ξ M ¯ K ( ¯ μ A λ K ¯ λ A μ K ) + e L ¯ N ( ξ N J ¯ L ξ M K ξ N K ¯ L ξ M J ) e M ¯ M A μ J A λ K = ξ M ¯ K ( ¯ μ A λ K ¯ λ A μ K ) + ( ξ L ¯ J ¯ L ξ M ¯ K ξ L ¯ K ¯ L ξ M ¯ J ) A μ J A λ K . 取值为1到 ¯ L e M ¯ M ), φ μ 为普通四维时空指标]。由于 φ a 关于指标 N 的反对称性,独立的 N 分量其实只有一个,即 2 N ,它的展开式为

2 N

我们发现,(高维内空间中的)实数矢量物质场的高维自旋流密度 N ( N 为高维空间指标,但 N

为普通四维时空指标)可以化身为普通四维时空内的标量场的流密度 N 。如果把高维空间的SO(2)引力规范群对称性下的洛伦兹联络(自旋仿射联络) D μ φ a [ μ δ a b i g ω μ i ( L i ) a b ] φ b 看作是普通的电磁势,则矢量物质场的高维自旋流密度就化身为普通四维时空内的标量场的电流密度,于是电磁耦合理论可以在高维引力规范理论中呈现展示(呈展)出来。在维度紧致化之后,普通杨–米尔斯规范耦合在本质上就是高维引力规范理论在普通四维时空内的引力效应,普通规范场是引力理论框架内的“呈展规范场”(emergent gauge field)。引力相互作用和规范相互作用可以在该引力规范理论中得到统一。

以上讨论了高维矢量场的作用量密度、场方程、能量–动量张量和自旋流密度。狄拉克场的对应专题亦可以讨论,但这里从略。

7. 结论和讨论

规范场论是近代物理学中自量子力学产生之后的又一块基石 [8] [9] [44] ,可以说是20世纪后半期的理论物理学主旋律(之一) [5] [6] [7] 。但是规范理论并不仅仅只有在量子场论和粒子物理学中才出现。在物理学其它领域如人造电磁介质结构与量子光学系统、原子物理学系统等量子力学领域,也产生了“人造”(synthetic)规范场和“呈展”(emergent)规范场(文献 [21] 综述了部分这方面的研究结果);在各种引力理论中,还可以将非阿贝尔规范场呈现出来,从而统一引力和规范相互作用,本文叙述了这方面的部分研究结果。本文讨论的主要内容有:

本文基于传统的电磁对偶理论,通过引入电磁场的复张量表述,发现在复数形式下的电磁对偶变换其实是一个电磁场的整体规范变换,于是本文提出了“局域电磁对偶规范对称性”这一概念。尽管对偶规范势的物理意义之一是其分量为各向异性介电系数张量和磁导率张量的非对角元,但是很难想象自由真空为天然各向异性。当然,在束缚系统中,如卡西米尔空间,真空(量子真空零点涨落能)可以各向异性。电磁对偶变换是在假设磁荷存在时提出来的,但即使当磁荷和电荷同时不存在(也即在所观察的系统内不出现磁荷和电荷),对于自由的电磁场方程而言,局域电磁对偶规范对称性仍然成立。当然,“局域电磁对偶规范对称性”亦值得日后被推广到杨–米尔斯非阿贝尔情形。

非阿贝尔卡鲁扎–克莱因理论可以将广义相对论引力理论和杨–米尔斯规范场论统一起来。卡鲁扎–克莱因理论 [16] [17] [18] 的高维统一思想和路线在超引力、弦理论和M理论中以新的面貌呈现,展现了丰富多彩、富有启发性意义的新观念 [19] 。另一种理论即引力规范理论借助体时空(bulk spacetime)的局域洛伦兹群规范对称性 [31] [32] ,也可以将爱因斯坦引力理论和杨–米尔斯非阿贝尔规范理论统一起来 [33] 。

本文所研究、介绍的非阿贝尔版本的卡鲁扎–克莱因理论和高维引力规范理论都可以将引力场和杨–米尔斯规范场统一起来,其具体理论细节尽管很不相同,但是都采用了“高维统一”这一基本思想。

尽管非阿贝尔卡鲁扎–克莱因理论能将爱因斯坦引力和杨–米尔斯规范耦合统一起来,但是其缺陷也是存在的:

i) 如理论杂项太多,导致在宇宙大尺度上的电磁波和引力波传播速度不再相同,违反在双中子星合并事件中对伽马射线和引力波双星使的观察结果 [26] [27] ,因此需要约束卡鲁扎–克莱因理论内的各种参数 [28] [29] ;当使用卡鲁扎–克莱因理论把规范耦合和引力相互作用统一起来时,后者的宇宙学常数项会破坏前者的规范对称性;非阿贝尔规范对称性本是一种基本对称性,但是通过Levi-Civita联络产生杨–米尔斯规范场强,使得非阿贝尔规范对称性不再基本,而是从属于引力理论的广义坐标变换,稍显违和。本札记主要内容是对本作者研究非阿贝尔卡鲁扎–克莱因理论的一个陈述和总结,寻其优缺点,将它与另一个可能更有前途的引力–规范统一理论 [31] [32] 比较,为后者提供借鉴。

ii) 卡鲁扎–克莱因理论和广义相对论的希尔伯特–爱因斯坦作用量是曲率的一次形式,过于简单,无法承载四力统一大任务,因此统一场论的理论形式需要具有杨–米尔斯规范场论特点,如拉格朗日量需要至少是曲率平方形式 [31] [32] ,“以引力场为骨架,以规范场为肉身”,高维自旋联络和曲率分别化身为杨–米尔斯规范势和规范场张量(规范场场强),高维物质场的自旋流可以化身为杨–米尔斯荷流。在这样的理论框架下 [31] [32] ,爱因斯坦引力场方程以引力规范场论方程的首次积分形式出现,杨–米尔斯规范场论的作用量密度也可以从引力作用量密度得到 [33] 。

对以上两理论,相比较而言,我们更倾向于后者(高维引力规范理论)优先作为统一引力相互作用和杨–米尔斯规范耦合的理论,因为高维引力规范理论 [33] 看起来杂项少、理论简洁自然。另外,既然规范场可以被统一于引力场之中,那么物质场呢,是否也可以与引力场统一起来?这是爱因斯坦“几何化”统一场论思想。如果能将物质场与引力规范场统一起来,也许我们可以说,从研究基本相互作用的理论物理学角度讲,可能人类研究自然,始于引力,也将终于引力。弦论和M理论对四力统一任务的追求,可以说也是体现了这一观念和范式趋势。

笔者在“规范场论札记(I)” [21] 和本文“规范场论札记(II)”中,把自己过去十多年来思考钻研的心得内容整理出来,这是为了梳理、检核、提升自己的理解,确保有一个确定的明晰思维。这种整理将很多留在脑中多年或因来不及逐个发表、或因当时未写下来的较复杂推导现在能完整记录下来,有助于排除自己在概念和数学推导上的隐晦、未定之处,避免思绪混乱、积重难返。希望本文和本专题内容 [21] 对一般读者拓宽其视野也有所补益。

文章引用

沈建其. 规范场论札记(II):局域电磁对偶变换理论、广义卡鲁扎–克莱因衍生杨–米尔斯规范场理论与高维引力规范场论
Notes on Gauge Field Theories (II): Local Electromagnetic Dual Transformation The-ory, Generalized Kaluza-Klein Emergent Yang-Mills Gauge Field Theory and Higher-Dimensional Gravitational Gauge Field Theory[J]. 现代物理, 2023, 13(05): 134-161. https://doi.org/10.12677/MP.2023.135014

参考文献

  1. 1. Yang, C.N. and Mills, R.L. (1954) Conservation of Isotopic Spin and Isotopic Gauge Invariance. Physical Review, 96, 191-195. https://doi.org/10.1103/PhysRev.96.191

  2. 2. Glashow, S.L. (1961) Partial-Symmetries of Weak Interactions. Nuclear Physics, 22, 579-588. https://doi.org/10.1016/0029-5582(61)90469-2

  3. 3. Weinberg, S. (1967) A Model of Leptons. Physical Review Letters, 19, 1264-1266. https://doi.org/10.1103/PhysRevLett.19.1264

  4. 4. Salam, A. (1968) Weak and Electromagnetic Interactions. In: Svar-tholm, N., Ed., Elementary Particle Physics: Relativistic Groups and Analyticity, 8th Nobel Symposium, Almquvist and Wiksell, Stockholm, 367-377.

  5. 5. Weinberg, S. (1995) The Quantum Theory of Fields (I). Cambridge University Press, Cambridge. https://doi.org/10.1017/CBO9781139644167

  6. 6. Weinberg, S. (1996) The Quantum Theory of Fields (II). Cambridge University Press, Cambridge.

  7. 7. Ryder, L.H. (1996) Quantum Field Theory. 2nd Edition, Cambridge University Press, Cambridge.

  8. 8. Weyl, H. (1950) Space-Time-Matter (Translated from the 4th Edition by Brose, H.L., Methuen, London, 1922). Dover, New York.

  9. 9. 郝刘祥. 外尔的统一场论及其影响[J]. 自然科学史研究, 2004, 23(1): 50-63.

  10. 10. 李华钟. 简单物理系统的整体性: 贝里相位及其他[M]. 上海: 上海科学技术出版社, 1998: 3, 6, 10, 12.

  11. 11. Gao, X.C. (2002) Geometric Phases for Photons in an Optical Fibre and Some Related Predictions. Chinese Physical Letters, 19, 613-616. https://doi.org/10.1088/0256-307X/19/5/302

  12. 12. Lin, Y.J., Compton, R.L., Jiménez-García, K., Porto, J.V. and Spiel-man, I.B. (2009) Synthetic Magnetic Fields for Ultracold Neutral Atoms. Nature, 462, 628-632. https://doi.org/10.1038/nature08609

  13. 13. Lin, Y.-J., Compton, R.L., Jiménez-García, K., Phillips, W.D., Porto, J.V. and Spielman, I.B. (2011) A Synthetic Electric Force Acting on Neutral Atoms. Nature Physics, 7, 531-534. https://doi.org/10.1038/nphys1954

  14. 14. Zhai, H. (2012) Spin-Orbit Coupled Quantum Gases. International Journal of Modern Physics B, 26, Article ID: 1230001. https://doi.org/10.1142/S0217979212300010

  15. 15. Liu, F. and Li, J. (2015) Gauge Field Optics with Anisotropic Media. Physical Review Letters, 114, Article ID: 103902. https://doi.org/10.1103/PhysRevLett.114.103902

  16. 16. Kaluza, T. (1921) Zum Unitätsproblem in der Physik. Sitzungsber Preuss Akad Wiss, Berlin, 966-972.

  17. 17. Klein, O. (1926) Quantentheorie und fünfdimensionale Relativitätstheorie. Zeitschrift für Physik A, 37, 895-906. https://doi.org/10.1007/BF01397481

  18. 18. Overduin, J.M. and Wesson, P.S. (1997) Kaluza-Klein Gravity. Physical Re-ports, 283, 303-378. https://doi.org/10.1016/S0370-1573(96)00046-4

  19. 19. 李新洲. 现代卡卢扎-克莱因理论[J]. 自然杂志, 1985, 8(11): 771-778.

  20. 20. Wikipedia, Kaluza-Klein Theory. https://en.wikipedia.org/wiki/Kaluza-Klein_theory

  21. 21. 沈建其. 规范场论札记(I): 电磁学和量子光学中的人造规范势与卡鲁扎-克莱因理论中的衍生电磁规范场[J]. 现代物理, 2023, 13(4): 85-112.

  22. 22. Jackson, J.D. (1999) Classical Electrodynamics. John Wiley & Sons, New York, Chapter 6, 273-275.

  23. 23. 许冰, 严亮, 刘丽华. 电磁场的复矢量表示[J]. 大学物理, 2007, 26(4): 16-23.

  24. 24. 沈建其. 电磁场的复张量表述[J]. 大学物理, 2009, 28(5): 6-8.

  25. 25. Kuyrukcu, H. (2014) The Non-Abelian Weyl-Yang-Kaluza-Klein Gravity Model. General Relativity and Gravitation, 46, Article No. 1751. https://doi.org/10.1007/s10714-014-1751-x

  26. 26. LIGO Scientific Collaboration and Virgo Collaboration, et al. (2017) Multi-Messenger Observations of a Binary Neutron Star Merger. The Astrophysical Journal Letters, 848, L12.

  27. 27. LIGO Scientific Collaboration and Virgo Collaboration, et al. (2017) Gravitational Waves and Gamma-Rays from a Binary Neutron Star Merger: GW170817 and GRB 170817A. The Astrophysical Journal Letters, 848, L13.

  28. 28. 沈建其. 诸引力理论喧嚣尘上, 中子星合并一扫乾坤[J]. 现代物理知识, 2019, 31(1): 17-32.

  29. 29. 沈建其. 星系暗物质之谜及其研究现状[J]. 现代物理, 2018, 8(4): 162-176.

  30. 30. Shen, J.Q. (2009) Gravitational Gauge Theory De-veloped Based on the Stephenson-Kilmister-Yang Equation. International Journal of Theoretical Physics, 48, 1566-1582. https://doi.org/10.1007/s10773-009-9929-9

  31. 31. Shen, J.Q. (2009) A Gravitational Constant and a Cosmological Con-stant in a Spin-Connection Gravitational Gauge Field Theory. Journal of Physics A: Mathematical & Theoretical, 42, Article ID: 155401. https://doi.org/10.1088/1751-8113/42/15/155401

  32. 32. Shen, J.Q. (2016) A Gravitational Gauge Field Theory Based on Stephenson-Kilmister-Yang Gravitation with Scalar and Spinor Fields as Gravitating Matter Sources. General Relativity and Gravity, 48, Article No. 62. https://doi.org/10.1007/s10714-016-2042-5

  33. 33. Shen, J.Q. (2016) Gravitational Gauge Theory as a Route to Gravi-ty-Gauge Unification. In: Bailey, L., Ed., Gauge Theories and Differential Geometry, Nova Science Publishers, Inc., New York, Chapter 3, 97-178.

  34. 34. Cianfrani, F., Marrocco, A. and Montani, G. (2005) Gauge Theories as a Geometrical Issue of a Kaluza-Klein Framework. International Journal of Modern Physics D, 14, 1195-1231. https://doi.org/10.1142/S0218271805006900

  35. 35. Barbosa, A.L., Guillen, L.C.T. and Pereira, J.G. (2002) Teleparallel Equivalent of Non-Abelian Kaluza-Klein Theory. Physical Review D, 66, Article ID: 064028. https://doi.org/10.1103/PhysRevD.66.064028

  36. 36. Lu, J.-A. and Huang, C.-G. (2013) Kaluza-Klein-Type Models of de Sitter and Poincaré Gauge Theories of Gravity. Classical & Quantum Gravity, 30, Article ID: 145004. https://doi.org/10.1088/0264-9381/30/14/145004

  37. 37. Jalalzadeh, S. and Sepangi, H.R. (2005) Classical and Quantum Dynamics of Confined Test Particles in Brane Gravity. Classical & Quantum Gravity, 22, 2035-2048. https://doi.org/10.1088/0264-9381/22/11/008

  38. 38. 侯伯元, 侯伯宇. 物理学家用微分几何[M]. 第二版. 北京: 科学出版社, 2004: 2, 4.

  39. 39. Ohanian, H.C. and Ruffini, R. (1994) Gravitation and Spacetime. 2nd Edition, W. W. Norton & Company, Inc., New York, Chapter 6.

  40. 40. 瓦尼安, H.C. (Ohanian, H.C.), 鲁菲尼, R. (Ruffini, R.). 引力与时空[M]. 第2版. 向守平, 冯珑珑, 译. 北京: 科学出版社, 2006: 6.

  41. 41. 赵峥, 刘文彪. 广义相对论基础[M]. 北京: 清华大学出版社, 2010: 2.

  42. 42. 沈建其. 电动力学与光学相关专题研究进展[C]//全国高校第十二届《电动力学》教学暨学术研讨会报告文选. 泉州: 福建泉州师范学院, 2009: 13-26.

  43. 43. 沈建其. 电动力学与光学相关专题研究进展[J]. 泉州师范学院学报, 2009, 27(4): 27-32.

  44. 44. 姜志进. 韦耳与规范场理论[C]//全国高校第十二届《电动力学》教学暨学术研讨会报告文选. 泉州: 福建泉州师范学院, 2009: 29-35.

附录:Killing (基林)矢量场与Lie (李)导数理论和方法

在本文正文(第4节“用Killing矢量场摆脱困境”)中,我们已经看到,Killing矢量可以在内外空间让交叉度规分量 ω μ i ( L i ) a b 和规范势 ( L i ) a b 之间建立起联系(即 2 N ),可以让我们从引力理论得到杨–米尔斯规范对称群。本作者在2007年之前证明这样的非阿贝尔卡鲁扎–克莱因理论可以让我们得到杨–米尔斯场强即

2 N ,

其中右边第一项 ( L i ) a b 关于 a , b a , b 反对称,第二项 2 N 也关于时空指标 2 N N = 1 反对称,也就是此项可以化为: ( L 1 ) a b = ( 0 i i 0 ) ( L 1 ) 11 =0, ( L 1 ) 12 =i, 。因此, ( L 1 ) 21 = i , 具有标准的杨–米尔斯规范场张量结构。但是接下来却被“卡住”,本作者当时无法证明系数 ( L 1 ) 22 = 0 如何与规范对称群的结构常数建立联系(也就是不知如何证明这里确实存在一个规范群),直到注意到Kuyrukcu 2014年论文 [25] ,才明白 D μ φ a [ μ δ a b i g ω μ i ( L i ) a b ] φ b 的物理意义是Killing矢量场,这样就可以解决规范群结构常数问题。由于Killing矢量对于我们理解如何从卡鲁扎–克莱因理论中展现出非阿贝尔规范群至关重要,为了让读者进一步理解Killing矢量,下面我们来叙述有关Killing矢量场论的知识 [38] [39] [40] [41] 。

本附录内关于Killing矢量、李导数、等度规变换、矢量平行移动等定义、基本性质、定理和符号体系参考自目前文献 [38] [39] [40] [41] (这些文献与卡鲁扎–克莱因理论无关)。我从实用目的择其精要,并对文献内一些扼要内容 [38] [39] [40] 进行具体展开论证,为读者钻研非阿贝尔型卡鲁扎–克莱因理论提供知识基础。“Lie derivative”在中文材料中已经被翻译为“李导数”;“Killing vector”虽然可以译为“基林矢量”,但是本文仍旧沿用中文文献内一般习惯,将Killing保留其西文称呼。

设我们有两个Killing矢量场 a , b μ ,那么Killing矢量场 D μ φ 1 μ φ 1 i g ω μ 1 ( L 1 ) 11 φ 1 i g ω μ 1 ( L 1 ) 12 φ 2 = μ φ 1 g ω μ φ 2 . 相对于另一个Killing矢量场 ω μ 1 的李导数被定义为 [38]

ω μ ,

其中 D μ φ 2 μ φ 2 i g ω μ 1 ( L 1 ) 21 φ 1 i g ω μ 1 ( L 1 ) 22 φ 2 = μ φ 2 + g ω μ φ 1 . 的计算方法是: φ 1

十分值得强调的是,上面定义虽然用了普通偏导数,看上去不具有明显的时空坐标变换协变性(在广义坐标变换下的不变性),但是实际上在无挠时空下,上面的普通偏导数可以用协变导数代替。这是一个十分重要的结论,它使得我们运用Killing矢量可以得心应手 [38] [39] [40] 。这容易证明:因为Killing矢量 φ 2 φ = ( φ 1 + i φ 2 ) / 2 的协变导数为 φ * = ( φ 1 i φ 2 ) / 2 φ 1 ,故而由两者的对易关系 φ 2 得到的新Killing矢量可以化为 [38] [39] [40]

1 2 ( D μ φ 1 + i D μ φ 2 ) = 1 2 [ ( μ φ 1 g ω μ φ 2 ) + i ( μ φ 2 + g ω μ φ 1 ) ] = μ [ 1 2 ( φ 1 + i φ 2 ) ] + i g ω μ [ 1 2 ( φ 1 + i φ 2 ) ] = ( μ + i g ω μ ) φ = D μ φ .

于是在弯曲时空中,一个Killing矢量场 1 2 ( D μ φ 1 i D μ φ 2 ) = 1 2 [ ( μ φ 1 g ω μ φ 2 ) i ( μ φ 2 + g ω μ φ 1 ) ] = μ [ 1 2 ( φ 1 i φ 2 ) ] i g ω μ [ 1 2 ( φ 1 i φ 2 ) ] = ( μ i g ω μ ) φ * = D μ φ * . 相对于另一个Killing矢量场 D μ φ 1 = 1 2 ( D μ φ + D μ φ * ) 的李导数定义为 D μ φ 2 = 1 2 i ( D μ φ D μ φ * ) 。对于有挠时空下的李导数与Killing矢量,我们当然也可以推广(而且推广有多种可能性),但是本文不予考虑。

下面我们来论证度规张量相对于Killing矢量场 φ 1 的李导数 [39] [40] 。我们考虑 φ 2 的李导数 φ 。可以证明它的李导数为零,且结果为 φ * (这是isometry等距或等度规变换的体现,也可作为Killing矢量的定义) [39] [40] 。所谓等度规变换,是指在时空坐标无限小变换 D μ φ 1 D μ φ 1 + D μ φ 2 D μ φ 2 = 1 2 ( D μ φ + D μ φ * ) ( D μ φ + D μ φ * ) 1 2 ( D μ φ D μ φ * ) ( D μ φ D μ φ * ) = 2 D μ φ * D μ φ . ( φ = ( φ 1 + i φ 2 ) / 2 为无限小参量)下,变换前后的度规相等,即 φ * = ( φ 1 i φ 2 ) / 2 ,这样的等度规变换对矢量 φ 1 = 1 2 ( φ + φ * ) 有一个约束,即它必须满足Killing矢量场方程 φ 2 = 1 2 i ( φ φ * ) [25] 。注意要把等度规变换的不变性即isometry [39] [40] 与“平移不改变四维矢量长度”(parallel transport invariance) [41] 区分开来。后者是指把一个位于 m 2 ( φ 1 φ 1 + φ 2 φ 2 ) = m 2 [ 1 2 ( φ + φ * ) 2 1 2 ( φ φ * ) 2 ] = 2 m 2 φ * φ 点的矢量 φ 1 平移(parallel transport)到附近点 φ 2 ,要求 φ [41] 。此要求度规的协变导数为零即 φ * (此性质称为metricity条件)。

上述度规沿着Killing矢量的无限小变换 D μ φ * D μ φ m 2 φ * φ 也可以用李导数来表述,即此Killing矢量场方程可以化为 l = 1 2 [ D μ φ 1 D μ φ 1 + D μ φ 2 D μ φ 2 m 2 ( φ 1 φ 1 + φ 2 φ 2 ) ] = D μ φ * D μ φ m 2 φ * φ . [39] [40] 。所以,等度规变换(即度规在无限小变换 φ 1 下具有的不变特性 φ 2 [41] )等价于度规沿着Killing矢量场 φ = ( φ 1 + i φ 2 ) / 2 的李导数 φ * = ( φ 1 i φ 2 ) / 2 。这样就建立了李导数、等度规变换以及Killing场之间的关系(进一步推导细节可见有关文献 [39] [40] )。

Killing矢量 φ 1 有一个特性,它与四维守恒动量 φ 2 的内积为常数,即 D μ D μ φ 1 + m 2 φ 1 = 0 。此处定义四维动量 D μ D μ φ 2 + m 2 φ 2 = 0 。读者可以论证出 [39] [40] :

μ ( μ φ 1 g ω μ φ 2 ) g ω μ ( μ φ 2 + g ω μ φ 1 ) + m 2 φ 1 = 0 , μ ( μ φ 2 + g ω μ φ 1 ) + g ω μ ( μ φ 1 g ω μ φ 2 ) + m 2 φ 2 = 0.

读者进一步可以得到

i

其中使用了 μ [ μ ( φ 1 + i φ 2 2 ) + i g ω μ ( φ 1 + i φ 2 2 ) ] + i g ω μ [ μ ( φ 1 + i φ 2 2 ) + i g ω μ ( φ 1 + i φ 2 2 ) ] + m 2 ( φ 1 + i φ 2 2 ) = 0. (Killing矢量定义)和 D μ D μ φ + m 2 φ = 0 ( φ 1 )。故而上面证明了Killing矢量 φ 2 与四维动量 T μ ν = D μ φ 1 D ν φ 1 + D μ φ 2 D ν φ 2 η μ ν l = ( 1 2 ) 2 ( D μ φ + D μ φ * ) ( D ν φ + D ν φ * ) + ( 1 2 i ) 2 ( D μ φ D μ φ * ) ( D ν φ D ν φ * ) = D μ φ D ν φ * + D μ φ * D ν φ η μ ν l . 的内积为常数 [39] [40] 。

李导数与协变导数的关系可以从下面的运算看出:标量 φ 的李导数就是它的普通导数,故

φ *

故而我们有结论 φ 1 。如果李导数 φ 2 也满足莱布尼茨法则 S μ a b φ a D μ φ b φ b D μ φ a ,那么结合前述结论 a , b ,我们就有 a , b 。由于 2 N 是任意张量,那么 μ 。这可以看作Killing矢量的另一个定义。事实上, S μ a b (这是isometry等距变换体现 [39] [40] )。

下面要介绍几个定理 [38] [39] [40] :若 a , b S μ a b 都是Killing矢量,即 S μ 12 S μ 12 φ 1 D μ φ 2 φ 2 D μ φ 1 = 1 2 ( φ + φ * ) 1 2 i ( D μ φ D μ φ * ) 1 2 i ( φ φ * ) 1 2 ( D μ φ + D μ φ * ) = 1 2 i [ ( φ + φ * ) ( D μ φ D μ φ * ) ( φ φ * ) ( D μ φ + D μ φ * ) ] = 1 i ( φ * D μ φ φ D μ φ * ) . (满足isometry等距/等度规条件),则 S μ a b 亦是Killing矢量,即 a , b [38] [39] [40] 。我们先证明 μ ,其中 1 i ( φ * D μ φ φ D μ φ * ) ω μ 以及 μ y x = ζ W z ,于是我们得到一个潜在的Killing矢量 μ y z = ζ W x ,它由 W x H y W y H x μ z x H x + μ z y H y 生成 [38] [39] [40] 。值得再次强调的是,在无挠时空中, μ z y = ζ W x ,即普通导数可以被协变导数替换。这是一个重要性质,它不但表明有关Killing矢量的定义在平直时空和弯曲(但无挠)时空通用,可以形成统一的理解,而且也为计算带来很大方便。那么模仿定义 μ z x = ζ W y ,我们有

( δ μ ¯ ¯ ) H = ζ W × H

μ x x = μ y y = μ z z = μ m

在上面结果内八项中,对于第一、三、五、七项使用Killing矢量的定义(如 μ ¯ ¯ = μ m I 3 × 3 + δ μ ¯ ¯ × ( μ m H ) + i ω η m ξ A × ( ε m E ) = i ω n m ε m E , × ( ε m E ) i ω η m 1 ζ W × ( μ m H ) = + i ω n m μ m H . 等),那么它们的和为

n m = μ m ε m

于是 η m = μ m / ε m 。利用黎曼曲率张量定义: i × ( i μ m H ) ω η m ξ A × ( ε m E ) = ω n m ( ε m E ) , × ( ε m E ) ω η m 1 ζ W × ( i μ m H ) = ω n m ( i μ m H ) . ,我们就有结果

× ( ε m E ± i μ m H ) ω η m 1 ζ W × ( i μ m H ) ω η m ξ A × ( ε m E ) = ± ω n m ( ε m E ± i μ m H ) .

η m 1 ζ W = η m ξ A

下面会证明 ( ω η m ξ A ) × ( ε m E ± i μ m H ) = ± ω n m ( ε m E ± i μ m H ) (暂时我们设它成立),于是

( ω η m ξ A ) × [ ( ω η m ξ A ) × ( ε m E ± i μ m H ) ] = ω 2 n m 2 ( ε m E ± i μ m H ) . .

利用 ε x z = ξ A y (这是isometry等距变换体现) [39] [40] 和 ε z x = ξ A y ε x y = ξ A z ε y x = ξ A z 等于

ε y z = ξ A x

使用前面已经论证得到的 ε z y = ξ A x ,读者就可以得到

ε z x * = ε x z

利用 ε z x * = ε x z ε z x = ε x z ,于是我们有 ε z x 。当然,现在 ε x z 内仅剩余 ξ ,我们需要证明它为零。将 ξ = i 进一步化为

( i ω η m A ) × [ ( i ω η m A ) × ( ε m E ± i μ m H ) ] = ω 2 n m 2 ( ε m E ± i μ m H )

因为 ε ¯ ¯ 关于 ε ¯ ¯ = ( ε m i A z i A y i A z ε m i A x i A y i A x ε m ) = ε m ( 1 i A z / ε m i A y / ε m i A z / ε m 1 i A x / ε m i A y / ε m i A x / ε m 1 ) 反对称,而 η m 1 ζ W = η m ξ A 关于 ζ = ξ = i 对称,所以我们有重要结论: η m 1 ζ W = η m ξ A ,即由 W / μ m = A / ε m 生成的矢量 μ ¯ ¯ 确实是Killing矢量 [39] [40] ,或者说, μ ¯ ¯ = ( μ m i W z i W y i W z μ m i W x i W y i W x μ m ) = μ m ( 1 i W z / μ m i W y / μ m i W z / μ m 1 i W x / μ m i W y / μ m i W x / μ m 1 ) = μ m ( 1 i A z / ε m i A y / ε m i A z / ε m 1 i A x / ε m i A y / ε m i A x / ε m 1 ) . 是Killing矢量(场)。两个Killing矢量之和仍旧是Killing矢量,如 ( i ω η m A ) × [ ( i ω η m A ) × ( ε m E ± i μ m H ) ] ε m l k D l ( ε k i j D i F j ) ,那么 ε m l k D l ( ε k i j D i F j ) = ε m l k ε k i j D l D i F j = ( δ m i δ l j δ m j δ i l ) D l D i F j = D j D m F j D i D i F m . ,也即 g μ ν 也是Killing矢量 [39] [40] 。

设我们有由 g μ ν A μ A ν γ μ ……等Killing矢量场构成的一个集合,其中任意两个矢量场的对易可以得到第三个Killing矢量场 [38] ,该Killing矢量场也位于该集合,而任意一个Killing矢量也可以写为若干Killing矢量之和,如此说来,我们有如下关系 [38] [39] [40] :

g μ ν = ( γ μ γ ν + γ ν γ μ ) / 2 .

这样的Killing矢量场全体构成一个完备的集合 [38] 。在一个 γ μ 维时空内, γ p 这样的分量方程一共有 γ μ = γ p e p μ 个,独立的 e p μ 函数有 g μ ν = e p μ e p ν 个,故而一个 e p μ 维时空可以有 g μ ν = ( γ μ γ ν + γ ν γ μ ) / 2 个Killing矢量 [38] [39] [40] 。

关于Killing矢量的其它性质,借助定义 g μ ν = e p μ e p ν 以及 e 5 μ A μ (采用了 g ˜ μ ν = ( g ˜ μ ν g ˜ μ 5 g ˜ 5 ν g ˜ 55 ) = ( g μ ν + ϕ 2 A μ A ν ϕ 2 A μ ϕ 2 A ν ϕ 2 ) 循环),利用Ricci恒等式 A μ ,Killing矢量满足这样一个关系式 μ = 0 , 1 , 2 , 3 [38] 。由此计算得到 g ˜ μ 5 ϕ ,进一步得到 g ˜ μ ν [38] 。这说明,在无物质的时空内即 g ˜ ν λ = ( g ˜ ν λ g ˜ ν 5 g ˜ 5 λ g ˜ 55 ) = ( g ν λ A ν A λ g σ τ A σ A τ + 1 / ϕ 2 ) ,Killing矢量满足零质量的波动方程 g ˜ μ ν ;在有物质分布区域, g ˜ ν λ 可以看作Killing矢量场的“等效质量”项。

在Killing矢量运算过程中需要李导数。李导数满足莱布尼茨法则: g ˜ μ ν g ˜ ν λ = ( g μ ν + ϕ 2 A μ A ν ϕ 2 A μ ϕ 2 A ν ϕ 2 ) ( g ν λ A ν A λ g σ τ A σ A τ + 1 / ϕ 2 ) = ( ( g μ ν + ϕ 2 A μ A ν ) g ν λ + ϕ 2 A μ ( A λ ) ( g μ ν + ϕ 2 A μ A ν ) ( A ν ) + ϕ 2 A μ ( g σ τ A σ A τ + 1 / ϕ 2 ) ϕ 2 A ν g ν λ + ϕ 2 ( A λ ) ϕ 2 A ν ( A ν ) + ϕ 2 ( g σ τ A σ A τ + 1 / ϕ 2 ) ) = ( δ μ λ 0 0 1 ) . 。此可以用证法一:借助 ϕ 2 ϕ 2 Γ ˜ λ , μ ν = 1 2 ( ν g ˜ λ μ + μ g ˜ ν λ λ g ˜ μ ν ) ,可以证明前面式子左右两边相等;也可以用证法二:设 Γ ˜ λ , μ 5 5 g ˜ λ μ = 0 ,于是 Γ ˜ λ , μ 5 。我们定义 Γ ˜ λ , μ 5 = 1 2 ( 5 g ˜ λ μ + μ g ˜ 5 λ λ g ˜ μ 5 ) 1 2 ( μ g ˜ 5 λ λ g ˜ μ 5 ) = 1 2 [ μ ( ϕ 2 A λ ) λ ( ϕ 2 A μ ) ] = ϕ 2 2 ( μ A λ λ A μ ) + 1 2 ( A λ μ ϕ 2 A μ λ ϕ 2 ) . ,计算 Γ ˜ λ , μ 5 以及

μ A λ λ A μ

接下来我们要证明 R = g β ν ( ν Γ μ β μ + μ Γ μ β ν + Γ σ β ν Γ μ σ μ Γ σ μ β Γ μ σ ν ) 成立,即:

ν Γ μ β μ + μ Γ μ β ν + Γ σ β ν Γ μ σ μ

这样,我们就有结论: R g β ν Γ σ μ β Γ μ σ ν g 55 g σ ν g μ λ Γ ν , μ 5 Γ λ , σ 5 R ˜ 2 κ 1 2 κ g 55 g σ ν g μ λ Γ ˜ ν , μ 5 Γ ˜ λ , σ 5 1 2 κ ( ϕ 2 2 ) 2 g 55 g σ ν g μ λ ( μ A ν ν A μ ) ( σ A λ λ A σ ) = 1 2 κ ( ϕ 2 2 ) 2 g 55 g σ ν g μ λ f μ ν f σ λ = 1 2 κ ( ϕ 2 2 ) 2 g 55 f μ ν f μ ν , 。后者可以化为 f μ ν = μ A ν ν A μ 或者 Γ ˜ ν , μ 5 1 2 κ ( ϕ 2 2 ) 2 g 55 = 1 4 (使用了 R 2 κ )。结合前面的结论 1 4 f μ ν f μ ν ,于是我们就有 f μ ν = μ A ν ν A μ ,此为李导数所满足的莱布尼茨法则。

期刊菜单