Modern Physics
Vol.08 No.04(2018), Article ID:26077,28
pages
10.12677/MP.2018.84024
A Review of Historical and Physical Significance of Klein’s Vectorial Gauge Theory and Electromagnetic-Nuclear Force Unification Model
Jianqi Shen
College of Optical Science and Engineering,
Received: Jul. 3rd, 2018; accepted: Jul. 17th, 2018; published: Jul. 25th, 2018
ABSTRACT
Swedish physicist Oskar Klein (1894-1977) suggested a vectorial gauge theory and a unified model of electromagnetic and nuclear forces in a conference of physics held in
Keywords:Klein Vectorial Gauge Theory, Electromagnetic-Nuclear Interaction Unification, Yang-Mills Gauge Theory, Electroweak Unification Model
克莱因矢量规范理论与电磁力-核力统一模型之历史与物理学意义述评
沈建其
浙江大学玉泉光电学院,浙江 杭州
收稿日期:2018年7月3日;录用日期:2018年7月17日;发布日期:2018年7月25日
摘 要
本文回顾了瑞典物理学家奥斯卡·克莱因(1894~1977)在1938年波兰华沙会议上发表的一个矢量规范理论和电磁力-核力统一模型雏形,证明了克莱因的矢量规范理论其实在数学上正是一个标准的杨-米尔斯规范理论,商榷与纠偏现在不少物理学家和科学史家所认为的克莱因理论仅仅是“有点像杨-米尔斯规范理论,但实际其实不是”等不妥当观点。尽管克莱因在当年并没有主动用到物理学中的规范对称性观念和数学中的群论工具(这些是分别在1953和1954年由泡利和杨-米尔斯提出的),但是克莱因已经用到协变导数、让中微子与电子构成同位旋二重态且要求同位旋守恒,这些关键构件使得他自动地被引导到SU(2)非阿贝尔规范理论建构道路上去。因此,正是克莱因第一个得到了正确的非阿贝尔(非交换)规范理论数学形式,比泡利和杨-米尔斯早十五六年,但克莱因的这一工作一直被后人曲解和否定。克莱因被剥夺了该领域应有的荣誉,在文献中他被当作是杨-米尔斯非阿贝尔规范理论(1954年)前奏史中失败了的“反面”陪衬例子来对待。受此连累,即使他的电磁力-核力统一模型已经包含了后来的弱电统一模型基本构件和框架(除了无希格斯机制),却也被后人忽视。故本文意图纠偏这种认识。
关键词 :克莱因矢量规范理论,电磁力-核力统一模型,杨-米尔斯规范场,弱电统一模型
Copyright © 2018 by author and Hans Publishers Inc.
This work is licensed under the Creative Commons Attribution International License (CC BY).
http://creativecommons.org/licenses/by/4.0/
1. 引言
理论物理学的终极目标之一是追求基本相互作用和基本粒子的统一。至今为止,物理学已经经历了六次统一,包括牛顿力学将天上-人间的规律的统一,麦克斯韦电动力学将光、电、磁的统一,热力学与统计物理的热-功统一以及必然性与概率性的统一,狭义与广义相对论将时间与空间、物质与能量、引力与几何的统一,量子力学对宏观与微观的统一,格拉肖-温伯格-萨拉姆对电磁相互作用与弱相互作用的统一。此外,1970年代之后对强、弱、电相互作用的统一(大统一理论)以及产生了所谓“万物的理论”(超弦理论),这些虽还缺乏直接的实验证明,但也属于必然的研究方向。在过去几百年,引力理论和规范理论一直互有反哺,在否定之否定的基础上波浪式前进。牛顿引力理论(1687)对电磁学的库伦-高斯定律和安培环路定律有借鉴意义,最终形成了经典电动力学(1865),在此基础上诞生了狭义相对论(1905),继而发展为广义相对论(1915),这是一个全新的引力理论。广义相对论的广义坐标变换被魏尔(Weyl)在1910年代推广至新的标度变换,重新解释了电磁相互作用的起源,虽然不怎么成功,但在量子力学(1926)建立之后,魏尔等人重新将标度变换解释为相位变换(现在称为规范变换),促使电磁规范理论(1929)的发现。五维的广义相对论引力理论(1919)也衍生出电磁力,把电磁力看作是第五维度引发的引力,这开辟了用高维引力场去统一电磁场的观念先河,对后来的几十年理论物理学的发展影响很大。高维空间引力虽然抽象,也被一些人看作是空中楼阁,但其实从理论物理学角度来看,它是最自然、最经济的做法,通过一个最简单的假设(引入额外空间隐藏的维度,但不必伤筋动骨改变原先的方程形式),却可以解决一大堆理论物理疑难,这好似一个无本生意;即使为回答现实空间为何是三维的这个问题,亦要研究高维后才能来回答。电磁理论是阿贝尔(可交换)规范对称理论。后来,具有阿贝尔规范群对称性的电磁理论又发展为非阿贝尔(非交换)规范理论(1938, 1953~1954),这其实相当于在“内空间”中增加了维度(这些新维度,现在被解释为弱相互作用中的味荷和强相互作用的色荷)。反过来再来看广义相对论引力理论,就会觉得该理论不够规范彻底,于是又要求将广义相对论引力理论也改造为非阿贝尔规范对称理论,即引力规范理论。以引力为基底,可以建立引力-规范统一理论,把强、弱、电规范场看作是高维引力规范场在四维时空内的体现。可以说,人类研究自然,曾始于引力,也将终于引力,四力一统,希翼“江山”永固。这也许是二十世纪统一场论的基本思潮。本文将挂一漏万综述当时这种思潮,且以克莱因矢量规范理论为基本例子和观点依托,评述这种思潮产生的背景、内涵及其意义或影响。本文侧重点之一在于围绕克莱因矢量规范理论和电磁力-核力统一模型,说明克莱因的矢量规范理论其实在数学上正是后来(1950年代)的杨-米尔斯规范理论,克莱因的电磁力-核力统一模型也是后来(1960年代)格拉肖-温伯格-萨拉姆弱电(弱力-电磁力)统一理论的雏形。
在近代物理学史中,科学史家已经广泛研究了很多重要的著名物理学家和次重要的著名物理学家。本文研究的是一位次重要的非著名物理学家。在非著名物理学家名单当中,本作者认为当首推瑞典物理学家奥斯卡·克莱因(Oskar Klein, 1894~1977),原因有二:他发现了很多近代物理学中的十分关键重要的概念、方程和定律,但因为各种各样不幸的“擦边球”效应,他不幸变得次重要了;他在1938年所提出的矢量规范理论和电磁力-核力统一场论模型,本可以使得他成为近代物理学巨擘,但因为过早地发表在非著名会议期刊而被忽视,即使再次被关注却仍然被世人误解。本文意在还原克莱因该理论真面目,纠正世人对其的误解和偏见。
在1954年,物理学家杨振宁(Yang)与米尔斯(Mills)提出局域SU(2)群非阿贝尔规范对称理论 [1],该理论(及其自然推广)后来成为描述弱力与强力的基本框架。1960年代格拉肖(Glashow)、温伯格(Weinberg)、萨拉姆(Salam) [以及稍早期薛文格(Schwinger)不完整的探索]在杨-米尔斯规范理论框架下提出了SU(2) × U(1)弱电统一模型(该模型与SU(3)量子色动力学一起构成粒子物理学标准模型) [2] [3] [4]。但本文将要指出,杨与米尔斯并非是最早提出该规范场理论数学形式的人。其实早在1938年瑞典物理学家奥斯卡·克莱因在波兰华沙一次会议上已经提出了与该两类理论(杨-米尔斯规范理论和弱电统一模型)相当的关于基本力统一的一个理论 [5] [6] [7]。除了矢量规范场的作用量内的一个系数的失误,克莱因的该理论其实就是一个标准的杨-米尔斯规范理论;克莱因的该理论也已经接近20多年后由薛文格、格拉肖提出的SU(2) × U(1)弱力模型 [2]。温伯格 [3] 、萨拉姆 [4] 在1967~1968年把希格斯对称破缺机制(1964年) [8] [9] [10] 放入进了格拉肖SU(2) × U(1)模型,才最终建立了弱电统一模型(该模型的主要提出者格拉肖、温伯格、萨拉姆三人在1979年获得诺贝尔物理学奖)。可以说,克莱因1938年理论 [5] [6] [7] 唯独缺了希格斯机制,他本人几乎已经是一统近代物理学的巨擘,后来的人只是断断续续地重复了他的发现。但很遗憾的是,无论是近代物理学术还是学史,对克莱因的评价大为偏低甚至颠倒性忽视,例如在学术文献中,几乎根本不提他1938年的工作;在物理学史文献中,他的这个工作被当作规范理论研究史中的一个失败的“反面”例子而被宣传,或者以注脚或配角的身份作为规范理论前奏史中的一部分。我们认为,这种偏低评价完全不符合真实历史事实。本文作者在十多年前注意到这个现象,但近来看到若干文献 [11] - [16],发现这些文献对克莱因1938年理论仍旧有诸多误解或曲解,故而认为有必要替克莱因理论解释若干,澄清世人对他的误解。
本文的主要观点如下:对于非阿贝尔(非交换)矢量规范场论(主要是指正确的非线性结构),克莱因 [5] [6] [7] 比杨振宁与米尔斯 [1] 早16年已经提出,但后世学者对克莱因这一工作多有曲解,这对克莱因十分不公正。因此我们认为现在该理论即使被称呼为克莱因-杨-米尔斯理论也不为过(但实际上现在一直称呼为杨-米尔斯理论)。尽管理论物理学家们或多或少都知道克莱因在1938年确实触及了非阿贝尔(非交换)矢量规范理论,但主观上都认为他的理论根本不是后来的杨-米尔斯矢量规范理论(如对于克莱因1938年的场论,一般人都用了“有点像”、“有点接近,但不是杨-米尔斯规范理论”这样的评价) [11] - [16]。本文从数学上证明,这是一个误解,克莱因该理论其实在数学关系上就是一个标准的杨-米尔斯非阿贝尔规范理论,甚至可以说,杨与米尔斯的工作(1954)相当于从另一角度(强调规范对称性)重新发现了该理论,而真正的首次提出者应当是克莱因(1938),因为该矢量规范理论重要的构件如规范对称群(如克莱因的中微子-电子同位旋二重态的矩阵表述)、正确的(非交换)规范场强及协变导数等在克莱因场论中都已有,其在数学结构上就是一个精确的非阿贝尔规范理论。值得一提的是,最重要的构件即“折磨”杨六七年(1947~1954)才推导得到的“非阿贝尔规范场强” [16] 在克莱因(1938)场论中 [5] [6] [7],却是一个轻松自然的结果。
本文框架如下:先介绍克莱因生平事迹和他的一般物理学研究成就,再介绍发表克莱因规范理论和统一场论的1938年波兰华沙物理学会议召开情形。由于此次会议在一般文献内都语焉不详,故而本文内作了比较具体的论述,包括与会者对克莱因理论的反响。这也有助于读者了解那个年代物理学家关注的重点问题;之后再介绍克莱因的矢量规范理论,证明了其与后来的杨-米尔斯理论在数学上的精确一致性,同时再说明克莱因在此基础上建立的电磁力-核力统一模型具有后来弱电统一模型的雏形特点;论述了后人对克莱因1938年理论的评价,指出这些评价有诸多对克莱因理论的误解之处;最后对克莱因的悲剧进行总结、反思。
本文所涉人物比较多。对于较知名人物或文内多次出现的人物,在一般情况下,其首次出场时用中文译名,必要时标注其英文名,再次出场时用其中文译名;对于非知名人物或文内偶尔出现的人物,用其英文名交代。
2. 克莱因生平及克莱因理论产生的时代背景
奥斯卡·本杰明·克莱因(Oskar Benjamin Klein),系瑞典理论物理学家,生于1894年9月15日,卒于1977年2月5日。克莱因其名在文献中用的是Oskar,也有用Oscar的,这可能是该词在瑞典语与英语中的区别。克莱因父亲生于斯洛伐克,后去瑞典求学。克莱因出生在斯德哥尔摩郊外小镇,先在瑞典受教育。在1914年他父亲去世后,克莱因去法国求学,在路上遇一战爆发,他被招募入军队,在1915~1916年回国服兵役。自1917年起,他受教于丹麦哥本哈根大学量子力学创立者之一的尼尔斯·玻尔,后来在1921年取得斯德哥尔摩学院(现在的斯德哥尔摩大学)的博士学位。在1923年他离开丹麦,在美国密歇根大学接受教职。克莱因在1925年返回哥本哈根,与艾伦菲斯特一起工作了一段时间,在1926年任职于瑞典隆德大学,1930年任职于斯德哥尔摩学院。克莱因获得1959年马克斯·普朗克奖章,于1962年退休。除了本文将要介绍的1938年理论(包括矢量规范理论和电磁-核力统一场论模型)外,克莱因的重要工作有很多(多已经写进当前的物理学教科书),如相对论标量场的克莱因-戈登(Klein-Gordon)方程(1926)、克莱因佯谬(与势垒处正反粒子产生有关的效应,也称为克莱因隧穿效应)、引力与电磁力统一的(卡鲁扎-克莱因) Kaluza-Klein理论(1926)、Jordan-Klein二次量子化方案(1927)、克莱因-仁科公式(Klein-Nishina formula,量子电动力学低能电子-光子散射截面公式,1929) [17]。有趣的是,在1926年克莱因甚至独立地发现了量子力学薛定谔方程(非相对论波动方程),但因为生病延误了发表 [17]。我们知道薛定谔在获得他的薛定谔方程之前曾经得到过标量场的相对论波动方程(现在被称呼为克莱因-戈登方程)。薛定谔发表了前者,没有发表后者,而克莱因刚好翻过来。值得一提的是克莱因在1926年能提出Klein-Gordon方程和薛定谔方程,其实也并不稀奇。他在1926年提出了类似于卡鲁扎的基于五维时空的引力-电磁力统一理论(现在被称呼为Kaluza-Klein理论),里面就产生了一个由第五维度的度规产生的标量场。据称,克莱因当时认为该五维理论就是一个统一了一切的理论,因为引力、电磁力以及量子力学波函数(即该标量场)都有了。当然,引力与电磁力的“统一企图”在后来被抛弃,因为电磁力要首先与弱衰变力统一起来(弱电统一理论 [2] [3] [4] ),但是其推广的版本(如非阿贝尔Kaluza-Klein理论以及类似高维引力统一理论又在弦论中复活)。可以说,克莱因前半生一直在与统一场论打交道。本文所要推介的他的1938年理论,也是一个统一场论。
发表克莱因矢量规范理论和电磁力-核力统一场论模型工作的会议是召开于1938年5月30日至6月3日的波兰华沙会议,会议主题是物理学新理论 [5]。在介绍克莱因的工作之前,有必要介绍此次著名但鲜有具体记载的会议召开情形。我们知道,1939年9月1日德国希特勒以“闪电战”几乎一天之内就占领波兰主要领土。这次会议是在1938年召开的,因为有这个即将到来的气氛存在,参加本次会议的没有一位是德国人。此次波兰会议的参加者中有很多当时欧洲的翘楚(著名物理学家),包括今天我们耳熟能详的如下一批人:N. Bohr,L. Brillouin,L. de Broglie,C. Darwin,A. Eddington,R. Fowler,G. Gamow,S. Goudsmit,Oscar Klein,H. Kramers,L. de Kronig,P. Langevin,C. Moeller,J. von Neumann,F. Perrin,L. Rosenfeld,and E. Wigner [11]。为了便于会议学术讨论,与会者围坐在一张大圆桌周围。会议共有九个报告,由研究生和博士后作了会议讨论记录,次年在巴黎出版的会议论文集内记录了每个报告结束后的问答环节中所提的问题。格罗斯(Gross)在综述此次波兰会议论文集时发现,报告提问环节所讨论的内容比报告本身有趣多了 [11]。德高望重的玻尔作了开场报告,之后由冯·诺伊曼做第二个报告。他们都讨论了对量子力学的解释。玻尔的报告题目是《原子物理学中的因果性问题》,冯·诺伊曼介绍了他的两项研究,其一是证明量子力学不存在隐变量解释(正如现在我们知道,他的证明有错,他的证明后来被波姆和贝尔推翻),其二是他与数学家伯克霍夫研究的如何改变通常的逻辑来理解量子力学,譬如用希尔伯特空间内的代数逻辑代替基于布尔代数的逻辑。根据格罗斯的说法 [11],冯·诺伊曼的这一做法没有错,但是当时在会议上受到玻尔的强烈反对。玻尔和冯·诺伊曼报告结束后,现场有关于逻辑的讨论。根据会议规则,只有会议的受邀请人才有资格讨论,一般年轻的听众,尤其是那些站着的柱子,是没有资格张口的,但是一位来自巴黎的叫Destouches的绅士先生被允许讲话,而且实际上在每个报告(除了克莱因的报告)结束后,他都讲得很长 [11]。这位绅士先生是法国德布罗意的门徒,可能是一位“民科”(江湖物理学家),他在法国也有某些显赫的(经济)地位。第三个报告是德布罗意的,但是德布罗意本尊未到,所以他的论文由E. Bauer宣读,并由这位绅士先生Destouches补充。德布罗意的论文题目是《量子理论和相对论之间的连接环节》,他讨论了调和量子力学与相对论之间的一些困难。这位绅士先生Destouches又将这些困难放大了,并不厌其烦地讲述由他发明的一个带点魔幻色彩的相对论粒子动力学,其中每个粒子都有自己的时间。他们的报告自然激起了一片批评之声。第四个报告是克莱因的,正是我们本文下面需要分析的内容。不过克莱因的报告结束后,除了穆勒(Moeller)提问外,没人吱声。下面也会指出,穆勒提了一个对克莱因很有帮助的好问题,虽然这个问题是张冠李戴的,但也告诉我们,有时由错误的问题也可以得到正确的答案。第五个报告是德国海森堡的。由于政治原因,海森堡本尊也没有来,所以他的报告是由Kramers代读的。海森堡提出了那个时代重要的两个现实物理问题(量子场论紫外发散消去问题和宇宙射线观察问题)。伽莫夫也在现场,他做了有关宇宙射线的简短说明。第六个报告是布里渊的,他做了关于基本粒子的报告。格罗斯认为,除了克莱因的报告,该报告是那次会议中最引人入深、饶有趣味的。布里渊报告结束后,也激起了很多讨论。第七个报告是爱丁顿的。根据不少文献记载,爱丁顿是很狂傲的,他曾在某次会议上当众撕掉钱德拉萨卡的白矮星论文;野史记载,当有记者告诉爱丁顿全世界只有三个科学家理解相对论时,爱丁顿说:“我不知道第三人是谁?”爱丁顿曾在一战后负责了爱因斯坦广义相对论中预言的星光偏折实验观察,促进了相对论的传播。不过,在这次波兰会议上,爱丁顿扮演了一个“江湖物理学家”角色。他提出了一个万物的理论,题目叫作《量子理论的宇宙学应用》,他声称他可以确定出电磁精细结构常数、宇宙半径、宇宙内所有粒子总数、以及所有基本粒子之间的质量关系。他用圆周率的79次方以及2的256次方建立了与电磁精细结构常数的关系,还预测出宇宙半径为1.23410的27次方厘米。当然,爱丁顿的理论也激起了与会听众的很长时间的讨论。听众中的不少人都等着伏击他,很多物理学家走上前来礼貌地否定他的理论。对于听众而言,爱丁顿的报告以及之后的激烈讨论是本次会议最精彩的一个环节 [11],带来了欢快的气氛。第八个报告是宇宙学家米尔恩的。米尔恩本人未到,所以他的报告由达尔文宣读(这个达尔文是提出进化论的达尔文的孙子)。米尔恩的报告甚至比爱丁顿的报告还要疯狂,因为他用基于马赫原理的绝对时间观,放弃能量和动量守恒律,最后推导出了库伦定律和玻尔轨道半径等。当达尔文辛苦地读完了米尔恩的论文后说:“我终于读完米尔恩先生的论文,但是我也不同意其中的结论和某些假设。”由于米尔恩本人不在,所以该报告没有引起讨论。最后一个报告是法国朗之万的,他的报告题目是《关于物理哲学中的实证主义和现实主义倾向》。该文不是关于物理的,而是关于哲学的,对于物理学家来说,很难看懂。会议结束后,会议主席致了辞 [5] [11]。以上是1938年波兰会议的主要情形。可以说,有一半报告并没有引起与会听众的共鸣,甚至还引致批评和反对。
1938年会议论文于1939年在巴黎结集出版 [5]。克莱因在1955年应邀参加Berne Congress (伯尔尼研讨会),他回顾了他的工作。伯尔尼研讨会论文集(Proceedings of the Berne Congress)发表在期刊Helvetica Physica Acta上(O. Klein, Helv. Phys. Acta, Suppl 4, 58, 1956)。正如我们现在所知,无论是1938年波兰华沙会议论文集 [5] 以及Helvetica Physica Acta工作,在当时都没有得到多少反响。在克莱因去世后,他的1938年波兰会议论文作为历史资料(而非学术资料)又被重印了几次,如在1986年的Surveys in High Energy Physics中,出版社将1939年在巴黎出版的该论文刊出 [6];在1991年由奥斯卡·克莱因纪念讲座出版文集,内收录了该论文 [7]。上面已经指出,克莱因各种贡献很多,虽然他未获得诺贝尔奖,但是为其开办纪念讲座,实至名归。奥斯卡·克莱因纪念讲座肇始于1988年,由斯德哥尔摩大学与瑞典皇家科学院诺贝尔委员会发起,每年由一位获得奥斯卡·克莱因奖章的物理学家主持召开。虽然克莱因的1938年论文在1986年被再版,但是本人认为这类再版其实是作为历史的纪念,而非承认其学术上的贡献(此时杨-米尔斯规范理论和温伯格等人的弱电统一模型理论 [2] [3] [4] 的探索和确认工作已经完结,研究高潮也早已落幕)。本人的理由是:不少近来文献仍旧认定克莱因1938年理论“包含了近似的规范场论非线性项”、“有点像非阿贝尔规范理论但其实不是” [11] - [16]。这些都是属于对克莱因的曲解观点。只有澄清误解,才算是真正认真看待克莱因当年该工作的开始。
克莱因1938年的理论其实是作为一个统一场论提出的。爱因斯坦、魏尔、卡鲁扎等在1920年前后掀起以统一引力与电磁力为目标的统一场论风暴,其余波在之后几十年一直未息。克莱因该文有17页 [5] [6] [7],按照现在的眼光看,他的论文可以拆分为三个小主题:引力与广义的电磁力(即包括了核力)在五维时空内的统一;SU(2)矢量规范理论;电磁力与核力的统一。克莱因的矢量规范理论和电磁力-核力统一模型是挂在五维时空广义相对论中的。五维广义相对论是他的理论的寄主。在本文内我们不评价该寄主问题,仅仅讨论其矢量规范理论和电磁力-核力统一模型 [5] [6] [7] [11] [12] [13]。由于质子、中子、电子都是费米子,克莱因在其论文内,利用五维时空场论,讨论了引力场内的狄拉克旋量场的作用量密度和场方程,协变导数中同时出现了SU(2)矢量规范场和自旋仿射联络 [5] [6] [7]。这些内容其数学形式即使在今天也是正确的,但不是我们本文内要讨论的内容。
本文还需要指出克莱因文内一些物理学术语意义在当年与今天的区别。在克莱因发表该论文的年代,粒子物理学尚处于幼年(或上升)时期,核子之间的强力以及弱衰变力之间的关系也许不是那么明朗的,有时甚至是混淆在一起的、不作区分的。当时关于弱衰变力理论是费米(Fermi) 1934年提出的四费米子相互作用理论;当时关于核子之间的强相互作用理论是汤川秀树(Yukawa) 1935年提出的介子理论。当然,现在我们知道,费米和汤川的理论分别是现在的弱电统一理论和量子色动力学的低能近似理论。克莱因1938年理论就是要将电磁力与以上相互作用作一个统一描述。在汤川介子理论(核力理论,也即强相互作用理论)中,质子与中子构成了同位旋二重态。克莱因也采取了这一做法。但克莱因的创新是将中微子和电子也看作一个新的同位旋二重态。那么这样的理论就可以解释自由中子衰变(衰变为质子、电子和电子型反中微子)。所以,克莱因1938年理论 [5] [6] [7] 中的统一场论其实是对电磁力与弱衰变力的统一。他所引入的广义“电磁场”即他所谓的 场(此也即后来温伯格等人弱电统一理论 [2] [3] [4] 中的中间玻色子 )正是传递质子和中子之间、中微子和电子之间弱相互作用的规范粒子。克莱因在论文中明确提到 场是用来解释贝塔衰变过程的。这说明克莱因明确知道他的理论可以用到弱相互作用中的。但克莱因的意图并不仅于此。克莱因在该文前言中首先引用了四篇汤川秀树在1935~1938年发表在日本数学物理学会期刊上的论文,用较多笔墨讨论汤川的核力理论中的可能不足之处;之后克莱因讨论五维引力及电磁力和引力的统一。克莱因该文没有提到费米的弱相互作用理论。所以,克莱因该文目的总的说来是想把核子间(核力场)的所有相互作用和电磁力在引力框架中统一起来。质子和中子是核子。虽然中微子和电子不是核子,但我们还是把他的该模型称为电磁力-核力统一模型,尽管今天的核力在意义上其实主要是指原子核内的强相互作用,而非弱作用。就内容本质而言,称呼克莱因的模型为电磁力-弱力统一模型更恰当(上面提到,克莱因明确知道他的理论可以用到弱相互作用即贝塔衰变中的),但克莱因论文并没有提到费米弱作用理论,从论文一开始看,他的落脚点与受启发点更多地落在汤川的SU(2)标量介子核力理论(顺便一说,16年后的杨-米尔斯理论开篇第一段也是讨论核子-核子之间吐纳介子的核力现象)。也因为电磁力-弱力统一模型这个名称如今已经被用在了格拉肖、温伯格、萨拉姆等人于1960年代建立的弱电统一模型 [2] [3] [4] 中了,故对克莱因模型,本文不用“电磁力-弱力统一模型”这个名称。对于这些名词在历史上(如克莱因论文)和今天的区别,请读者先有所领会,以避免误解。
3. 克莱因矢量规范理论与电磁力-核力统一场论要义及述评
下面我们简要叙述克莱因该规范理论中的矢量场部分的作用量密度 与规范场强 、 、 ,然后再与杨-米尔斯矢量场理论作比较,看看它们在数学上是否精确等价。下面的数学比对已经在文献 [18] 发表。为了评述方便,下面进一步指出这些数学关系。克莱因的矢量规范理论表述如下 [5] [6] [7] [11] [12] [13] :
(1)
克莱因的表达式(规范场张量) 、 和 出现在文献 [6] 的(30)与(31)式,拉格朗日密度 出现在他的(32)式 [6]。在克莱因文内,时空脚标用的都是拉丁字母。我们为了与现在的习惯一致,将这些时空脚标改为了希腊字母。在上面公式(1)中, 、 和 是由克莱因引入的SU(2)规范对称性需要的三种矢量场(不过克莱因没有指明SU(2)群。但在解释克莱因的中微子-电子二态列矩阵的规范理论时,克莱因需要引入 和 )。克莱因把 解释为电磁势,耦合系数 是电荷(当然,在如今的弱电统一理论中,这里的 是弱味荷。弱味荷和U(1)弱超荷的组合,才是电荷。克莱因在1938年波兰华沙会议报告后,在缪勒提问启发下,他提到需要添加一个U(1)规范场 [5] [11]。这样克莱因的模型就与后来的弱电统一模型更加接近了); 和 的引入乃是为了解释弱力(电子与中微子之间的相互作用)。很明显,克莱因该理论是对电磁理论的推广,推广到弱同位旋二重态(克莱因在文内研究了“电子与中微子构成该二重态,让 和 场来中介”的情形。这条“弱电统一”模型构件很基本、很关键,克莱因是第一个提出该构件的人),他同时想把电磁力与弱力统一在一起。当然,今天我们根据格拉肖-温伯格-萨拉姆弱电统一模型 [2] [3] [4] 知道,克莱因这里还缺一个配件即U(1)规范场,正是U(1)规范场与克莱因的 一起线性组合(即温伯格混合)才得到电磁规范场。不过克莱因说准备在他的理论中添加一个U(1)规范场 [5] [11]。当然,克莱因在该文内没有具体展开。我们不清楚他后来是否对他这个看上去很像SU(2) × U(1)统一的模型进一步研究。不过,无论如何,我们可以说克莱因的电磁力-核力统一模型其实基本上具备了20多年后弱电统一模型所有必要的配件(除了希格斯机制 [8] [9] [10] 还未包含进去。这点下面还会进一步说明)。
在克莱因论文 [6] 中,在从式(1)到(14)中,克莱因研究了引力场中的旋量场及其拉格朗日密度。自式(15)开始,克莱因引入了 、 和 ,并把质子和中子看作为同位旋二重态,之后也把中微子与电子看作为同位旋二重态,给出了同位旋二重态粒子在 、 和 作用下的拉格朗日密度和场方程。之后研究 、和 场的拉格朗日密度。克莱因的拉格朗日密度是
(2)
其中前两式就是克莱因文 [6] 的(26)和(27)式,上面式(2)内第三式是他文内的(9)式。在克莱因文中,用 代表规范势 、 和 ,用 代表规范场张量(场强) 、 和 (注: 、 、 和 、 、 也是他所用的符号)。 代表额外维度(第五维), 是与额外维度有关的系数。对于上面式(2)内第三
式协变导数算符 的来源我们可以这样来理解:普通导数算符 在五维时空内可以分为两部分之和
(3)
在引力场可以忽略不计时,普通四维时空度规 (平直度规),那么把 理解为普通导
数算符 ,而第五维的贡献 写为 ,这样便得到上面协变导数算符表达式(2)。从协变导
数算符 可以看出,克莱因的规范场 是悬挂在高维引力场中的,将高维引力场作为这些新规范场的起源。但是他的作用量密度内的 项并非直接来自于引力场的作用量密度。克莱因提到,引力场中的作用量密度可以写为Levi-Civita联络的平方形式(即他的(23)式) [6],因此他说“为了得到A-场与B-场的场方程,我们来考虑它们的作用量密度,它是爱因斯坦引力场方程的作用量密度的五维类比”。在卡鲁杂-克莱因理论中,我们知道Levi-Civita联络虽然可以看作一个(电磁)规范场强,但是它却没有类似 这样的双线性(非线性)项的。克莱因的规范理论 、 、 中的非线性项并非来自引力,而是另由方案得到,具体说来,他采用了 (这一式倒是受引力理论启发)。我们来看克莱因是如何获得他的场强 、 、 的。
在克莱因的协变导数 中,关于 ( 代表第五维)的梯度算符 起着确定
电荷系数的作用。在质子-中子二重态 中,质子带正电而中子不带电,那么当 作用在质子-中子二
重态 上时,便得到
(4)
此为克莱因文 [6] 中式(15)内之一。由此看出,中子 的电荷系数为0,而质子 的电荷系数为+1。由于克莱因的 和 场起着交换质子-中子二重态中电荷的作用,所以 和 必然要带电荷(带一个单位电荷, 和 所带电荷符号相反)。克莱因将他的三个规范势 、 和 写成了如下一个矩阵的形式,见式(5)。由于 和 所带电荷符号相反、而电磁场 不带电,那么类似上面式(4)的做法,克莱因写出:
(5)
以上也是属于克莱因文 [6] 中式(15)内公式。我们可以看出,克莱因赋予 电荷系数为 ,赋予 电荷系数为 。下面我们来看克莱因的场强 。克莱因直接给出了计算结果,见他的文章式(29)~(31)。这让读者觉得很突兀,有点不便于理解。为了更确切地理解克莱因的思路,我们给出具体计算步骤。先计算 内的第一项 ,结果为
(6)
同理,再计算 ,结果为
(7)
于是,克莱因的场强 为
(8)
再利用 、 、 在矩阵 内的位置(见下面),克莱因得到这些张量的显形式
(9)
这些结果就是克莱因文 [6] 内式(29)~(31)内的结果。这些关系与前面引述的(1)式中的 、 、 [5] [6] [7] [11] [12] [13] 是一致的。
看起来克莱因的规范势 与杨-米尔斯的规范势 很不相同。这里, 是SU(2)群生成元, 是三个泡利矩阵, 为杨-米尔斯规范群内空间指标。当克莱因的 乘上 后,其倒有点类似杨-米尔斯的规范势 :
(10)
克莱因的上面做法,虽然与杨-米尔斯的标准做法很不相同,但所得到的规范场张量 、 、 却与杨-米尔斯规范场张量精确一致(下面将具体比对)。除非是克莱因方法“错错得对”,导致偶然蒙对,否则其物理意义确实值得挖掘,即要寻找他的非标准做法为什么能与基于“同位旋不变性”的标准方法结果一致的原因。
之后克莱因在论文 [6] 内讨论了与规范场 、 和 有关的其它结果,包括这种规范场 、 和 的能量-动量张量,即他的式(37);他的式(39)与(40)分别是 场与 、 场的场方程。在 场的方程即麦克斯韦方程中,克莱因指出方程右边除了旋量粒子电荷流密度外,还多出了与 和 场有关的电荷流密度(因为 和 场带有电荷);克莱因在他的式(41)前后研究了这两个源(旋量粒子与 、 场)的流密度之和,发现它们的总荷是守恒的,还专门研究了 和 场的总荷密度(全空间积分);在他的式(42)之后克莱因研究了 和 场的量子化问题,给出了量子对易括号形式。
下面我们来简述杨-米尔斯规范理论基本结构 [1]。根据目前文献内的符号与惯例以及我们所使用的自然单位制( ),杨-米尔斯规范场强表达式是 ,其中矢量规范势定义为 ,SU(2)群生成元是 ( 是三个泡利矩阵, ),满足对易关系 ,其中 是全反对称群结构常数( )。由此我们可以得到杨-米尔斯规范场强三个表达式:
(11)
杨-米尔斯的作用量密度是 。我们定义一个
与 ,从而我们可以组合出更有物理含义的规范场强(无论在克莱因理论中还是在后来的弱电统一理论中,它们都对应于带电荷的规范场)
(12)
还可以进一步证明 内的 项为
(13)
于是杨-米尔斯规范场强第三分量为
(14)
我们发现杨-米尔斯理论内的规范势 对应于克莱因的 ,杨-米尔斯规范势 对应克莱因的 ,杨-米尔斯规范势(第三分量) 对应克莱因的 ;杨-米尔斯规范场强 对应克莱因的 ,杨-米尔斯规范场强 对应克莱因的 ,杨-米尔斯规范场强(第三分量) 对应克莱因的 ,杨-米尔斯的耦合系数 对应于 。此时,克莱因的上述规范场强与杨-米尔斯的规范场强在数学上精确一致 [18]。在杨-米尔斯理论中, 与 互为复数共轭( );在克莱因的理论中,也有互为复数共轭关系 。格罗斯认为 [11],克莱因的场强 中的 这一新特点“非常像杨-米尔斯理论,但实际上它不是”(This looks a lot like Yang-Mills theory. But actually it is not);“实际上克莱因几乎构造了一个SU(2)规范理论,但并不完全”(In fact Klein almost did construct an SU(2) gauge theory; but he not quite) [11]。本作者已经在上面证实,这个评价是对克莱因的冤枉,因为式(1)克莱因的规范场张量 内的 这一项可以化为
(15)
于是克莱因的张量变为了 。
将克莱因的 写为杨-米尔斯的 ,克莱因的 就精确地化为了式(11)杨-米尔斯理论中的 。由此说明,格罗斯 [11] 评论错了。
需要指出的是,克莱因的作用量密度 内有一个系数错误 [18]。根据杨-米尔斯的作用量密度,克莱因的该作用量密度括号内的项 应该改为 才对。注意到关系式 内有一个负号,有可能克莱因没有顾及到这个负号,才导致漏掉了 前的负号。此外,克莱因的 前缺少因子2,这个失误有点匪夷所思。我们知道复数场的作用量密度中的系数应当是实数场作用量密度系数的两倍,如他的克莱因-戈登标量场的动能密度项 (复场)与 (实场)系数就有该两倍关系,克莱因作为场论老手,似乎不应该漏掉 前的系数2,因为 与 也是复场( 与 互为复数共轭)。按照克莱因的作用量密度 ,来计算 与 的能量密度,它将是负数(不妥),因此克莱因或其他人可以立即明白这个系数有问题。对于克莱因这篇论文而言,这是一个错误,但是对于一个理论体系而言,不久读者可以纠正之。因此这个系数 问题可以立即排除,它不是原则性的瑕疵 [18]。
那么克莱因是如何得到他这一正确的非阿贝尔矢量规范场强 、 和 的呢?在现在标准的做法当中,我们需要利用规范对称性来获得这一矢量规范场强,例如杨与米尔斯在1954年就是采用了这个方法 [1]。这种方法虽然很正确,但让这个问题(构造非阿贝尔规范场强 )变得很难。克莱因竟然是很轻易地就解决了这一难题 [18]。根据克莱因的论文 [6],用现代的语言表述是,克莱因用了定义 ,其中“协变导数”为 和 ,这些也即他论文中的(9)、(15)、(27)式 [6]。当然,由于第五维以及他的电荷矩阵的“干扰”,我们作为读者看到,他在写出这些结果时,也伴随着诸多复杂曲折的步骤甚至不规范的地方(按照现在的规范理论角度来看),主要是他的协变导数 中的参数 旁多了一个电荷矩阵(为什么电荷矩阵不得不错放在此处?这是因为克莱因要在SU(2)对称框架内将电磁力与弱力统一起来,电荷矩阵问题是一个顽疾。这一点下面会具体讲)。由于克莱因在这块内容的叙述的复杂性,兼因该法从目前眼光看,也并不完全妥当(主要还是因他的电荷矩阵问题),故而上面笔者只是弃其枝蔓,将克莱因该块理论分析作了简化陈述 [18]。但是,克莱因得到的结果确实就是标准的非阿贝尔规范场强 。按照规范对称性要求,像 这样的形式是没有意义的,因为协变导数 只作用于规范群的基础表示如物质场 上,也就是 。 和 可能没有物理意义,不过它们之差却是规范场强 。其实,这在黎曼几何中也已经可以领教:黎曼曲率张量是 ,把Levi-Civita联络 (此处也即黎曼对称联络即Christoffel符号)看作矩阵元,以 作为矩阵指标,那么黎曼曲率张量可以写为
(16)
进一步变为 ;如果我们定义复数的联络 ,那么黎曼曲率张量
(17)
这与非阿贝尔规范场强 结构是一样的。如果克莱因当时已经知晓黎曼几何中 这样的曲率形式(我们知道黎曼几何理论其实也是一个规范理论),那么他在他的矢量规范理论中模仿 来获得 (也就天然能自动满足非阿贝尔规范对称性),也确实是合情合理的。但本作者认为克莱因当时未必知晓上述 这样的形式(据本作者所知,上述 这样的写法,几乎在文献中没有出现过;尽管会有人想到过,但谁也不会当真),那么克莱因的规范场强 是否仅是侥幸蒙对的呢?通过钻研他的论文 [6],我们认为克莱因的这种写法( )在他的五维时空场论中确有逻辑上的理由 [18]。前面已经说过,按照后来的杨-米尔斯理论看来,对于矢量规范场,克莱因的五维时空是一个不必要的外壳,但是在当年克莱因没有专门使用SU(2)规范对称性,因此条件相当匮乏环境下,他的五维理论恰好帮他弥补了条件不足,使得其摆脱了这个困境。克莱因论证了这样一个事实(但看起来不很具体):当五维时空退化为四维时空时,因受第五维的影响,四维时空内的Levi-Civita联络内的普通导数算符 都会带上 ,变为 。他的非阿贝尔规范场强 就产生自Levi-Civita联络。由于以上每一步都是合法的推理,因此我们不能说克莱因对矢量规范场的场强的定义
(18)
属于偶然蒙对 [18]。虽然从后来主流物理学角度讲,克莱因的这种方法(由第五维来衍生出非阿贝尔规范场)已经被放弃,但其包含的数学上的合理要素却是他在这个问题(轻松获得非阿贝尔规范场场强)上成功的原因。从物理学史角度以及物理学研究一般过程来看,克莱因的上述建立规范场的场强的做法,是一条正常的路子 [18]。每一个重要的基础物理学理论,一般都有新旧两种提出版本:一般旧版本总是东挪西支、磕碰波折的,而新版本却能爽快利索精彩地将旧版本理论推理出来,是因为它借助了某些新的基本物理原理和理论对称性或更高一级的数学手段。1938年的克莱因理论属于前一类(旧版本),1954年的杨-米尔斯理论属于后一类(新版本)。又例如从牛顿力学到分析力学(哈密顿力学、拉格朗日力学)、从法拉第-安培-麦克斯韦电动力学到后来用张量表述的电动力学以及电磁规范理论、从洛伦兹-爱因斯坦相对论到闵可夫斯基时空联姻理论以及庞加莱关于相对论对称性的分析,虽然旧方法显得不够系统,但在物理学史上,总是把旧方法的提出者才当作是重要的肇始者,新方法虽然在后来的教材中会被采纳,但新方法的提出者其地位肯定不如旧方法提出者高。但从克莱因矢量规范理论到杨-米尔斯理论这个线索中,克莱因的功绩几乎完全被抹煞了。这一历史与学术原因都应该分析。
既然克莱因的规范场 和 分别带一个单位的正负电荷,于是在与电磁场 耦合时也可以立即写出 和 的规范场强(物理意义十分明显,仅仅把普通导数改为协变导数即可):
与 ,
此为本文上面式(1)内的关系。如果定义如下规范势与规范场张量
, (19)
, (20)
同时也将克莱因的 写为 ,那么我们可以得到 :
(21)
以及得到 :
(22)
利用同位旋空间内的转动不变性,模仿上面两式(即要求 、 、 的上指标具有轮换不变性),我们可立即写出第三个规范场强 :
(23)
利用上面对 和 的定义,这第三个规范场强可以化为 。此即
克莱因文内的广义“电磁场”表达式。克莱因虽然没有借助“同位旋空间内的转动不变性”(此为杨-米尔斯1954年论文 [1] 重点),但是也得到了正确的非阿贝尔规范场强。
克莱因把质子-中子选作为同位旋二重态、把中微子-电子也选作为同位旋二重态 [5] [11]。把质子-中子选作为同位旋二重态,起始于海森堡,诸家规范理论包括后来的杨-米尔斯理论都用到了(当然现在的弱电统一模型中已经放弃了这一条,而改作u、d夸克作为弱同位旋二重态了)。但把中微子-电子也选作为同位旋二重态,克莱因是第一个,这也是正确的弱力模型的基本构件。虽然在克莱因全文中的数学展开主要是以质子-中子二重态为例来讨论的,但文中多次在谈及质子-中子同位旋二重态时,顺便也提及中微子-电子同位旋二重态。因此,克莱因理论,其实就是一个弱电统一理论的正确雏形(但他还未用到希格斯机制。希格斯机制是在1964年提出来的 [8] [9] [10],1967~1968年温伯格和萨拉姆分别将它用在了SU(2) × U(1)弱电统一模型之中,才建立了完整的弱电统一模型)。
克莱因的规范势和协变导数表示如下
, (24)
其中 是来自于五维引力理论的一个系数(克莱因该理论的寄主是五维广义相对论,这是统一场论余波未息所致。但这宿主本身并非必要。当然,正是因为他用了这一五维宿主,导致后人包括杨振宁等亦认为之所以克莱因理论有“类似杨-米尔斯理论的非线性特性”是因为它来自于引力场的非线性。其实并非如此)。从规范势 看出,似乎他的 应当是U(1)规范势,不是SU(2)第三分量规范势。但实际上并非如此,因为克莱因的协变导数中,还有一个电荷矩阵 与 乘在一起。 才看起来更像SU(2)规范势:
(25)
在1938年会议上克莱因报告完毕,物理学家穆勒(Moeller)提了一个问题 [6] [11] (该问题作为一个论文结尾的补注,仍旧出现在文献 [6] [7] 内):“最近实验证据显示核力场有一个中性分量,即中性汤川(Yukawa)介子似乎没有在你的理论中体现。”汤川介子理论是中子-质子间的强核力理论,不是弱衰变力理论。克莱因研究的才是弱衰变力。穆勒该问题也说明当时强力与弱力有时是不区分的。尽管穆勒该问题是指鹿为马,但是克莱因的回答却很正确(物理学中,经常会发生一个错误的问题导致正确的答案或者将正确的答案用在错误的对象上的事情)。克莱因说这可以通过引入一个对角分量( 场)来解决,即
, (26)
这里, 以U(1)规范势的身份进入克莱因的统一场论。这与后来的弱电统一模型非常接近 [11]。
由于历史的局限性,克莱因的协变导数也不那么正确。他的协变导数算符 内含有 。按照后来的眼光看来,仅仅有 就足够了, 是多余的。但在当时条件下,克莱因加入 却是有不得以的理由,因为他不得不提出一个电荷矩阵,以来区分带电的电子和不带电的中微子。目前的电荷矩阵是类似Gell-Mann―Nishijima关系,它对左手征粒子,有 ,其中 为弱同位旋第三分量(即 ), 为弱超荷(对于轻子即中微子和电子, )。于是左手征轻子的电荷矩阵为 。克莱因的统一场论中也有与此一模一样的电荷矩阵,但有不同点:克莱因的电荷矩阵是整体乘在SU(2)或者U(2)规范势上的,非常复杂,且是强制命令,不像现在的格拉肖-温伯格-萨拉姆SU(2) × U(1)弱电统一模型,该电荷矩阵是对称破缺之后的自然产物。杨与米尔斯也提出过这样的电荷矩阵 [1],他们也深知这样一个问题,但他们只是略微讨论了一下,并没有像克莱因那样进行具体运算。在今天看来,克莱因因为当时目标过于宏大(统一场论),该电荷矩阵的引入成为了一个败笔,连带牺牲了正确的协变导数(导致协变导数内多出了不必要的一项)。这是克莱因继上面矢量规范场作用量密度系数失误问题之后的第二个错误问题。如果克莱因的目标不是那么恢宏(要把电磁力与弱力统一起来,把弱力看作广义电磁力的一部分),那么也许可以避免这个问题。但是,话又说回来,克莱因的理论属于统一场论,基于引力,肯定要求引力去统一其它一切基本相互作用,所以这个恢宏目标是绕不过去的,那么这个错误问题是他的一个宿命、窠臼。克莱因的这一理论,成也萧何(即新规范理论和电磁力-核力统一理论的建立),败也萧何(即电荷矩阵绕不过去,导致规范场与物质耦合错误)。
按照1938年克莱因该理论版本 [5] [11],克莱因的电磁力-核力统一模型其实是U(2)统一模型,不是SU(2) × U(1)统一模型(说明:SU(2)与U(1)群是U(2)群的子群。在克莱因报告后的问答环节,可以看出克莱因只有一个耦合系数,而SU(2) × U(1)有两个耦合系数)。这是克莱因统一场论的第三个瑕疵问题。由于在当时(1938年会议)克莱因还没有来得及引入U(1)规范场,克莱因是把SU(2)第三分量当作是电磁场。而现在的弱电统一模型,是把SU(2)第三分量规范场与U(1)规范场的一个混合(温伯格混合)当作是电磁场的。不过克莱因不久也会立即明白这一点,这在数学中将不可避免让人认识到这一点。
克莱因对U(1)场的引入,本身含义是模糊的。不过,这个情有可原。类似有趣的模糊例子有很多,如1967年温伯格所提出的弱电统一理论 [3],一开始就是为强力设置的,不久他发现他把一个正确的理论用在了一个错误的对象上,于是改用在弱力上,他就建立了弱电统一模型 [3]。杨与米尔斯在1954年的论文中 [1],将他们的矢量规范理论用在了中子-质子同位旋二重态上,他们在论文中的讨论看起来像是强核力,不像是弱力。按照现在的观点看,其实也是用错了对象(至少对于中子-质子同位旋规范理论,后来已经被放弃)。有人认为杨与米尔斯是想用SU(2)规范场解释质子与中子的弱相互作用。不过根据杨-米尔斯的论文 [1],全篇讨论的立足点之一其实更像是强核力,如在引言中就提到“强相互作用譬如 介子-核子就应该满足这样的同位旋守恒定律”,但从读者的角度看,论文的主体部分似乎很难看出到底是在研究强力还是弱力。从强力角度看,这种质子、中子间的同位旋是不守恒的。对于弱力来说,这种同位旋才守恒,因为中子可以衰变为质子和轻子,而轻子(电子和中微子)之间也有弱作用,质子、中子丢失的同位旋,可以交给电子和中微子。克莱因从一开始就用对了对象,即将SU(2)用在了中微子-电子弱同位旋二重态上。其他物理学家(如薛文格、格拉肖) 20多年后才做到这一点(目前他们被认作是首先提出“中微子-电子同位旋二重态”的人,但实际上克莱因才是第一人)。
总之,克莱因该统一场理论走在时代前面的优点有:用了正确的中微子-电子弱同位旋二重态、正确的规范场强、包含了SU(2)和U(1)两类矢量规范场,还有不那么重要的正确的电荷矩阵。缺点之处是:他的电荷矩阵是强制规定且整体乘在这个广义矢量规范场上,使得理论太复杂(导致规范场与物质耦合错误);只有一个耦合系数(因此他的理论是U(2)弱电统一模型,对参数限定太死);还未考虑到需要将SU(2)第三分量规范场与U(1)规范场进行混合(并且将混合产物当作是电磁场)。在这三个缺点当中,对于后两者,我们认为,克莱因可以立即明白及克服,因此它们不能算太大的问题。第一个问题(电荷矩阵被整体乘在SU(2)矢量规范场上)才是他的理论的致命问题,这也使得他的理论(矢量规范粒子与费米子的耦合)不再具有SU(2)规范不变性。他之所以这么做,我推测有两个原因:1) 面对解释为何中微子不与电磁场耦合这个问题,这种做法(强制命令一个电荷矩阵)是当时他能想到的最好的方法;2) 他将SU(2)规范场的第三分量看作了电磁场,他当时发表的版本还没有来得及引入U(1)矢量规范场(U(1)规范场是他在报告后的问答环节中引入的)。现在我们知道,电磁场无法在SU(2)规范对称框架描述(除非SU(2)规范对称群自发破缺到电磁U(1)规范对称群,但这样可能会产生其它问题);电磁场其实是SU(2)规范场的第三分量与U(1)矢量规范场的混合产物(后来称为“温伯格混合”)。我们可以预测,当克莱因将U(1)规范场引入后,就大大解放了他的理论,就应该会得到类似“温伯格混合”的方案(事实上,比温伯格1967年提出“温伯格混合”早六七年,格拉肖也得到了类似的机制)。所以,能得到“温伯格混合机制”本身并不难,但克莱因能否将其利用起来且改善自己理论的不足之处,这一点就不得而知了。当然,后人也不能指望克莱因一次性解决所有问题,毕竟20~30年后的弱电统一模型也是由很多人在很多论文中完成,其中还需要借助来自实验的结果。克莱因能以一己之力在1930年代提出了30年之后正确的弱电统一模型雏形,已经不得不让人惊叹。
4. 分析他人对克莱因理论的评价
克莱因1938年理论可以分为矢量规范理论和电磁力-弱力统一模型两部分。后者其优点缺点比较能一目了然(上面也已经一一指出),并不存在世人对其的曲解。但由于世人对克莱因理论前者(矢量规范理论)的曲解很多,世人也不把其后者模型当作一回事。下面我们来看1960~1970年代建立粒子物理标准模型战争“硝烟弥散”之后,后世文献对克莱因1938年矢量规范理论的各种评论。
有人以克莱因的场论有质量,得出结论说克莱因并没有发现非阿贝尔(非交换)规范对称结构 [11]。这应当一分为二来看,首先他该文确实不是以规范对称性目的来建立他的矢量场论(所以才有了后来泡利 [11] [14] 和杨-米尔斯 [1] 的新发现),他的目的是统一当时已经发现的全部基本相互作用(引力、电磁力与核力);其次,虽然他没有关注、强调、意识到这个非阿贝尔规范对称结构及其重要性(如格罗斯认为克莱因并没有试图提出也没有讨论这种扩展的SU(2)规范对称性及其思想 [11] ),但他是可以自动去满足规范对称性要求的,前提是只要他有规范场下的协变导数、同位旋二重态(如中微子-电子构成同位旋二重态)、且要求满足同位旋几率守恒(符合幺正变换不变性),就能自动建立具有SU(2)规范对称性的理论,也即后来的泡利和杨-米尔斯理论(泡利 [11] [14] 没有发表)。事实上克莱因也确实做到了(在规范对称性上,由于理论本身具有自动性,所以克莱因是顺势被动地遵循了规范对称结构,而后来的杨-米尔斯的工作相当于主动地带了一张“航海地图”)。克莱因的工作有点像哥伦布发现美洲大陆这一事件:哥伦布航行的目的之一是去东方富裕的中国,他认为向西航行穿过大西洋,就可以先到达日本,之后到达中国,谁知实际到达的是当时闻所未闻的美洲。哥伦布不知道穿过大西洋其实还不够,还有一个太平洋。他把美洲岛上的黄色人种(印第安人)称为印度人,同时一直相信旁边的古巴可能就是中国或是通往中国的路。哥伦布至死都这么认为。但是,克莱因比哥伦布更清楚自己所发现的是什么,他知道自己的规范场是带荷的,且能解释弱衰变力(如贝塔衰变),但他把弱味荷仍旧解释为电荷。不过话又说回来,认识到自己所发现的是什么其实也并不重要,重要的是你发现了什么。本作者认为,我们也可以说克莱因是确确实实发现了规范对称结构了的,只是没有意识到它的重要性,或者说没有按照现代人的意识去理解他自己的发现。但对于一个发现来说,这些其实根本不重要,正如量子力学产生之前,谁会同意U(1)规范对称性对电磁理论的重要性呢?没人认同。只有在量子力学产生之后,物理学家才认识到U(1)规范对称性是电磁理论最核心的对称性,但是对于早期安培、法拉第、麦克斯韦等人的经典电动力学而言,它一点也不重要。
文献 [11] 和 [13] 对克莱因理论有详细评述。文献 [11] 作者Gross (格罗斯)和文献 [13] 作者O’Raifeartaigh与Straumann评价风格不同。前者 [11] 给出了毫不含糊的确定评价,如认为克莱因的理论,只是有点像非阿贝尔规范理论,但实际不是 [11];后者 [13] 的评价就显得比较隐晦,给人以“是也不是,不是也是”的感觉。本文认为,就克莱因的矢量规范场这部分,其理论就是一个标准的SU(2)数学结构理论(当然,要除去在Lagrangian密度上的一个容易纠正的系数−2错误。就难度而言,这个失误已经不是关键构件的问题了)。下面我们具体来看文献 [11] 和 [13] 是如何评价克莱因的,我们同时再给出“评价的评价”。
由于克莱因意图把引力、电磁与核力统一起来,按照格罗斯的说法,克莱因1938年的理论是第一个最值得受尊敬的“万物理论” [11]。本作者认为这仅仅是从史料角度出发所作的礼节性评语,并没有从学术角度来肯定这一值得受尊敬的“万物理论”。格罗斯比较详细地论述了克莱因理论,并且对很多细节作了客观评价,但在最核心要点上,他对克莱因做了否定性评论 [11],即他认为克莱因的理论并非一个杨-米尔斯规范理论,只是有点接近而已 [18]。前面我们已经引用了他的部分观点。这儿再度引用他其它的进一步观点。格罗斯说:“他(克莱因)几乎发明了SU(2)规范理论但是并不完全。但他已经非常接近了。”(He almost invented SU(2) gauge theory but not exactly. However, he was very close);“很清楚克莱因不完全清楚他在做什么……克莱因的目的是建立一个基于同位旋U(1)规范理论的所有力的理论。他几乎建立了一个SU(2)规范理论但是并不完全。我不认为他真的已经知道自己的理论已经非常接近(真理),但这点(规范理论结构)并非是他当时关心的”(It is clear that Klein did not completely understand what he had done…… Klein’s goal was to construct a theory of all the forces based on a U(1) gauge theory of iso-spinors. He almost constructed an SU(2) gauge theory, but not exactly. I do not think he really understood that he even came close to it; that was not his concern) [11]。格罗斯的上述评论除了“他几乎建立了一个SU(2)规范理论但是并不完全”这一句外,都是很客观的。但是由于前面笔者已经证明其实克莱因的理论中的规范场部分是精确等价于16年后的杨-米尔斯理论,上面格罗斯的这些评论反倒显得有点吹毛求疵、过于苛求了。比如格罗斯的评语“克莱因的目的是建立一个基于同位旋的U(1)规范理论的所有力的理论”,我们认为这句话只能针对克莱因理论的前半部分意图,他确实是有这个嫌疑(仅凭着这个嫌疑就可以把克莱因的理论否定掉),但是本文作者在前面也已经提到克莱因是使用了如下规范场强定义法 (其中“协变导数”为 和 )来得到他的正确的规范场强(现在被称呼为杨-米尔斯规范场强)的。从这一点就可以看出,克莱因自己翻了身,不自不觉走向了非阿贝尔规范理论道路。要是真的如格罗斯的评语所说“克莱因的目的是建立一个基于同位旋的U(1)规范理论的所有力的理论”,那么克莱因的场强 就仅仅只有 这一项,而不会有杨-米尔斯理论至关紧要的特征项 ,而且克莱因这一特征项还是精密正确的,而不是“看上去近似的非阿贝尔项”(前面我们已经有论证)。而格罗斯恰恰认为这一项“非常像杨-米尔斯理论,但实际上它不是”,故而他并不认为克莱因建立了SU(2)规范理论。虽然格罗斯对克莱因在多数议题上有客观评价 [11],但在最关键点上有原则性的曲解,甚至冤枉了克莱因 [18]。
O’Raifeartaigh与Straumann [13] 提及或论述了杨-米尔斯理论之前的所有规范理论(包括1910年代魏尔、1921~1926年卡鲁扎-克莱因的理论以及1926年量子力学产生之后伦敦、福克、魏尔对电磁规范理论的理解),详细介绍了克莱因1938年理论和泡利1953年给派斯(Pais)的一个草算和信件(W. Pauli, Meson-Nucleon Interaction and Differential Geometry, A Letter to Pais)。比起文献 [11] 根本没有认定克莱因理论是一个SU(2)规范理论来,文献 [13] 在论述克莱因理论时倒是承认了克莱因将U(1)规范对称性理论推广到SU(2)规范对称性理论。但是他们在论述泡利1953年的该类理论时,又作了晦涩评价,看起来又降低了对克莱因的理论的评价 [18]。例如,该文 [13] 作者说:“通过研究高维空间曲率,泡利第一次自动发现了非阿贝尔规范场强的正确表达式。”(Studying the curvature of the higher dimensional space, Pauli automatically finds for the first time the correct expression for the non-Abelian field strength.)之后他们又说:“这是(泡利)得到的正确的场强,该场强后来又由杨与米尔斯引入。据我们所知,除了克莱因1938年论文,它在(泡利)这里是首次出现。”(This is exactly the field strength which was later introduced by Yang and Mills. To our knowledge, apart from Klein’s 1938 paper, it appears here the first time) [13]。上面的论述强调了是泡利第一次获得正确的场强表达式,但后面这句话“除了克莱因1938年论文,它在(泡利)这里是首次出现”又说得含混晦涩(作者 [13] 在主干句中两次强调泡利首次得到了非阿贝尔规范场强的正确表达式,且又暧昧指出“除了克莱因”,泡利是首次发现)。我们认为文献 [13] 作者对克莱因的理论也有曲解,他们其实并没有意识到克莱因比泡利更早已经获得了正确的非阿贝尔规范场强的表达式。他们像其他物理学家一样,只是觉得克莱因的场强有点像非阿贝尔规范场强但其实不精确,所以才说了这句模棱两可的评语 [18]。
再来看新版《杨振宁传》作者在一篇文内的评述 [16]。该文写道:“克莱因在1938年华沙一次物理学会议上提出一个场论,因为这个场论包含一个非线性项,有一些近似非阿贝尔规范理论的非线性项。这件事在20世纪八九十年代被瑞典物理学家瑟西莉娅·加尔斯科格(Cecilia Jarlskog)‘发现’,于是不少物理学家开始发表文章,试图解释何以克莱因的文章以前没有被人们注意到。”该文献 [16] 说克莱因的理论“有一些近似非阿贝尔规范理论的非线性项”。笔者在本文前面已经用数学证明和一一比对,其实克莱因的这个规范场论具有精确的杨-米尔斯规范理论的非线性项,它与杨-米尔斯规范理论在数学上是一模一样的,并非仅仅是“有一些近似的非线性项”。想必这件事也并非迟到20世纪八九十年代才被关注到。在克莱因生前(1977年之前)就已经被他人注意到,克莱因本人也多次谈及自己的这个场论。克莱因去世当年(1977年),美国《今日物理》(Physics Today)配了几篇去世人物简评,其中包括对克莱因的简评(作者:Stanley Deser) [17]。Deser写道:“在1930年代,他(克莱因)开始从事新粒子研究。在这一阶段,他的成果包括在1938年提出的非阿贝尔矢量场相互作用的一个形式与克莱因变换以及介子理论和后来的基本粒子分类学。”
文献 [16] 继续说:“杨振宁在演讲中理所当然地要提到克莱因的这篇文章。他一方面肯定了克莱因的贡献,另一方面也指出克莱因文章没有受到广泛关注的原因所在。首先他指出克莱因是怎么样得到非线性项的:‘克莱因是怎样得到这些项的呢?答案在于,他从卡鲁扎-克莱因(Kaluza-Klein)理论出发,该理论建立在广义相对论的基础上,具有非线性项’。”笔者认为,文献 [16] 引述的杨振宁的这个评价相当于否定了克莱因1938年理论核心部分(即克莱因广义规范场的规范场强) [5] 与杨-米尔斯规范理论之规范场强 [1] 在数学上的精确一致性。我们具体分析如下:卡鲁扎-克莱因统一场论(1919~1926)引入了第五维,它是一个五维的广义相对论,它力图把引力与电磁力统一起来。克莱因1938年理论 [5] 确实从卡鲁扎-克莱因统一场论出发,不过他的非线性项,与广义相对论的非线性项(即方程内包含度规的非线性)看起来没有直接的必然的联系。他的非线性项,其实与后来的杨-米尔斯理论一样,也是由非交换群SU(2)规范结构导致的,尽管他当时没有像杨与米尔斯在1954年 [1] 那样强调这点(或者特别关注这一点),因为他没有以SU(2)规范对称性为中心目标(克莱因1938年该文的目的是统一引力、电磁力和核力),但克莱因把他的矢量场的荷准确地设立为e-v (电子-中微子二重态),而我们知道,一个二重态(如自旋在磁场内的进动、原子二能级布居数在光场作用下的拉比振荡)天然具有SU(2)群结构,这在理论物理学中是一个基本数学现象。即使1930年代的物理学家不太熟悉这一点也不要紧,只要赋予二重态几率守恒,必然会引导其建立正确的具有SU(2)群结构特征的理论。这就是为何克莱因不必意识到、不必强调和利用SU(2)规范对称性,也可以得到正确的SU(2)矢量规范理论的根源。所以,克莱因规范理论的非线性项并非来自于广义相对论的度规非线性项。
当时(1910~1930年代)统一场论风靡一时,研究者们受爱因斯坦影响,认为所有基本相互作用应从引力出发来统一,这是一个基本信念。克莱因不能免俗,卡鲁扎-克莱因理论(1919~1926)是克莱因1938年场论的立论背景。但是克莱因1938年场论作为一个电磁力与核力的统一理论,是已经脱离引力这个背景的(也即脱离了卡鲁扎-克莱因理论和广义相对论的)。例如,由克莱因得到的正确的非阿贝尔规范场强表达式,其实就是脱离于卡鲁扎-克莱因理论而提出来的。因此,克莱因得到的正确的非阿贝尔规范场论非线性项其实是与卡鲁扎-克莱因和广义相对论无关的。他获得该场强的方法与正确的现代非阿贝尔规范场论的方法其实是有亲缘关系的,在前面第三节中已经指出(即 ,该式子在他的高维引力理论中有其合理性)。
如果硬要认定克莱因“从卡鲁扎-克莱因理论出发,该理论建立在广义相对论的基础上,具有非线性项” [16],那么这就意味着我们要把克莱因理论看作是一个非阿贝尔卡鲁扎-克莱因理论 [19] [20] [21] [22],这样高维广义相对论中的非线性项才有可能是非阿贝尔矢量规范场论来源。现在我们知道,非阿贝尔卡鲁扎-克莱因理论有多个版本 [19] [20] [21] [22],它们通过某些约束条件(如Killing矢量场方程)把杨-米尔斯方程从五维或更高维卡鲁扎-克莱因理论中作为一个特殊的“引力场”呈现出来,包括泡利1953年理论 [11] [14] 也属于该种理论(泡利事实上用到了Killing矢量场方程,但没有提到该术语 [13] )。总的说来,克莱因的理论有点像五维非阿贝尔Kaluza-Klein理论,泡利的理论其实就是六维非阿贝尔卡鲁扎-克莱因理论。但是在杨-米尔斯方程(1954)出来之前,是没有线索(如Killing矢量场方程这一约束条件)从高维卡鲁扎-克莱因理论中把杨-米尔斯方程构造出来的,所以既然克莱因(1938)与泡利(1953)能创建非阿贝尔卡鲁扎-克莱因理论,本身就说明他们脑中已经具有了内空间同位旋不变性的思想,事实上已经早于杨-米尔斯先写出了杨-米尔斯方程,之后才能利用约束条件把杨-米尔斯规范场从高维引力理论的空间内呈现出来。该内空间(即非阿贝尔卡鲁扎-克莱因理论中的高维空间)就是后来的杨-米尔斯非阿贝尔群规范空间。总之,无论从哪个角度讲,克莱因已经有内空间同位旋不变性思想,所以他才可以得到正确的规范场强。
当然,我们也应该指出:从克莱因场论(1938)的规范场与物质耦合的作用量中协变导数的瑕疵(主要是受电荷矩阵干扰所致)看来,克莱因该耦合作用量破坏了局域规范对称性。事实上,如果不理睬电荷矩阵问题,就能满足规范对称性;考虑了电荷矩阵,反而成了“吃力不讨好”的结果。当然,克莱因的目的其实就是为了统一电磁力与弱力等,一定要在他的理论中把电磁力放进去(这是他的立足点),电荷矩阵是一个无法绕过的存在。那个(非阿贝尔)规范对称性并非他的立足点。但泡利(1953)的理论虽然也用到了高维引力外壳,不过,非阿贝尔规范对称性已经是立足点 [11] [14]。因此,正如Susskind在一部专著“Superstrings,Physics World on the first non-Abelian gauge theory”中指出,杨-米尔斯理论的“再发现”仅仅是因为泡利选择了不发表(Yang-Mills was “rediscovered” only because Pauli had chosen not to publish)。
文献 [16] 根据杨振宁对克莱因场论的评价,得出结论说:“正因为卡鲁扎-克莱因理论建立在广义相对论基础上,必然导致他们不可能导致规范变换。……正是因为克莱因的研究没有发现规范变换,所以他的工作没有受到人们的关注。这才是问题关键所在。杨振宁对克莱因1938年论文的评价应该是令人信服和中肯的。”本作者认为,我们不能因为克莱因没有强调规范变换,就否认或抹煞他在规范场论的工作,况且其实也不宜强调说克莱因“没有发现规范变换”,事实上有了协变导数(克莱因已经使用,但因为他受到他的电荷矩阵干扰,他写得有瑕疵),他提出了正确的SU(2)规范荷(e-ν二重态),而且已经获得了正确的SU(2)规范场强,这些就等价于克莱因场论已经自动遵守了规范变换,克莱因本人也已经被动地建立了非对易规范理论。只要赋予二重态几率守恒,模仿一下U(1)电磁规范理论,就可以天然得到SU(2)规范不变性的理论(当然,16年后杨与米尔斯是主动地建立非阿贝尔规范理论)。举一个类似的例子,像对黎曼几何,我们也可以借助局域的空间转动群对称性来建立。但是黎曼在1851年建立黎曼几何时没有用到这种由无穷小变换所确定的连续变换群(李群)方法(李群是在1874年开始建立的)。我们难道由此可以说,黎曼没有发现黎曼几何中的这种对称性从而应剥夺他创立黎曼几何的功劳?值得一提的是,强调规范变换并非克莱因当时的论文主题(他当时的论文主题还是在于统一场论,即将引力、电磁力、核力统一起来)。历史上,牛顿建立经典力学时,并没有发现时空平移和转动对称性,甚至连动量守恒、能量守恒定律他也没有(特别主动地)发现,甚至对于动能与动量之间的区别在牛顿时代以及其去世之后还在争论着;麦克斯韦建立电动力学,也并没有发现U(1)规范变换;洛伦兹、爱因斯坦建立狭义相对论,也并没有注意到现在所谓的SL(2, C)洛伦兹群和庞加莱群对称性。庞加莱注意到了,但相对论的发现权却主要被冠在爱因斯坦头上;量子力学中的变换对称性更多,创建者也都没有强调(如海森堡根本都不知道自己猜测构造出来的量子力学运算规则其实就是矩阵运算规则,这一点是由玻恩指出来的)。对于这一切,我们均没有因为他们当年未曾注意到或未发现有关变换对称性而抹煞他们的功绩。同样,克莱因获得了正确的非阿贝尔规范场论数学形式(这是最重要的一点),我们不应抹煞其该工作,尤其不能因为后来者对非阿贝尔规范场论十分强调其(非阿贝尔)规范不变性,而克莱因当年未强调这点,于是就说他不是这种新规范场论的首创者。事实上,从他1938年论文题目(“On the theory of charged fields”即“关于带电场的理论” [5] [6] [7] )看,他正是在提出一种广义的带电的电磁场的理论,这正是这种非阿贝尔(非对易)规范场的重要核心特质。这里,克莱因所谓的“带电场”的“场”就是指广义的电磁场,不是指像质子、电子那样的(物质)场。质子、电子这类物质场在克莱因该论文内被称为“粒子”或用古称“粒子波函数”名之。
从理论结构比较这一角度来看,克莱因1938年的场论 [5] 与1953年泡利 [11] [14] 、1954年杨-米尔斯规范理论 [1] 之间的关系有点类似洛伦兹1892~1904年力学与爱因斯坦1905年狭义相对论(“论运动物体的电动力学”)之间的关系。可以说,爱因斯坦1905年理论所得到的几乎全部结论,洛伦兹(及庞加莱)在过去十年都已经得到了(而且庞加莱在数学上看得更远)。爱因斯坦的做法是公理化做法,他用了两条基本原理:1) 相对性原理;2) 光速不变原理。洛伦兹的做法虽然不系统、甚至修修补补,且他的洛伦兹变换也是经过多次修正才最终得到正确的版本,但他要求麦克斯韦方程组在他的洛伦兹时空变换下形式不变,这本身就是相对性原理的卓越体现(当然,洛伦兹对时空变换的解释还是不同于爱因斯坦的,前者一直摒弃相对时空观),“光速不变”的结论洛伦兹与庞加莱也得到了。洛伦兹后来对爱因斯坦理论评价说:爱因斯坦利用我们已经得到的推论(指光速不变)作为出发点建立了他的理论。历史上,洛伦兹和庞加莱作为相对论的先驱者,在相对论中的贡献获得了承认,例如在相对论中,有洛伦兹变换、洛伦兹因子、洛伦兹收缩、洛伦兹群、庞加莱群、庞加莱变换等术语。克莱因也是非阿贝尔规范理论的先驱,但他的贡献没有得到一丝承认,而且还被大大误解(仅仅在一些论述规范理论的史料中作为一个“反面”的佐料来陪衬,被赋予“有点像”、“有点接近,但不是杨-米尔斯规范理论”这样的负面的曲解性评价),我们认为这是很不公正的 [18]。例如在规范理论中至关重要的非阿贝尔规范场强,它应该可以被称呼为“克莱因场强”(如果尊重历史的话)。真实历史是:该场强(现在称SU(2)杨-米尔斯理论的规范场强)首先由克莱因在1938年波兰会议提出(1939年在巴黎出版该会议论文集),其次由泡利在1953年7月给派斯的信中提出,之后才由杨与米尔斯在1954年2月下旬的一次报告中正式提出(六月投稿、十月发表)。对于到底谁先提出这个场强,是克莱因还是泡利,O’Raifeartaigh与Straumann的论述 [13] 有点含混晦涩。本作者的解读是,O’Raifeartaigh与Straumann有宽严两套标准。从宽标准来看,克莱因算是得到非阿贝尔规范场强的第一人,但他也许认为克莱因的场强并不正确(只是“有点像、有近似的形式”),因此从严标准看,泡利才是得到正确场强的第一人。但是,在历史上泡利抛弃了自己的这个理论,主要理由是这种理论不允许有短程力,这与粒子物理实践观察结果不同。克莱因理论(1938) [5] 被后人误解、泡利(1953)主动放弃该理论 [11] [14],最终杨与米尔斯(1954)重新独立发现、发表该理论(强调非阿贝尔规范对称性这一关键特性,以此作为出发点,这是杨与米尔斯的重要贡献) [1]。
一篇关于“杨振宁与粒子物理标准模型”文献 [23] 说:“格拉肖于1961年开始考虑严格的SU(2)对称性的情形,并将这个对称性用于轻子(包括电子和中微子)。类比SU(2)核子理论,格拉肖认为电子和中微子可以被看作同一种轻子的两种不同状态。这一看法是一个巨大的突破,因为电子带有电荷,必定融入电磁相互作用,电子和中微子又是弱相互作用下轻子的不同状态,这就意味着电磁力和弱相互作用也许可以在轻子二重态的思想中被统一起来。” [23] 笔者认为,格拉肖这一“巨大的突破”(认为电子和中微子可以被看作同一种轻子的两种不同状态)其实克莱因在1938年论文中已经做到了;按照格罗斯的观点,把电子和中微子看作一个二重态,克莱因是第一人 [11]。文献 [23] 说:“因为H. Weyl已经指出电磁场是U(1)规范场,格拉肖干脆将SU(2)和U(1)这两个矩阵表示做直积,以形成一个更大的矩阵表示SU(2) × U(1)。格拉肖应该是人类历史上第一个发现弱相互作用和电磁作用统一结构的人。”笔者认为,这“人类历史上第一个发现弱相互作用和电磁作用统一结构的人”,其实应当是1938年时的克莱因,而非1961年时的格拉肖。文献 [23] 继续说“遗憾的是,格拉肖的模型存在一个巨大的缺陷,那就是他人为构造了三个规范粒子的质量,从而导致规范不变性被破坏掉,并且他无法预言三个规范粒子的质量。”本文作者认为, 就连格拉肖这个很遗憾的错误,克莱因在1938年也犯了(克莱因相信存在一种方案,可以直接添加规范粒子质量项,但不影响作用量密度的规范对称性)。如果说格拉肖主要是因为以上工作获得1979年诺贝尔物理学奖的话,那么克莱因更加应该获得该奖,因为他比格拉肖(1961)早23年已经提出了以上方案(当然,克莱因在1977年已经去世了 [17] )。我们认为,弱电统一模型如今被称为格拉肖-温伯格-萨拉姆模型,但是如果在该名称前添加克莱因,也是完全应该的、符合历史实际情况的 [18]。
我们认为说得最客观、最明确的是奥肯(Okun) [24]。他在一篇介绍规范理论(从魏尔、福克开始)的三页短文 [24] 内提到:“第一个非阿贝尔规范理论是由克莱因在1938年提出,1954年杨与米尔斯再发现非阿贝尔规范对称性。”(The first non-Abelian gauge theory was suggested by O. Klein in 1938, and in 1954, C. N. Yang and R. L. Mills rediscovered the non-Abelian gauge symmetry.)但奥肯不作论证说明(本作者文献 [18] 以及本文中的数学比对,属于对奥肯文章的一个补足)。这里,奥肯把规范理论和规范对称性分开来说,这是符合历史事实的。是克莱因发现了该理论基本数学结构,但没有强调其规范对称性(当然,他模仿电磁力,实际也已经用到了规范对称性;论文中也多次提到“规范对称性”这一词、在引言提到过“将中微子和电子构成列矩阵矢量将会与规范对称性有密切联系”,但没有特意点明该规范对称性到底与U(1)对称性有什么区别),而杨与米尔斯则在其1954年论文中从一开始就强调和利用了这种列矩阵矢量需要满足的非阿贝尔规范对称性 [1]。
5. 克莱因理论境遇的教训与反思
克莱因的矢量规范场论与电磁-核力统一场论包含了那么多的闪光点(矢量规范场论其数学形式与后来的杨-米尔斯理论精确一致、电磁-核力统一场论包含了后来的弱电统一模型的很多基本要件),但是还是被历史无情地抛弃了。关于克莱因被忽视和曲解,其根本原因在于如下几条(以主要到次要为序):
①克莱因将研究工作发表在非著名会议期刊上 [5],影响力很小。尽管很多人都不屑于提及这点原因(而宁愿用其它抽象的虚无主义理由来解释),但本人认为这一点是克莱因失败的主要原因。格罗斯也提到了这一点 [11]。他认为,克莱因没有谋求正式期刊发表,只刊出在不知名、难以找寻的会议论文集内。从派斯处我们得知,克莱因曾经写信给玻尔,希望玻尔关于发表提些建议,但我们不知道玻尔是如何回复的,也不知道克莱因没有正式发表在期刊内的原因是什么 [11]。但克莱因毕竟还是将他的工作发表在1939年在巴黎出版的论文集内 [5],而且在1955年还在应邀参加Berne Congress (伯尔尼研讨会)时回顾了他的工作,该文发表在期刊Helvetica Physica Acta上(O. Klein, Helv. Phys. Acta, Suppl 4, 58, 1956)。照理,克莱因已经正式发表了他的工作,应该引起注意。但是毕竟这些欧洲期刊影响力弱,此时已经是二战后,物理学的中心已经从欧洲移到美国。Helvetica Physica Acta是瑞士物理学会期刊,创刊于1928年,刊物语言并非英语。2000年时它与法国“亨利·庞加莱研究所年鉴”合并为新的“亨利·庞加莱年鉴”,这是一个理论物理与数学物理刊物。Helvetica Physica Acta是一个著名的“寂寂无名”刊物(瑞士物理学会官网提到它时认为它是曾经的著名期刊)。其实,早期在Helvetica Physica Acta上曾发表不少优秀工作,但它们也被后来的新生刊物文章取代,其贡献没有得到应有的承认。例如斯塔克尔伯格(Stueckelberg)比美国费曼(Feynman)早六七年提出了量子电动力学的现代形式,他用法语发表在Helvetica Physica Acta上[E. C. G. Stueckelberg, Helv. Phys. Acta, 15, 23~37 (1942)],但1965年的诺贝尔物理学奖获奖名单中没有他,实际获奖者三人薛温格、朝永振一郎、费曼的工作都发表在美国期刊,但都比斯塔克尔伯格晚六七年。可以说,在1930~1940年代,一些欧洲物理学家尤其是操法语者,将工作用法语发表在Helvetica Physica Acta等期刊,是一个惯例,但这些工作却被二战后崛起的美国期刊内的文章“重新发现、重新发表”和取代,当然也有所进化(例如,这里有一个插曲:费曼的量子电动力学重要亮点是费曼图,因为基于光子-电子散射的直观考虑,我们可以画出一些费曼图,由图可以立即翻译为数学语言如跃迁振幅等,进而计算散射截面和粒子寿命等,就可以与实验结果比较了。费曼后来见到斯塔克尔伯格,曾问他为什么不画图。斯塔克尔伯格回答说:“我没有绘图工。”)。从斯塔克尔伯格的遭遇,也可以理解克莱因两次发表的重要工作为什么没有引起后来人注意确实是有这样一个外部形势原因的。最终克莱因的1938年矢量规范理论和电磁力-核力统一模型被曲解、否定、忽视,没有得到继承,他的理论也分别被后来更完善的版本即1950年代的杨-米尔斯规范理论和1960年代的弱电统一模型取代。
②克莱因的研究以引力为背景,是以引力为寄主衍生了这种矢量规范场。而杨与米尔斯一开始就摒弃了引力,不需要引力寄主,直接以SU(2)同位旋规范对称性为出发点。该路子后来成为正统路子。这种推广的矢量规范理论,既然被用在核力上,却从高维相对论引力作为出发点,这也无疑让后人对克莱因理论有先验的曲解。这是内部原因。当然,在用矢量规范理论统一了强、弱、电力后,现在的粒子物理统一理论,仍旧沿袭当年爱因斯坦-卡鲁杂-克莱因等旧纲领,从新的起点,基于引力理论,将非阿贝尔规范理论与引力理论统一在高维空间或超对称空间之中。这是后话了。
③克莱因不合时宜地过早提出了他的理论。以中微子-电子二重态为荷建立核力(弱力)与电磁力的内在关系,就这个思路,克莱因提得太早了。由于实验条件还没有跟上,时人还来不及消化这种远远超前的理论,大家对克莱因的理论还没有反应过来,应者寥寥 [18]。等反应过来,一些人已经再次将这类思想重新提出、发表到当时最主流期刊,反而是他们受到追捧。如1950年代后期,薛文格提出SU(2)规范对称群自发破缺到电磁U(1)规范对称群,把SU(2)第三分量解释为电磁场 [25],这与克莱因有类似的思路;格拉肖把自己老师薛文格的SU(2)模型推广为SU(2) × U(1)模型 [2],这一点克莱因也几乎做到了。弱力和核力的统一,因1930年代实验数据还少,这还不是当时的主题。等时候已到(1960年代),后来的人重新发现弱电统一结构,发表在主流期刊,早期的非主流文献,自然不会被关注到。在1950年代,非阿贝尔规范理论的提出者有好几家,除了泡利与杨-米尔斯这两家外,萨拉姆的学生在博士论文附录中也提出了非阿贝尔规范理论。此时才到了非阿贝尔规范理论再此被发现的火候。
④最不幸的原因是时隔七八十年,后人对克莱因1938年理论仍旧有诸多误解,甚至对其有颠倒性否定。由于后来的杨-米尔斯规范理论以及格拉肖-温伯格-萨拉姆弱电统一理论已经深入人心,成为基本物理知识的一部分,后人对早期历史文献不再愿意仔细消化,反而更愿意以自己添加的想象来代替理解,从而痛快地否定了克莱因当年的理论。例如在格罗斯文章 [11] 中,他毫不犹豫地否定了克莱因规范场强
中其实完全精确无误的非线性项 。
通过研究克莱因这一事件,我们受到的启示也有很多:
一个理论的建立有多种方法,有物理上的古法和数学上的雅法,如何评价其各自地位?可以说,自1950年代前后,物理学基本理论原理的建立更多地依赖于对称性、不变性思想,这些方法目前已经成为了最重要的物理学基本原理内容之一(正如杨振宁所说的“对称性支配相互作用”),这也反映我们对世界本质和本原的基本看法(当然,对称性与不变性,是物质之本质抑或仅仅是其体现,这个可以有争论,但无论如何这已经成为了近代理论物理学家们建立新理论之手段)。而在这之前不少理论(牛顿力学、麦克斯韦电动力学、量子力学)的建立较少依赖于这个方法。狭义与广义相对论的建立算是比较多地使用了“对称性、不变性”等思想。克莱因没有主动采用规范不变性思想却使用到了规范理论的很多关键构件,也建立了正确的杨-米尔斯矢量规范场理论之数学结构(尽管受到电荷矩阵“干扰”,在电磁力-弱力统一方面还有瑕疵),但因为过早地提出,且这个“路数”不为后来人欣赏(1950年代后的人强调对称性、不变性思想),且克莱因的数学形式写法也与后来占主流地位的杨-米尔斯理论在表观形式上看起来并不完全一样(其实它们是精确等价的,本文前面已有证明),故而被后人忽视和误解。这是一个历史教训(此教训并不仅限于数理研究领域,在实验与发明类的工作优先权的判定上,恐更突出)。
在现代理论物理学中,使用群论工具已经成为标准选择。克莱因没有用到群论,但是其推导更具物理直觉意义,因此站在历史角度,我们也许不可小觑其手段。克莱因的规范场强的构造方法,物理意义很明显。这种物理直觉在教学角度更容易帮助我们理解后来由温伯格等人提出的电弱统一理论中带电的 粒子为什么既可以是规范场客体,又因为其允许带电自然也可以成为物质粒子客体。这种 粒子是传递弱相互作用的矢量规范玻色子,它其实对应于克莱因电磁力-核力统一模型中的 和 场。克莱因知道在把中微子和电子(以及质子和中子)看作同位旋二重态后,需要推广普通电磁场 ,提出新的 、 规范场,且必须要求 和 场也带电(他的论文题目“关于带电场的理论” [5] [6] [7] 就是指这个意思)。可以说,仅凭这个题目或其文内观点“带电的矢量规范场”这一短语,克莱因几乎唯一地准确地定出了非阿贝尔规范场的非线性结构(本文前面的数学论证恰好就是表明了这一点)。后人所谓的否定克莱因理论的观点,如认为“克莱因理论只是具有一点类似杨-米尔斯理论的非线性特性但实际根本不是杨-米尔斯理论”,是完全不正确的。后来的杨振宁与米尔斯用群论方法,数学严谨了,这也是标准做法,但物理意义不像克莱因的做法那样明显。对于研习过弱电统一模型的人,在看到中间玻色子W作为规范粒子可以携带一个单位的正、负电荷, 想必会有惊诧,因为这意味着中间玻色子场W的导数项中需要添加一个电磁势而成为协变导数。非阿贝尔规范场的非线性项真的可以自动成全这样的完美协变导数项吗?如果熟悉克莱因的理论,那么我们立即就可以明白,非阿贝尔规范场的非线性项确实可以成全这样的协变导数项。通过对克莱因方法的分析,我们认识到,构造非对易规范场的场强(该理论的主要配件),并非只有杨与米尔斯使用非阿贝尔群数学这唯一一种方法。就像推导洛伦兹变换,既可以用洛伦兹转动群SO(1, 3)或SL(2, C)群方法,也可以使用爱因斯坦采用代数方程再添加“光速不变”这一特解作为定解条件这一手法。我们不能因为爱因斯坦在1905年不了解(或不懂) SO(1, 3)和SL(2, C)群,就说爱因斯坦没有发现时空的这种对称性。爱因斯坦可以怼问:“我连洛伦兹变换都推导出来了,何必管我是否懂SO(1, 3)和SL(2, C)群!”同样的道理,克莱因也可以说:“我连正确的非对易规范场的场强都推导出来了,何必管我是否用非阿贝尔群数学?”从历史角度看,通常物理学(包括理论物理学)亦特别强调物理意义的明确性,而非首先强调数学上的严格性(在过去的物理学史中,对物理理论在数学上的严格性的完善,往往属于是后来人的后续工作)。其实,克莱因不但应是非阿贝尔矢量规范理论的先驱者,而且实际上也应该是很重要的主角,但因为其理论被人误解,几十年来却被看作为“牺牲”在拂晓前的人,成为了非阿贝尔矢量规范理论前传中的反面或陪衬例子,这是很不公正的。
杨振宁用规范对称性为线索来构造场强 [1],这个方法很正规,但也导致这个工作(场强的构造)变得很难。杨振宁思索七年的卡壳问题在克莱因那里竟然不成为问题,可能是克莱因那时采用的广义相对论研究背景对他起了很大的帮助作用。杨振宁据称直到他的矢量规范理论发表之后较久才注意到黎曼曲率张量(场强)可以写为非阿贝尔规范场强结构( )。但这个现象在1929年Weyl就注意到了。也许有人说杨-米尔斯的群论方法可以立即从SU(2)群规范场推广到实际需要的SU(N)规范场,而克莱因方法仅仅只能研究SU(2)群规范场,不能用于复杂一点的规范场。其实,克莱因方法也一样能做到这一点。注意克莱因方法也用到了矩阵,他其实等价于在实际上用到了李群生成元的矩阵表示,尽管他没有提到李群。打一个比方,我们现在已经知道光场与二能级原子系统或三能级原子系统的耦合哈密顿量分别具有SU(2)、SU(3)群结构。但一个人即使不懂SU(2)、SU(3)群,也一点不影响其构造这样的哈密顿量并去获得正确的本征值和本征态。当然,懂得与利用SU(2)、SU(3)群,可以获得更多理性认识,但我们也不能因此说不懂或不使用SU(2)、SU(3)群的人在本问题中不能获得更多物理认识。对于克莱因与杨-米尔斯之间的关系,历史上还有一个类似的例子即爱因斯坦与希尔伯特在建立广义相对论中的关系。在这个事例中,爱因斯坦担任了克莱因的角色,而希尔伯特类似杨-米尔斯角色。爱因斯坦自1907年到1915年一直致力于广义相对论的建立,但一开始发表的多篇论文中的引力场方程都是错误的。爱因斯坦用的是物理学直觉法、试探法、猜测法,建立的方程总是不完备、不自洽。在1915年数学家希尔伯特对爱因斯坦的课题产生了兴趣,于是爱因斯坦向希尔伯特等人作了几次演讲,讲述了自己准备如何用黎曼几何来描述引力的思想。希尔伯特立即想到只要将黎曼几何中的Ricci曲率标量作为引力场作用量密度,利用变分法就可以奏效,他比爱因斯坦提前五天获得了正确的引力场方程。希尔伯特用的是数学法,爱因斯坦用的是物理法。当然,现在还是把广义相对论的创立者定为爱因斯坦,而不是希尔伯特,毕竟爱因斯坦多年研究,且物理思想出自于他。现在我们把Ricci曲率标量称为爱因斯坦-希尔伯特作用量密度,希尔伯特在这里分得了部分荣誉。
伪命题评价标准可能会带来灾难性后果。将克莱因的矢量场论或杨-米尔斯的矢量场论用到实际,还存在一个障碍,那就是规范场粒子的质量问题。弱力是短程力,需要让规范场携带一个大的质量。而带质量的规范场会破坏规范对称性。这个问题直到1964年才被Englert、Brout与Higgs等人解决(现在被称呼为Englert-Brout-Higgs-Guralnik-Hagen-Kibble机制) [8] [9] [10],通过自相互作用Higgs场的低能凝聚(类似超导),让规范粒子带上质量。杨-米尔斯规范场论才被逐渐接受。克莱因在1938年面对弱力的短程性问题,直接就赋予规范粒子(新粒子)质量,用来解释核力的短程性。但这不等于说,克莱因放弃了规范对称性(克莱因该文两次提到“规范不变性”、五次提到“规范变换”)。克莱因在引言中已经说到:“新粒子(笔者注:即规范场粒子)的静止质量,并不出现在场方程中,但也许可以通过不影响拉格让日不变性的方法将质量项添加进去。”他继续写道:“但是,理论的未来发展将导致一些额外项,如(规范粒子)与尺度有关的自能就会以质量的形式进入理论,这不是不可能。”克莱因该文六次提到“自能”这个词。克莱因的“让自能变为规范粒子静止质量”观点倒有点类似后来的标准模型中的希格斯机制(即规范对称破缺导致真空自能进入规范场,让规范粒子带上沉重的质量 [8] [9] [10] ),但克莱因论文内这一想法当时只是猜测,并无显示有具体方案。但是毕竟克莱因曾让规范粒子添上了质量项,这一条也成为了克莱因没能发现规范对称性的“罪状”或“罪证”,后人从而可进一步抹煞其建立规范理论数学结构这个物理学史事实。其实,对于克莱因而言,是否关注、发现规范对称性,根本不是他当时的目的,因此说他“没能发现非阿贝尔规范对称性”是一个原本不应存在的强加的伪命题、伪要求,但对克莱因而言,历史后果却是灾难性的,因为连同他正确的矢量场数学结构也被忽略和否认了。至于他超越粒子物理学20多年的弱电统一思想(即电磁-核力统一理论,此核力即为弱力),后人对此则更加无视了。那么克莱因是否一点也没有意识到他的理论包含了超越电磁U(1)规范对称性的新的对称性呢?克莱因在他的论文引言内提出:因为一些原因,他要把旋量粒子(质子和中子,中微子和电子)各自构成二重态(即他说的“双行矩阵”),“……这种带电粒子和中性粒子描述法与海森堡的核力组分理论一致,矩阵表示相应于同位旋。另一方面,这样的矩阵表示与规范变换最为接近。” [5] [6] [7] 在克莱因论文结尾,克莱因提到了与他的推广的规范场 场有关的荷,他仍将它解释为电荷,来自高维引力(因为他的统一场论毕竟是以引力为寄主的)。他在论文最后一句说道:“它们(荷)表达了 场的规范变换性质。”那么这里克莱因两次提到的“规范变换”到底是什么变换呢?显然不再是U(1)规范变换,因为他已经将中微子-电子看作同位旋二重态以及 场的规范场张量 、 数学形式等都一目了然不再满足U(1)规范变换(U(1)规范变换只导致线性规范场,他的规范场是非线性的)。但是很遗憾克莱因也没有指出这是SU(2)规范变换(指出SU(2)规范变换,这才是杨-米尔斯1954年工作的核心)。但从克莱因的“这样的(双行)矩阵表示与规范变换最为接近”这一句看,他也许也部分明白这是与二维矩阵表示有关的规范变换。在1938年会议上当克莱因报告完毕,物理学家穆勒(Moeller)提了一个问题 [6] [11] :“最近实验证据显示核力场有一个中性分量,即中性汤川(Yukawa)介子似乎没有在你的理论中体现。”汤川理论(强作用理论)是一个SU(2)对称性的标量介子场理论。既然在1938年时具SU(2)对称性的三个介子(两个带电、一个中性)行为(效应)都已经有所显示,且克莱因理论受启发于汤川理论,那么克莱因理应理解他的理论也具有SU(2)对称性。另外,既然克莱因已经将原先的U(1)电磁场理论推广为包含电磁场与两个新规范场(两个 场)总共三个规范场的新理论,且该新理论明显不是三个U(1)场的简单平庸放置或组合,克莱因应当明白这不再是传统的U(1)规范对称性了,但是他并没有为此新对称性命名,更没有具体展开钻研,虽然他多次提到“规范对称性”这个笼统的词。总之,克莱因该文将同位旋二重态看作为新的物质态,靠着“天才的物理直觉”和引力理论研究的经验,比杨与米尔斯早16年得到了正确的非阿贝尔规范场的数学形式,但没有正式地注意到里面的非阿贝尔规范变换群特性。发现非阿贝尔规范对称性,并非克莱因该文目的。他的注意力集中在另一个主题即电磁力与弱力的统一描述。
面对理论上规范粒子无质量的要求,而在实际事实上,规范粒子必须要有大的质量这一事实,克莱因(1938)、泡利(1953)和杨-米尔斯(1954)都是有过犹豫迷惑的。这是一个事关“规范对称信仰”的站队问题、立场问题。克莱因做了上述讨论后认为可能存在不改变作用量规范对称性的前提下允许在作用量密度中添加质量项(或者以自能方式),这严重站错了队,最终受到后人(如格罗斯)的“严打”,成为克莱因没有发现SU(2)规范对称的“罪证”之一 [11];泡利“宁死不屈”,决不妥协,选择了不发表,做了“烈士” [12] [14];杨-米尔斯 [1] 把着重点关注在同位旋对称性这个优美构件上,看起来不太重视这个矛盾重重的规范粒子质量问题(如在1954年2月下旬杨振宁在普林斯顿做报告时,泡利也在场,泡利前后问了两次“你这个规范粒子质量是多少?”杨振宁先是回答“我们不知道”,其次再回答“我们还没有确切的结论” [12] )。同样,在之后正式发表的杨-米尔斯论文 [1] 末尾,他们对规范粒子质量问题,做了讨论,结论倾向于对这个重要问题的答案“还不确定” [1]。这相当于采用了明智的“绥靖”策略,而克莱因和泡利走了两个不同的极端。这段事实,令人回味,值得钻研,给人启发也很多。
除了与同位旋二重态有关的规范理论外,克莱因 [5] [6] [7] 与泡利 [11] [14] 的工作还涉及引力与规范理论的统一。按照现在的视角看,他们的理论类似非阿贝尔卡鲁扎-克莱因理论。本作者也在1999~2006年对非阿贝尔卡鲁扎-克莱因理论有所钻研,认为该类理论十分庞杂且不具有唯一性。非阿贝尔卡鲁扎-克莱因理论确实有多个版本 [19] [20] [21] [22],例如将SU( )与引力统一起来,时空维度可以是4 + 1维的(克莱因理论 [5] [6] [7] 属于这类),也可以是 维(泡利的理论 [11] [14] 属于这类),也可以是 维的。这类理论一般需要一个约束条件,如Killing矢量场方程,将内外空间联系起来。由于非阿贝尔卡鲁扎-克莱因理论不具有唯一性,这样的理论往往前景堪忧,但是它们往往可以给出丰富的启发性思想,不能小觑。在历史上,像魏尔的规范理论、高维统一以及与克莱因与泡利有关的非阿贝尔规范不变性这类概念都是在那些被淘汰了的统一理论中产生的。谈及此,值得提一下中国老一辈物理学家束星北,他在1933年也对统一电磁力与引力有过努力 [26] [27]。在他的理论中,基于广义相对论,时空仍旧是四维的(不像卡鲁杂-克莱因理论那样需要第五维以及更高维)。那么四维的广义相对论如何把电磁力也涵盖进去,额外的自由度出自哪里?束星北提出了一个巧妙的思想,就是引入复数,在他的理论中,物质场的能量-动量张量内的质量密度包含虚部(承担电荷密度的角色),他的时空度规 也有虚部,其中以非对角度规分量 的虚部作为电磁势,度规的实部仍旧属于爱因斯坦引力场部分。我们知道,根据爱因斯坦广义相对论引力场方程,度规分量 实部的弱场近似方程其实很类似Maxwell方程,那么依次类推,现在其虚部自然也可以满足类似Maxwell方程的方程。所以,束星北的引力-电磁力统一理论本身在逻辑上也是有其合理性的,确实从引力场方程中把电磁场方程推导出来了。把度规推广到复数,建立复度规流形理论,数学家在一百多年前已经研究了,但在物理上赋予其意义(把复数质量的虚部看作电荷,把度规非对角分量 的虚部看作电磁规范势),可以说,束星北论文可能是第一篇 [26] [27]。在束星北论文末尾 [27],提到过对爱因斯坦等人的致谢,因为爱因斯坦曾经对其论文 [26] 内某一公式表示过疑问。不知是否受到过束星北该文的影响,爱因斯坦在晚年也致力于基于复度规的统一场论 [28] [29] [30]。与束星北相同的是,爱因斯坦研究的复度规非对角分量包含反对称虚部;束星北与爱因斯坦不同的部分是,束星北的度规对角分量含有虚部,而爱因斯坦的对角度规分量不含虚部。所以,在束星北理论中,允许物质场的能量-动量张量包含虚部,而爱因斯坦研究的则是复厄密度规(满足 ),束星北的度规并非完全的复厄密度规(他的物质的能量-动量张量也是复数)。从物理的角度讲, 爱因斯坦的复厄密度规 [28] [29] [30] 才容易被接受。总之,度规具有反对称的虚部,在广义相对论中是允许的(束星北的复度规不满足 ,让四维时空线元不再是实数,因此在物理上是一个瑕疵,但放弃实数四维时空线元条件,在纯数学上可能也是接受的)。复时空流形是一个自然的概念。但复度规理论十分复杂,例如,传统的实度规理论只有一个黎曼曲率,而复度规理论的黎曼曲率增加到四到八个 [31];复度规理论必须具有挠率 [32],若无挠率,理论就不自洽,这又使得理论变得很庞杂。在一些由数学家所写的复流形著作中,并无挠率 [31],这实际上是一种极为特殊的复度规理论,无法被用到一般的引力-规范统一理论中去。由于多方面的原因,在通向统一场论的道路上,留下了横七竖八的尸体。它们在逻辑上都是有其自在的合理性,但这些理论众说纷纭,各有各的出发点、各有各的方案,所以最终的裁判仍是自然和实验。但在实践还未能开展时(检验统一场论的实验十分苛刻,非目前条件能所为),理论物理的真理标准,也许应当是唯一性。这与应用物理完全不同。正如“文无第一,武无第二”,牛顿也曾经认为:原理性的基础物理,是把复杂的对象简单化,因此它的规律应当是唯一的;而应用物理,则是把简单的对象复杂化,允许很多方案和技巧共存。一个属于体现根本原理性的理论,如果同时有多种方案和多种版本,那么这不是好事情,恰恰说明所有这一切理论最终都属于是“走失了方向”而将被淘汰,而目前我们对这个物理现象还近乎无知。譬如关于暗能量和暗物质之本质,目前有上百家理论都宣称可以解释这些特异物质, 其实恰好说明我们对它们一无所知。
6. 讨论与结论
提出于1954年的杨-米尔斯非阿贝尔规范理论是描述粒子物理学强、弱相互作用的基本理论,也是统一强、弱、电相互作用的基本理论框架。在文献中,普遍认为是泡利(1953)和杨-米尔斯(1954)分别独立(但亦有互动)提出了非阿贝尔规范理论。只是泡利由于担心规范场粒子质量问题故而颇为踌躇,选择了不发表(此问题十年后由希格斯等人解决 [8] [9] [10] ),而杨与米尔斯正式发表,因而杨与米尔斯独享了荣誉。尽管有人挖掘出了1938年克莱因所发表的矢量规范理论,但文献中只是把克莱因该理论看作是一个失败了的方案,认作它是一个在表面上看起来与杨-米尔斯规范理论略微有点相似但其实根本不算是杨-米尔斯理论的错误尝试,并把克莱因理论(1938)当作是杨-米尔斯理论(1954)正式提出之前那一段“前奏史”中的一个反面例子加以“鞭挞”。克莱因理论至今仍旧被看作是一个“阵亡”在黎明前的没有取得成功的配角。但实际情形真的如此吗?本文介绍了1938年克莱因的统一场论要旨,该统一场论包括一个矢量规范理论和电磁力-核力统一模型。本文具体证明了克莱因矢量规范理论的关键构件即规范场张量其实恰好精确等价于后来的杨-米尔斯规范理论的规范场张量;同时我们也指出了克莱因的电磁力-核力统一模型,其实就是后来的弱电统一理论模型的雏形。除了因为历史原因克莱因未使用希格斯机制(以及手征性)外,克莱因的该统一场论包含了弱电统一模型的基本架构,如他已经将中微子和电子一起看作一个同位旋二重态、它们受SU(2)和U(1)规范场的作用。克莱因的论文本意是把SU(2)规范场生成元第三分量对应的规范场 当作是电磁场(这是不恰当的),但在事后物理学家缪勒的提问下,克莱因提出还要添加一个U(1)规范场 。确实,在后来的温伯格等人的弱电统一理论(1967~1968)中,电磁场被当作是SU(2)规范场生成元第三分量 和U(1)规范场 的混合(以一定比例线性叠加)。因此,克莱因1938年理论中的电磁力-核力统一模型已经具有了20多年后弱电统一理论的架构。
本文在2000年后就应撰就。其写作思路最初缘起于李政道讲稿《粒子物理和场论简引》(1984)中的引文,该引文引用了克莱因1938年理论,这相当于在一定程度上肯定了克莱因理论的价值;此外一些科学史著作也扼要提到过克莱因在“非阿贝尔规范理论”的工作,这些科学史总的观点是认为克莱因理论是一个失败了的尝试,为引出杨-米尔斯1954年理论做铺垫。有人肯定,有人否定,这种矛盾看法促使我对克莱因理论产生了兴趣。经过查看,我认为克莱因理论自由规范场的数学形式就是一个杨-米尔斯理论,但当时我未在数学上做精确比对。我本来认为这是很清楚的命题(即克莱因在1938年确实提出了正确的杨-米尔斯理论数学形式),不必再由人赘言,因而也就未及时撰写本文。但近年来看到了一些专业文献 [11] - [16],我发现里面对克莱因该工作有很多误解,尤其是有颠倒性曲解,即他们认为克莱因1938年的矢量规范理论“仅是在表面上看起来与杨-米尔斯规范理论有相似的非线性特征,但其实根本不算是杨-米尔斯理论”,我认为有必要澄清,遂写此文。本文对克莱因理论的历史境遇评述如下。
克莱因理论包含了20世纪下半叶(量子)场论和粒子物理学主要研究方向(非阿贝尔规范理论和弱电统一理论),但由于历史局限性,他的理论没有被人注意或承认。这在学术上的主要原因是:克莱因没有主动使用或指出他的理论的SU(2)规范对称性,其所提理论中的规范场生长在高维“统一场论”(卡鲁扎-克莱因理论)的五维时空中,因此克莱因的工作受到了同时代人和后人的曲解。尽管卡鲁扎-克莱因理论后来在超弦理论中有所复活,但毕竟对于普通规范场的缘起,克莱因当年基于高维引力框架所提出的矢量规范理论思路确实不符合后来物理学实际发展路子(引力理论至今还一直被排除在普通规范场论之外,除了一些偏门理论如引力规范理论 [33] [34] 以及有名的弦论等)。克莱因理论被后人认为走错了方向,而且认为其数学结构也仅仅是有点类似杨-米尔斯理论、是一个纯错误的理论。但本作者认为,其实这两条对克莱因的论断(“走错了方向”、“理论错误”)都不成立。在克莱因时代,由于统一场论余波未息,虽然卡鲁扎-克莱因理论成了克莱因1938年理论同位旋不变性的一个宿主或寄主,但是这个“高维引力”壳其实并非一定必要。事实上既然克莱因(包括后来的泡利)已经把中微子和电子看作成了内空间同位旋二重态,对于克莱因(1938)与泡利(1953)而言,非阿贝尔规范场论是自然而然的产物(事实上,泡利1953年理论也是从高维引力出发的,但泡利已经看出,这个引力外壳可以不必要;但克莱因的目的是为了建立统一场论,把电磁规范场与弱力规范场统一起来,他认为多一个规范场,就意味着需要多增加额外引力维度来解释,因此保留了这个高维引力外壳;杨与米尔斯则根本没有去涉及这个引力外壳,相当于认为这新的规范场是天然存在的,没有去想高维寄主)。克莱因1938年该17页论文包含了三大主题(彼此交错在一起):引力场与规范场的统一、推广的电磁规范场理论(实为后来的杨-米尔斯非阿贝尔规范理论,但克莱因没有提这类术语)、电磁力与弱力的统一模型(为后来的弱电统一模型雏形)。其中克莱因第二个目标完成了;第三个目标框架也已经打好,基本构件具备,但缺少希格斯机制帮助,可以算完成了半个;第一个目标狭义地说,错了;广义地说,该类高维统一理论思想在近代统一场论(非阿贝尔卡鲁扎-克莱因理论和引力规范理论)中又有所复活。
克莱因、泡利和杨-米尔斯建立他们的非阿贝尔规范理论的指导思想和过程各不相同,从历史的角度讲,都是芸芸众生环节通向正确理论的必由路子,当然后来的方案(如杨-米尔斯版本)比之前的方案强且干脆利落。杨与米尔斯提出该工作的贡献主要有二:①将非阿贝尔规范对称群用到了规范场中去;②提出了非阿贝尔规范场的非线性数学形式。本文证明,该第②点在克莱因1938年理论中本身已经做到,但却被后人一直曲解和否定 [11] - [16]。我们必须指出,1938年克莱因矢量规范场的数学结构(主要为非阿贝尔规范场的非线性结构这一核心配件)与1954年提出的杨-米尔斯规范理论是精确一致的。这是本文需要强调的核心。本文意图在于纠正世人对克莱因不公正的待见。克莱因应当被认作是首次提出正确的非交换规范对称理论数学形式的人,而非仅仅是被当作一位在规范理论中“失败了的先驱者”看待。
文章引用
沈建其. 克莱因矢量规范理论与电磁力-核力统一模型之历史与物理学意义述评
A Review of Historical and Physical Significance of Klein’s Vectorial Gauge Theory and Electromagnetic-Nuclear Force Unification Model[J]. 现代物理, 2018, 08(04): 204-231. https://doi.org/10.12677/MP.2018.84024
参考文献
- 1. Yang, C.N. and Mills, R.L. (1954) Conservation of Isotopic Spin and Isotopic Gauge Invariance. Physical Review, 96, 191-195. https://doi.org/10.1103/PhysRev.96.191
- 2. Glashow, S.L. (1961) Partial-Symmetries of Weak Interactions. Nuclear Physics, 22, 579-588. https://doi.org/10.1016/0029-5582(61)90469-2
- 3. Weinberg, S. (1967) A Model of Leptons. Physical Review Letters, 19, 1264-1266. https://doi.org/10.1103/PhysRevLett.19.1264
- 4. Salam, A. (1968) Elementary Particle Physics: Relativistic Groups and Ana-lyticity. In: Svartholm, N., Ed., Eighth Nobel Symposium, Almquvist and Wiksell, Stockholm, 367.
- 5. Klein, O. (1939) On the Theory of Charged Fields. Warsaw Conference on New Theories in Physics, Kasimierz, 30 May-3 June 1939, 77-93.
- 6. Klein, O. (1986) On the Theory of Charged Fields (Translated from French in “Warsaw Conference on New Theories in Physics” 1938). Surveys in High Energy Physics, 5, 269-285. https://doi.org/10.1080/01422418608228775
- 7. Klein, O. (1991) On the Theory of Charged Fields (Translated from French in “Warsaw Conference on New Theories in Physics” 1938). In: Yang, C.N. and Weinberg, S., Eds., The Oskar Klein Memorial Lectures, Vol. 1, World Scientific Publishing, Singapore, 87-103.
- 8. Englert, F. and Brout, R. (1964). Broken Symmetry and the Mass of Gauge Vector Mesons. Physical Review Letters, 13, 321-323. https://doi.org/10.1103/PhysRevLett.13.321
- 9. Higgs, P.W. (1964) Broken Symmetries and the Masses of Gauge Bosons. Physical Review Letters, 13, 508-509. https://doi.org/10.1103/PhysRevLett.13.508
- 10. Guralnik, G.S., Hagen, C.R. and Kibble, T.W.B. (1964) Global Conservation Laws and Massless Particles. Physical Review Letters, 13, 585-587. https://doi.org/10.1103/PhysRevLett.13.585
- 11. Gross, D.J. (1994) Oscar Klein and Gauge Theory. arxiv.org/hep-th/9411233
- 12. O’Raifeartaigh, L. (1997) The Dawning of Gauge Theory. Princeton University Press, Princeton.
- 13. O’Raifeartaigh, L. and Straumann, N. (1999) Early History of Gauge Theories and Kaluza-Klein Theories, with a Glance at Recent Developments. arxiv.org/hep-ph/9810524
- 14. Straumann, N. (2002) On Pauli’s Invention of Non-Abelian Kaluza-Klein Theory in 1953. The 9th Marcel Grossmann Meeting on Recent Developments in Theoretical and Experimental General Relativity, Gravitation and Relativistic Field Theories, Rome, 2-8 July 2000, 1063-1066.
- 15. Straumann, N. (1996) Early History of Gauge Theories and Weak Interactions. arxiv.org/hep-ph/9609230
- 16. 杨建邺. 杨-米尔斯规范场理论的创立[J]. 现代物理知识, 2012, 24(3): 27-30.
- 17. Deser, S. (1977) Oskar Klein. Physics Today, 30, 67-68. https://doi.org/10.1063/1.3037609
- 18. 沈建其. 场论小史谈: 奥斯卡克莱因及其矢量规范理论[J]. 现代物理知识, 2017, 29(5): 57-64.
- 19. Cianfrani, F., Marrocco, A. and Montani, G. (2005) Gauge Theories as a Geometrical Issue of a Kaluza-Klein Framework. International Journal of Modern Physics D, 14, 1195-1231. https://doi.org/10.1142/S0218271805006900
- 20. Kuyrukcu, H. (2014) The Non-Abelian Weyl-Yang-Kaluza-Klein Gravity Model. Genernal Relativity and Gravity, 46, 1751. arxiv.org/hep-th/1308.1898
- 21. Barbosa, A.L., Guillen, L.C.T. and Pereira, J.G. (2002) Teleparallel Equivalent of Non-Abelian Kaluza-Klein Theory. arxiv.org/gr-qc/0208052
- 22. Reifler, F. and Morris, R. (2007) Conditions for Exact Equivalence of Kaluza-Klein and Yang-Mills Theories. arxiv.org/gr-qc/0707.3790
- 23. 陶勇. 杨振宁与粒子物理标准模型. 2016. http://blog.sciencenet.cn/u/taoyingyong2014 http://blog.sciencenet.cn/blog-1253715-1009642.html
- 24. Okun, L.B. (2010) V.A. Fock and Gauge Symmetry. Uspekhi Fizicheskikh Nauk (Soviet Physics Uspekhi), 180, 871-873. https://doi.org/10.3367/UFNr.0180.201008g.0871
- 25. Schwinger, J. (1957) A Theory of the Fundamental Interactions. Annals of Physics, 2, 407-434. https://doi.org/10.1016/0003-4916(57)90015-5
- 26. Soh, H.P. (1933) Theory of Gravitation and Electromagnetism. Studies in Applied Mathematics, 12, 298-305. https://doi.org/10.1002/sapm1933121298
- 27. Soh, H.P. (1933) Theory of Gravitation and Electromagnetism. Chinese Journal of Physics, 1, 74-81.
- 28. Einstein, A. (1945) A Generalization of the Relativistic Theory of Gravitation. Annals of Mathematics, 46, 578-584. https://doi.org/10.2307/1969197
- 29. Einstein, A. and Straus, E.G. (1946) A Generalization of the Relativistic Theory of Gra-vitation (II). Annals of Mathematics, 47, 731-741. https://doi.org/10.2307/1969231
- 30. Einstein, A. (1948) A Generalized Theory of Gravitation. Review of Modern Physics, 20, 35-39. https://doi.org/10.1103/RevModPhys.20.35
- 31. Shen, J.Q. (2010) Complex Metric, Torsion, Spin-Connection Gauge Field, and Gravitomagnetic Monopole. In: Levy, M.B., Ed., Mathematical Physics Research Developments, Nova Science Publishers, New York, 419-526.
- 32. 陈志华. 复流形[M]. 北京: 科学出版社, 2010.
- 33. Shen, J.Q. (2009) A Gravitational Constant and a Cosmological Constant in a Spin-Connection Gravitational Gauge Field Theory. Journal of Physics A: Mathematical and Theoretical, 42, Article ID: 155401. https://doi.org/10.1088/1751-8113/42/15/155401
- 34. Shen, J.Q. (2016) A Gravitational Gauge Field Theory Based on Ste-phenson-Kilmister-Yang Gravitation with Scalarand Spinor Fields as Gravitating Matter Sources. General Relativity and Gravity, 48, 62.