量子物理简史

发表于 2019-06-29 更新于 2019-07-06 分类于故事 Disqus：本文字数： 9.3k 阅读时长 ≈ 15 分钟

全文摘录于《上帝掷骰子吗？》，看完回味之余，觉得有必要整理下量子物理发展过程中比较重要的瞬间和那些颠覆认知的概念。

黄金时代

光是什么？自古以来科学家众说纷纭，但大体分为微粒说和波动说两派。最初微粒说以直线传播和反射作为依据；波动说借衍射发展起来，但是人们认为光是种纵波，所以必须借助光以太这种虚无缥缈的物质而存在。

17世纪，格里马第认为颜色是因为光波频率不同引起，并得到胡克支持；牛顿在1672年完成光的色散试验后，认为光的复合和分解是不同颜色微粒的混合和分开，光是一种粒子，受到胡克和波义耳的批评后与胡克交恶。而后惠更斯引入波前的概念，以波动学的角度成功推导出光的反射和折射定律。而后牛顿环被发现，可以很轻松地被惠更斯的理论证明，自此波动说占据上风。

1704年，胡克死后次年，牛顿出版《光学》一书，以粒子说的角度分析了光的种种实验现象，并将之与自己的力学体系结合在一起。那时的牛顿出版了《数学原理》，且是微积分的发明人（尽管和莱布尼兹有争议），同时在政府担任要职，风头无二。从此，第一次波粒之争中微粒说以压倒性优势盖过波动说，大获全胜。

1804年，托马斯·杨在他的《自然哲学讲义》中描述他所做的光的双缝干涉实验，干涉形成的明暗条纹可以很好地被波动说解释。在发现无法更好解释时，微粒说以马吕斯在1809年发现的光偏振反驳。1819年，菲涅尔采用波动说很好地解释了光的衍射，泊松将之应用到圆盘衍射时，发现推导出阴影中心会出现一个亮斑，即泊松亮斑，并被阿拉果实验验证。同时，为了解释光的偏振，菲涅尔认为光是一种横波，而非纵波，并在1821年成功从理论中推导出偏振现象。最后1850年，傅科实验测量出光在水中的速度小于真空，从而奠定了波动说在第二次波粒之争中的胜局。

波动说并非没有弱点，因为光这种“横波”的传播速度如此之快，它的介质“以太”一定坚硬无比，但是一粒小小的灰尘就可以阻挡光的传播，这似乎又是匪夷所思的。波动说的解释是以太是稀薄且静止的。虽然有些牵强，但随着1856、1861、1865年麦克斯韦三篇电磁理论的论文发表，麦克斯韦预言光是电磁波的一种。1887年被赫兹的实验证实。自此波动说一统天下，此时的物理，经典力学、经典电动力学和经典热力学构成了经典物理的三大支柱，在当时看来，一切物理现象都在人们的控制之中，这个世界的所有基本原理都已经被发现。

乌云

黄金时代的喜悦没有维持太久，而后一些科学发现让科学家感受到不详的预兆：

1895年，伦琴发现X射线
1896年，贝克勒尔发现铀元素的放射性
1897年，居里夫人和她的丈夫研究了放射性，并发现了其它放射性元素
同年，J.J. 汤姆逊在研究阴极射线时发现电子
1899年，卢瑟福发现元素嬗变

The beauty and clearness of the dynamical theory, which asserts heat and light to be modes of motion, is at persent obscured by two clouds

1900年，在开尔文的一次演讲中第一次提到“乌云”一词，其中提到的两朵乌云分别是：

1881、1886年，迈克尔逊-莫雷实验否定了以太的存在
经典物理在黑体辐射研究中的困境

前者导致了相对论的诞生，后者催生了量子论。

在黑体辐射中的困境是，针对能量分布和温度以及波长的关系，维恩得出的分布公式和瑞利金斯公式分别在长短波方面贴合实验结论。1900年，普朗克凑出了普朗克黑体公式，能完美符合各个波长上的实验结果。

在尝试使用经典物理学推出这个公式失败后，普朗克不得不做出这样的假定：能量在发射和吸收时，不是连续不断的，而是分成一份一份的。对于能量的最小单位，普朗克称为“能量子”，而后被称为量子（quantum）。量子的能量等于普朗克常数乘以辐射频率。

E=hν

那一年，普朗克42岁。

玻尔的原子模型

在光电效应中，人们发现对于特定金属，能不能打出电子之和光的频率有关，而打出电子的多少才和光强有关。特定频率的光打出的电子能量是有一个上限的，这个上限和光强并没有关系。

普朗克1900年的论文发表之初，并没有得到学术界甚至他自己的重视。1905年，爱因斯坦发展了普朗克量子化的思想。提出组成光的能量存在最小单位，称为“光量子”（light quanta），而后被简称为光子（photon）。光是以量子形式吸收能量，是一个瞬时作用，没有累积概念，光子的能量大小只与光频率有关。

1905年爱因斯坦的这篇论文同样并没有受到认同，因为光量子的概念和当时已尘埃落定波动说并不贴合。而后密立根的实验和康普顿研究X射线被自由电子散射时，很好地证明了爱因斯坦的观点。在1910年，索尔维赞助的第一次索尔维会议中，大家对骚动的量子理论莫衷一是。

1912年，考入剑桥的玻尔投入了卢瑟福的门下，这时卢瑟福正为它提出的原子行星模型苦恼。行星模型相对J.J.汤姆逊的枣糕模型更符合α射线轰击金箔的实验，但仍然说明不了为何电子可以稳定地围绕原子核运转。

玻尔受到巴尔末在1885年发现的氢原子谱线公式启发，提出了电子的能级和跃迁的概念。电子只能在特定能级上维持，在能级间跃迁时吸收或释放能量。玻尔的理论可以很好地推导出巴尔末公式，这系列论文发表于1913年。

玻尔模型提出伊始，得到了广泛地实验支持，同时预言了一些新的谱线存在，并很快得到证实。玻尔模型的能级假设十分具有量子化色彩。引入相对论和假定电子具有更多量子数后玻尔-索末菲模型也能成功解释塞曼效应和斯塔克效应（氢原子谱线受电磁场的影响）。通过这个模型，可以推导出一个原子的化学性质和它的最外层电子数相关，从而表现出一定的规律性，这也为周期表的存在提供了理论基础。为了解释电子为何能自发分层，泡利提出“泡利不相容原理”：同一层能容纳的电子数是有限的。

玻尔的量子化模型相对传统的麦克斯韦电磁体系走得实在太远，模型假设电子的能级、轨道是量子化的，但并没有解释为什么，总让人感受到不安稳。同时玻尔体系只能解释只有一个核外电子的原子模型。电子的跃迁时机，模型也无法解释，看似是完全随机的。

20世纪初，德布罗意在他的博士论文中提出，伴随电子运动的有一个超光速的相波，即德布罗意波。凭此论文德布罗意获得了1929年的诺贝尔物理学奖。德布罗意预言的德布罗意波而后被戴维逊和G.P.汤姆逊实验证实。这似乎又掀起了波动说和微粒说的战争。同时，玻色-爱因斯坦统计方法把光子视为不可分割的一种粒子，成功推导出普朗克的黑体辐射公式。波动说和微粒说似乎哪一种都不是、哪一种又都是。

1924年，玻尔、克喇默斯和斯雷特联名发表BKS理论，放弃了光量子假设，试图在波和粒子间建立一种对应，收效并不明显。

决定论？

在玻尔提出玻尔模型的时候，海森堡受邀前去哥本哈根工作，此时正是1924年，尝试统一微粒说和波动说的BKS理论提出不久，就被实验否定，光量子是实实在在的东西，而非只有统计意义。1925年4月，海森堡结束哥本哈根访问回到哥廷根后，使用矩阵的思路分析原子的运动模型。

海森堡从实验中观测到的，能够实实在在感受到的能级差出发，采用矩阵作为数学工具，将之运用在经典动力学公式中去，把玻尔-索末菲模型旧的量子条件改造成由矩阵推出的公式，进而可以很容易推导出原子能级和辐射频率。在和波恩和约尔当的合作下，海森堡发布《论量子力学》和《论量子力学II》。新体系马上获得巨大成功，矩阵力学在此基础上得到发展。受到海森堡矩阵启发，狄拉克借助泊松括号用更简单的方式相同的理论。乌伦贝克和古兹密特提出自旋模型，并得到矩阵力学支持。海森堡的模型将玻尔模型的范围推广至更广的范围（氦原子）。

1925年，薛定谔受到德布罗意启发，将电子看做德布罗意波，用一个波动方程去表示，从经典的哈密顿-雅克比方程出发，利用变分法和德布罗意公式求出了一个非相对论波动方程，即薛定谔波动方程。通过求解这个方程，可以很轻松地理解电子为何只能在特定能级运行。1926年1到6月，薛定谔一连发表多篇论文，并证明了经典力学知识波动力学的一种特殊表现。

尽管两派互不服气，但是薛定谔、泡利、玻尔等人证明这两种理论在数学上是等价的。在狄拉克的努力下，矩阵力学和波动力学作为一种理论的不同形式体现出来。前者更像微粒说，后者更像波动说。

我们观察下双缝干涉实验。对于波动说，在双缝时，电子可以很好地由薛定谔波动方程去描述，但是若此时关闭了一条缝，实验结果也就变成了一条缝而不是一片区域，电子所在的波到达缝时发生了什么呢。对于微粒说，电子穿过哪条缝似乎是完全随机，不可预期的，同时每个电子穿过狭缝时，是不可能知道狭缝间有多宽，甚至无法知道还存在其他狭缝，那么狭缝背后的干涉条纹的规律性怎么解释呢？更有意思的现象是，如果我们在每条狭缝上安装测量仪器，我们可以发现，每次只能在一条狭缝时测量到电子，但同时干涉条纹会随着测量行为而消失。

哥本哈根解释

上面提到的现象，似乎隐隐地体现出测量行为对理论表现的影响。海森堡在1927年反复思考矩阵运算中p × q ≠ q × p的特性，如果我们把p和q分别看做观测得到的结果，似乎说明，我们不可能同时观察得到p和q。原因是，观察本身就会影响我们对另一个物理量的测量。经过一阵计算，海森堡得出

1	△p × △q > h/4π

△p和△q分别代表对p和对q的测量误差。对其中一种的精确都会影响对另一种的粗略。这个理论被称为不确定性原理，抑或测不准原理。这个误差并不来自于测量仪器，而是在理论上就不可实现，就像永动机。p和q叫做共轭量，动量和位置就是一对共轭量。能量和时间也是一种共轭量，这意味着，对时间的精确会意味能量的模糊，在确定的某一刻，能量甚至可以凭借不确定性凭空出现，，由于质能本质相同，所以每时每刻我们的真空都在“沸腾着”，“幽灵”物质凭空涨落。

在看到海森堡的论文后，玻尔意识到，不确定性原理是具有普遍意义的，它“以一种极为漂亮的手法”显示了不确定性如何应用在量子论中。不确定性建立在波和粒子的双重基础上，对于粒子属性的了解越多，对于波属性就了解的越少。

现在回头想一下那个问题：电子究竟是粒子还是波。玻尔认为：

任何时候我们观察电子，它只能表现出一种属性，要么粒子要么是波。但是作为整体来看，它表现出波粒二象性。如果你一定要问，电子本来是什么？我只能说我一点也不关心它本来是什么，我只关心我们能“观测”到它是什么。举个例子，我们对大自然的理解实际上都建立在我们观察到它是什么，它本质上是什么对我们没有意义（类似“白马非马”诡辩）。对于电子的观察方式不同，它的表现方式就不同，一旦观察方式确定了，电子就只能以一种特定的形式存在。

这就是玻尔的互补原理。它和波恩的概率解释、海森堡的不确定性三者构成了量子论“哥本哈根解释”的核心。影响着人们对宇宙的根本认识。

回头再看对电子干涉实验的讨论，观察干涉条纹也好，在狭缝安装仪器也好都是不同的观察方式，得到的结果自然不同。谈论任何物理量都是没有意义的，除非你首先描述测量这个物理量的方式。再说的明确一点，一个物理量如果无法测量，那它就是没有意义的。换言之，不存在一个客观绝对的世界，唯一存在的就是我们能够观察到的世界。

这种解释把观测者和外部宇宙结合在了一起，即不存在一个观测者能独立之外的宇宙。这听上去似乎有点形而上学了。

这个解释当然并不完善，比如在你不观测时，电子以概率波的形式存在于空间，而只要你观察，它的波函数就会随机坍缩到某个具体位置。对此，哥本哈根的解释是，不观测时，对电子的讨论没有意义，只有数学可以描述——波函数，而在观测时才具有实在的意义。

薛定谔的猫

对于哥本哈根解释，许多科学家是并不能信服的，其中就包括笃信确定论和因果论的爱因斯坦。爱因斯坦认为，观察导致坍缩这一点暗示了某种超距作用，而这是和相对论相违背的。在1927年第五届索尔维会议上，爱因斯坦和玻尔展开了激烈的论战，以玻尔获胜告终。

三年后的第六届索尔维会议，爱因斯坦提出光箱实验反驳海森堡的不确定性原理，被玻尔通过广义相对论的红移效应完美解释。人们似乎感到，上帝真的掷骰子。

1933年，爱因斯坦和他的两个同事波多尔斯基、罗森共同提出“ERP佯谬”（名字来自三个首字母），试图说明量子论是不完备的。下面是一种简化了的版本：

我们想象一个自旋为0的大粒子衰变成两个小粒子，向相反两个方向飞去，两者的自旋方向必定相反。只要我们部去观察，每个例子自旋便都处在上/下两种概率的叠加态中，但我们只有观察其中一个例子，如A是上旋，那么B必定是下旋，可问题是B如何在A坍缩至上旋时，一定坍缩为下旋呢？

量子论的解释里面，观察后，例子A坍缩至上旋完全是概率现象，是在被观测一刻才有的意义，粒子B在此刻也会根据A的决定作出相应的坍缩。这个信号是怎么传递的。

玻尔解释说，在观察前，并不存在两个分裂的粒子，它们是一个整体，只能用波函数去描述。所以不存在超光速的信息传递。有意思的是，ERP佯谬是可以被实验证明的。后面也会提到。

相对爱因斯坦的思维实验，薛定谔的实验要更易理解和更出名。在他1935年《量子力学的现状》的第5节。薛定谔描述了著名的“薛定谔的猫”的实验。既然量子效应的匪夷所思还能让人容忍，那就把它放大到宏观世界里。

它设想了一个不透明的箱子，有一个处于衰变和不衰变叠加态的原子，只要原子衰变，就会激发一系列的连锁反应，打破箱子里的毒气瓶，从而杀死箱子里的猫。在量子论的解释里，只要我们不打开箱子，原子处于只能用波函数描述的叠加态中，此时猫也只能处于死和活的概率波叠加态中。这恐怕很难被接受。

那么我们把猫换成人呢？如果他能在纸上写下在箱子内的感受，他会这么认为吗？当然不会，他会坚定的认为自己从头到尾活得好好地，抑或是感觉不太妙。这是因为他作为观察者在箱子内不断观察自己的状态，不停地出发自己的波函数坍缩。

难道人和猫有区别吗？换句话说，难道因为人有能力“测量”自己存活与否（换句话说就是人有“意识”），而猫不能，所以人能让自己的概率波坍缩，而猫只能任由自己停留在死或生的概率波函数中？

真是匪夷所思。

坍缩和平行宇宙

冯·诺依曼指出使用仪器观测和人来观察并无区别，仪器本身也是由不确定的粒子组成，使用仪器观察只不过把粒子的叠加态转移到了仪器上，无限复归，直到人意识的参与。为了避免过于唯心的讨论，恐怕要探究下“意识”究竟是什么。

首先，意识并不是实际的物质存在，它基于我们的大脑而存在，有种观点认为：意识是组成原子群的一种“组合模式”，照这么推论一个人的意识理论上是完全可以复制和粘贴的。同时，由于模式才是本质，那么意识的载体并不重要，我们人类的肉体作为意识载体存在完全只是一种选项。意识也可以依附在机器上存在，它不过是输入输出间极为复杂的一种算法加上复杂的数据结构而已。关于意识的更多探讨，可以阅读罗杰·彭罗斯的《皇帝新脑》（原文推荐）

1979年，约翰·惠勒进行了一次延迟选择实验，他通过巧妙地设置半透镜的角度使得，在终点处观察者能否观测到光子直接影响光子在起点半透镜的选择。换句话说，观察者决定了光子的历史。推广而言，我们的观测行为本身参与了宇宙的创造过程。这实际上是加强版的人择原理。人择原理说，我们存在这个事实本身，决定了宇宙的某些性质是这样而不是那样的。参与性宇宙则表明，我们的存在不仅影响了宇宙的性质，甚至参与并创造了宇宙和它的历史。我们选择了宇宙，宇宙又创造了我们。

坍缩这个概念玄之又玄，于是有科学家提出了其他解释。比如艾弗莱特1954年提出了MWI（多世界解释）。按照艾弗莱特的说法，电子穿过双缝后，整个世界本身成为两个独立的叠加，我们观察到电子穿过左缝或右缝，是因为我们碰巧处在对应的分裂出来的宇宙中。量子过程产生的一切可能都会对应一个实际的宇宙，只不过大多数宇宙中，没有智能生物来提出问题。多世界解释又被称为平行宇宙。艾弗莱特假定任何孤立系统都必须严格按薛定谔方程演化。虽然宇宙只有一个波函数，但是这个宇宙态矢量十分复杂，它存在于高维甚至无限维的希尔伯特空间中。我们处在的每个世界不过是“真实”矢量在某个方向上的投影。

既然世界是叠加态的，电子也是叠加态的。那为何处在宏观世界的我们从未感受到量子尺度的叠加态呢？

退相干理论的提出尝试回答这个问题。理论提出，我们只谈论微观物体时，牵涉的粒子数很少，模拟它的希尔伯特空间维度自然也较低。但一旦牵扯到仪器或我们本人观察时，我们就引入了一个极为复杂的态矢量和维度极高的希尔伯特空间。这样，在低维空间相干的两个世界在此时被退相干，变得毫无联系，从而让我们感受不到彼此。量子叠加态的在宏观层面的瓦解正是退相干的直接后果。

退相干的提出让我们摆脱了对“观测”，“意识”的哲学讨论。让我们再次可以抽身于环境之外世界。宇宙重新成为唯一的主宰，人和观测者只是它的一部分。但是，为了解释电子行为而把整个宇宙拖下水的做法也受到一些质疑。

“量子自杀”实验在20世纪80年代提出，它实际上是薛定谔的猫的真人版，实验假设把猫换成人。对于哥本哈根解释，伴随原子衰变概率，有一半可能人活着，一半可能人死掉。MWI则认为，一个世界里的你活着，另一个世界的你死掉。然而，多宇宙预言：永远都会有一个“你”活着。其中活着的宇宙对你来说才是有意义的。那么为了验证MWI假说是否正确，那么只要做实验的人一直活着就可以了。如果假设成立，不论概率多么低，活着的你必定存在。对一直选择活着分支的你来说，你是“永生”的。这也就是说，如果MWI成立，那么对于某人来说，他无论如何自杀都不会死！因为按照MWI，在每个量子过程中都有两个世界分裂出来，这么多世界中必定包含你活着的那个。那么从该人的视角看，他怎么死都死不了。这就是从“量子自杀”中推出的“量子永生”。推广来看，总存在一些量子效应，使人不会衰老，那么，从主观意义上看，只要一个人有意识，那么他就必定永生。

量子计算机和其他解释

在量子理论中，一个量子不仅有0或1的可能，还可以表示0和1的叠加态。原来n个bit可以表示的信息，使用量子后可以表示2 ^ nbit。1985年，德义奇证明，量子计算机无法实现超越算法的任务，意味着它只能做普通图灵机能做的。但是计算同样的任务时，它能做的更快。量子计算机进行的是并行计算。当10bits的信息在处理时，量子计算机实际上在操作2 ^ 10 = 1024种状态。由于量子态纠缠很容易退相干，目前量子计算机进展有限。

有意思的是，哥本哈根解释和MWI对于量子计算机的算力有着不同的解释。MWI解释里，在n bits的信息处理时，存在着2 ^ n个宇宙的计算机在计算并最后汇总。哥本哈根解释认为，在观测（输出结果）前，宇宙中存在着2 ^ n个叠加的计算机在干活。两种听起来都挺不可思议的。

无论哥本哈根还是MWI在叠加态上的解释都离常识较远。按照德布罗意的思路，有一个导波造成了量子看似的随机性。量子论中一些随机的表现实际上我们不够了解的原因，有一些不可见的变量没有考虑进去才导致了系统的不可预知。一旦把这些额外的变量考虑进去，整个系统又变成完备、确定、可预测的。这种“隐变量理论”在1932年被冯·诺依曼的论文证明不存在。

1952年，大卫·玻姆发现冯·诺依曼推导中的假设存在漏洞，并重新使用“量子势”建立起新的隐变量理论。量子势称，粒子周围散发着一种势场，这种势弥漫在整个宇宙中，每时每刻对环境了如指掌。在电子向双缝进发时，势场会提前发现双缝存在并指导电子的行为。在观测时，测量仪器首先与势场相互作用，这会使电子发生一些微妙的变化。玻姆的理论虽然可以解释量子力学中的现象。恢复了世界实在性（世界可以独立在之外观察）、决定性（现象可预测）的同时但是破坏了定域性（不能存在超距的因果关系）。

1963年，贝尔发展了ERP佯谬，提出和定域性、实在性等价的贝尔不等式。而后在1982年，被阿斯派克特实验证明，粒子间存在违背贝尔不等式，即违背定域性、实在性的行为。而后又被一系列实验验证。说明我们宇宙并不存在定域实在性，即要么选择“观察者”，要么选择“超距信号作用”。

这次爱因斯坦输了，“上帝真得掷骰子”。

除了上面提到的哥本哈根、MWI和隐变量，还有许多别的解释：

系综解释：我们的世界不存在单个的事件，每一个预测都只能是平均的，针对整个集合的。系综说，不要深究具体某个事件的意义，而且我们也不解释单个事件，不确定性在这里只是统计极限。这种解释并没有分析“坍缩”这个难题，只是简单将之踢出了体系之外
GRW理论（命名取自三个提出者的姓名首字母），理论认为不论宏观还是微观系统，都不可能严格意义上孤立，即与外界毫不相干。它们总是与外界发生交流，受一些随机过程影响，比如位置从弥漫的叠加态变成比较精确的准确位置。但是这种情况出现的概率太低，几乎要等很久很久才会出现一次（按照他们的估计约为）。我们称这种过程为“自发定域”。尽管微观粒子自发定域如此之难，但是组成宏观物体的粒子数的量级很高，所以宏观物体内每秒发生着成千上万次自发定域。同时，由于系统内的粒子间相互纠缠，少数几个粒子的自发定域会引起多米诺效应，从而让宏观物体一直处于定域状态。这种定域时间很短，所以我们没法感觉到叠加态（近日耶鲁大学有一篇类似的论文疑似发现了定域、抑或坍缩的发生过程确实是有时间的）。但是GRW解释中抛弃了能量守恒定律，另一方面，如果自发定域的时间和参与的粒子数有关，我们完全有能力安排只用小数量级的粒子去观测，如银离子，这时叠加态维持时间在GRW解释中应该会很久。
退相干历史，根据这种解释，现实是唯一的，历史是叠加的，“精细历史”间是相关的，但我们并不关心精细历史，我们只关心能观测到的粗略历史。随着历史树向上粗略化，不同历史间退相干。

大统一与超弦

宇宙中存在4种力：

引力
电磁力
强相互作用力
弱相互作用力

20世纪60年代，弱作用力与电磁力统一成交换“中间玻色子”的力，而后量子色动力学（QCD）尝试统一强作用力。1968年，意大利物理学家韦尼基亚诺通过欧拉β函数提出韦尼基亚诺模型，并被南部阳一郎、萨斯金、尼尔森用来描述粒子，并发展出弦论。但根据弦论推导，我们的时空需要是26维的，因此并不受科学界欢迎。1971年，施瓦兹和雷蒙引入超对称思想，把26维简化为10维，之后施瓦兹和格林完成弦论和超对称结合，得到“超弦”。1982年，通过计算发现，超信理论可以很好地解释引力。1984年，两人发现，在理论自洽下的一些有限情况里，不仅可以包容规范场理论，还能包容粒子的标准模型。从而让超弦理论一炮而红。理论认为，我们生活在一个10维空间里，但是其中6个维度是紧紧蜷缩起来的。当我们把观察尺度降低到普朗克空间尺度上，会发现时空中的一个“点”，实际上是个6维空间，其中6个维度不停扰动，造成了全部的量子不确定性。

1995年，爱德华·威顿在超弦年会上统一了不同耦合常数下的5种弦论，这种统一理论成为“M理论”。目前，超弦理论仍在持续探索之中。