本文为“身边的微分方程”系列第7篇。难度提示:★★★★★
若想了解本系列及本专栏其他文章,请收藏目录:
或按下文方法关注本专栏:
本文中,我们将迎来本系列的一位VIP,它是主宰微观世界运行规律的基本法典、更是开创二十世纪灿烂物质文明的第一推动。
即使不抬头看本文标题,我们也能猜到,本文要出场的这位VIP,就是薛定谔方程:
关于它如何为现代文明带来的一个个神迹,我们将在后续的几篇文章里慢慢体会。
在此之前,我们需要先来参悟一下方程本身的意义。
不然,等我们自虐般地解完一堆不同束缚态的薛定谔方程之后,可能仍然不知道自己在干啥。
而为了达到循序渐进的效果,我们将薛定谔方程的参悟的过程,由具象到抽象、拆成两个问题来回答:
在中学物理中,我们就知道,一个原子核的核外电子的能量往往不能连续取值,而只能处在一些分立的能量值上面,这些分立的能量值叫作电子的能级(Energy Level)。
当我们在化学课中讨论一个元素化学性质的第一性原理时,或者当我们在半导体物理中讨论导带、禁带等决定半导体材料性能的关键因素时,其实本质上就是在直接或间接讨论原子核外电子的能级分布。
而这些能级分布的信息,正是薛定谔方程给出来的。
换句话说,求解薛定谔方程能得到的最重要的信息,就是一个体系中允许存在的能级。
如果先放下整个方程的物理意义不谈,仅仅满足于“得到能级信息”这个实用主义的目的,那么这个求解过程理解起来并不难,我们马上就能体验一番。
先来瞥一眼薛定谔方程:
此处:
即虚数单位;
, 即普朗克常数,而 称为约化普朗克常数;
,即梯度算子;
,是体系中的势能分布,取决于具体的物理情形;
,即名声在外的波函数(Wave Function)。
而为了方便讨论,我们不妨先将方程简化为一维情形,此时梯度算子退化为对 坐标的偏导数,方程简化为:
根据我们在前面几课中对线性偏微分方程的认识,我们知道,要求解这样一个方程,标准做法是先分离变量,得到关于坐标和关于时间的两个独立的函数,记为:
这样,方程就化为:
两边同时除以 ,得:
我们不妨令方程两边同时等于某个常数:
这样就能将两个独立的方程分别求解了。
而根据以前求解弦振动和热传导方程的经验,我们需要重点关注的,通常是坐标的方程:
为了方便后面的讨论,我们将两边同时乘以 ,这样方程化为:
这个方程叫作定态薛定谔方程(它也是我们讨论薛定谔方程意义的关键 )。
回顾本系列以前的文章中求解弦振动方程和热传导方程的经验,我们可以猜到:
如果限定了边界条件,那么我们通常会得到这个方程的一组特解序列 ,而每个特解会对应一个常数值 ,满足方程:
这里得到的常数序列 ,就是粒子能量允许出现的取值,也就是能级。
这里顺便说一句,一个体系里允许的能级 ,在量子力学中被称作能量的本征值(Eigen Value),请记住这个词,它是我们理解方程物理意义的关键。
到这里,用薛定谔方程寻找能级的过程就说完了。
看起来是不是很简单?我们仅仅调用一下已经在前面的课程中练过手的分离变量法,就能解出允许出现的能级取值,这完全体验不到烧脑的感觉啊……
但是别忘了,我们在这里仅仅是对求解步骤做了一个简单介绍,而并没有真实地经历在具体的势能条件下求解 的过程。
相信我,等后面我们给出了具体的势能函数 ,真正动手求解的时候,就会发现岁月静好都是假象。真实情况是,哪怕面对的是所有元素中最简单的氢原子体系,求解过程都会让我们痛苦到怀疑人生。
但不管怎么样,如果我们不去纠结“为什么薛定谔方程解出来的 就是我们要找的能级”之类的深层次问题,仅仅就功利主义的目的而言,理解到这一步,就可以进入具体的物理场景中求解薛定谔方程(虽然很痛苦 )、去见识那些改变人类历史进程的神迹了。
不过,作者相信,本文的读者不会甘心就此打住,因为我们对于薛定谔方程的困惑实在太多:
比如波函数 以及特解序列 的物理意义是什么?又比如为什么体系允许的能级 必须通过求解薛定谔方程来得到?
这两个问题的背后,其实也就是我们将要回答的第二个问题:
如果要用两句话来回答这个问题,我们可以说:
定态薛定谔方程就是经典力学能量关系:
的量子版本。
而完整的薛定谔方程也可以看作牛顿第二定律的量子版本。
但是同学们要问了:这些方程的形式和经典力学看起来完全不像啊,怎么把它们联系起来呢?
在回答这个问题之前,我们还得追溯到一个更根本的问题:
进入量子力学世界的正确姿势是怎样的?
我们知道,在经典力学中,描述一个物理对象的状态时,我们用的是具体的、可以测量的力学量(如位置、速度、动量、能量等 )。
而在量子力学中,一个物理对象或体系的状态,只需要用一个抽象的东西来描述,它叫做“态矢量 (State Vector)”,也就是我们通常说的“量子态”。
(比如薛定谔的猫那种既生又死的状态就是态矢量的一个虚构的、但是很直观的版本…… )
而这个抽象的态矢量有一种定量化的、可用于计算的表述方式,这正是波函数
当然,有同学会很好奇:一个函数怎么和一个被称作“矢量”的玩意儿联系起来?
这个我们后面再来体会。
现在我们来关注一个更重要的问题:
在量子力学中,我们熟悉的经典力学量信息被扔到哪里去了?
毕竟,宏观世界与微观世界不是割裂的,所以,经典力学中能得到的信息,量子力学中也必须包含。
这个问题的答案也不难猜到:
经典力学量的信息当然应该都包含在波函数当中。
不过,这种说法还不够准确,更准确的说法是:
经典力学量的信息都以概率形式被包含在波函数当中。
换句话说,波函数不是一个具体的物理量,但它包含了所有经典力学量的概率信息。
这样一来,从字面上来说,波函数 的物理意义就清楚了:
它是一个包含了所有经典力学量概率信息的抽象物理量“态矢量”的具体化身。
(更准确地说,是在“坐标表象”下的具体化身,但这里我们不用去关注什么是“坐标表象”,有兴趣知道的同学可以关注本专栏另一个深度科普系列:从线性代数到量子力学)
那么具体怎么包含这些概率信息呢?
相信本文的读者都听说过薛定谔的猫吧,我们先用它来做一个不严谨的说明。
我们知道,在这个思想实验中,有一个盒子里装了三样东西:
一颗可能发生衰变的粒子、一台可以被粒子的衰变触发的杀猫神器、和一只万年网红猫。
当我们不打开盒子时,对于盒子外面的观察者而言,粒子的衰变状况就是一个不确定的状态,相应地、猫就处于一种“既生又死”的叠加态。
这种叠加态,就是一个典型的(虽然是虚构的 )态矢量,事实上,我们可以像向量的线性组合一样,将它表示成向量叠加的形式:
这里我们采用的是一种叫做“狄拉克符号”的记法,其中 就是描述“既生又死叠加态”的态矢量,而 表示观察到活猫的“活猫态”, 表示观察到死猫的“死猫态”。
将它表示成几何直观,就是这个样子:
也就是说,当我们不去观察猫时,猫实际所处的状态,是“活猫态” 和“死猫态” 的线性叠加,这在经典物理中不可能存在的状态,恰恰是量子力学的最大特征。
现在我们来说说概率信息:
刚才我们看到,猫的态矢量的线性叠加关系中,有两个叠加系数 ,这两个系数就包含了概率信息。
具体说来,就是当我们打开盒子观察猫的死活时,猫的状态会随机坍缩到“活猫态”和“死猫态”当中的一个,坍缩到“活猫态”的概率是 ,而坍缩到“死猫态”的概率是
这就是态矢量包含概率信息的原理。
我们来看两个真实的例子。
第一个例子,是我们在很多量子力学科普书上都看到过的,波函数的统计诠释:
一个粒子的波函数的模方 ,表示 时刻在 处找到这个粒子的概率密度。
这句话就描述了波函数如何包含粒子位置的概率信息,后面的课程中,我们会看到它给我们带来的好处。
不过,位置毕竟只是众多力学量中的一个,我们还要关注其他的力学量。
虽然其他力学量的概率信息不再像位置的概率信息那么明显,但我们仍然能找到它们。
比如我们接下来要说的第二个例子,也是我们最关注的能量。
在前面对薛定谔方程求解过程的描述中,我们知道,通过分离变量,求解关于坐标的那个定态薛定谔方程,我们能得到特解序列 以及相应的能级序列 。
而粒子处于某个能级的概率,就是通过特解序列 来计算的,我们马上来看。
类比弦振动方程和热传导方程,我们知道,如果给定了薛定谔方程的初始条件 ,那么 可以表示成 的级数和形式,即:
而这里的系数 的模方 就代表了能量的概率信息,说得具体一点,就是:
对于一个初始状态处于 的粒子,当我们去测量它的能量时,测得它处在能级 上的概率为 。
也就是说,在寻找能量的概率信息时,特解序列 扮演了一个非常关键的角色。
前面我们提到过,一个体系允许出现的能级 称作能量的本征值(Eigen Value)。
现在,我们也相应地将这个扮演关键角色的特解序列 称作能量的本征函数(Eigen Function)、或者叫做能量的本征态(Eigen State)。
这里对本征态的物理意义稍微多聊两句:
以能量本征态为例:一个粒子的波函数,通常是能量本征态的线性叠加(即前面给出的级数和 ),这也是所谓“叠加态”,此时能量是不确定的。但一旦我们去测量它的能量时,波函数就会随机坍缩到其中一个本征态上,此时能量就是确定的了。
所以,本征态的物理意义就是:对一个物理对象测量某个力学量,得到某个确定本征值的时候,粒子所处的量子态。
打个不恰当的比喻:在薛定谔的猫的例子中,如果将“猫的死活”看成一个“力学量”(虽然这是虚构的 ),那么“死猫”和“活猫”就是这个力学量的两个本征态。打开盒子观察猫的死活之前,猫的状态就是两个本征态的叠加,但一旦打开盒子看了猫之后,猫的状态就确定了,此时它必然随机坍缩到某个本征态上,不是死就是活,绝对不会又死又活。
不过需要注意的是,当粒子处于能量的某个本征态 、即具有确定的能量值 时,位置仍然是不确定的,此时位置的概率分布仍然由 计算。
而这个概率分布的一个直观的例子,就是原子核外各种形态的电子云,每一种电子云形态其实就对应了能量的一个本征态(准确说是三维情形下的 ),这个我们以后再解释:
而这个本征态的概念可以推广到任意力学量:
对于一个具体的物理对象,任意一个力学量 都会对应一组允许取值的本征值 (也就是经典力学中可以被测量到的值 )和相应的本征态 ,当我们将 表示成这些本征态的级数和 时,相应的系数的模方 就是测得该粒子 的概率。
由此,我们就看到了波函数如何包含经典力学量的概率信息。
而在量子力学中,某个力学量的本征值和本征态信息,其实也完整描述了这个力学量本身,从这个意义上说,本征值和本征态就是“一个力学量的ID”。
那么,怎样才能找到一个力学量的本征值和本征态呢?
这将通过求解所谓的“本征方程”来实现。
接下来的问题自然就是:本征方程长什么样?
前面我们提到“本征值”时,在括号里备注了它的英文: Eigen Value,而这个词的另一个中文翻译,是线性代数中的“特征值”,这不禁让我们浮想联翩:
也许本征方程和线性代数中的特征值理论有关?
我们这就回到线性代数中看看。
在线性代数中,一个矩阵与向量相乘的过程,可以看成是对向量的某种操作。
从结果上来说,一个“普通的”矩阵碰上一个“普通的”向量时,通常会对这个向量产生一些旋转加伸缩的合成效果,而且在不同的向量上会造成不同的旋转角度和伸缩系数。
不过,对于一个矩阵而言,我们总是能找到一组“不普通的”向量,使得这个矩阵作用在上面时,只产生伸缩的效果,而不会使其旋转。
这样的向量,就是这个矩阵的特征向量,而它伸缩的比例,就是相应的特征值。
写成矩阵相乘的形式,就是:
其中 是矩阵 的特征向量, 是相应的特征值。
现在我们回到量子力学,来看看这个关系式的一个失散多年的孪生兄弟。
温馨提示:以下内容可能因为过于抽象而引起不适。
量子力学中,一个力学量也会对应一个类似于矩阵的东西,我们将它称作“算符”,通常是在该力学量的符号上加一个小尖帽 。
比如,一个粒子的 坐标有“ 坐标算符”,记作 ;动量有动量算符,记作 。
而我们最关注的能量,也有能量算符,又叫哈密顿算符(Hamiltonian Operator,这是因为经典力学中能量又被称作哈密顿量),记作
是不是很头疼?这好端端的,怎么又冒出一堆新玩意儿来。
但不管怎么样,来都来了,我们还是问问这堆算符的物理意义是什么吧。
单独讨论算符的物理意义是比较困难的,但我们可以像矩阵作用在特征向量上面一样,将一个算符、比如哈密顿算符 作用在它的某个本征态 上面,形式上写成: ,这个时候就可以讨论物理意义了。
不严格地说,这个式子的物理意义可以理解为,对一个处于状态 的粒子测量它的能量。
而根据前面提到的本征态的物理意义,我们知道,此时我们会百分之百得到一个确定的能量值 ,测量结束之后,粒子的状态仍然处于 。
将这个物理过程写成一个关系式,就是:
不严格地说,这个公式的左边可以理解为测量行为,右边可以理解为测量结果。
而能量算符与能量本征态的这个关系,对于一般的力学量也成立,任意一个力学量 与它的本征态 之间也满足:
(其中 是本征态 对应的本征值 )
看,这个式子是不是和矩阵的特征向量关系式 形式上很像?
没错,这就是我们要找的本征方程的抽象形式。
(可以看到,力学量算符作用在波函数上,形式上和矩阵作用在向量上一样,这就是为什么我们将波函数又称作“态矢量”的原因 )
不过,这个抽象形式看起来虽然很有道理的样子,但还是不能当饭吃。毕竟,我们拿着本征方程是要找出本征值和本征态的。
所以接下来,我们要来关注本征方程的具体计算。
实际上,如果知道了力学量算符的某种具体的、可以计算的形式,那么从理论上说,本征值和本征态就可以通过本征方程被解出来。
那么,这些算符的具体的形式长什么样呢?
在线性代数中,我们知道,它们就是一个个具体的矩阵。
而在量子力学中,算符的花样会比较多:它们有时候表现成一个(无穷维的 )矩阵,有时候又是一个函数,甚至有时候还会变成其他骨骼清奇的怪物……
我们还是以我们最关注的能量算符、也就是哈密顿算符 为例来具体看一看。
我们先从形式上写出能量的本征方程:
由于能量本征值 即本征态 都已经有了具体的值或函数形式,因此接下来的任务,就是要找出哈密顿算符的具体形式(坐标表象下 )。
这需要我们从牛顿力学中寻找一些启示。
在牛顿力学中,我们知道,一个体系的总能量(单指机械能 )是动能与势能之和,即:
而动能:
于是:
这个关系式可以直接照搬到算符上面来,我们将动量算符记为 、势能算符记为 ,那么我们可以形式上写出哈密顿算符(能量算符 )与动量、势能算符之间的关系:
之所以要写成这样的形式,是因为动量和势能两个算符的具体形式(坐标表象下 )是我们可以直接给出来的。
先说简单的:势能算符 ,可以直接表示成势能关于坐标的函数
而动量算符 (只讨论一维情形 ),就是我们前面说的“骨骼清奇的怪物”的一个例子,它是一个微分算子:
(这个关系式的由来说来话长,这里不展开,还是在那个深度科普系列 从线性代数到量子力学 中,有一个不严谨但相对易于理解的说明 )
将这两个式子代入哈密顿算符关系式中,得:
再将哈密顿算符代入能量本征方程中,我们就得到:
由于本征函数 只是 的函数,因此上式中对坐标的偏导可以写成 ,于是方程化为:
还认识它吗?它就是我们前面分离变量得到的定态薛定谔方程!
到这里,我们终于可以来理一理薛定谔方程的含义了。
首先,刚才我们已经看到,分离变量后得到的定态薛定谔方程,本质上就是能量本征方程的一个具体形式,它描述的是能量的哈密顿算符与能量本征值、本征态之间的关系。
这样一来,“求解薛定谔方程可以得到能量的本征值”这个结论从逻辑上说就没有什么违和感了。
现在我们再简单说说薛定谔方程本尊,虽然它对我们这个系列来说其实并不那么重要。
根据我们前面给出的哈密顿算符的关系式,我们可以将薛定谔方程写成抽象形式:
从这个式子可以看出,它其实描述的是态矢量的时间演化规律与体系能量之间的关系,或者说得更通俗一点,描述的是量子态的动力学规律。
这也就是为什么我们常常将薛定谔方程比作“量子力学中的牛二定律”。
顺便提一句,这个演化规律背后,还涉及到一些更深层次的物理意义,不过这需要涉及到分析力学、李群等离我们这个系列有些遥远的知识,我们就不继续深究了。
毕竟,仅仅从实用主义的角度来说,我们其实只需要关注定态薛定谔方程就足够了。
能将这篇烧脑文坚持读到最后的同学,你们真的不容易。
说实话,其实文章写到最后,作者也不敢确定,是否真的能对零基础的同学讲清楚薛定谔方程的含义,毕竟篇幅那么短、信息量那么多、而量子力学又那么抽象。
如果没有完全读懂文中内容,又想了解更多,可以看看文中一直安利的另一个深度科普系列:
那个系列更侧重于讲述量子力学背后精妙的数学体系,节奏也比这篇文章慢得多,有兴趣的同学可以去瞧瞧。
但不管有没有完全理解薛定谔方程,对于理解它的应用而言,我们只需要知道一点就够了:
薛定谔方程能给出体系能量的本征态和本征值(也就是能级 )的信息,这是我们从第一性原理上理解化学元素的周期律和化学性质、理解材料的一些宏观物性、以及理解半导体原理的关键。
正是这个关键信息,带来了二十世纪灿烂的物质文明。
接下来的几篇中,我们将见识到这一点。
上一篇:宇宙灵气能量学-下篇
下一篇:激光的功率密度与能量密度