什么是能量?如果你是一位物理初学者,你的脑中浮现出来的可能是动能、势能、热能、电能等一系列东西. 但多加思考你便会感到非常不舒服——明明都是能量,为什么有这么多种?我们不妨挑几个列出来看看它们长什么样.
首先是动能. 我们想象一个质量为 m 的小球在光滑的地面上做匀速直线运动. 我们从 t=0 时刻开始计时,在 t 时刻,它的位置可以由一个从原点指向小球的矢量 \vec{r} 来表示,那么它的动能显然是 E_{k}=\frac{1}{2}m\left(\frac{r}{t}\right)^2\\接着是势能. 还是这个小球,我们将它提起到距离零势面上方高度为 r 的地方,那么它的重力势能 E_g=mgr\\然后是静电势能. 在一个与点电荷 q_1距离为 r 的地方放入一个试探电荷 q_2 ,它具有的静电势能 E_e=k\frac{q_1q_2}{r}\\
下面再来看看动量. 对于上面第一个情景来说,小球的动量就是 P=m\frac{r}{t}\\
我们来看看,它们有什么共同点?聪明的你一定一眼就看出,上面所有的表达式中都含有 r 这个量,而余下的其他物理量则只和系统本身有关. 为什么 r 如此特殊?我们很自然地引入广义坐标这个概念.
在讨论广义坐标之前,我们应该先搞清楚什么是坐标. 相信大家对空间坐标已经很熟悉了:如果我告诉你一组数 (x,y,z) ,你就可以找到与其相对应的位置,并且这个位置是唯一的,那么这组数中的 x,y,z 就是这个位置的三个坐标(分量). 在这里我们暂且忽略坐标的严格数学定义,将其理解为这样一个“数组到位置”的唯一映射就足够了.
那么什么是广义坐标呢?我们知道,几个坐标可以用于确定一个位置,而广义坐标确定的是一个物理系统的状态. 这是什么意思呢?比如说,对于磨坊里的一个水磨,我唯一需要关心的是这个水磨的转动,而不是它的其他运动. 因此,为了确定它的转动位置,我只需要知道它相对于参考位置所转过的角度 \phi 就足够了. 这个角度 \phi 就是这个水磨系统的一个广义坐标. 同理,对于一个做匀速直线运动的小球而言,一个运动距离 r 就足够概括整个系统的状态了. 总之我们可以说,广义坐标是用于描述系统状态的物理量.
我们现在知道,为了描述一个物理系统的状态,我应该去找到一些广义坐标. 那么问题是,为了*完整地*描述一个物理系统的状态,我一共需要找到多少广义坐标?
对于二维平面上的一个点,为了描述它的位置,我最少需要 (x,y) 两个量. 而在三维空间中,我需要 (x,y,z) 三个量. 类似地,如果我为了描述一个物理系统的状态,最少需要用到 n 个广义坐标 (q_1,q_2,\dots,q_n)\\那么 n 就是这个物理系统的自由度. 也就是说,对于一个自由度为 n 的物理系统,我最少需要 n 个广义坐标 q_1,q_2,\dots,q_n 才能够完整地描述它的状态.
但为了完整地描述一个系统,只有广义坐标是不够的,因为系统不是静态的,它还会运动. 因此我们要引入广义速度的概念.
我们回顾一下那个做匀速直线运动的小球. 在那个系统中,为了确定整个系统的状态,我们需要一个广义坐标 r . 但同时,我们还关心这个系统将要如何演化,于是我们求出了小球的速度 v=\frac{dr}{dt}=\dot{r}\\我们使用在 r 上面加一个点的记号来表示与坐标 r 相对应的速度,即 \dot{r}=\frac{dr}{dt} .
同样,对于那个水磨来说,除了关心它转过的角度 \phi ,我们还关心它转动的速度有多快,即转动的角速度 \dot{\phi} .
对于一个物理系统,如果它的广义坐标是 q_1,q_2,\dots,q_n ,那么这些广义坐标对时间的一阶全导数便是对应的广义速度 \dot{q_1},\dot{q_2},\dots,\dot{q_n}\\
现在,我们有了广义坐标 q_i 和广义速度 \dot{q_i} ,也就可以描述这个系统此刻与接下来一小段时间内的状态了. 或许你会问:加速度呢?我们都学过牛顿运动定律 \vec{F}=m\vec{a} ,其中加速度 \vec{a} 是位矢 \vec{r} 对时间的二阶全导数,即 \vec{a}=\ddot{\vec{r}}\\类似地,广义速度 \dot{q_i} 是用于预判广义坐标 q_i 的走位的. 那么为了描述这个系统,我们还需要引入一个广义加速度 \ddot{q_i} 用于预判广义速度 \dot{q_i} . 至于你问我为什么不需要一个三阶或更高的量?我也只能告诉你:目前为止,上帝说了算.
但从数学上而言,广义加速度 \ddot{q_i} 是不需要被独立确定的. 显然,当某一时刻的广义坐标 q_i 和广义速度 \dot{q_i} 都确定了,相应的广义加速度 \ddot{q_i} 作为广义速度对时间的导数,也就被唯一地确定了.
现在,我们距离完整地描述一个物理系统越来越近了!我们有了广义坐标 q_i 和广义速度 \dot{q_i} ,但是我们都知道,单纯这几个物理量之间必须要有某种关联——某种受物理法则所支配的关联. 也就是说,为了去描述、预测一个物理系统的演化,我们需要一个物理量把这两个东西打包起来. 于是,我们有了一个函数 \mathcal{L}(q,\dot{q})\\其中我们简略地将所有的广义坐标和广义速度打包起来: q=(q_1,q_2,...,q_n)\\ \dot{q}=(\dot{q_1},\dot{q_2},...,\dot{q_n})\\由于物理系统是随时间不断演化的,因此上面的所有东西都应该是时间的函数,即
q=q(t)\\ \dot{q}=\dot{q}(t)\\ \mathcal{L}=\mathcal{L}(q,\dot{q},t)\\我们把这个函数 \mathcal{L}(q,\dot{q},t) 称为拉格朗日量. 对于一个物理体系来说,拉格朗日量的具体形式确定了,这个物理系统的演化就完全确定了. 也就是说,一个物理系统的拉格朗日量包含了这个系统演化的所有基本信息. 它的重要性自然不需要我多说了.
我们的基础知识准备得差不多了,下面我们可以开始进入物理法则的部分了.
Almost there...
哈密顿原理,也称最小作用量原理,可以毫不夸张地说是近现代物理学最重要的原理之一. 目前为止,除去唯象的一些理论,哈密顿原理可以导出*所有*物理定律. 我们完全有理由相信,哈密顿原理是我们这个宇宙最基本的物理原理之一. 如此重量级的物理原理,我们还得从作用量讲起.
我们刚刚已经构建了一个物理系统的拉格朗日量 \mathcal{L}(q,\dot{q},t) ,接下来我们更进一步:新定义一个量 S=\int_{t_1}^{t_2}\mathcal{L}(q,\dot{q},t)dt\\我们将这个量称为系统的作用量. 作用量是在一段时间 [t_1,t_2] 内拉格朗日量对时间的积分,就像拉格朗日量本身一样,它也包含了物理系统演化的所有基本信息.
而哈密顿原理告诉我们:一个物理系统的演化应时刻保持作用量 S 的值最小. 你问我为什么?到目前为止,上帝说了算.
Anyway, 我们假设一个物理系统在任意一段时间 [t_1,t_2] 之内,从 q(t_1) 演化到了 q(t_2) . 我们现在来思考,这个系统有多少种演化方式能够使作用量 S 最小呢?
比如:当系统演化到 q(t) 的时候,我们让它稍微偏离一点轨迹,比如说偏离到 q(t)+\delta q(t) . 那么相应地,整个演化过程的作用量也会由 S 偏离到 S+\delta S .
我们假设,在 q(t) 的演化方式中,作用量 S 已经是最小值了,那么哈密顿原理告诉我们,必须有S \leq S+\delta S\\由于在任意一段时间 \delta t 内,上面的关系始终成立,我们取 \delta t \rightarrow 0 . 那么,对应的变化量 \delta q \rightarrow0\\ \delta \dot{q} \rightarrow 0\\
\delta S \rightarrow 0\\
因为系统演化的起点 (t_1) 和终点 (t_2) 始终不变,于是有
\delta q(t_1)=\delta q(t_2)=0\\由于 \delta q 和 \delta \dot{q} 所引起的作用量变化
\delta S =\int_{t_1}^{t_2}\mathcal{L}(q+\delta q,\dot{q}+\delta \dot{q},t)dt-\int_{t_1}^{t_2}\mathcal{L}(q,\dot{q},t)dt=0\\或是写成 \delta S =\delta\int_{t_1}^{t_2}\mathcal{L}(q,\dot{q},t)dt+\int_{t_1}^{t_2}\mathcal{L}(q,\dot{q},t)dt-\int_{t_1}^{t_2}\mathcal{L}(q,\dot{q},t)dt\\ 所以哈密顿原理可以写成 \delta S=\delta \int_{t_1}^{t_2}\mathcal{L}(q,\dot{q},t)dt=0\\
从哈密顿原理出发,我们可以导出著名的拉格朗日方程.
我们接着上面的推导,将被积函数拆开: \delta \int_{t_1}^{t_2}\mathcal{L}(q,\dot{q},t)dt=\int_{t_1}^{t_2}\left(\frac{\partial \mathcal{L}}{\partial q}\delta q+\frac{\partial \mathcal{L}}{\partial \dot{q}}\delta \dot{q}\right)dt=0\\由于 \delta\dot{q}=\frac{d(\delta q)}{dt} ,有 \int_{t_1}^{t_2}\left(\frac{\partial \mathcal{L}}{\partial q}\delta q+\frac{\partial \mathcal{L}}{\partial \dot{q}}\frac{d(\delta q)}{dt}\right)dt=0\\观察到
\frac{d}{dt}\left(\frac{\partial \mathcal{L}}{\partial \dot{q}}\delta q\right)=\frac{d}{dt}\frac{\partial \mathcal{L}}{\partial \dot{q}}\delta q +\frac{\partial \mathcal{L}}{\partial \dot{q}} \frac{d(\delta q)}{dt}\\我们将右边第二项代入得到 \int_{t_1}^{t_2}\left(\frac{\partial \mathcal{L}}{\partial q}\delta q+\frac{d}{dt}\left(\frac{\partial \mathcal{L}}{\partial \dot{q}}\delta q\right)-\frac{d}{dt}\frac{\partial \mathcal{L}}{\partial \dot{q}}\delta q\right)dt=0\\整理一下 \int_{t_1}^{t_2}\left(\frac{\partial \mathcal{L}}{\partial q}-\frac{d}{dt}\frac{\partial \mathcal{L}}{\partial \dot{q}}\right)\delta qdt+\int_{t_1}^{t_2}d\left(\frac{\partial \mathcal{L}}{\partial \dot{q}}\delta q\right)=0\\
于是就有 \int_{t_1}^{t_2}\left(\frac{\partial \mathcal{L}}{\partial q}-\frac{d}{dt}\frac{\partial \mathcal{L}}{\partial \dot{q}}\right)\delta qdt+\left(\frac{\partial \mathcal{L}}{\partial \dot{q}}\delta q\right)_{t_1}^{t_2}=0\\由于 \delta q(t_1)=\delta q(t_2)=0\\所以左边的第二项消失了. 原方程就变成了 \int_{t_1}^{t_2}\left(\frac{\partial \mathcal{L}}{\partial q}-\frac{d}{dt}\frac{\partial \mathcal{L}}{\partial \dot{q}}\right)\delta qdt=0\\我们发现, \delta q 是可以任取的,因此为了满足这条方程,括号里的东西就必须为零,因此 \frac{\partial \mathcal{L}}{\partial q}-\frac{d}{dt}\frac{\partial \mathcal{L}}{\partial \dot{q}}=0\\这就是简洁优雅的拉格朗日方程.
在处理物理问题的时候,如果你能够正确写出系统的拉格朗日量,只需要代入上面的方程,系统的演化方程就会自然而然地蹦出来,而不再需要做任何受力分析了. 然而,目前我们并不关心这个,我们的目标是推导能量和动量守恒关系.
Tips:细心观察,你还会发现,拉格朗日量对系统演化的影响是不受常数影响的:如果我将系统的拉格朗日量从 \mathcal{L} 变为 \mathcal{L}+const. ,拉格朗日方程并不会发生任何改变. 这个性质也正是系统势能的“零势点”通常能够自由选取的理由.
为了得到能量守恒定律,我们还需要时间平移不变性的事实.
直白地说,时间平移不变性指的是:
没有哪个时间点是特殊的,所有的物理定律并不会随着时间改变.
但为了将它纳入我们的推导,我们需要将它翻译为数学语言. 事实上,时间平移不变性是指:当时间坐标从 t 变为 t+\Delta t 时,系统的拉格朗日量形式不变,即 \mathcal{L}(q,\dot{q},t)=\mathcal{L}(q,\dot{q},t+\Delta t)\\也就是说,系统所遵循的物理规律并不会随系统的演化而改变.
为了得到动量守恒定律,我们还需要空间平移不变性的事实.
与时间类似,空间平移对称性是指:
没有哪个空间位置是特殊的,所有的物理定律不会随着空间位置改变.
相应的数学语言就是 \mathcal{L}(q,\dot{q},t)=\mathcal{L}(q+\Delta q,\dot{q},t)\\
几经波折,我们终于来到了这里——能量守恒和动量守恒定律. 下面让我们完成最后一点优雅的操作.
能量守恒定律是基于哈密顿原理与时间平移不变性的一个推论. 现在,我们来根据时间平移不变性来寻找这个守恒量.
首先,我们想要知道拉格朗日量 \mathcal{L}(q,\dot{q},t) 随时间的变化情况,因此我们对它求时间的全导数 \frac{d\mathcal{L}}{dt}=\sum_i \frac{\partial \mathcal{L}}{\partial q_i}\dot{q_i}+\sum_i \frac{\partial \mathcal{L}}{\partial \dot{q_i}}\ddot{q_i}+\frac{\partial \mathcal{L}}{\partial t}\\
由于时间平移不变,即 \mathcal{L}(q,\dot{q},t)=\mathcal{L}(q,\dot{q},t+\Delta t) ,所以有 \frac{\partial \mathcal{L}}{\partial t}=0\\现在,我们使用拉格朗日方程,做代换 \frac{\partial \mathcal{L}}{\partial q_i}=\frac{d}{dt}\frac{\partial \mathcal{L}}{\partial \dot{q_i}}\\于是得到 \frac{d\mathcal{L}}{dt}= \sum_i \left( \frac{d}{dt}\frac{\partial \mathcal{L}}{\partial \dot{q_i}}\dot{q_i}+\frac{\partial \mathcal{L}}{\partial \dot{q_i}}\ddot{q_i}\right)=\sum_i \frac{d}{dt}\left(\dot{q_i}\frac{\partial \mathcal{L}}{\partial \dot{q_i}}\right)\\进行一下移项,我们得到 \frac{d}{dt}\left(\sum_i \dot{q_i}\frac{\partial \mathcal{L}}{\partial \dot{q_i}}-\mathcal{L}\right)=0\\两端积分,得到 \sum_i \dot{q_i}\frac{\partial \mathcal{L}}{\partial \dot{q_i}}-\mathcal{L}=const.\\可以看到,这个量是一个不随时间变化的守恒量,由此定义 E\equiv\sum_i \dot{q_i}\frac{\partial \mathcal{L}}{\partial \dot{q_i}}-\mathcal{L}\\为这个物理系统的能量.
这就是我们熟知的能量守恒定律. 可以看到,能量这个物理量并非空穴来风,它是我们在哈密顿原理和时间平移不变性的指导下,自然导出的一个守恒量,仅此而已.
与能量守恒类似,动量守恒的指导原理是哈密顿原理和空间平移不变性.
我们考虑赋予整个物理系统一个微小的位移 \epsilon ,那么系统拉格朗日量的改变量为 \delta \mathcal{L}=\sum_i \frac{\partial \mathcal{L}}{\partial q_i}\delta q_i=\epsilon \sum_i \frac{\partial \mathcal{L}}{\partial q_i}\\由于空间平移不变,所以 \delta \mathcal{L}=0 . 考虑到位移 \epsilon 可以任取,因此必须有 \sum_i \frac{\partial \mathcal{L}}{\partial q_i}=0\\我们再次使用拉格朗日方程,做代换 \frac{\partial \mathcal{L}}{\partial q_i}=\frac{d}{dt}\frac{\partial \mathcal{L}}{\partial \dot{q_i}}\\于是我们得到 \frac{d}{dt}\sum_i \frac{\partial \mathcal{L}}{\partial \dot{q_i}}=0\\两端积分,得到 \sum_i \frac{\partial \mathcal{L}}{\partial \dot{q_i}}=const.\\可以看到,这个量是一个不随时间变化的守恒量,由此定义 P\equiv \sum_i \frac{\partial \mathcal{L}}{\partial \dot{q_i}}\\为这个物理系统的动量.
这就是我们所熟知的动量守恒定律. 事实上,由于各个广义坐标之间相互独立,我们可以将动量 P 写作一个 n 维矢量,即 \vec{P}=\frac{\partial \mathcal{L}}{\partial \vec{r}}\\其中 \vec{r}=(\dot{q_1},\dot{q_2},...,\dot{q_n})^T\\
经过一番捣腾,我们十分优雅地导出了能量守恒和动量守恒定律. 如果你能够静下心来,一步一步从最基本的假设一路走到以上两条守恒律,我相信你也一定也会被它的优雅所折服. 这已经是我不知多少次推导这两条定律了,尽管简洁,但每次的操作都会让我想起初次推导时的震撼.
码字也码了挺久的,或许之后有时间了会把这篇续写成一篇完整的分析力学笔记吧(笑).
^ L.D.Landau. Course of Theoretical Physics, Volume 1. (2-15)
上一篇:营销关键词之「渠道」
下一篇:财富传承,这四种观念你必须掌握