从原理到运动方程
广义坐标
略去质点、径矢、速度、加速度等基本概念的介绍. 为了确定 $N$ 个质点组成的系统在空间的位置, 需要给定 $N$ 个径矢. 在我们生活的三维欧氏空间中, 需要给定 $3N$ 个坐标. 通常唯一地确定系统位置所需独立变量的数目称为系统的自由度, 这些独立变量不一定是质点的 Descartes 坐标, 根据问题的条件, 有时选取其他坐标更方便.
对于 $s$ 个自由度的系统, 可以完全刻画其位置的任意 $s$ 个变量 $q_1,q_2,\cdots,q_s$ 称为该系统的广义坐标, 其导数 $\dot q_l$ 称为广义速度.
只是给定广义坐标的数值, 并不能确定系统在给定时刻的 “力学状态”, 因为还不足以预测下一时刻系统的位置. 对于给定的广义坐标值, 系统可以具有任意的速度, 因此下一时刻系统的位置可能不同.
经验表明, 同时给定系统的所有广义坐标和速度就可以确定系统的状态, 并且原则上也可以预测以后的运动. 从数学观点看, 某时刻给定所有广义坐标 $q$ 和速度 $\dot q$ 就唯一地确定了该时刻的加速度 $\ddot q$.
值得澄清的是, 读者可能与曾经的笔者一样抱有错误的理解: 要决定下一时刻的 $\dot q$, 我们应当需要 $\ddot q$ 呀! 然而正确的理解应当是, 我们可以把每一时刻的 $q$ 与 $\dot q$ 当作一帧, $q$ 是这一帧的图像内容, $\dot q$ 是这一帧自带的运动模糊. 客观世界就像播放器一样, 读取到了当前的 $q$ 和 $\dot q$, 立刻计算出下一帧应该怎样绘制. 假如需要 $\ddot q$, 那么请设想两个一模一样的运动场景, 却可能因为一个看不见的 “初始加速度” 参数而导致下一帧完全不同. 这与自然规律相违背, 是不可能的.
加速度与坐标、速度的关系式称为运动方程. 对于函数 $q(t)$ 来说, 这个关系式是二阶微分方程, 原则上可以通过积分求出 $q(t)$ 进而确定系统的运动轨迹.
运动微分方程
Hamilton 原理
Hamilton 原理指出, 每一个力学系统都可以用一个确定的函数 $L(q_1,q_2,\cdots,q_s,\dot q_1,\dot q_2,\cdots,\dot q_s,t)$ 所表征. 假设在时刻 $t=t_1$ 和 $t=t_2$ 系统的位置由两组坐标 $q^{(1)}$ 和 $q^{(2)}$ 确定, 那么系统在这两个位置之间的运动使得 $\displaystyle S=\int_{t_1}^{t_2}L(q,\dot q,t)\mathrm dt$ 取最小值. $L$ 称为给定系统的 Lagrange 函数, $S$ 则称为作用量, 因此该原理又称作最小作用量原理.
Lagrange 函数中只包含 $q$ 和 $\dot q$, 而不包含更高阶导数 $\ddot q, \dddot q, \cdots$, 这反映了我们讨论过的物理事实: 系统的力学状态完全由坐标和速度确定.
为了方便书写, 假设系统仅有一个自由度, 只需确定一个 $q(t)$. 假设 $q=q(t)$ 是使 $S$ 取最小值的函数, 即用任意函数 $q(t)+\delta q(t)$ 代替 $q(t)$ 都会使 $S$ 增大, 其中 $q(t)$ 的变分 $\delta q(t)$ 从 $t_1$ 到 $t_2$ 的整个时间间隔内都是小量. 由于新的这个函数在 $t=t_1$ 和 $t=t_2$ 也应该分别取值 $q^{(1)}$, $q^{(2)}$, 于是应当有 $\delta q(t_1)=\delta q(t_2)=0$.
用 $q(t)+\delta q(t)$ 代替 $q(t)$ 使得 $S$ 产生增量
\[\int_{t_1}^{t_2}L(q+\delta q,\dot q+\delta\dot q, t)\mathrm dt-\int_{t_1}^{t_2}L(q,\dot q, t)\mathrm dt\]这个差按照 $\delta q$ 和 $\delta\dot q$ 的幂级数展开式是从一阶项开始的, $S$ 取最小值的必要条件是这些项之和, 即积分的一阶变分等于 $0$. 于是最小作用量原理可以写成
\[\boxed{\delta S=\delta\int_{t_1}^{t_2}L(q,\dot q, t)\mathrm dt=\int_{t_1}^{t_2}\left(\frac{\partial L}{\partial q}\delta q+\frac{\partial L}{\partial\dot q}\delta\dot q\right)\mathrm dt=0}\]务必注意变分符号 $\delta$ 与微分符号 $\mathrm d$ 的区别. 根据求导与变分运算可交换的性质, 有 $\delta\dot q=\dfrac{\mathrm d}{\mathrm dt}\delta q$, 进行分部积分可得
\[\delta S=\frac{\partial L}{\partial\dot q}\delta q\Bigg\vert_{t_1}^{t_2}+\int_{t_1}^{t_2}\left(\frac{\partial L}{\partial q}-\frac{\mathrm d}{\mathrm dt}\frac{\partial L}{\partial \dot q}\right)\delta q\mathrm dt=0\]第一项等于 $0$, 剩下的积分应该在 $\delta q$ 任意取值的时候都等于 $0$. 因此只能成立
\[\boxed{\frac{\partial L}{\partial q}-\frac{\mathrm d}{\mathrm dt}\frac{\partial L}{\partial\dot q}=0}\]对于有 $s$ 个自由度的系统, 在最小作用量原理中有 $s$ 个不同的函数 $q_l(t)$ 应该独立地变分, 所以可以得到 $s$ 个方程 $\displaystyle \frac{\partial L}{\partial q_i}-\frac{\mathrm d}{\mathrm dt}\frac{\partial L}{\partial\dot q_i}=0$, 其中 $i=1,2,\cdots, s$. 这就是运动微分方程, 又称 Lagrange 方程. 这是包含 $s$ 个未知函数 $q_i(t)$ 的 $s$ 个二阶微分方程组, 这个方程组的通解包含 $2s$ 个任意常数. 为了确定这些常数, 从而完全确定力学系统的运动, 必须知道描述系统在某给定时刻状态的初始条件, 例如坐标和速度的初值.
可加性
考虑两个彼此距离极远、完全没有相互作用的系统 $A$ 和 $B$ 时, 经验告诉我们它们的运动是独立的. 即, 如果系统 $A$ 的运动状态完全由它的 $q_A, \dot q_A$ 决定, 而系统 $B$ 也是如此,那么整个大系统的 Lagrange 函数必然具有可加性. 这种可加性要求 $L_{total} = L_A(q_A, \dot q_A) + L_B(q_B, \dot q_B)$, 只有这样, 当我们对 $q_A$ 进行变分时, 产生的 Lagrange 方程才不会出现任何关于 $q_B$ 的项.
非唯一性
如果两个 Lagrange 函数 $L$ 和 $L’$ 满足 $L’(q,\dot q, t)=L(q, \dot q, t)+\dfrac{\mathrm d}{\mathrm dt}f(q,t)$, 那么它们给出的 Lagrange 方程应当是完全相同的. 这一点是显然的, 作用量 $S’$ 比 $S$ 多出一项
\[\Delta S=\int_{t_1}^{t_2}\frac{\mathrm df}{\mathrm dt}\mathrm dt\]在变分过程中, 由于我们固定了始点和终点的坐标, 这个增量 $\Delta S$ 的变分恒等于 $0$, 因此 $\delta S’=0$ 和 $\delta S=0$ 导出的物理轨迹是一致的.
从这个角度再看独立性, 可以得出, 任何破坏独立性的交叉项, 如果无法被写成形如
\[\dfrac{\mathrm df}{\mathrm dt}=\dfrac{\partial f}{\partial q}\dot q+\dfrac{\partial f}{\partial t}\]的关于时间和坐标的全导数项, 都会导致运动方程耦合, 从而违反 “独立运动” 的物理事实.
伽利略相对性原理
为了研究力学现象, 必须选择参考系. 一般来说运动规律在不同的参考系下具有不同的形式, 我们需要考虑如何选择参考系使得力学规律在形式上最为简单.
惯性参考系
相对于任意参考系, 空间是非均匀且各向异性的. 这就是说, 如果某个物体与其他物体之间没有相互作用, 它在空间中的不同位置和不同指向在力学意义上是不等价的. 同样, 一般情况下任意参考系中时间也是非均匀的, 即不同时刻也是不等价的. 时间和空间的这些性质使得力学现象的描述变得复杂.
想象你在一个高速旋转的转盘上观察一个放在转盘外地面的小球. 小球离转盘中心越远, 你观察到的它受到的 “惯性离心力” 就越大。这意味着, “空间中的不同位置” 对这个小球的力学表现是不一样的——靠近中心是一个样, 靠近边缘是另一个样. 如果你把球沿半径方向扔, 和你沿切线方向扔, 小球的轨迹受力表现完全不同, 这意味着 “不同指向” 是不等价的. 如果这个转盘还在不断加速旋转, 那么你在 $t_1$ 时刻看小球,和在 $t_2$ 时刻看小球,它的运动规律又变了, 这就是 “不同时刻” 的不等价.
然而存在这样一种参考系, 空间相对它是均匀、各向同性的, 时间相对它是均匀的. 这种参考系称为惯性参考系, 其中某个时刻静止的自由物体将会永远静止.
对于在惯性参考系中自由运动的质点, 时间和空间的均匀性意味着其 Lagrange 函数不显含质点径矢 $\boldsymbol r$ 和时间 $t$, 即 $L$ 只能是速度 $\boldsymbol v$ 的函数. 而且由于空间各向同性, Lagrange 函数也不依赖于 $\boldsymbol v$ 的方向, 也就是 $L=L(v^2)$. 由于 Lagrange 函数不显含质点的径矢 $\boldsymbol r$, 可知 $\dfrac{\partial L}{\partial\boldsymbol v}=0$, 所以 Lagrange 方程可以写作
\[\dfrac{\mathrm d}{\mathrm dt}\dfrac{\partial L}{\partial\boldsymbol v}=0\]由此可得 $\dfrac{\partial L}{\partial\boldsymbol v}=\text{const.}$, 又因为 $\dfrac{\partial L}{\partial\boldsymbol v}$ 只是速度的函数, 所以 $\boldsymbol v=\text{const.}$. 由此可见, 惯性参考系中, 质点任何自由运动的速度和大小都不改变, 这就是惯性定律.
伽利略变换
如果在我们已有的这个惯性参考系以外, 再引进一个相对它作匀速直线运动的惯性参考系, 则相对于这两个参考系的自由运动规律完全相同, 即自由运动仍是匀速直线运动. 实验证明, 不仅自由运动规律对这两个参考系完全相同, 所有力学关系是相对这两个参考系都是等价的. 因此存在没有先后顺序的无穷多个惯性参考系相互作直线运动, 这些参考系中时间和空间性质都是相同的, 力学规律也是相同的. 这个结论称为伽利略相对性原理.
设有两个不同的参考系 $K$ 和 $K’$, 其中 $K’$ 相对于 $K$ 以速度 $\boldsymbol V$ 运动, 同一个质点相对这两个参考系的坐标 $\boldsymbol r$ 和 $\boldsymbol r’$ 满足 $\boldsymbol r= \boldsymbol r’+\boldsymbol Vt$ 另外在经典力学中, 成立绝对时间假设 $t=t’$ 此二公式称为伽利略变换. 伽利略相对性原理可以表述为力学运动方程在伽利略变换下具有不变性.
自由质点的 Lagrange 函数
我们来推导质点相对于惯性参考系的自由运动. 这种情况下, Lagrange 函数只能依赖于 $v^2$, 我们来确定这个依赖关系的形式.
惯性参考系 $K$ 相对于另一惯性参考系 $K’$ 以无穷小速度 $\boldsymbol\varepsilon$ 运动. Lagrange 函数 $L(v^2)$ 经过伽利略变换后得到 $L’$, 由于在所有惯性参考系中运动方程的形式都相同, 所以这两者只能相差某个关于时间和坐标函数的全导数. 这一点请检查 “非唯一性” 部分. 因此有
\[L'=L(v'^2)=L(v^2+2\boldsymbol v\cdot\boldsymbol\varepsilon+\varepsilon^2)\]展开为 $\boldsymbol\varepsilon$ 的幂级数, 忽略一阶以上的无穷小, 得到
\[L'=L(v^2)+2\dfrac{\partial L}{\partial v^2}\boldsymbol v\cdot\boldsymbol\varepsilon\]只有当该等式右边第二项与速度 $\boldsymbol v$ 呈线性依赖关系时它才是时间的全导数. 因此 $\dfrac{\partial L}{\partial v^2}$ 不依赖于速度, 即该情况下, Lagrange 函数可以写作 $L=\frac{m}{2}v^2$其中 $m$ 为常数, 称为质点的质量.
进一步地, 若 $K$ 以有限速度 $\boldsymbol V$ 相对于 $K’$ 运动, 成立
\[L'=\frac m2v'^2=\frac m2(\boldsymbol v+\boldsymbol V)^2=\frac m2v^2+2\frac m2\boldsymbol v\cdot\boldsymbol V+\frac m2V^2=L+\frac{\mathrm d}{\mathrm dt}\left(2\frac m2\boldsymbol r\cdot\boldsymbol V+\frac m2V^2t\right)\]第二项是时间的全导数, 因此 Lagrange 函数仍然满足此原理.
根据 Lagrange 函数的可加性, 对于没有相互作用的质点组成的自由质点系, 成立
\[L=\sum_a\frac{m_av_a^2}2\]需要指明的是, 只有考虑到可加性, 给出的质量定义才有实际的物理意义. 容易看出质量不可能是负的, 否则考虑作用量积分, 可以取到绝对值任意大的负值而没有最小值.
另外, 根据 $v^2=\left(\dfrac{\mathrm dl}{\mathrm dt}\right)^2$, 为了得到 Lagrange 函数, 只需要求出特定坐标系中弧长微元 $\mathrm dl$ 的平方. 例如
- 在 Descartes 坐标系中成立 $\mathrm dl^2=\mathrm dx^2+\mathrm dy^2+\mathrm dz^2, \; L=\dfrac m2(\dot x^2+\dot y^2+\dot z^2)$ ;
- 在柱坐标系中 $\mathrm dl^2=\mathrm dr^2+r^2\mathrm d\varphi^2+\mathrm dz^2, \; L=\dfrac m2(\dot r^2+r^2\dot\varphi^2+\dot z^2)$ ;
- 在球坐标系中 $\mathrm dl^2=\mathrm dr^2+r^2\mathrm d\theta^2+r^2\sin^2\theta\mathrm d\varphi^2, \; L=\dfrac m2(\dot r^2+r^2\dot \theta^2+r^2\sin^2\theta\dot\varphi^2)$.
质点系的 Lagrange 函数
考虑质点之间有相互作用但不受外部任何物体作用的封闭质点系. 为了描述质点之间的相互作用, 可以在自由质点系的 Lagrange 函数中增加根据相互作用性质确定的坐标的某一函数. 称其作质点系的势能, 将其记为 $-U$, 则
\[L=\sum_a\frac{m_av_a^2}{2}-U(\boldsymbol r_1,\boldsymbol r_2,\cdots)\]为了方便, 将 $T=\displaystyle \sum_a\frac{m_av_a^2}2$ 称为质点系的动能.
值得注意的是, 经典力学范围内, 势能仅依赖于所有质点在同一时刻的位置, 即任何质点位置的改变立即影响到所有其他质点. 否则假设相互作用以一个有限速度传递, 则有相对运动的不同参考系中传递速度不相同, 从而相互作用的物体的运动规律在不同惯性参考系中也不相同, 这违背了伽利略相对性原理.
建立运动方程
\[\frac{\mathrm d}{\mathrm dt}\frac{\partial L}{\partial \boldsymbol v_a}=\frac{\partial L}{\partial\boldsymbol r_a}\]即
\[\boxed{m_a\frac{\mathrm d\boldsymbol v_a}{\mathrm dt}=-\frac{\partial U}{\partial\boldsymbol r_a}}\]这种形式的运动方程称为 Newton 方程. 右端矢量
\[\boxed{\boldsymbol F_a=-\frac{\partial U}{\partial \boldsymbol r_a}}\]称为作用在第 $a$ 个质点上的力. 它与 $U$ 一样, 只依赖于所有质点的坐标, 不依赖于速度. 因此, $\ddot{\boldsymbol r}_a$ 也只是坐标的函数.
势能可以增减任意常数而不改变运动方程. 选择这个任意常数最自然通用的方法是选择无限增大质点间距离时势能趋向于 $0$.
如果描述运动不是 Descartes 坐标, 而是任意地广义坐标 $q_i$, 则为了得到新的 Lagrange 函数, 必须进行相应的变换
\[x_a=f_a(q_1,q_2,\cdots, q_s),\quad \dot x_a=\sum_k\frac{\partial f_a}{\partial q_k}\dot q_k,\quad\cdots\]从而得到
\[L=\frac12\sum_{i,k}a_{ik}(q)\dot q_l\dot q_k-U(q)\]对于非封闭质点系 $A$, 它与运动完全已知的质点系 $B$ 相互作用时, 称 $A$ 在给定的外场中运动. 由于质点系 $B$ 的运动是完全已知的, 这意味着在对总作用量进行变分时, 我们不再需要对 $q_B$ 进行变分. 此时只有 $q_A$ 是独立的变分变量, 因此可以将质点系 $A+B$ 的 Lagrange 函数 $L$ 中的广义坐标 $q_B$ 用给定的时间函数代替, 由此得到质点系 $A$ 的 Lagrange 函数 $L_A$.
假设质点系 $A+B$ 是封闭的, 则 $L=T_A(q_A,\dot q_A)+T_B(q_B,\dot q_B)-U(q_A, q_B)$, 用已知的时间函数代替后, $T_B(q_B,\dot q_B)$ 是只依赖于时间的函数, 可以从 $L$ 中略去, 因此 $L_A=T_A(q_A,\dot q_A)-U(q_A, q_B(t))$. 可见在外场中质点系的运动由通常形式的 Lagrange 函数描述, 唯一的区别就是势能可能显含时间.
如果一个质点在一个场中任意位置都受到相同的力 $\boldsymbol F$, 则称这样的外场是均匀的. 显然, 均匀外场中势能可以写成 $U=-\boldsymbol F\cdot\boldsymbol r$.