首页 > 技术文章 > 哈密顿正则方程和哈密顿-雅克比方程

immcrr 2018-07-06 16:18 原文

勒让德变换和正则方程

设有\(f(x,y)\),则全微分\(df(x,y)=udx+vdy\),其中\(u=\partial f(x,y)/\partial x,v=\partial f(x,y)/\partial y\)。这里的变量是\(x,y\)。注意\(u\)\(x,y\)的函数,即\(u=u(x,y)\),从这个式子出发,也可以把函数关系表示为\(x=x(u,y)\)。现在希望把变量换成\(u\)\(y\),也就是说把函数\(f(x,y)\)看做复合函数\(f(u,y)=f[x(u,y),y]\),构造函数\(g(u,y)=f(u,y)-ux(u,y)\),则\(dg(u,y)=df-xdu-udx=vdy-xdu\),上式就成功地把变量换成了\(u\)\(y\),有\(\partial g(u,y)/\partial y=v,\partial g(u,y)/\partial u=-x\)。这就是勒让德变换,通过修改被全微分的函数,来把全微分式中\(udx\)换成\(xdu\)

位形空间中的拉格朗日函数\(L(q,\dot{q},t)\)\(q\)\(\dot{q}\)为自由变量,现在想把\(\dot{q}\)换成对应的动量\(p=\partial L/\partial \dot{q}\),让自由变量变成\(q\)\(p\)。先求其全微分$$dL(q,\dot{q},t)=\sum_k\left(\frac{\partial L}{\partial q_k}dq_k+\frac{\partial L}{\partial\dot{q}_k}d\dot{q}_k\right)+\frac{\partial L}{\partial t}dt$$按照广义动量的定义$$p_k=\frac{\partial L}{\partial \dot{q_k}}$$和拉格朗日方程$$\dot{p_k}=\frac{d}{dt}\frac{\partial L}{\partial \dot{q_k}}=\frac{\partial L}{\partial q_k}$$代入拉格朗日函数的全微分式中,得到$$dL(q,\dot{q},t)=\sum_k\left(\dot{p}_kdq_k+p_kd\dot{q}_k\right)+\frac{\partial L}{\partial t}dt$$上式中扮演自变量身份的还是\(q_k,\dot{q}_k,t\)三者,现在希望把上式中的\(p_kd\dot{q}_k\)换成\(\dot{q}_kdp_k\),从而把自变量换成\(q_k,p_k,t\)三者。为此使用勒让德变换,构造新函数$$H(p,q,t)=\sum_kp_k\dot{q}_k-L(q,\dot{q},t)$$求上式全微分得到$$dH(p,q,t)=\sum_k(\dot{q}_kdp_k-\dot{p}_kdq_k)-\frac{\partial L}{\partial t}dt$$这就是说$$\begin{aligned}\frac{\partial H}{\partial p_k}&=\dot{q}k\ \frac{\partial H}{\partial q_k}&=-\dot{p}k\ \left(\frac{\partial H}{\partial t}\right){p,q}&=-\left(\frac{\partial L}{\partial t}\right){\dot{q},q}\end{aligned}$$这个新函数\(H\)和拉格朗日力学中的广义能量函数一样,但是这里把它写作\(p,q,t\)的函数(相空间),而非\(q,\dot{q},t\)的函数(位形空间),所以这里\(H\)称为哈密顿函数。前两个式子就是哈密顿正则方程。

罗斯函数

上面利用勒让德变换把所有的广义速度\(\dot{q}_k\)换成了广义动量\(p_k\),但是有时候只希望一部分广义坐标对应的广义速度被替换,而另一部分仍保留广义速度。这时介于拉格朗日函数和哈密顿函数之间的,叫做罗斯函数。例如假设系统有两个广义坐标\(q,\xi\),现在只想把拉格朗日函数中的\(\dot{q}\)换成广义动量,而\(\dot{\xi}\)保留。为此构造罗斯函数$$R(q,p,\xi,\dot{\xi})=p\dot{q}-L$$求其全微分为$$dR(q,p,\xi,\dot{\xi})=-\dot{p}dq-pd\dot{q}-\frac{\partial L}{\partial \xi}d\xi-\frac{\partial L}{\partial \dot{\xi}}d\dot{\xi}+\dot{q}dp+pd\dot{q}\=\dot{q}dp-\dot{p}dq-\frac{\partial L}{\partial \xi}d\xi-\frac{\partial L}{\partial \dot{\xi}}d\dot{\xi}$$这表明$$\begin{aligned}\frac{\partial R}{\partial q}=-\dot{p},\frac{\partial R}{\partial p}=\dot{q}\end{aligned}\ \frac{\partial R}{\partial \xi}=-\frac{\partial L}{\partial \xi},\frac{\partial R}{\partial \dot{\xi}}=-\frac{\partial L}{\partial \dot{\xi}}$$前两式正是\(q\)这个广义坐标对应的哈密顿正则方程。把后两式代入\(\xi\)的拉格朗日方程中,有$$\frac{d}{dt}\frac{\partial R}{\partial \dot{\xi}}-\frac{\partial R}{\partial \xi}=0$$所以如果只对希望变换的广义速度进行勒让德变换,则得到的结果就是罗斯函数,罗斯函数对于已经变换的广义坐标,得到的运动方程是哈密顿正则方程形式,对于还未变换的广义坐标,得到的还是拉格朗日方程形式。如果坐标\(q\)是循环坐标,则原拉格朗日函数不显含\(q\),则上面罗斯函数不显含\(q\),又因为循环坐标,从而\(p\)为常数,由此上面的方程只是关于\(\xi\)的微分方程,循环坐标完全被消去,比\(\xi\)的拉格朗日方程要简单。

泊松括号和力学量随时间的变化

设力学量\(f(p,q,t)\),则关于时间全导数为$$\frac{df}{dt}=\frac{\partial f}{\partial t}+\sum_k\left(\frac{\partial f}{\partial p_k}\dot{p}_k+\frac{\partial f}{\partial q_k}\dot{q}_k\right)$$又因为\(\dot{q}_k=\partial H/\partial p_k,\dot{p}_k=-\partial H/\partial q_k\)所以$$\frac{df}{dt}=\frac{\partial f}{\partial t}+\sum_k\left(\frac{\partial H}{\partial p_k}\frac{\partial f}{\partial q_k}-\frac{\partial H}{\partial q_k}\frac{\partial f}{\partial p_k}\right)$$定义泊松括号为$$[F,G]=\sum_k\left(\frac{\partial F}{\partial p_k}\frac{\partial G}{\partial q_k}-\frac{\partial F}{\partial q_k}\frac{\partial G}{\partial p_k}\right)$$则$$\frac{df}{dt}=\frac{\partial f}{\partial t}+[H,f]$$这就是力学量随时间的变化。如果函数\(f\)不显含时间\(t\),则\(f\)守恒的充要条件是\([H,f]=0\)

作用量函数

最小作用量原理说的是在时刻\(t=t_1\)和时刻\(t=t_2\),系统的位置由两组坐标\(q^{(1)}\)\(q^{(2)}\)确定,那么系统在这两个位置之间的运动使得作用量$$S=\int_{t_1}^{t_2}L(q,\dot{q},t)dt$$取最小值。即\(\delta S=0\)

\(q(t)\)使得作用量\(S\)取最小值,现在给\(q(t)\)一个变分\(\delta q(t)\),变分\(\delta q(t)\)满足\(\delta q(t_1)=\delta q(t_2)=0\),从而系统始末状态不变,只是运动轨迹变化。则使用\(q(t)+\delta q(t)\)代替\(q(t)\)\(S\)带来的变分为$$\delta S=\delta \int_{t_1}{t_2}L(q,\dot{q},t)dt=\int_{t_1}{t_2}\left(\frac{\partial L}{\partial q}\delta q+\frac{\partial L}{\partial \dot{q}}\delta\dot{q}\right)dt$$由于是等时变分,所以\(\delta \dot{q}=d(\delta q)/dt\),分部积分可得$$\delta S=\frac{\partial L}{\partial \dot{q}}\delta q\Bigg|{t_2}_{t_1}+\int_{t_1}{t_2}\left(\frac{\partial L}{\partial q}-\frac{d}{dt}\frac{\partial L}{\partial \dot{q}}\right)\delta q dt$$

现在重新考虑作用量,让积分沿着真实的运动路径,只固定\(t=t_1\)对应的\(q^{(1)}\)这一端,而让在\(t=t_2\)时刻的\(q(t_2)\)通过不同的位置,这样作用量\(S\)就是\(t=t_2\)时刻通过的不同位置的函数。观察上面\(\delta S\)的式子,由于沿着真实的运动路径,上式积分为零,而第一项的下限有\(\delta q(t_1)=0\)所以有$$\delta S=\sum_ip_i\delta q_i$$其中\(\delta q_i\)\(t=t_2\)时的\(\delta q_i(t)\)\(p_i\)是对应的广义动量。上式表明,若如此重新考虑作用量,则有$$\frac{\partial S}{\partial q_i}=p_i$$这是固定两端时间\(t=t_1,t=t_2\)和一端状态\(q(t_1)\),而让另一端的状态\(q(t_2)\)变动的情况;同样的,还可以这样重新考虑作用量,固定两个状态\(q(t_1)\)\(q(t_2)\),以及一端的时间\(t=t_1\),而让另一端时间\(t_2\)变动(简记为\(t\)),则可设想,也会存在一个\(\partial S/\partial t\),它的具体表达式求法如下:将\(S\)看做末端的坐标和时间的函数,则有$$\frac{dS}{dt}=\frac{\partial S}{\partial t}+\sum_i\frac{\partial S}{\partial q_i}\dot{q}_i=\frac{\partial S}{\partial t}+\sum_ip_i\dot{q}_i$$另一方面,按照作用量的定义,有\(dS/dt=L\),两式对比,则有$$\frac{\partial S}{\partial t}=L-\sum_ip_i\dot{q}_i=-H$$所以如此定义的作用量的全微分可以写作$$dS=\sum_ip_idq_i-Hdt$$这里的作用量\(S\)是末端坐标和时间的函数,又叫做哈密顿主函数。

正则变换

\(s\)个广义坐标\(q_i\)做变换,\(Q_i=Q_i(q,t)\),则\(s\)\(Q_i\)仍然是广义坐标,从而拉格朗日方程仍然成立(因为拉格朗日方程不依赖于广义坐标的选取),这种变换称为点变换。在哈密顿力学中,\(p,q\)都是平等的独立变量,因此变换还可以推广到\(2s\)个,即从\(p,q\)到新变量\(P,Q\) $$Q_i=Q_i(p,q,t),\quad P_i=P_i(p,q,t)$$但是作该变换以后,运动方程不一定具有正则形式:$$\dot{Q}_i=\frac{\partial H'}{\partial P_i},\quad \dot{P}_i=-\frac{\partial H'}{\partial Q_i}$$而运动方程能保持这种结构的变换称之为正则变换。可见正则变换是需要一定条件的。这个条件就是$$dF=\sum_ip_idq_i-\sum_iP_idQ_i+(H'-H)dt$$其中\(P_i,Q_i\)是正则变换,\(H'\)是变换后的哈密顿函数,\(F\)是一个关于新老坐标、时间的函数,称之为变换的母函数。也就是说一个变换如果是正则变换,则上式的右端一定是某个函数的全微分。由上式可以看出$$p_i=\frac{\partial F}{\partial q_i},\quad P_i=-\frac{\partial F}{\partial Q_i},\quad H'=H+\frac{\partial F}{\partial t}$$这里的母函数\(F=F(q,Q,t)\),也可以采用勒让德变换把母函数变成\(q,P\)\(t\)的函数,为此把上面\(F\)的全微分\(dF\)换成\(d(F+\sum\limits_iP_iQ_i)\)得到$$d(F+\sum\limits_iP_iQ_i)=\sum_ip_idq_i-\sum_iQ_idP_i+(H'-H)dt$$上式表明左端是一个关于\(q,P,t\)的函数,这个母函数记为\(\Phi(q,P,t)\),显然有$$p_i=\frac{\partial \Phi}{\partial q_i},\quad Q_i=\frac{\partial \Phi}{\partial P_i},\quad H'=H+\frac{\partial \Phi}{\partial t}$$需类似地母函数还有两个,一共四类母函数。

要注意的是,进行正则变换以后,哈密顿函数的形式会发生变化,上式最后一个式子表明母函数对时间的偏导数给出新老哈密顿函数的差值,如果选取的母函数不显含时间,则只需要将原哈密顿函数中的\(p,q\)代换成\(P,Q\)即可。

因为在一个正则变换\(Q_k=Q_k(p,q,t)\)中,即有动量参与,也有坐标参与,所以变换后的\(Q,P\)不在具有动量或坐标的意义,无法进行区分,所以称为正则共轭变量。另外,正则变换不改变泊松括号,即$$[f,g]{p,q}=[f,g]{P,Q}$$

最后,\(p,q\)的随时间的演化也可以归结为一种正则变换,变换的母函数就是\(-S\)。前面说,初始固定而末端变动的作用量函数\(S\)是末端时间和坐标的函数\(S=S(q,t)\),由此有作用量函数的全微分$$dS=\sum_ip_idq_i-Hdt$$现在如果让初始端也变动(但固定时间差\(\tau\)),则作用量函数\(S\)是初始状态\(q_t\)、初始时刻\(t\)、末尾状态\(q_{t+\tau}\)三者的函数,且明显有全微分式$$dS=\sum_i(p_{t+\tau}dq_{t+\tau}-p_tdq_t)-(H_{t+\tau}-H_t)dt$$对比第一类母函数,可以发现\(-S\)是从\(q_t,p_t\)\(q_{t+\tau},p_{t+\tau}\)的正则变换母函数。

哈密顿-雅克比方程

对于末端变化的作用量函数,前面已经得出$$\frac{\partial S}{\partial t}+H(q,p,t)=0\\frac{\partial S}{\partial q_i}=p_i$$将后一式的\(p_i\)代入前一式的哈密顿函数中去,得到$$\frac{\partial S}{\partial t}+H\left(q_1,\cdots,q_s;\frac{\partial S}{\partial q_1},\cdots,\frac{\partial S}{\partial q_s};t\right)=0$$称为哈密顿-雅克比方程。观察该方程,它是一个偏微分方程,求微分的函数是\(S(q,t)\),自变量是\(q_i\)和时间\(t\),而且是一阶的偏微分方程。考虑方程的全积分,应该含有\(s+1\)个任意常数,由于\(S(q,t)\)仅以其导数的形式出现在方程中,所以这\(s+1\)个任意常数中必然有一个是相加的:$$S=f(t,q_1,\cdots,q_s;\alpha_1,\cdots,\alpha_s)+A$$其中\(\alpha_1,\cdots,\alpha_s\)\(A\)是这\(s+1\)个任意常数。现在用\(\alpha_i\)作为\(s\)个新动量,用\(f\)作为正则变换的母函数,则该母函数是第二类母函数。设正则变换带来的新坐标为\(\beta_1,\cdots,\beta_s\),则按照正则变换,有$$p_i=\frac{\partial f}{\partial q_i},\quad\beta_i=\frac{\partial f}{\partial \alpha_i},\quad H'=H+\frac{\partial f}{\partial t}$$只看上面最后一个式子,\(\frac{\partial f}{\partial t}=\frac{\partial S}{\partial t}=-H\)所以变换后的哈密顿函数\(H'=0\),从而根据哈密顿正则方程,有$$\dot{\alpha}_i=0\Rightarrow\alpha_i=\text{const}\\dot{\beta}_i=0\Rightarrow\beta_i=\text{const}$$再回来看第二个式子(其实是\(s\)个式子)$$\beta_i=\frac{\partial f}{\partial \alpha_i}$$可以将\(s\)个坐标\(q_i\)用时间\(t\)\(2s\)个常数\(\alpha_i,\beta_i\)表示出来。所以哈密顿-雅克比方程也像拉格朗日方程或者哈密顿正则方程一样成为求解问题的基础方程。

推荐阅读