最小作用量原理
描述客觀事物規律的方法
最小作用量原理(principle of least action)是物理學中描述客觀事物規律的一種方法。即從一個角度比較客體一切可能的運動(經歷),認為客體的實際運動(經歷)可以由作用量求極值得出,即作用量最小的那個經歷。公元40年,希臘工程師(Hero)提出了光的最短路程原理,是最小作用量原理的早期表述,到中世紀,最小作用量原理思想被更多的人所接受。
最小作用量原理
影響的動力學系統在發生變化時,其變化方式總是使有關的作用量為最小。在對物理實在(現象)的觀察中,科學家們相信,對於不同的觀察者物理實在可以不同,但其物理實在的結構(規律)必定是相同的。物理學中描述物理實在結構的方法之一就是作用量方法。這種方法從功能角度去考察和比較客體一切可能的運動(經歷),認為客體的實際運動(經歷)可以由作用量求極值得出,是其中作用量最小的那個。這個原理稱為最小作用量原理。
物理學中最小作用量原理(英語:least action principle),或更精確地,平穩作用量原理(英語:stationary action principle),是一種變分原理,當應用於一個機械系統的作用量時,可以得到此機械系統的運動方程。這原理的研究引導出經典力學的拉格朗日表述和哈密頓表述的發展。卡爾·雅可比特稱最小作用量原理為分析力學之母。
在現代物理學里,這原理非常重要,在相對論、量子力學、量子場論里,都有廣泛的用途。在現代數學里,這原理是莫爾斯理論的研究焦點。本篇文章主要是在闡述最小作用量原理的歷史發展。關於數學描述、推導和實用方法,請參閱條目作用量。最小作用量原理有很多種例子,主要的例子是莫佩爾蒂原理(Maupertuis' principle)和哈密頓原理。
在最小作用量原理之前,有很多類似的點子出現於測量學和光學。古埃及的拉繩測量者(rope stretcher)在測量兩點之間的距離時,會將固定於這兩點的繩索拉緊,這樣,可以使間隔距離減少至最低值。托勒密在他的著作《地理學指南》(Geographia)第一冊第二章里強調,測量者必須對於直線路線的誤差做出適當的修正。古希臘數學家歐幾里得在《反射光學》(Catoptrica)里表明,將光線照射於鏡子,則光線的反射路徑的入射角等於反射角。稍後,亞歷山大的希羅證明這路徑的長度是最短的。
動力學中的一個變分原理。由保守系統的動力方程可以導出這個原理,也可自這原理導出動力方程。這原理可表述為:對於定常保守系統,作用量Tdt的積分的全變分為零。即
(1)
式中T為動能;t為時間;Δ為全變分記號。Δ與變分記號δ不同之處是:,而。將Δ與δ施於同一變數時,有關係式:
。
因此Δ和δ兩符號有關係式:。
最小作用量原理還可詳述為:對於定常保守系統,在廣義坐標qi和時間t的聯合空間里,對於機械能E保持不變(即)的各條路徑中,如果路徑的端點(包括始點和終點)的全變分為零,則積分對於真實運動的路徑和鄰近的旁路比較,真實路徑的積分是駐值。在一般實際情況中,式(1)確定的積分為極小值,最小作用量原理即由此得名。
對於一個質點,,因此式(1)成為
上式是1744年由P.-L.M.de馬保梯最先提出的一個最小作用量原理。他研究這個問題的目的是想配合光學中的費馬原則,說明光是一種高速運動著的微粒。L.-V.德布羅意和E.薛定諤等所創立的波動力學(現在都稱它為量子力學)也受到力學中的最小作用量原理和光學中的費馬原理的許多類似之處的啟發。後來L.歐拉證明這原理對於一個質點在有心力場中的運動也是成立的。J.-L.拉格朗日把這原理推廣到N個自由度的保守系統並給予嚴格證明,所以這原理稱為馬保梯-拉格朗日最小作用量原理。
最小作用量原理與哈密頓原理的相同點是:①兩者都是作用量的積分的變分原理,對時間不長的運動,兩者都是極小值;②兩者都是在多維空間中真實路線積分與旁路線積分的比較;③這兩個原理在所設條件下與保守系統的動力方程等效,三者可互相推導。最小作用量原理與哈密頓原理的不同點是:①哈密頓原理以為作用量,L為動勢,最小作用量原理以為作用量;②哈密頓原理的始點和終點在多維空間中為兩定點,變分為等時的,即,最小作用量原理的始點q0和終點q1的全變分為零。即,且機械能E在各條路線上相同,即。兩種作用量有關係式:式中H為哈密頓函數。
費 德布羅意
上式是莫培督在1744年提出來的最小作用量原理的表示式。他是受到17世紀時期所建立的
馬原理啟發,用微粒說來解釋光在空間的行進規律。L.歐拉認為這個原理很有價值,在1744年用力學方法證明它在輳力場中成立。對質點系的最小作用量原理的證明是J.L.拉格朗日在1760年得出的。在物理學上,微粒和波動的對偶關係是L.V.德布羅意在1923年提出物質波后,再經過C.J.戴維孫和L.H.革末於年的實驗所證實,才得到公認的。德布羅意就是在費馬原理和最小作用量原理的啟發下發展了物質波理論。
莫佩爾蒂
是恆定的。由於兩個原因,這論點是笛卡兒派與牛頓派無法接受的:1.活力恆定不能應用於硬物體(不能壓縮的物體)。2.活力的數學定義是質量與速度平方的乘積。為什麼速度在活力這數量里出現兩次?萊布尼茨派辯明,理由很簡單,任何物質對於運動都有一種自然的趨向。在靜止狀態,物體里含有一個內在的速度。當物體開始移動時,對應於實際的運動,又產生了第二個速度項目。笛卡兒派與牛頓派則認為這辯理簡直是胡言。對於中古學者,運動的內在趨向這句話,具有一種奧秘的性質;這中古學者的偏愛,必須毫無反顧地抗拒。今天,硬物體的概念已被完全地否定了。至於質量與速度平方的乘積,這數量則是動能的兩倍。現代力學給予了活力一個很重要的角色。對於莫佩爾蒂而言,硬物體的概念是很重要的。他提出的最小作用量原理有一個很特別的優點:這原理可以應用於硬物體與彈性物體。又可以應用於靜止狀態的物體與光,似乎,這原理可以廣泛的應用於宇宙的每一個角落。莫佩爾蒂又從宇宙論的觀點來論述:最小作用量好像一個經濟原理;在經濟學里,大概就是精省資源的意思。這論述的瑕疵是,並沒有任何理由,能夠解釋,為什麼作用量趨向最小值,而不是最大值。事實上,萊布尼茨證明過,在大自然現象中,這物理量有可能趨向最小值,也有同樣的可能趨向最大值。假若,我們解釋最小作用量為大自然的精省資源,那麼,我們又怎麼解釋最大作用量呢?在量子力學的發展中,作用量的不連續性不以其最初的假定方式保持下來。這種不連續性使解釋量子力學的數量關係成為可能,但卻沒有去找這種解釋。這樣,不連續性就以終極概念的身份出現了。作用量不連續在日後推廣為相對論的量子論中可以得到因果性的解釋。看來這種推廣的嘗試對作用量概念本身帶來某些新的認識,就像時空網格數的概念那樣,用普朗克常數去除作用量的表象沒有被排除,嬗變過程就在此網格中發生,在宏觀的近似中網格可以作為自身同一的基本粒子的世界線而加以研究。此時世界線的概率就同愛丁頓所說的那種數量關係的作用量聯繫在一起,於是最小作用量原理就成為最大概率原理。1819年,高斯在題為《論新的力學普遍原理》一書中,提出了作為更為普遍原理的結論,無摩擦的約束系統在任意力作用下將這樣運動:來自約束的對系統的拘束和施加於約束上的壓力均取極小值。高斯用以下方式闡述了他的最小拘束原理。“倘若質點是自由的,那麼對以任何方式聯繫起來的,受任意影響的質點系來說,它在每一時刻的運動都要完全或只是有可能完全依照這些質點本來就有的方式進行活動,也就是說運動要以儘可能小的拘束進行。如果在無限小的瞬間,對每一質點的質量和該質點現在的位置的偏離量的平方之積取和,這個和則可作為對拘束的量度高斯觀念的發展是1892——1893年赫茲提出的最直路徑原理。這個原理同時延續了雅考畢的思路,即對全部變分原理和動力學加以幾何化。這一問題在眾所周知,赫茲不用力的概念而要建立起力學的嘗試中得到闡明。這個嘗試是在《力學原理》這本書上講的(1892)。[羅素的某些看法。根據質量和能量的相對論的數量關係,羅素推出把質量和時間之積當成作用量的可能性。但是,引力質量還有與其相等的慣性質量可以由距離代表,這時作用量就是長度和時間的乘積了。用這種觀點來看待普朗克常量,羅素說:要是把作用量取作物理學的基本概念,我們或許能建立起來全是原子論的,極適於檢驗的物理學。羅素接著指出:相對論中時間空間間隔的不變性和作用量的意義(即在微觀世界中的作用量)之間的聯繫是意味深長的。與上述類似的一些設想並不能引起物理知識的實際的進展,不過卻很值得提出來,因為此後推廣量子力學時要用作用量來表徵近代物理的特徵和風格。
於1744年,在巴黎科學院發表的一篇論文《幾種以前互不相容的自然定律的合一論》(Accord de plusieurs lois naturelles qui avaient paru jusqu'ici incompatibles)中,莫佩爾蒂提出,光折射的路徑,從一種介質到另一種介質,是作用量的最小值。按照這論點,如前圖,假設光線從折射率為的介質1折射於折射率為介質2,則作用量為
其中,是光線的質量。雖然光線並沒有質量,這變數對於結果沒有任何影響,可以被忽略。
取作用量對於變數的導數,設定為零,經過一些運算,可以得到。
1744年,萊昂哈德·歐拉在論文《尋找具有極大值或極小值性質的曲線,等周問題的最廣義解答》(Methodus inveniendi lineas curvas maximi minimive proprietate gaudentes, sive solutio problematis isoperimetrici lattissimo sensu accepti)里,以非常清楚的字句,給出最小作用量原理的定義:
設定一個質量為M,速度為v的粒子移動無窮小距離ds。這粒子的動量為Mv,當乘以無窮小距離時,會給出ds,粒子的動量積分於無窮小距離ds。現在,我宣明,這移動粒子的真實軌道(在所有連結兩個端點的可能軌道之中)是為最小值的軌道,或者,假定質量是個常數,是為最小值的軌道。
如同歐拉所寫,是動量積分於移動路徑。採用現代術語,這積分等於簡略作用量;其中,p是廣義動量,q是廣義坐標。因此,在同一年,稍微比莫佩爾蒂晚一點,歐拉獨立地發表了,與莫佩爾蒂的理論等同的,關於變分原理的理論。歐拉並沒有爭奪優先榮譽。
假設沒有任何作用力施加於這粒子,則這粒子以均勻速度移動:
只有在軌道長度s為最小值時,才能得到作用量最小值。這軌道是一條直線。
拋物線運動
假設這移動於二維空間的粒子感受到均勻重力,則根據活力定律(principle of vis viva),
其中,v是瞬時速度,v0是最初速度,y是粒子朝著y-軸移動的距離,g是加速度常數。
將這方程代入作用量:
令,求作用量的穩定值,應用變分法,可以得到歐拉-拉格朗日方程:
其中,是積分常數。重新編排,可以得到
將這方程積分,
其中,是積分常數。
假設粒子的初始位置為,初始速度為,則
重新編排,可以看出這是拋物線方程:
歐拉又將這結果推廣至一群粒子。他認為最小作用原理所以正確,是因為粒子的慣性試著阻抗任何關於狀態的改變,自由粒子會選擇遵循影響最小的作用力。
微分運動方程數學等價於其對應的積分運動方程,這具有很重要的哲學意義。微分方程描述局部於空間的一點或單獨時間的片刻。舉例而言,牛頓第二定律解釋為瞬時作用力F施加於質量為m的粒子會造成瞬時加速度為a的運動。明顯對比地,作用量原理不會局部於一點,而牽涉到積分於一段時間間隔或一個空間的局域。更重要地,通常在經典作用量原理的表述里,系統的初始狀態和終結狀態是固定不變的,也就是說,
設定一個移動粒子開始於位置x1、時間t1,結束於位置x2、時間t2,連接這兩個端點的物理軌道是作用量積分的平穩值。
特別地針對這程序,終結狀態的固定動作似乎額外地賦予了作用量原理一些目的論的特色。在物理學史里,這特色不經意地製造出很多激烈的爭論。
相對論運用時空事件的四維世界把最小作用量原理解釋為能夠從可能的世界線中挑選出實際的世界線的原理。在這種情況下相對論並沒有給最小作用原理添加進新的物理內容。這種物理內容可以為量子物理所引入。只有作出某種把相對論和微觀世界聯繫在一起的解釋的情況下,根據更為一般的設想,相對論或許有“推出”最小作用原理的可能。在建立廣義相對論時愛因斯坦用過最小作用原理。此時作用量的概念得到某些新的解釋。如所周知,在決定空間和時間的曲率時藉助於四個恆等式,並且力求排除表徵空間時間特性但不表徵曲率的多餘的參量。這些恆等式按其物理意義而言表示不同坐標系中空間和時間曲率的同一性,曲率張量取決於能量衝量張量。在研究此問題時,愛因斯坦指出,上述四個恆等式有物理意義,也就是具有守恆定律的意義,並且表示了空間時間的特性。然而,現在當我們談能量衝量張量時,空間的首要特性,即其均勻性對應於衝量分量守恆;而時間的均勻性對應於能量守恆。這樣,守恆定律就對應於曲率張量之間恆等的數量關係,作為與這種或那種坐標表示無關的物理特性的曲率對應於作用量。愛丁頓提出在廣義相對論中對作用量這一概念意義的極為精細、深刻的說法。他指出:對時空連續統而言,作用量扮演著類似於能量在空間關係上所扮演的角色。在四維世界里,作用量是曲率的量度,即決定質點運動的四維連續統的基本特性的量度。我們順便指出:在敘述魏爾的統一場論時愛丁頓曾順帶提到對作用量的一種很有益的解釋。愛丁頓說,可能作用量就是概率的函數,然而當把一些概率連乘,則作用量就相加,從而作用量可以認為是概率的對數。由於概率的對數是負數,所以作用量就要看成是概率的對數再加上負號,此時最小作用原理則表示實際實現的運動的最大概率。
在現代量子力學中最小作用量原理起著重要作用。不但如此,對於作用量概念的思考也激起對現存理論進行總結的嘗試。表徵微觀世界之基本量,即作用量子和引入到宏觀力學的基本數量關係中的量,即由能量按時間積分,這兩個量的量綱一致,促使近代理論家在一系列設想上儘管沒有引出什麼具體的物理理論,但是卻引出一些看來是很有前途的物理理論。