矩陣論

用於解線性方程組的現代理論

矩陣本身所具有的性質依賴於元素的性質,矩陣由最初作為一種工具經過兩個多世紀的發展,現在已成為獨立的一門數學分支——矩陣論。而矩陣論又可分為矩陣方程論、矩陣分解論和廣義逆矩陣論等矩陣的現代理論。

概述


矩陣(Matrix)是指縱橫排列的二維數據表格,最早來自於方程組的係數及常數所構成的方陣。這一概念由19世紀英國數學家凱利首先提出。矩陣是高等代數學中的常見工具,也常見於統計分析等應用數學學科中。在物理學中,矩陣於電路學、力學、光學量子物理中都有應用;計算機科學中,三維動畫製作也需要用到矩陣。
矩陣的運算是數值分析領域的重要問題。將矩陣分解為簡單矩陣的組合可以在理論和實際應用上簡化矩陣的運算。對一些應用廣泛而形式特殊的矩陣,例如稀疏矩陣和准對角矩陣,有特定的快速運算演演算法。在天體物理量子力學等領域,也會出現無窮維的矩陣,是矩陣的一種推廣。

發展歷史


矩陣是數學中的一個重要的基本概念,是代數學的一個主要研究對象,也是數學研究和應用的一個重要工具。“矩陣”這個詞是由西爾維斯特首先使用的,他是為了將數字的矩形陣列區別於行列式而發明了這個述語。而實際上,矩陣這個課題在誕生之前就已經發展的很好了。從行列式的大量工作中明顯的表現出來,為了很多目的,不管行列式的值是否與問題有關,方陣本身都可以研究和使用,矩陣的許多基本性質也是在行列式的發展中建立起來的。在邏輯上,矩陣的概念應先於行列式的概念,然而在歷史上次序正好相反。
先把矩陣作為一個獨立的數學概念提出來,並首先發表了關於這個題目的一系列文章。凱萊同研究線性變換下的不變數相結合,首先引進矩陣以簡化記號。1858年,他發表了關於這一課題的第一篇論文《矩陣論的研究報告》,系統地闡述了關於矩陣的理論。文中他定義了矩陣的相等、矩陣的運演演算法則、矩陣的轉置以及矩陣的逆等一系列基本概念,指出了矩陣加法的可交換性與可結合性。另外,凱萊還給出了方陣的特徵方程和特徵根(特徵值)以及有關矩陣的一些基本結果。凱萊出生於一個古老而有才能的英國家庭,劍橋大學三一學院大學畢業后留校講授數學,三年後他轉從律師職業,工作卓有成效,並利用業餘時間研究數學,發表了大量的數學論文。
1855 年,埃米特(C.Hermite,1822~1901)證明了別的數學家發現的一些矩陣類的特徵根的特殊性質,如現在稱為埃米特矩陣的特徵根性質等。後來,克萊伯施(A.Clebsch,1831~1872)、布克海姆(A.Buchheim)等證明了對稱矩陣的特徵根性質。泰伯(H.Taber)引入矩陣的跡的概念並給出了一些有關的結論。在矩陣論的發展史上,弗羅伯紐斯(G.Frobenius,1849-1917)的貢獻是不可磨滅的。他討論了最小多項式問題,引進了矩陣的秩不變因子和初等因子、正交矩陣、矩陣的相似變換合同矩陣等概念,以合乎邏輯的形式整理了不變因子和初等因子的理論,並討論了正交矩陣合同矩陣的一些重要性質。 1854 年,約當研究了矩陣化為標準型的問題。1892年,梅茨勒(H.Metzler)引進了矩陣的超越函數概念並將其寫成矩陣的冪級數的形式。傅立葉、西爾和龐加萊的著作中還討論了無限階矩陣問題,這主要是適用方程發展的需要而開始的。
矩陣的應用是多方面的,不僅在數學領域里,而且在力學、物理、科技等方面都十分廣泛的應用。

矩陣論的基本內容


一般矩陣論會包括如下內容:
1、線性空間的相關內容,包括線性空間的定義及其性質,線性子空間;
2、內積空間的相關內容,包括歐氏空間
3、線性變換的相關內容,包括最小多項式理論;
4、范數理論及其應用的相關內容,包括向量范數,矩陣范數以及范數的應用;
5、矩陣分析及其應用的相關內容,包括向量和矩陣極限、微分和積分、方陣級數理論、方陣級數理論的應用等;
6、矩陣分解的相關內容,包括最大秩分解和矩陣分解的應用;
7、廣義逆矩陣及其應用的相關內容,包括基本定義和相關應用;
8、特徵值的估計及廣義特徵值的相關內容,包括特徵值的估計及廣義特徵值和應用。

用途


矩陣論的一個重要用途是解線性方程組。線性方程組中未知量的係數可以排成一個矩陣,加上常數項,則稱為增廣矩陣。另一個重要用途是表示線性變換,即是諸如f(x) 4x之類的線性函數的推廣。設定基底后,某個向量v可以表示為m×1的矩陣,而線性變換f可以表示為行數為m的矩陣A,使得經過變換后得到的向量f(v)可以表示成Av的形式。矩陣的特徵值和特徵向量可以揭示線性變換的深層特性。

物理應用

線性變換及對稱線性變換及其所對應的對稱,在現代物理學中有著重要的角色。例如,在量子場論中,基本粒子是由狹義相對論的洛倫茲群所表示,具體來說,即它們在旋量群下的表現。內含泡利矩陣及更通用的狄拉克矩陣的具體表示,在費米子的物理描述中,是一項不可或缺的構成部分,而費米子的表現可以用旋量來表述。描述最輕的三種夸克時,需要用到一種內含特殊酉群SU(3)的群論表示;物理學家在計算時會用一種更簡便的矩陣表示,叫蓋爾曼矩陣,這種矩陣也被用作SU(3)規範群,而強核力的現代描述──量子色動力學的基礎正是SU(3)。還有卡比博-小林-益川矩陣(CKM矩陣):在弱相互作用中重要的基本夸克態,與指定粒子間不同質量的夸克態不一樣,但兩者卻是成線性關係,而CKM矩陣所表達的就是這一點。

量子態的線性組合

1925年海森堡提出第一個量子力學模型時,使用了無限維矩陣來表示理論中作用在量子態上的運算元。這種做法在矩陣力學中也能見到。例如密度矩陣就是用來刻畫量子系統中“純”量子態的線性組合表示的“混合”量子態。另一種矩陣是用來描述構成實驗粒子物理基石的散射實驗的重要工具。當粒子在加速器中發生碰撞,原本沒有相互作用的粒子在高速運動中進入其它粒子的作用區,動量改變,形成一系列新的粒子。這種碰撞可以解釋為結果粒子狀態和入射粒子狀態線性組合的標量積。其中的線性組合可以表達為一個矩陣,稱為S矩陣,其中記錄了所有可能的粒子間相互作用。

簡正模式

矩陣在物理學中的另一類泛應用是描述線性耦合調和系統。這類系統的運動方程可以用矩陣的形式來表示,即用一個質量矩陣乘以一個廣義速度來給出運動項,用力矩陣乘以位移向量來刻畫相互作用。求系統的解的最優方法是將矩陣的特徵向量求出(通過對角化等方式),稱為系統的簡正模式。這種求解方式在研究分子內部動力學模式時十分重要:系統內部由化學鍵結合的原子的振動可以表示成簡正振動模式的疊加。描述力學振動或電路振蕩時,也需要使用簡正模式求解。

幾何光學

在幾何光學里,可以找到很多需要用到矩陣的地方。幾何光學是一種忽略了光波波動性的近似理論,這理論的模型將光線視為幾何射線。採用近軸近似(英語:paraxial approximation),假若光線與光軸之間的夾角很小,則透鏡或反射元件對於光線的作用,可以表達為2×2矩陣與向量的乘積。這向量的兩個分量是光線的幾何性質(光線的斜率、光線跟光軸之間在主平面(英語:principal plane)的垂直距離)。這矩陣稱為光線傳輸矩陣(英語:ray transfer matrix),內中元素編碼了光學元件的性質。對於折射,這矩陣又細分為兩種:“折射矩陣”與“平移矩陣”。折射矩陣描述光線遇到透鏡的折射行為。平移矩陣描述光線從一個主平面傳播到另一個主平面的平移行為。由一系列透鏡或反射元件組成的光學系統,可以很簡單地以對應的矩陣組合來描述其光線傳播路徑。

電子學

在電子學里,傳統的網目分析(英語:mesh analysis)或節點分析會獲得一個線性方程組,這可以以矩陣來表示與計算。