矩陣

數學術語

在數學中,矩陣(Matrix)是一個按照長方陣列排列的複數或實數集合,最早來自於方程組的係數及常數所構成的方陣。這一概念由19世紀英國數學家凱利首先提出。

矩陣是高等代數學中的常見工具,也常見於統計分析等應用數學學科中。在物理學中,矩陣於電路學、力學、光學和量子物理中都有應用;計算機科學中,三維動畫製作也需要用到矩陣。矩陣的運算是數值分析領域的重要問題。將矩陣分解為簡單矩陣的組合可以在理論和實際應用上簡化矩陣的運算。對一些應用廣泛而形式特殊的矩陣,例如稀疏矩陣和准對角矩陣,有特定的快速運算演演算法。關於矩陣相關理論的發展和應用,請參考矩陣理論。在天體物理量子力學等領域,也會出現無窮維的矩陣,是矩陣的一種推廣。

數值分析的主要分支致力於開發矩陣計算的有效演演算法,這是一個幾個世紀以來的課題,是一個不斷擴大的研究領域。矩陣分解方法簡化了理論和實際的計算。針對特定矩陣結構(如稀疏矩陣和近角矩陣)定製的演演算法在有限元方法和其他計算中加快了計算。無限矩陣發生在行星理論和原子理論中。無限矩陣的一個簡單例子是代表一個函數泰勒級數的導數運算元的矩陣。

歷史


矩陣的研究歷史悠久,拉丁方陣和幻方在史前年代已有人研究。
作為解決線性方程的工具,矩陣也有不短的歷史。成書最遲在東漢前期的《九章算術》中,用分離係數法表
矩陣
矩陣
線性方程組,得到了其增廣矩陣。在消元過程中,使用的把某行乘以某一非零實數、從某行中減去另一行等運算技巧,相當於矩陣的初等變換。但那時並沒有現今理解的矩陣概念,雖然它與現有的矩陣形式上相同,但在當時只是作為線性方程組的標準表示與處理方式。
矩陣正式作為數學中的研究對象出現,則是在行列式的研究發展起來后。邏輯上,矩陣的概念先於行列式,但在實際的歷史上則恰好相反。日本數學家關孝和(1683年)與微積分的發現者之一戈特弗里德·威廉·萊布尼茨(1693年)近乎同時地獨立建立了行列式論。其後行列式作為解線性方程組的工具逐步發展。1750年,加布里爾·克拉默發現了克萊姆法則
矩陣的現代概念在19世紀逐漸形成。1800年代,高斯和威廉·若爾當建立了高斯—若爾當消去法。1844年,德國數學家費迪南·艾森斯坦(F.Eisenstein)討論了“變換”(矩陣)及其乘積。1850年,英國數學家詹姆斯·約瑟夫·西爾維斯特(James Joseph Sylvester)首先使用矩陣一詞。
英國數學家阿瑟·凱利被公認為矩陣論的奠基人。他開始將矩陣作為獨立的數學對象研究時,許多與矩陣有關的性質已經在行列式的研究中被發現了,這也使得凱利認為矩陣的引進是十分自然的。他說:“我決然不是通過四元數而獲得矩陣概念的;它或是直接從行列式的概念而來,或是作為一個表達線性方程組的方便方法而來的。”他從1858年開始,發表了《矩陣論的研究報告》等一系列關於矩陣的專門論文,研究了矩陣的運算律、矩陣的逆以及轉置和特徵多項式方程。凱利還提出了凱萊-哈密爾頓定理,並驗證了3×3矩陣的情況,又說進一步的證明是不必要的。哈密爾頓證明了4×4矩陣的情況,而一般情況下的證明是德國數學家弗羅貝尼烏斯(F.G.Frohenius)於1898年給出的。
1854年時法國數學家埃爾米特(C.Hermite)使用了“正交矩陣”這一術語,但他的正式定義直到1878年才由費羅貝尼烏斯發表。1879年,費羅貝尼烏斯引入矩陣秩的概念。至此,矩陣的體系基本上建立起來了。
無限維矩陣的研究始於1884年。龐加萊在兩篇不嚴謹地使用了無限維矩陣和行列式理論的文章后開始了對這一方面的專門研究。1906年,希爾伯特引入無限二次型(相當於無限維矩陣)對積分方程進行研究,極大地促進了無限維矩陣的研究。在此基礎上,施密茨、赫林格和特普利茨發展出運算元理論,而無限維矩陣成為了研究函數空間運算元的有力工具。
矩陣的概念最早在1922年見於中文。1922年,程廷熙在一篇介紹文章中將矩陣譯為“縱橫陣”。1925年,科學名詞審查會算學名詞審查組在《科學》第十卷第四期刊登的審定名詞表中,矩陣被翻譯為“矩陣式”,方塊矩陣翻譯為“方陣式”,而各類矩陣如“正交矩陣”、“伴隨矩陣”中的“矩陣”則被翻譯為“方陣”。1935年,中國數學會審查后,中華民國教育部審定的《數學名詞》(並“通令全國各院校一律遵用,以昭劃一”)中,“矩陣”作為譯名首次出現。1938年,曹惠群在接受科學名詞審查會委託就數學名詞加以校訂的《算學名辭彙編》中,認為應當的譯名是“長方陣”。中華人民共和國成立后編訂的《數學名詞》中,則將譯名定為“(矩)陣”。1993年,中國自然科學名詞審定委員會公布的《數學名詞》中,“矩陣”被定為正式譯名,並沿用至今。

定義


由m×n個數排成的m行n列的數表稱為m行n列的矩陣,簡稱m×n矩陣。記作:
這m×n個數稱為矩陣A的元素,簡稱為元,數位於矩陣A的第i行第j列,稱為矩陣A的(i,j)元,以數為(i,j)元的矩陣可記為()或()m×n,m×n矩陣A也記作。
元素是實數的矩陣稱為實矩陣,元素是複數的矩陣稱為復矩陣。而行數與列數都等於n的矩陣稱為n階矩陣或n階方陣。

基本運算


矩陣運算在科學計算中非常重要,而矩陣的基本運算包括矩陣的加法,減法,數乘,轉置,共軛和共軛轉置。

加法

矩陣的加法滿足下列運算律(都是同型矩陣):
應該注意的是只有同型矩陣之間才可以進行加法。

減法

數乘

矩陣的數乘滿足以下運算律:
矩陣的加減法和矩陣的數乘合稱矩陣的線性運算。

轉置

把矩陣A的行和列互相交換所產生的矩陣稱為A的轉置矩陣,這一過程稱為矩陣的轉置
矩陣的轉置滿足以下運算律:

共軛

矩陣的共軛定義為:.一個2×2複數矩陣的共軛如下所示:

共軛轉置

矩陣的共軛轉置定義為:,也可以寫為:。一個2×2複數矩陣的共軛如下所示:

乘法


主條目:矩陣乘法
兩個矩陣的乘法僅當第一個矩陣A的列數和另一個矩陣B的行數相等時才能定義。如A是m×n矩陣和B是n×p矩陣,它們的乘積C是一個m×p矩陣,它的一個元素:
並將此乘積記為:.
例如:
矩陣的乘法滿足以下運算律:
結合律:
左分配律:
右分配律:
矩陣乘法不滿足交換律。

行列式


主條目:行列式
一個的正方矩陣A的行列式記為或者,一個矩陣的行列式可表示如下
一個矩陣的行列式等於其他任意行(或列)的元素與對應的代數餘子式乘和之積,即:

特徵值與向量


主條目:特徵值,特徵向量
的方塊矩陣A的一個特徵值和對應特徵向量是滿足的標量以及非零向量。其中為特徵向量,為特徵值
A的所有特徵值的全體,叫做A的譜,記為。矩陣的特徵值和特徵向量可以揭示線性變換的深層特性。

矩陣的跡


主條目:矩陣的跡
矩陣A的對角元素之和稱為矩陣A的跡(trace),記作,即

正定性


n×n的實對稱矩陣A如果滿足對所有非零向量,對應的二次型
若,就稱A為正定矩陣。若則A是一個負定矩陣,若,則A為半正定矩陣,若A既非半正定,也非半負定,則A為不定矩陣。對稱矩陣的正定性與其特徵值密切相關。矩陣是正定的當且僅當其特徵值都是正數。

矩陣的分解


主條目:矩陣分解
矩陣分解是將一個矩陣分解為比較簡單的或具有某種特性的若干矩陣的和或乘積,矩陣的分解法一般有三角分解、譜分解、奇異值分解、滿秩分解等。

三角分解

設,則A可以唯一地分解為,其中是酉矩陣,R是正線上三角復矩陣,或A可以唯一地分解為其中L是正線上三角復矩陣,是酉矩陣。

譜分解

譜分解(Spectral decomposition)是將矩陣分解為由其特徵值和特徵向量表示的矩陣之積的方法。需要注意只有對可對角化矩陣才可以施以特徵分解。

奇異值分解

假設M是一個m×n階矩陣,其中的元素全部屬於域K,也就是實數域或複數域。如此則存在一個分解使得
其中U是m×m階酉矩陣;Σ是m×n階實數對角矩陣;而V*,即V的共軛轉置,是n×n階酉矩陣。這樣的分解就稱作M的奇異值分解。Σ對角線上的元素Σi,i即為M的奇異值。常見的做法是將奇異值由大而小排列。如此Σ便能由M唯一確定了。

滿秩分解

設,若存在矩陣及,使得A=FG,則稱其為的A一個滿秩分解。

LUP分解

LUP分解的思想就是找出三個n×n矩陣L,U,P,滿足.其中L是一個單位下三角矩陣,U是一個單位上三角矩陣,P是一個置換矩陣。而滿足分解條件的矩陣L,U,P稱為矩陣A的一個LUP分解。

特殊類別


對稱矩陣

線性代數中,對稱矩陣是一個方形矩陣,其轉置矩陣和自身相等。即.例如:.

Hermitian矩陣

一個正方的復值矩陣稱為Hermitian矩陣,若即其元素,換言之Hermitian矩陣是一種復共軛對稱矩陣。
對一個實值矩陣,Hermitian矩陣與對稱矩陣等價。

正交矩陣

一個實的正方矩陣稱為正交矩陣,若.

酉矩陣

一個復值正方矩陣稱為正交矩陣,若.

帶型矩陣

矩陣,若矩陣滿足條件=0,|i-j|>k,則矩陣A可以稱為帶型矩陣(banded matrix)。

三角矩陣

在線性代數中,三角矩陣是方形矩陣的一種,因其非零係數的排列呈三角形狀而得名。三角矩陣分上三角矩陣和下三角矩陣兩種。若,則的矩陣稱為上三角矩陣,若,則的矩陣稱為下三角矩陣。三角矩陣可以看做是一般方陣的一種簡化情形。

相似矩陣

在線性代數中,相似矩陣是指存在相似關係的矩陣。相似關係是兩個矩陣之間的一種等價關係。兩個n×n矩陣A與B為相似矩陣當且僅當存在一個n×n的可逆矩陣P,使得:或。

相合矩陣

令,並且C非奇異,則矩陣稱為A的相合矩陣。其中線性變換稱為相合變換。

范德蒙矩陣

Vandermonde矩陣(范德蒙矩陣)的命名來自Alexandre-Théophile Vandermonde的名字,范德蒙矩陣是一個各列呈現出幾何級數關係的矩陣。
例如:
或以第i行第j列的關係寫作:

阿達馬矩陣

Hadamard矩陣(阿達馬矩陣)是一個方陣,每個元素都是+1或−1,每行都是互相正交的。
n階的阿達馬矩陣H滿足:。這裡In是n×n的單位矩陣。

對角矩陣

對於m×m的矩陣,當時,有,此時所有非對角線上的元素均為0,此時的矩陣稱為對角矩陣

分塊矩陣

一個分塊矩陣是將矩陣分割出較小的矩陣,這些較小的矩陣就稱為子塊。例如:
該矩陣可以分為四個2×2的矩陣:
分塊后的矩陣可以寫為如下形式:

Jacobian矩陣

Jacobian矩陣是函數的一階偏導數以一定方式排列成的矩陣。
可表示為如下形式:

旋轉矩陣

旋轉矩陣(Rotation matrix)是在乘以一個向量的時候有改變向量的方向但不改變大小的效果的矩陣。旋轉矩陣不包括反演,它可以把右手坐標系改變成左手坐標系或反之。所有旋轉加上反演形成了正交矩陣的集合。
旋轉矩陣是世界上著名的彩票專家、澳大利亞數學家底特羅夫研究的,它可以幫助您鎖定喜愛的號碼,提高中獎的機會。首先您要先選一些號碼,然後,運用某一種旋轉矩陣,將你挑選的數字填入相應位置。如果您選擇的數字中有一些與開獎號碼一樣,您將一定會中一定獎級的獎。當然運用這種旋轉矩陣,可以最小的成本獲得最大的收益,且遠遠小於複式投注的成本。
旋轉矩陣的原理在數學上涉及到的是一種組合設計:覆蓋設計。而覆蓋設計,填裝設計,斯坦納系,t-設計都是離散數學中的組合優化問題。它們解決的是如何組合集合中的元素以達到某種特定的要求。

范數


主條目:范數
矩陣的范數主要包括三種主要類型:誘導范數,元素形式范數和Schatten范數。
若映射滿足以下要求:
則稱該映射為上的矩陣范數。

誘導范數

誘導范數又稱矩陣空間上的運算元范數(operator norm),定義為:
常用的誘導范數為p范數:
p范數也稱為明克夫斯基p范數或者范數。特別的,當時,對應的誘導范數分別為

元素形式范數

將矩陣按照列的形式,排成一個的向量,然後採用向量范數的定義,即得到矩陣的元素形式范數,表式如下:

Schatten范數

Schatten范數是用矩陣的奇異值定義的范數,定義為:
其中為對應矩陣的奇異值。

應用


圖像處理

在圖像處理中圖像的仿射變換一般可以表示為一個仿射矩陣和一張原始圖像相乘的形式,例如,
這裡表示的是一次線性變換再街上一個平移。

線性變換對稱

線性變換及其所對應的對稱,在現代物理學中有著重要的角色。例如,在量子場論中,基本粒子是由狹義相對論的洛倫茲群所表示,具體來說,即它們在旋量群下的表現。內含泡利矩陣及更通用的狄拉克矩陣的具體表示,在費米子的物理描述中,是一項不可或缺的構成部分,而費米子的表現可以用旋量來表述。描述最輕的三種夸克時,需要用到一種內含特殊酉群SU(3)的群論表示;物理學家在計算時會用一種更簡便的矩陣表示,叫蓋爾曼矩陣,這種矩陣也被用作SU(3)規範群,而強核力的現代描述──量子色動力學的基礎正是SU(3)。還有卡比博-小林-益川矩陣(CKM矩陣):在弱相互作用中重要的基本夸克態,與指定粒子間不同質量的夸克態不一樣,但兩者卻是成線性關係,而CKM矩陣所表達的就是這一點。

量子態的線性組合

1925年海森堡提出第一個量子力學模型時,使用了無限維矩陣來表示理論中作用在量子態上的運算元。這種做法在矩陣力學中也能見到。例如密度矩陣就是用來刻畫量子系統中“純”量子態的線性組合表示的“混合”量子態。
另一種矩陣是用來描述構成實驗粒子物理基石的散射實驗的重要工具。當粒子在加速器中發生碰撞,原本沒有相互作用的粒子在高速運動中進入其它粒子的作用區,動量改變,形成一系列新的粒子。這種碰撞可以解釋為結果粒子狀態和入射粒子狀態線性組合的標量積。其中的線性組合可以表達為一個矩陣,稱為S矩陣,其中記錄了所有可能的粒子間相互作用。

簡正模式

矩陣在物理學中的另一類泛應用是描述線性耦合調和系統。這類系統的運動方程可以用矩陣的形式來表示,即用一個質量矩陣乘以一個廣義速度來給出運動項,用力矩陣乘以位移向量來刻畫相互作用。求系統的解的最優方法是將矩陣的特徵向量求出(通過對角化等方式),稱為系統的簡正模式。這種求解方式在研究分子內部動力學模式時十分重要:系統內部由化學鍵結合的原子的振動可以表示成簡正振動模式的疊加。描述力學振動或電路振蕩時,也需要使用簡正模式求解。

幾何光學

在幾何光學里,可以找到很多需要用到矩陣的地方。幾何光學是一種忽略了光波波動性的近似理論,這理論的模型將光線視為幾何射線。採用近軸近似(英語:paraxial approximation),假若光線與光軸之間的夾角很小,則透鏡或反射元件對於光線的作用,可以表達為2×2矩陣與向量的乘積。這向量的兩個分量是光線的幾何性質(光線的斜率、光線跟光軸之間在主平面(英語:principal plane)的垂直距離)。這矩陣稱為光線傳輸矩陣(英語:ray transfer matrix),內中元素編碼了光學元件的性質。對於折射,這矩陣又細分為兩種:“折射矩陣”與“平移矩陣”。折射矩陣描述光線遇到透鏡的折射行為。平移矩陣描述光線從一個主平面傳播到另一個主平面的平移行為。
由一系列透鏡或反射元件組成的光學系統,可以很簡單地以對應的矩陣組合來描述其光線傳播路徑。

電子學

在電子學里,傳統的網目分析(英語:mesh analysis)或節點分析會獲得一個線性方程組,這可以以矩陣來表示與計算。