特徵向量

矩陣理論上的重要概念

矩陣的特徵向量是矩陣理論上的重要概念之一,它有著廣泛的應用。數學上,線性變換的特徵向量(本徵向量)是一個非簡併的向量,其方向在該變換下不變。該向量在此變換下縮放的比例稱為其特徵值(本徵值)。

一個線性變換通常可以由其特徵值和特徵向量完全描述。特徵空間是相同特徵值的特徵向量的集合。“特徵”一詞來自德語的eigen。1904年希爾伯特首先在這個意義下使用了這個詞,更早亥爾姆霍爾茲也在相關意義下使用過該詞。eigen一詞可翻譯為”自身的”、“特定於……的”、“有特徵的”、或者“個體的”,這顯示了特徵值對於定義特定的線性變換的重要性。

第一性質


線性變換的特徵向量是指在變換下方向不變,或者簡單地乘以一個縮放因子的非零向量。
特徵向量對應的特徵值是它所乘的那個縮放因子。
特徵空間就是由所有有著相同特徵值的特徵向量組成的空間,還包括零向量,但要注意零向量本身不是特徵向量。
線性變換的主特徵向量是最大特徵值對應的特徵向量。
特徵值的幾何重次是相應特徵空間的維數。
有限維向量空間上的一個線性變換的譜是其所有特徵值的集合。
例如,三維空間中的旋轉變換的特徵向量是沿著旋轉軸的一個向量,相應的特徵值是1,相應的特徵空間包含所有和該軸平行的向量。該特徵空間是一個一維空間,因而特徵值1的幾何重次是1。特徵值1是旋轉變換的譜中唯一的實特徵值。

例子


隨著地球的自轉,除了在轉軸上的兩個箭頭,每個從地心往外指的箭頭都在旋轉。考慮地球在自轉一小時后的變換:地心指向地理南極的箭頭是這個變換的一個特徵向量,但是從地心指向赤道上任何一點的箭頭不會是一個特徵向量。又因為指向極點的箭頭沒有被地球的自轉拉伸,所以它的特徵值是1。
特徵向量
特徵向量
另一個例子是,薄金屬板關於一個固定點均勻伸展,使得板上每一個點到該固定點的距離翻倍。這個伸展是一個具有特徵值2的變換。從該固定點到板上任何一點的向量都是一個特徵向量,而相應的特徵空間是所有這些向量的集合。
但是,三維幾何空間不是唯一的向量空間。例如,考慮兩端固定的拉緊的繩子,就像弦樂器的振動弦那樣。振動弦的原子到它們在弦靜止時所處的位置的帶符號的那些距離視為一個空間中的一個向量的分量,那個空間的維數就是弦上原子的個數。
如果考慮繩子隨著時間流逝發生的變換,它的特徵向量,或者說特徵函數(如果將繩子假設為一個連續媒介),就是它的駐波——即那些通過空氣的傳播讓人們聽到弓弦和吉他的撥動聲的振動。駐波對應於弦的特定振動,它們使得弦的形狀隨著時間變化而伸縮一個因子(特徵值)。和弦相關的該向量的每個分量乘上了一個依賴於時間的因子。駐波的振幅(特徵值)在考慮到阻尼的情況下逐漸減小。因此可以將每個特徵向量對應於一個壽命,並將特徵向量的概念和共振的概念聯繫起來。

方程


從數學上看,如果向量v與變換A滿足 Av=λv,則稱向量v是變換A的一個特徵向量,λ是相應的特徵值。這一等式被稱作“特徵值方程”。
假設它是一個線性變換,那麼v可以由其所在向量空間的一組基表示為:
其中vi是向量在基向量上的投影(即坐標),這裡假設向量空間為n 維。由此,可以直接以坐標向量表示。利用基向量,線性變換也可以用一個簡單的矩陣乘法表示。上述的特徵值方程可以表示為:
但是,有時候用矩陣形式寫下特徵值方程是不自然甚或不可能的。例如在向量空間是無窮維的時候,上述的弦的情況就是一例。取決於變換和它所作用的空間的性質,有時將特徵值方程表示為一組微分方程更好。若是一個微分運算元,其特徵向量通常稱為該微分運算元的特徵函數。例如,微分本身是一個線性變換因為(若M和N是可微函數,而a和b是常數)
考慮對於時間t的微分。其特徵函數滿足如下特徵值方程:
其中λ是該函數所對應的特徵值。這樣一個時間的函數,如果λ = 0,它就不變,如果λ為正,它就按比例增長,如果λ是負的,它就按比例衰減。例如,理想化的兔子的總數在兔子更多的地方繁殖更快,從而滿足一個正λ的特徵值方程。
該特徵值方程的一個解是N = exp(λt),也即指數函數;這樣,該函數是微分運算元d/dt的特徵值為λ的特徵函數。若λ是負數,我們稱N的演變為指數衰減;若它是正數,則稱指數增長。λ的值可以是一個任意複數。因此d/dt的譜是整個複平面。在這個例子中,運算元d/dt作用的空間是單變數可微函數的空間。該空間有無窮維(因為不是每一個可微函數都可以用有限的基函數的線性組合來表達的)。但是,每個特徵值λ所對應的特徵空間是一維的。它就是所有形為N = N0exp(λt)的函數的集合。N0是任意常數,也就在t=0的初始數量。

定理


譜定理在有限維的情況,將所有可對角化的矩陣作了分類:它顯示一個矩陣是可對角化的,當且僅當它是一個正規矩陣。注意這包括自共軛(厄爾米特)的情況。這很有用,因為對角化矩陣T的函數f(T)(譬如波萊爾函數f)的概念是清楚的。在採用更一般的矩陣的函數的時候譜定理的作用就更明顯了。例如,若f是解析的,則它的形式冪級數,若用T取代x,可以看作在矩陣的巴拿赫空間中絕對收斂。譜定理也允許方便地定義正運算元的唯一的平方根。
譜定理可以推廣到希爾伯特空間上的有界正規運算元,或者無界自共軛運算元的情況。

特徵向量概述


簡介

計算矩陣的特徵值和特徵向量
假設我們想要計算給定矩陣的特徵值。若矩陣很小,我們可以用特徵多項式進行符號演算。但是,對於大型矩陣這通常是不可行的,在這種情況我們必須採用數值方法。

求特徵值

描述正方形矩陣的特徵值的重要工具是特徵多項式,λ是A的特徵值等價於線性方程組(A – λI) v = 0 (其中I是單位矩陣)有非零解v (一個特徵向量),因此等價於行列式|A – λI|=0 。
函數p(λ) = det(A – λI)是λ的多項式,因為行列式定義為一些乘積的和,這就是A的特徵多項式。矩陣的特徵值也就是其特徵多項式的零點。
一個矩陣A的特徵值可以通過求解方程pA(λ) = 0來得到。若A是一個n×n矩陣,則pA為n次多項式,因而A最多有n個特徵值。反過來,代數基本定理說這個方程剛好有n個根,如果重根也計算在內的話。所有奇數次的多項式必有一個實數根,因此對於奇數n,每個實矩陣至少有一個實特徵值。在實矩陣的情形,對於偶數或奇數的n,非實數特徵值成共軛對出現。

求特徵向量

一旦找到兩兩互不相同的特徵值λ,相應的特徵向量可以通過求解方程(A – λI) v = 0 得到,其中v為待求特徵向量,I為單位陣。
沒有實特徵值的一個矩陣的例子是順時針旋轉90度。

數值計算

在實踐中,大型矩陣的特徵值無法通過特徵多項式計算,計算該多項式本身相當費資源,而精確的“符號式”的根對於高次的多項式來說很難計算和表達:阿貝爾-魯費尼定理顯示高次(5次或更高)多項式的根無法用n次方根來簡單表達。對於估算多項式的根的有效演演算法是有的,但特徵值的小誤差可以導致特徵向量的巨大誤差。求特徵多項式的零點,即特徵值的一般演演算法,是迭代法。最簡單的方法是冪法:取一個隨機向量v,然後計算一系列單位向量。
這個序列幾乎總是收斂於絕對值最大的特徵值所對應的特徵向量。這個演演算法很簡單,但是本身不是很有用。但是,象QR演演算法這樣的演演算法正是以此為基礎的。

第二性質


代數重次

A的一個特徵值λ的代數重次是λ作為A的特徵多項式的零點的次數;換句話說,若λ是一個該多項式的根,它是因子(t − λ)在特徵多項式中在因式分解后中出現的次數。一個n×n矩陣有n個特徵值,如果將代數重次計算在內的話,因為其特徵多項式次數為n。
一個代數重次1的特徵值為“單特徵值”。
在關於矩陣理論的條目中,可能會遇到如下的命題:
"一個矩陣A的特徵值為4,4,3,3,3,2,2,1"
表示4的代數重次為二,3的是三,2的是二,而1的是1。這樣的風格因為代數重次對於矩陣理論中的很多數學證明很重要而被大量使用。
回想一下,我們定義特徵向量的幾何重次為相應特徵空間的維數,也就是λI − A的零空間。代數重次也可以視為一種維數:它是相應廣義特徵空間 (第一種意義)的維數,也就是矩陣(λI − A)^k對於任何足夠大的k的零空間。也就是說,它是“廣義特徵向量”(第一種意義)的空間,其中一個廣義特徵向量是任何一個如果 λI − A作用連續作用足夠多次就“最終”會變0的向量。任何特徵向量是一個廣義特徵向量,以此任一特徵空間被包含於相應的廣義特徵空間。這給了一個幾何重次總是小於代數重次的簡單證明。這裡的第一種意義不可和下面所說的廣義特徵值問題混淆。

例如

它只有一個特徵值,也就是λ = 1。其特徵多項式是(λ − 1)2,所以這個特徵值代數重次為2。但是,相應特徵空間是通常稱為x軸的數軸,由向量線性撐成,所以幾何重次只是1。
廣義特徵向量可以用於計算一個矩陣的若當標準型。若當塊通常不是對角化而是冪零的這個事實與特徵向量和廣義特徵向量之間的區別直接相關。

分解定理


如上所述,譜定理表明正方形矩陣可以對角化當且僅當它是正規的。對於更一般的未必正規的矩陣,我們有類似的結果。當然在一般的情況,有些要求必須放鬆,例如酉等價性或者最終的矩陣的對角性。所有這些結果在一定程度上利用了特徵值和特徵向量。下面列出了一些這樣的結果:
舒爾三角形式表明任何矩陣等價於一個上三角矩陣;
奇異值分解定理, A = UΣV * 其中Σ為對角陣,而U,V為酉矩陣。A = UΣV * 的對角線上的元素非負,而正的項稱為A的奇異值。這對非正方形矩陣也成立;
若當標準型,其中A = UΛU − 1 其中Λ不是對角陣,但是分塊對角陣,而U是酉矩陣。若當塊的大小和個數由特徵值的幾何和代數重次決定。若當分解是一個基本的結果。從它可以立即得到一個正方形矩陣可以完全用它的特徵值包括重次來表述,最多只會相差一個酉等價。這表示數學上特徵值在矩陣的研究中有著極端重要的作用。
作為若當分解的直接結果,一個矩陣A可以“唯一”地寫作A = S + N其中S可以對角化,N是冪零的(也即,對於某個q,Nq=0),而S和N可交換(SN=NS)。
任何可逆矩陣A可以唯一地寫作A = SJ,其中S可對角化而J是么冪矩陣(即使得特徵多項式是(λ-1)的冪,而S和J可交換)。

其他屬性


譜在相似變換下不變:矩陣A和P^-1AP有相同的特徵值,這對任何方形矩陣A和任何可逆矩陣 P都成立。譜在轉置之下也不變:矩陣A和A^T有相同的特徵值。
因為有限維空間上的線性變換是雙射當且僅當它是單射,一個矩陣可逆當且僅當所有特徵值都不是0。
若當分解的一些更多的結果如下:
一個矩陣A相似於對角陣當且僅當對於A的每一個特徵值的代數重次等於幾何重次。特別地有,一個n×n矩陣如果有n個不同特徵值,則總是可以對角化的。
矩陣作用的向量空間可以視為其廣義特徵向量所撐成的不變子空間的直和。對角線上的每個塊對應於該直和的一個子空間。若一個塊是對角化的,其不變子空間是一個特徵空間。否則它是一個廣義特徵空間,如上面所定義;
因為跡,也就是矩陣主對角線元素之和,在酉等價下不變,若當標準型說明它等於所有特徵值之和;
類似的有,因為三角矩陣的特徵值就是主對角線上的項,其行列式等於等於特徵值的乘積(按代數重次計算出現次數)。
正規矩陣的一些子類的譜的位置是:
一個厄爾米特矩陣(A = A*)的所有特徵值是實數。進一步的有,所有正定矩陣(v*Av > 0 for all vectors v)的所有特徵值是正數;
所有斜厄爾米特矩陣(A = −A*)的特徵值是純虛數;
所有酉矩陣(A-1 = A*)的特徵值絕對值為1;
假設A是一個m×n矩陣,其中m ≤ n,而B是一個n×m矩陣。則BA有和AB相同的特徵值加上n − m個等於0的特徵值。
每個矩陣可以被賦予一個運算元范數。運算元范數是其特徵值的模的上確界,因而也是它的譜半徑。該范數直接和計算最大模的特徵值的冪法直接相關。當一個矩陣是正規的,其運算元范數是其特徵值的最大模,並且獨立於其定義域的范數。

共軛特徵向量


一個共軛特徵向量或者說共特徵向量是一個在變換下成為其共軛乘以一個標量的向量,其中那個標量稱為該線性變換的共軛特徵值或者說共特徵值。共軛特徵向量和共軛特徵值代表了和常規特徵向量和特徵值相同的信息和含義,但只在使用交替坐標系統的時候出現。
例如,在相干電磁散射理論中,線性變換A代表散射物體施行的作用,而特徵向量表示電磁波的極化狀態。在光學中,坐標系統按照波的觀點定義,稱為前向散射對齊 (FSA),從而導致了常規的特徵值方程,而在雷達中,坐標系統按照雷達的觀點定義,稱為後向散射對齊 (BSA),從而給出了共軛特徵值方程。

特徵問題


一個廣義特徵值問題(第二種意義)有如下形式
其中A和B為矩陣。其廣義特徵值(第二種意義)λ 可以通過求解如下方程得到
形如A − λB的矩陣的集合,其中λ是一個複數,稱為一個“鉛筆”。若B可逆,則最初的問題可以寫作標準的特徵值問題。但是,在很多情況下施行逆操作是不可取的,而廣義特徵值問題應該如同其原始表述來求解。
如果A和B是實對稱矩陣,則特徵值都為實數。這在上面的第二種等價表述中並不明顯,因為矩陣B − 1A未必是對稱的。

環中元素


在方矩陣A,其係數屬於一個環的情況,λ稱為一個右特徵值如果存在一個列向量x使得Ax=λx,或者稱為一個左特徵值如果存在非零行向量y使得yA=yλ。
若環是可交換的,左特徵值和右特徵值相等,並簡稱為特徵值。否則,例如當環是四元數集合的時候,它們可能是不同的。
若向量空間是無窮維的,特徵值的概念可以推廣到譜的概念。譜是標量λ的集合,對於這些標量,沒有定義,也就是說它們使得沒有有界逆。
很明顯,如果λ是T的特徵值,λ位於T的譜內。一般來講,反過來並不成立。在希爾伯特空間或者巴拿赫空間上有一些運算元完全沒有特徵向量。這可以從下面的例子中看到。在希爾伯特空間(所有標量級數的空間,每個級數使得收斂)上的雙向平移沒有特徵向量卻有譜值。
在無窮維空間,有界運算元的譜系總是非空的,這對無界自共軛運算元也成立。通過檢驗譜測度,任何有界或無界的自共軛運算元的譜可以分解為絕對連續,離散,和孤立部分。指數增長或者衰減是連續譜的例子,而振動弦駐波是離散譜例子。氫原子是兩種譜都有出現的例子。氫原子的束縛態對應於譜的離散部分,而離子化狀態用連續譜表示。圖3用氯原子的例子作了解釋。

應用


薛定諤方程

一個變換用微分運算元代表的特徵值方程的例子是量子力學中的時不變薛定諤方程
HΨE = EΨE
其中H是哈密爾頓運算元,一個二階微分運算元而ΨE是波函數,對應於特徵值E的特徵函數,該值可以解釋為它的能量。
一個氫原子中的一個電子的束縛態所對應的波函數可以視為氫原子哈密爾頓運算元的一個特徵向量,也是角動量運算元的一個特徵向量。它們對應於可以解釋為它們的能量(遞增:n=1,2,3,...)和角動量(遞增:s, p, d,...)的特徵值。這裡畫出了波函數絕對值的平方。更亮區域對應於位置測度的更高概率密度。每幅圖的中心都是原子核,一個質子但是,在這個情況我們只尋找薛定鄂方程的束縛態解,就像在量子化學中常做的那樣,我們在平方可積的函數中尋找ΨE。因為這個空間是一個希爾伯特空間,有一個定義良好的標量積,我們可以引入一個基集合,在其中ΨE和H可以表示為一個一維數組和一個矩陣。這使得我們能夠用矩陣形式表達薛定鄂方程。
狄拉克記法經常在這個上下文中使用,以強調狀態的向量和它的表示,函數ΨE之間的區別。在這個情況下,薛定鄂方程寫作
並稱是H的一個本徵態(H有時候在入門級課本中寫作),H被看作是一個變換(參看觀測值)而不是一個它用微分運算元術語進行的特定表示。在上述方程中,理解為通過應用H到得到的一個向量。

分子軌道

在量子力學中,特別是在原子物理和分子物理中,在Hartree-Fock理論下,原子軌道和分子軌道可以定義為Fock運算元的特徵向量。相應的特徵值通過Koopmans定理可以解釋為電離勢能。在這個情況下,特徵向量一詞可以用於更廣泛的意義,因為Fock運算元顯式地依賴於軌道和它們地特徵值。如果需要強調這個特點,可以稱它為隱特徵值方程。這樣地方程通常採用迭代程序求解,在這個情況下稱為自洽場方法。在量子化學中,經常會把Hartree-Fock方程通過非正交基集合來表達。這個特定地表達是一個廣義特徵值問題稱為Roothaan方程。

因子分析

在因素分析中,一個協變矩陣的特徵向量對應於因素,而特徵值是因素負載。因素分析是一種統計學技術,用於社會科學和市場分析、產品管理、運籌規劃和其他處理大量數據的應用科學。其目標是用稱為因素的少量的不可觀測隨機變數來解釋在一些可觀測隨機變數中的變化。可觀測隨機變數用因素的線性組合來建模,再加上“殘差項。
特徵臉是特徵向量的例子
在圖像處理中,臉部圖像的處理可以看作分量為每個像素的灰度的向量。該向量空間的維數是像素的個數。一個標準化面部圖形的一個大型數據集合的協變矩陣的特徵向量稱為 特徵臉。它們對於將任何面部圖像表達為它們的線性組合非常有用。特徵臉提供了一種用於識別目的的數據壓縮方式。在這個應用中,一般只取那些最大特徵值所對應的特徵臉。

慣量張量

在徠力學中,慣量的特徵向量定義了剛體的主軸。慣量是決定剛體圍繞質心轉動的關鍵數據。

應力張量

固體力學中,應力張量是對稱的,因而可以分解為對角張量,其特徵值位於對角線上,而特徵向量可以作為基。因為它是對角陣,在這個定向中,應力張量沒有剪切分量;它只有主分量。

圖的特徵值

在譜系圖論中,一個圖的特徵值定義為圖的鄰接矩陣A的特徵值,或者(更多的是)圖的拉普拉斯運算元矩陣I − T − 1 / 2AT − 1 / 2,其中T是對角陣表示每個頂點的度數,在T − 1 / 2中,0用於取代0 − 1 / 2。圖的主特徵向量用於測量其頂點的中心度。Google的PageRank演演算法就是一個例子。www圖的修正鄰接矩陣的主特徵向量的分量給出了頁面評分。