Pearson相關係數

衡量定距變數間的線性關係

Pearson相關係數(Pearson CorrelationCoefficient)是用來衡量兩個數據集合是否在一條線上面,它用來衡量定距變數間的線性關係

有關係數簡介


如衡量國民收入和居民儲蓄存款、身高和體重、高中成績和高考成績等變數間的線性相關關係。當兩個變數都是正態連續變數,而且兩者之間呈線性關係時,表現這兩個變數之間相關程度用積差相關係數,主要有Pearson簡單相關係數。
其計算公式為:
計算公式
計算公式

值域等級解釋


相關係數的絕對值越大,相關性越強:相關係數越接近於1或-1,相關度越強,相關係數越接近於0,相關度越弱。
通常情況下通過以下取值範圍判斷變數的相關強度:
相關係數 0.8-1.0 極強相關
0.6-0.8 強相關
0.4-0.6 中等程度相關
0.2-0.4 弱相關
0.0-0.2 極弱相關或無相關
對於x,y之間的相關係數r :
當r大於0小於1時表示x和y正相關關係
當r大於-1小於0時表示x和y負相關關係
當r=1時表示x和y完全正相關,r=-1表示x和y完全負相關
當r=0時表示x和y不相關