頻率分佈

統計學術語之一

反映一組數據的平均水平與波動大小的數字特徵,可以用平均數方差等。它們從某一項側面反映了一組數據的情況,但是在實際生活中,有時只知道這些情況還不夠,還需要知道數據在整體上的分佈情況。例如,對於班組的一次代數考試情況,不僅要知道平均成績,還要知道90分以上的佔多少,80分與90分之間的佔多少,不及格的佔多少等。因此一組數據的頻率分佈十分重要。

應用


頻率分佈直方圖
直角坐標系中,橫軸表示樣本數據,縱軸表示頻率與組距的比值,將頻率分佈表中各組頻率的大小用相應矩形面積的大小來表示,由此畫成的統計圖叫做頻率分佈直方圖
頻率分佈直方圖能清楚顯示各組頻數分佈情況又易於顯示各組之間頻數的差別,它主要是為了將我們獲取的數據直觀、形象地表示出來,讓我們能夠更好了解數據的分佈情況。
頻率分佈表
頻率分佈表(table of frequency distribution)亦稱頻數分佈表,又稱次數分佈表,是一種統計學數表。頻率分佈表指統計學中表示樣本數據頻率分佈規律的表格。

舉例說明


頻率分佈
頻率分佈
為了了解中學生的身體發育情況,對某中學同年齡的60名女學生的身高進行了測量,
結果如下(單位:厘米):
167 154 159 166 169 159 156 166 162 158
159 156 166 160 164 160 157 156 157 161
158 158 153 158 164 158 163 158 153 157
162 162 159 154 165 155 157 151 146 151
158 161 165 158 163 163 162 161 154 165
162 162 159 157 159 149 164 168 159 153
我們知道,這組數據的平均數,反映了這些學生的平均身高,但是,有時只知道這一點還不夠,還希望知道身高在哪個小範圍內的學生多,在哪個小範圍內的學生少,也就是說,希望知道這60名女學生的身高數據在各個小範圍內所佔的比例大小,為此,需要對這組數據進行適當整理整理數據時。可以按照下面的步驟進行:
1.計算最大值與最小值的差
教師引導學生通過觀察比較找出數據中的最大值與最小值讓學生先對整個數據進行初步觀察,找出其中一個儘可能小的數據,然後按順序將全組數據過一遍,將每個數據與所找出的數據進行比較,如果前者更小,就用它來取代後者,並繼續往下進行,從而最後得到其中的最小值,同理得到其中的最大值。
最大值是169,最小會值是146,它們的差是:
算出了最大值與最小值的差,就知道這組數據變動的範圍有多大。
2.決定組距與組數
將一批數據分組,一般數據越多,分的組數也越多,經驗法則是:當數據在100個以內時,按照數據的多少,常分成5~12組。組距是指每個小組的兩個端點之間的距離。
如果取組距為3厘米,那麼由於在這批數據中,要將數據分成8組;如果取組距為2厘米,那麼由於,要分成12組,因為當數據個數接近100時,組數接近12,而這裡的數據個數是60,因此分成8組更合適些,於是取定組距為3厘米,組數為8。
3、決定分點
可以分成以下8組:146~149,149~152,152~155,155~158,158~161,161~164,164~167,167~170。
這時有些數據(如149、158、167)本身就是分點,不好決定它們究竟應該屬於哪一組,為避免出現這種情況,可以使分點比數據多一位小數,並且把第1組的起點稍微減小一點.例如,可以將第1組的起點定為145.5,這樣,所分的8個小組是:
145.5~148.5,148.5~151.5,151.5~154.5,154.5~157.5,157.5~160.5,160.5~163.5,
163.5~166.5,166.5~169.5。
4.列頻率分佈表
在根據頻數累計的結果在表中填出相應的頻數后,要將各頻數相加,看看它們的和是否等於數據的總個數,如果不相等,說明前面出現了差錯,需要進行檢查.在根據各組的頻數算出相應的頻率之後,也要根據各組的頻率之和是否等於回來檢查求頻率的計算過程是否有錯。

頻率分佈的特點


每組的最高數值與最低數值之間的距離。在分組整理統計量數時,組的大小可因系列內量數的全距及所要劃分的組數的不同而有所不同。每一組的最小限度叫做下限,最大限度叫做上限。下限和上限之間的距離,即為組距。
找到最大值L及最小值S,計算全距R

參考資料


1、http://www.moonedu.com/chuzhong/HTML/39611.shtml