統計推斷
以概率形式表述的推斷
統計推斷statistical inference 根據帶隨機性的觀測數據(樣本)以及問題的條件和假定(模型),而對未知事物作出的,以概率形式表述的推斷。它是數理統計學的主要任務,其理論和方法構成數理統計學的主要內容。
統計推斷是從總體中抽取部分樣本,通過對抽取部分所得到的帶有隨機性的數據進行合理的分析,進而對總體作出科學的判斷,它是伴隨著一定概率的推測。統計推斷的基本問題可以分為兩大類:一類是參數估計問題;另一類是假設檢驗問題。
在數理統計學中,統計推斷問題常表述為如下形式:所研究的問題有一個確定的總體,其總體分佈未知或部分未知,通過從該總體中抽取的樣本(觀測數據)作出與未知分佈有關的某種結論。例如,某一群人的身高構成一個總體,通常認為身高是服從正態分佈的,但不知道這個總體的均值,隨機抽部分人,測得身高的值,用這些數據來估計這群人的平均身高,這就是一種統計推斷形式,即參數估計。若感興趣的問題是“平均身高是否超過1.7(米)”,就需要通過樣本檢驗此命題是否成立,這也是一種推斷形式,即假設檢驗。由於統計推斷是由部分(樣本)推斷整體(總體),因此根據樣本對總體所作的推斷,不可能是完全精確和可靠的,其結論要以概率的形式表達。統計推斷的目的,是利用問題的基本假定及包含在觀測數據中的信息,作出盡量精確和可靠的結論。
在質量活動和管理實踐中,人們關心的是特定產品的質量水平,如產品質量特性的平均值、不合格品率等。這些都需要從總體中抽取樣本,通過對樣本觀察值分析來估計和推斷,即根據樣本來推斷總體分佈的未知參數,稱為參數估計。參數估計有兩種基本形式:點估計和區間估計。
個體是總體的一部分,局部的特性能反映全局的特點,但是,由於總體的不均勻性和樣本的隨機性,又使得樣本不能精確地反映總體。因此,抽取部分個體經分析得出有關總體的結論存在著差錯和不可靠。從理論上講有兩種途徑可以消除和減少這種差錯。
先假設真實差異不存在,表面差異全為試驗誤差。然後計算這一假設出現的概率,根據小概率事件實際不可能性原理,判斷假設是否正確。這是對樣本所屬總體所做假設是否正確的統計證明,稱為統計假設測驗。
統計假設測驗的基本步驟為:
(1)對樣本所屬總體提出假設(包括和);
(2)確定顯著水平;
(3)在正確的前提下,依統計數的抽樣分佈,計算 實際差異由誤差造成的概率;
(4)將算得的概率與相比較,根據小概率事件實際不可能性原理作出是接受還是否定的推斷。
總體是我們要研究的未知事物,我們往往不可能改變他的均勻性,當能夠使其達到理想的均勻時,已經完全掌握了它,沒有研究的必要了。
確保抽樣代表性
採取適當的抽樣方法確保抽樣的“代表性”,可有效地控制和提高統計推斷的可靠性和正確性。
隨機抽樣的方法很多,常用的有:
1、簡單隨機抽樣
簡單隨機抽樣,是指抽樣過程應獨立進行並且總體中每個個體被抽到的機會均等。隨機抽樣不是隨便抽取,隨便抽取容易受到個人好惡的影響。為實現隨機化,可採取抽籤、擲隨機數骰子或查隨機數值表等辦法。如從100件產品中隨機抽取l0件組成樣本,可以把這100件產品從l開始編號直到100號,然後用抓鬮的辦法任意抽出l0個編號,由這l0個編號代表的產品組成樣本。此種抽樣方法的優點是抽樣誤差小,缺點是手續繁雜。在實踐中真正做到每個個體被抽到的機會相等是不容易的。
2、周期系統抽樣
周期系統抽樣,又叫等距抽樣或機械抽樣,即將總體按順序編號,用抽籤或查隨機數值表的方法確定首件,進而按等距原則依次抽取樣本。如從120個零件中取五個做樣本,先按生產順序給產品編號,用簡單隨機抽樣法確定首件,然後按每隔24(由得)個號碼抽取一個,共抽取五個組成樣本。這種方法特別適用於流水線上取樣,操作簡便,實施起來不易出現差錯。但抽樣起點一經確定,整個樣本就完全固定。對總體質量特性含有某種周期性變化,而當抽樣間隔恰好與質量特性變化周期吻合時,就可能得到一個偏差很大的樣本。
3、分層抽樣法
分層抽樣法,即從一個可以分成不同子總體的總體中,按規定比例從不同層中隨機抽取個體的方法。當不同設備、不同環境生產同一種產品時,由於條件差別產品質量可能有較大差異,為了使所抽取的樣本具有代表性,可以將不同條件下生產的產品組成組,使同一組內產品質量均勻,然後在各組內按比例隨機抽取樣品合成一個樣本。這種抽樣方法得到的樣本代表性比較好,抽樣誤差較小,缺點是抽樣手續較繁,常用於產品質量檢驗。
4、整群抽樣法
這種方法是先將總體按一定方式分成多個群,然後隨機地抽取若干群並由這些群中的所有個體組成樣本。如按照生產過程將1000個零件分別裝入20個箱中,每箱50個,然後隨機抽取一箱,此箱中50個零件組成樣本。這種抽樣方法實施方便,但樣本來自個別群體而不能均勻分佈在總體中,因而代表性差,抽樣誤差較大。