統計推斷

以概率形式表述的推斷

統計推斷statistical inference 根據帶隨機性的觀測數據（樣本）以及問題的條件和假定（模型），而對未知事物作出的，以概率形式表述的推斷。它是數理統計學的主要任務，其理論和方法構成數理統計學的主要內容。

1基本內容特點表述形式

方法 2提高途徑 3統計假設測驗

4盡量均勻

基本內容

特點

統計推斷是從總體中抽取部分樣本，通過對抽取部分所得到的帶有隨機性的數據進行合理的分析，進而對總體作出科學的判斷，它是伴隨著一定概率的推測。統計推斷的基本問題可以分為兩大類：一類是參數估計問題；另一類是假設檢驗問題。

統計推斷的一個基本特點是：其所依據的條件中包含有帶隨機性的觀測數據。以隨機現象為研究對象的概率論，是統計推斷的理論基礎。

表述形式

在數理統計學中，統計推斷問題常表述為如下形式：所研究的問題有一個確定的總體，其總體分佈未知或部分未知，通過從該總體中抽取的樣本（觀測數據）作出與未知分佈有關的某種結論。例如，某一群人的身高構成一個總體，通常認為身高是服從正態分佈的，但不知道這個總體的均值，隨機抽部分人，測得身高的值，用這些數據來估計這群人的平均身高，這就是一種統計推斷形式，即參數估計。若感興趣的問題是“平均身高是否超過1.7（米）”，就需要通過樣本檢驗此命題是否成立，這也是一種推斷形式，即假設檢驗。由於統計推斷是由部分（樣本）推斷整體（總體），因此根據樣本對總體所作的推斷，不可能是完全精確和可靠的，其結論要以概率的形式表達。統計推斷的目的，是利用問題的基本假定及包含在觀測數據中的信息，作出盡量精確和可靠的結論。

方法

在質量活動和管理實踐中，人們關心的是特定產品的質量水平，如產品質量特性的平均值、不合格品率等。這些都需要從總體中抽取樣本，通過對樣本觀察值分析來估計和推斷，即根據樣本來推斷總體分佈的未知參數，稱為參數估計。參數估計有兩種基本形式：點估計和區間估計。

提高途徑

個體是總體的一部分，局部的特性能反映全局的特點，但是，由於總體的不均勻性和樣本的隨機性，又使得樣本不能精確地反映總體。因此，抽取部分個體經分析得出有關總體的結論存在著差錯和不可靠。從理論上講有兩種途徑可以消除和減少這種差錯。

統計假設測驗

先假設真實差異不存在，表面差異全為試驗誤差。然後計算這一假設出現的概率，根據小概率事件實際不可能性原理，判斷假設是否正確。這是對樣本所屬總體所做假設是否正確的統計證明，稱為統計假設測驗。

統計假設測驗的基本步驟為：

（1）對樣本所屬總體提出假設(包括和)；

（2）確定顯著水平；

（3）在正確的前提下，依統計數的抽樣分佈，計算實際差異由誤差造成的概率；

（4）將算得的概率與相比較，根據小概率事件實際不可能性原理作出是接受還是否定的推斷。

盡量均勻

總體是我們要研究的未知事物，我們往往不可能改變他的均勻性，當能夠使其達到理想的均勻時，已經完全掌握了它，沒有研究的必要了。

確保抽樣代表性

採取適當的抽樣方法確保抽樣的“代表性”，可有效地控制和提高統計推斷的可靠性和正確性。

隨機抽樣的方法很多，常用的有：

1、簡單隨機抽樣

簡單隨機抽樣，是指抽樣過程應獨立進行並且總體中每個個體被抽到的機會均等。隨機抽樣不是隨便抽取，隨便抽取容易受到個人好惡的影響。為實現隨機化，可採取抽籤、擲隨機數骰子或查隨機數值表等辦法。如從100件產品中隨機抽取l0件組成樣本，可以把這100件產品從l開始編號直到100號，然後用抓鬮的辦法任意抽出l0個編號，由這l0個編號代表的產品組成樣本。此種抽樣方法的優點是抽樣誤差小，缺點是手續繁雜。在實踐中真正做到每個個體被抽到的機會相等是不容易的。

2、周期系統抽樣

周期系統抽樣，又叫等距抽樣或機械抽樣，即將總體按順序編號，用抽籤或查隨機數值表的方法確定首件，進而按等距原則依次抽取樣本。如從120個零件中取五個做樣本，先按生產順序給產品編號，用簡單隨機抽樣法確定首件，然後按每隔24(由得)個號碼抽取一個，共抽取五個組成樣本。這種方法特別適用於流水線上取樣，操作簡便，實施起來不易出現差錯。但抽樣起點一經確定，整個樣本就完全固定。對總體質量特性含有某種周期性變化，而當抽樣間隔恰好與質量特性變化周期吻合時，就可能得到一個偏差很大的樣本。

3、分層抽樣法

分層抽樣法，即從一個可以分成不同子總體的總體中，按規定比例從不同層中隨機抽取個體的方法。當不同設備、不同環境生產同一種產品時，由於條件差別產品質量可能有較大差異，為了使所抽取的樣本具有代表性，可以將不同條件下生產的產品組成組，使同一組內產品質量均勻，然後在各組內按比例隨機抽取樣品合成一個樣本。這種抽樣方法得到的樣本代表性比較好，抽樣誤差較小，缺點是抽樣手續較繁，常用於產品質量檢驗。

4、整群抽樣法

這種方法是先將總體按一定方式分成多個群，然後隨機地抽取若干群並由這些群中的所有個體組成樣本。如按照生產過程將1000個零件分別裝入20個箱中，每箱50個，然後隨機抽取一箱，此箱中50個零件組成樣本。這種抽樣方法實施方便，但樣本來自個別群體而不能均勻分佈在總體中，因而代表性差，抽樣誤差較大。