質量數據

某質量指標的質量特性值

質量數據是指某質量指標質量特性值。狹義的質量數據主要是產品質量相關的數據,如不良品數、合格率、直通率、返修率等。廣義的質量數據指能反映各項工作質量的數據,如質量成本損失、生產批量、庫存積壓、無效作業時間等。這些均將成為精益質量管理的研究改進對象。

定義


由於質量一詞含義豐富,既包括狹義的產品質量,也包括廣義的工作質量,因而質量指標在企業中就多種多樣,質量數據在企業中幾乎無處不在。在質量數據統計分析中,特別關注三項指標,一是數據的集中位置,二是數據的分散程度,三是數據的分佈規律。數據的集中位置分別有平均值、中位數、眾數三種 表示方法,其各具優缺點,其中平均值最為普遍常用。數據的分散程度由標準差表達,用符號s(西格瑪)表示,數據的分散程度在質量管理中就是質量特性值的波 動性,反映過程能力。
數據的分佈規律在質量管理中對統計總體而言為正態分佈,該分佈規律是理論和實踐證明的統計規律。質量數據統計分析重點就是在總體正態分佈這個已知背景下研究該正態分佈的平均值和標準差。質量數據定量化分析對企業質量管理以及經營管理具有重要意義,其是精益質量管理的基礎。

特性


1.波動性,即在相同的生產技術條件下生產出來的一批產品,其質量特性數據由於受到操作者、設備、材料、方法、環境等多種因素的影響而總存在著一定的差異; 2.規律性,即當生產過程處於正常狀態時,其質量數據的波動是有一定規律的。

分類


數據錄入過程
質量數據是指由個體產品質量特性值組成的樣本(總體)的質量數據集,在統計上稱為變數;個體產品質量特性值稱變數值。根據質量數據的特點,可以將其分為計量值數據和計數值數據。
1.計量值數據
計量值數據是可以連續取值的數據,屬於連續型變數。其特點是在任意兩個數值之間都可以取精度較高一級的數值。它通常由測量得到,如重量、強度、幾何尺寸、標高、位移等。此外,一些屬於定性的質量特性,可由專家主觀評分、劃分等級而使之數量化,得到的數據也屬於計量值數據。
2.計數值數據
計數值數據是只能按0,1,2,……數列取值計數的數據,屬於離散型變數。它一般由計數得到。計數值數據又可分為計件值數據和計點值數據。
(1)計件值數據,表示具有某一質量標準的產品個數。如總體中合格品數、一級品數。
(2)計點值數據,表示個體(單件產品、單位長度、單位面積、單位體積等)上的缺陷數、質量問題點數等。如檢驗鋼結構構件塗料塗裝質量時,構件表面的焊渣、焊疤、油污、毛刺數量等。
數據一致性
很多用戶甚至一些數據倉庫項目的開發人員經常將數據質量和數據倉庫項目開發中的ETL過程的數據一致性混為一談,錯誤的認為數據倉庫項目(也即ETL過程)能夠修複數據以提高數據質量,其實數據質量和ETL過程的數據一致性是兩個不同的概念。ETL過程的數據一致性是指根據相同的業務理解(基於源系統模型和基於數據倉庫模型),在源系統查詢和統計的信息與在數據倉庫中得到的結果在各個細節層次(包括明細層次)上都是相同的。數據一致性是ETL過程必須保證的。質量是數據存在於企業的源系統中的,如常見的客戶代碼的不規範,同一個客戶在不同的系統中(例如業務處理系統和財務系統)有不同的代碼,甚至同一個客戶在同一個系統中也有不同的代碼,以保險公司的業務處理系統為例,同一個客戶先後在同一個保險公司投保,不同的業務員可能會輸入不同的客戶代碼;更常見的是那些沒有實現大集中的分散式的應用,同一個客戶(如工商銀行)在不同的分公司(如河南分公司和湖北分公司)投保,業務員很可能會輸入不同的代碼;再如,在業務處理系統中,有些錄入人員為了錄入的方便,常常將一些內容不輸或者採用默認值,造成一些重要錄入信息的缺失或錯誤。這些數據質量問題對數據分析系統造成嚴重的干擾和破壞。數據倉庫項目雖然不能夠修複數據以提高數據質量,但能發現存在的部分問題從而提醒用戶哪些數據是有質量問題的,給出用戶一些改進的建議,同時在分析和決策時應降低對這些數據的依賴程度,也可以提供輔助的方法跟蹤、監測數據質量問題。

收集方法


(一)全數檢驗
全數檢驗是對總體中的全部個體逐一觀察、測量、計數、登記,從而獲得對總體質量水平評價結論的方法。
(二)隨機抽樣檢驗 抽樣檢驗是按照隨機抽樣的原則,從總體中抽取部分個體組成樣本,根據對樣品進行檢測的結果,推斷總體質量水平的方法。
抽樣檢驗抽取樣品不受檢驗人員主觀意願的支配,每一個體被抽中的概率都相同,從而保證了樣本在總體中的分佈比較均勻,有充分的代表性;同時它還具有節省人力、物力、財力、時間和準確性高的優點;它又可用於破壞性檢驗和生產過程的質量監控,完成全數檢測無法進行的檢測項目,具有廣泛的應用空間。抽樣的具體方法有:
1.簡單隨機抽樣
簡單隨機抽樣又稱純隨機抽樣、完全隨機抽樣,是對總體不進行任何加工,直接進行隨機抽樣,獲取樣本的方法。
2.分層抽樣
分層抽樣又稱分類或分組抽樣,是將總體按與研究目的有關的某一特性分為若干組,然後在每組內隨機抽取樣品組成樣本的方法。
等距抽樣又稱機械抽樣、系統抽樣,是將個體按某一特性排隊編號后均分為n組,這時每組有 K二N/n個個體,然後在第一組內隨機抽取第一件樣品,以後每隔一定距離(K號)抽選出其餘樣品組成樣本的方法。如在流水作業線上每生產100件產品抽出一件產品做樣品,直到抽出n件產品組成樣本。
4.整群抽樣
整群抽樣一般是將總體按自然存在的狀態分為若干群,並從中抽取樣品群組成樣本,然後在中選群內進行全數檢驗的方法。如對原材料質量進行檢測,可按原包裝的箱、盒為群隨機抽取,對中選箱、盒做全數檢驗;每隔一定時間抽出一批產品進行全數檢驗等。
由於隨機性表現在群間,樣品集中,分佈不均勻,代表性差,產生的抽樣誤差也大,同時在有周期性變動時,也應注意避免系統偏差。
5.多階段抽樣
多階段抽樣又稱多級抽樣。上述抽樣方法的共同特點是整個過程中只有一次隨機抽樣,因而統稱為單階段抽樣。但是當總體很大時,很難一次抽樣完成預定的目標。多階段抽樣是將各種單階段抽樣方法結合使用,通過多次隨機抽樣來實現的抽樣方法。如檢驗鋼材、水泥等質量時,可以對總體按不同批次分為R群,從中隨機抽取 r群,而後在中選的r群中的M個個體中隨機抽取m個個體,這就是整群抽樣與分層抽樣相結合的二階段抽樣,它的隨機性表現在群間和群內有兩次。