調查誤差

調查誤差

調查誤差,是指在取得樣本數據資料過程中產生的誤差。

基本定義


調查誤差(Error in Survey)是指在取得樣本數據資料過程中產生的誤差。這部分誤差通常與調查者、回答者、資料搜集方式和問卷等因素有關,它們會形成在調查過程中出現無回答和回答出現偏誤等情況,進而形成系統性誤差

劃分類型


調查誤差從其產生的人員來劃分主要包括調查人員誤差和被調查人員誤差兩種。
1、調查人員誤差的產生是由於調查工作過失和故意舞弊所致,如調查者自身的素質不高,工作粗糙、登陸馬虎等所造成的誤差都屬於調查者的誤差。故意舞弊是指調查者是為了自己省事,根本沒有按照調查方案的規定進行調查,而是隨意編造甚至纂改調查資料。
2、被調查者誤差的產生有的是由於被調查者對問題的理解發生差錯,或是因為被調查者記憶不清回答有苦難而造成的;有的是由於調查的問題涉及到被調查者的利益故意錯答所致;有的是由於調查的問題涉及到一些敏感性的問題或是提問方式不當而拒絕回答所致。
其中被調查人員誤差按被調查者是否回答,又可分為無回答誤差和回答誤差兩種。前者包括調查單位的無回答和調查項目的無回答。調查單位的無回答是指未能從抽選樣本中的一部分單位取得調查資料。調查項目的無回答是指在抽樣調查中對調查方案中的個別項目未能得到回答。
無回答誤差產生的原因可歸納為以下兩種:一是由隨機抽樣所確定的被調查單位在具體調查時未能接觸到,致使被調查單位沒有接受調查;二是雖然接觸到了被調查者,但他們不合作,要麼是調查涉及到個人隱私、商業秘密等敏感性問題而不願意回答,要麼是調查問卷中所列的調查項目超出了被調查者的實際能力和條件或調查項目複雜而無法回答。後者產生的原因主要是由於被調查者所持有的立場、觀點不同,文化水平、經濟利益等方面存在差異,有意或無意的形成對客觀現象的認識存在偏差。如有的被調查者對一些問題沒有正確的判斷和見解,人云亦云;有的被調查者由於受調查員自身觀點的影響而沒能真正回答自己的觀點;還有的被調查者由於受經濟利益的驅動有意歪曲事實等等。

信息來源


能引起調查誤差的主客觀因素稱為“調查誤差來源”。在調查總誤差中,某特定誤差來源的影響既取決於其固有的導致誤差的可能性,又取決於這種可能性在調查實踐中被控制的程度。
儘管調查是由人設計和執行的,而人為因素可能會導致計量誤差,但這並不等於調查中所有的誤差都是由人的弱點和過失造成的。具體來說,調查誤差的來源於以下幾個方面:
1、調查計劃
確定工作範圍 調查設計者可能誤解了主辦者的目的意圖,制定了錯誤方針,誤導研究方向。不同的目標對設計的要求可能不同。目標總體與實際的調查總體不一致。調查可能不是實現目標的最佳途徑。沒有運用以前類似調查的經驗,可能會出現一些本來可以避免的錯誤。調查設計者可能曲解了主辦者的目的,其調查內容可能不符合主辦者的願意。調查設計者事先沒有預料到調查中應採取的某些步驟、會出現的問題以及選擇的僱員不合格導致計量質量降低。預算的考慮 調查組織無法籌集到足夠的現金,因而只能縮減調查預算或尋求妥協,結果導致數據質量降低。對調查各環節的資金分配不合理,可能導致經費不足,降低了調查質量。調查組成員間的交流 調查組織者沒有制定或明確工作人員的操作規則,使工作人員產生迷惑,最終導致調查誤差。調查組成員之間沒能互通工作中的重要信息。 2、抽樣
準備工作 用於分層的標準可能並不能使抽樣誤差最小化。抽樣框不夠完善,會導致某些總體單位被抽中的可能性過高,而某些總體單位卻沒有機會進入樣本,從而產生偏差。樣本的設計 從各階段抽選出的樣本單位數不能獲得估計量的最佳有效估計。增大樣本容量可能使非抽樣誤差增大。總的樣本容量可能已滿足總體估計量的精確度要求,但是對那些重要的小區域(子總體)的估計量的精確度卻不符標準。樣本的抽選 儘管本意是進行概率抽樣,主觀判斷仍然可能影響樣本的抽選。在訪問調查中,數據收集工作(即編列所要訪問的住宅)提供給訪問員的信息不夠準確,或是布置任務時提供的信息不足,或是任務分配表上出現抄錄錯誤,都會導致訪問員無法正確找到所抽選出的住宅。 3、問卷和表格的設計
計量方法的設計 問卷中題項的位置可能設置不當。被調查者可能沒有真正理解某問題的特別意圖。被調查者可能寧願迫使自己回答問題,也不願承認自己無知。某些問題的用詞可能會誘導受訪者。如果問卷太長,可能會使被調查者失去興趣,致使調查不能圓滿完成。設計者構造的問卷不能和被調查者建立和諧的氣氛。如果調查人員採用的開放問題所需答案既長又複雜,訪問員記錄答案與計算機編碼都會相當困難。對收集數據的指導 訓練手冊可能沒有為數據收集人員提供關於說服被調查者參與調查的有效建議。自填式問卷的指導可能說明不清楚,使問答者產生誤解。培訓手冊沒能激勵數據收集人員做好工作。調查表和調查步驟的小規模試驗 對於有關數據收集計劃的問題所做決定可能沒有根據。沒有進行正式的試驗,雖然調查表和調查步驟看上去都比較可行,但可能達不到預期效果。 4、數據的收集
準備工作 所得到的有關擔保可能不起作用,無助於回答的提高。雇傭的數據收集人員可能不合適。對數據收集人員的培訓不夠充分,可能會導致他們對預定步驟的執行有誤,或是在不理解自己應該幹些什麼時自我行事。操作 只在總部對收集數據的操作進行監控是不夠的。為說服受訪者參與調查所做的努力不同,可能導致樣本內不同個體參與調查的機會不等。 5、審卷和編碼
準備工作 所進行的審卷和編碼可能並不適用。審卷可能並不能檢查出所有錯誤。編碼分類可能不是唯一的,就會導致編碼問題。招聘的審卷人員/編碼人員可能不稱職。對於審卷人員/編碼人員的培訓不適當。操作 如果不對問卷進行登記與分組,丟失問卷的可能性就會增加,從而無回答也會增加 審卷/編碼工作通常都比較繁瑣,如果工作環境不好,很容易導致工作質量下降。審卷/編碼人員的督導可能不稱職。對審卷人員/編碼人員的工作質量的檢查程序不完善或是根本不存在,錯誤不被發現的可能性便會加大。 6、數據錄入
準備工作 設計的數據錄入程序可能是無效的,不能為分析提供有用的數據。雇傭的數據錄入員可能不稱職。對數據錄入員的培訓可能不適當。操作 數據錄入設備可能會出現故障。數據錄入的督導可能不稱職。質量控制中的措施不適當或缺乏措施,致使錄入出錯率高得無法接受。 7、數據處理
數據查錯 計算機程序員可能錯誤應用了數據查錯和編程的說明,給分析人員帶來問題。數據查錯中可能不能發現原始數據文件所有遺留的錯誤。為便於分析,某些用於確定總體子群項目的編程分類可能只代表總體大小的一部分 數據報告的編程 程序文件可能不包括滿意地完成一組分析所需的所有變數。程序文件的代碼錯誤。計算機出現故障可能會再次造成數據的丟失或出現錯誤。 8、數據分析
1)抽樣權數的計算
對無回答的調整可能較差地反映調查者的回答概率,因而也不大可能達到降低無回答偏差的目的。抽樣過程可能並沒有經過嚴密的證明,只能對最初抽樣概率進行估計或推測。在計算暫定權數與後面的調整值時,可能會出現計算錯誤。 2)準備工作
不使用抽樣權數可能導致調查估計值有偏。忽視了被調查者的結構特性,對估計值的統計精確性的測量可能也不準確。某些調查要花費很長時間才能完成。研究計劃可能沒有正確回答問題。計算機軟體中,可能存在沒被發現的程序錯誤。沒有對數據報告的數據項進行加權,對此又沒有說明,很難發現數據報告的錯誤。 3)操作
分析人員在執行分析計劃時可能出現錯誤。在探索性研究中,分析人員在專業性判斷上的錯誤可能會誤導分析方向,從而錯過了可能有重大發現的機會。分析人員在使用分析工具時出現程序錯誤或句法錯誤,可能會導致結論錯誤。 9、最終的研究報告
1)報告的準備工作
可能沒有計算或是沒有給出調查估計值的統計精確度,讓人很難了解估計值的好壞程度。對調查結果的解釋可能是錯誤的。最終的報告可能遺漏了調查中出現的一些重要的程序問題,因此很難對總體質量進行評價。 2)外部評論
研究人員可能並沒有打算對最終報告進行評價,因而也就失去了完善研究以及提高表述質量的一次機會。研究報告人員可能不能勝任研究工作。