效標效度

考查測驗分數與效標的關係

效標效度的別名是實證效度,其目的是考察測驗分數與效標關係。

基本簡介


效標效度是指測驗分數與效標的相關程度。所謂效標,就是檢驗測驗有效性的一種參照標準。效標常用一種公認比較可靠或權威的測驗結果表示。這實際上就是用一種已知的且認為其“有效”的測驗結果去檢驗另一個新測驗的有效性。之所以不直接用效標測驗去代替新測驗,往往是因為新測驗可能比效標測驗更為簡單、易行。
化學教學中常用學生的實際高考成績與模擬高考試題得分之間的相關來檢驗高考模擬試題的有效性。這裡應用的就是效標效度的檢測方法,高考就成了模擬考試的效標。
由於效標效度採用測驗分數和效標分數間的相關係數來表示,可以對被檢測的測驗進行定量化的分析比較,相對於內容效度而言更為客觀,其意義也較直觀,易於被理解和接受。但是,效標效度在實際化學教育測量中應用得並不多,這主要是因為目前尚未找到比較合理的、可以滿足化學教育測量各種要求的效標。除高考外,還沒有其他比較權威的化學考試,而高考卻不能作為一般化學教學測驗的效標。這是因為兩者之間在內容、性質上都有很大差別。高考是為高校錄取新生服務的選拔性考試,而教學測驗多是為教學服務的形成性評價的一部分;高考試題要在中學化學的全部教學內容範圍內取樣,而教學測驗往往只就某一教學階段的內容範圍取樣。在教學實際中,有時用教師對學生的等級評定作為某種測驗的效標,但這樣的效標難免會帶有較多的主觀因素的影響。某些心理測驗如智力測驗、國外的一些學科水平測驗等,與我國目前的化學教學實際尚有較大的距離,也很難作為化學教育測驗的效標。因此,尋找化學教育測驗的合理效標,是當前化學教育測評研究的重要課題之一。

分類


效標效度
效標效度
(一)預測效度與同時效度
根據搜集效標的時間,可以將效標效度分為預測效度和同時效度。
1.同時效度同時效度的效標資料是與測驗分數同時搜集的。例如大學入學考試可以用中學成績作效標。同時效度常用的效標是在校的學業成績、教師的等級評定、臨床檢查等。
2.預測效度
預測效度的效標資料需要過一段時間才可搜集到。此種效度對人員的選拔和安置工作非常重要。常用的效標是專業訓練的成績、實際工作的表現等。
(二)效標和效標測量
1.效標
所謂效標指的是衡量測驗有效性的外在標準,通常是指我們所要預測的行為。
可以用來作為效標的變數有很多。效標可以是連續變數(如分數),也可以是分類變數(如 職業);可以是然的現成的指標(如產量、薪水),也可以是人為設計的指標(如課堂測驗);可以是主觀評判,也可以是客觀測量。歸納起來,常見的效標主要有學業成就、等級評定、臨床診斷、特殊訓練成績、實際工作表現、對團體的區分、其他測驗成績。
2.效標測量
好的效標測量應符合以下幾個條件:
①效標測量必須真實地反映觀念效標的重要側面;
②效標測量必須穩定可靠;
③效標測量必須客觀,避免偏見;
④在保證有效性的前提下,效標測量必須儘可能簡單、省時、花費少。

條件


效標效度
效標效度
使研究具有較高的效標效度,應該滿足以下4個條件:
(1)理論構思要結構嚴謹、符合邏輯、層次分明,形成某種“構思網路”。例如,將兒童的自我意識發展分為自我認識、自我體驗和自我控制三方面,而自我認識進一步細分為對生理自我的認識、對心理自我的認識和對社會自我的認識。這樣的理論構思,就比較嚴謹、完整,有層次,並且形成一種“網路”,便於理解和研究。
(2)清晰、準確的界定研究的環境條件和變數。例如,“小學五年級學生髮散思維問題研究”這樣一個課題,對研究被試的年齡段,生理智力發展,學習、生活、社會環境等需要明確界定範圍,用文字和語言兩種形式完整、準確地表述研究變數
(3)對研究變數做出準確、嚴格的操作定義,並選擇對應、客觀的觀測指標。
(4)避免採用單一方法或單一指標去代表或分析多維的、多層次的、多側面的事物和活動,儘可能採用多種方法、多種指標,從不同角度分析研究相同的理論構思。
教育科學研究常常包含著複雜的、多維度的理論構思,如何提高研究的效標效度是進行研究設計時需要加以特別重視的問題,也是提高教育科學研究水平的重要內容。

估計方法


效標效度一般可以通過統計分析得到一個數量指標,因此有人又叫它統計效度。常用的估計方法有相關法、分組法、預期表法等。
1.相關法
確定效標效度最常用的方法是計算測驗分數與效標測量的相關。根據變數的性質不同,可分別採用積差相關法、等級相關法、二列相關法等。相關法的優點是:
①提供了預測源與效標間的數量關係;②可利用回歸方程式來預測每個人的效標分數。
相關法的缺點是:
①如果預測源與效標之間不是直線關係,便會低估測驗的效度;②不能提供關於取捨正確性的指標。
2.分組法
確定效標效度的另一種方法是看測驗分數能否區分由效標測量所定義的不同團體。例如在大學里,我們根據教師評定,把學生分為合格與不合格兩組,然後回過頭去查閱他們的高考分數,若兩組在高考分數上有顯著差異,那就可以認為高考是有效的,否則便認為是無效的。
3.預期表法
預期表法是將預測源分數和效標分數製成雙維圖表,並將每個變數按水平分成若干檔次,然後列出每個檔次上的人數百分比。從預期表我們可以看出效標效度的高低。從右下角到左上角的對角線上各格中的數字越大,說明效標效度越高。

效標測量


阿斯汀(A.W.Astin)將效標分為觀念效標和效標測量。觀念效標是一個概念,效標測量則是對觀念效標的數量化。例如:對於大學入學考試來說,我們感興趣的是“大學學習的成功”,這是觀念效標,而大學的學習成績,則是效標測量。如果無效標測量,觀念效標是毫無用處的。
好的效標測量應符合以下幾個條件:
①效標測量必須真實地反映觀念效標的重要側面;
②效標測量必須穩定可靠;
③效標測量必須客觀,避免偏見;
④在保證有效性的前提下,效標測量必須儘可能簡單、省時、花費少。