重測信度
重測信度
重測信度(test-retest reliability),又稱再測信度、穩定性係數(coefficient of stability),反映測驗跨越時間的穩定性和一致性,即應用同一測驗方法,對同一組被試者先後兩次進行測查,然後計算兩次測查所得分數的關係係數。該信度能表示兩次測試結果有無變動,反映了測驗分數的穩定程度。相關程度高,表示前後測量一致性高,穩定性好。重測的過程考慮了不同的條件(環境的、人的)帶來的測量結果的誤差,這種誤差與兩次施測的情境相關聯。
其優勢是能提供有關測驗結果是否隨時間而改變的資料,可作為預測受測者將來行為表現的依據。
其不足在於易受練習和記憶的影響,第一次測試所發現的錯誤也可能導致第二次反應的變化而增加誤差變異。再測信度只適用於測量那些不會隨時間的變化而改變的特質。
1)重測信度(test-retest reliability),又稱為再測信度、穩定性係數,是指用同一個量表對同一組被試施測兩次所得結果的一致性程度,其大小等於同一組被試在兩次測驗上所得分數的皮爾遜積差相關係數。
該信度能表示兩次測試結果有無變動,反映了測驗分數的穩定程度。
2)重測信度(test-retest coefficient)用於判斷測量是否具有時間一致性,也被稱為穩定性係數(cofficient of stability),它是指一組人在一個測驗上第一次得分和第二次得分的相關。
重測的過程考慮了不同的條件(環境的,人的)帶來的測量結果的誤差,這種誤差與兩次施測的情境相關聯。因為在前後兩種情境中施測的是同一個測驗,所以重測係數不能反映測驗題目樣本不同所帶來的誤差。此外,兩次施測的條件也和時間間隔有關,時間間隔越長,誤差變異越大。因此,當第一次施測和第二次施測的時間間隔相對較短時(幾天或幾周),重測的穩定性係數會較大;反之,當第一次施測和第二次施測的時間間隔較長時(幾個月或幾年),該係數就會偏小。
3)重測信度(test-retest reliability)是指對同一批被試進行有一定的間隔的兩次相同的測驗,得出第一次測驗和第二次測驗的分數,再對所得數據進行皮爾遜積矩相關係數計算便可直接得出信度值。
①如果相關值為1,則該測驗具有完美無瑕的信度,表明被試在兩次測驗上得到了完全一致的分數,但這種情況在心理學和教育學的研究中基本不會出現。②如果兩次測驗的相關係數為0,則該測驗完全不可靠,表明被試在第二次測驗時得到了與第一次完全不一致的分數。在此種情況下,這些分數毫無意義。③如果兩次測驗之間的相關值為負值,則表明被試在第一次測驗中取得的分數越高,在第二次測驗中所取得的分數越低;反之亦然。即便出現這種意外情況,測驗的信度也同樣被認定為0。
簡而言之,把同一被試者、同一個測驗在不同的時間測量兩次所得結果的相關係數稱為重測信度。重測信度側重評估時間差異所造成的誤差及其對測驗穩定性的影響,評價重測信度時應注意重測間隔時間長短對重測相關係數的影響。
重測信度的樣本涉及範圍可以很小。幾十人也行。
其計算公式為:
式中x和是第一次測量的實得分及實得分的平均值,y和是第二次測量的實得分及實得分的平均值, 是重測信度。
所有測驗的重測信度都介於0和1之間()。
用再測法估計信度能提供有關測驗結果是否隨時間而改變的資料,可作為預測受測者將來行為表現的依據。
再測信度易受練習和記憶的影響,前後兩次施測間隔的長短務必適宜。如果相隔時間太短,則記憶猶新,對練習的影響較大;如果相隔時間太長,則身體的發展與學習經驗的累積等均足以改變測驗分數而使相關降低。
另外,第一次測試所發現的錯誤也可能導致第二次反應的變化而增加誤差變異。
同時,再測信度只適用於測量那些不會隨時間的變化而改變的特質。
1.測量信度穩定
計算再測信度的前提是假設所測量的特質是穩定的,但這個假設意義並不明確。如果假設被測的特性是穩定的,但再測信度很低,這時我們就無法確定是我們的假設錯誤,還是其它情況影響了信度。相反,如果假定其特性是不穩定的,但兩次施測的相關很高,我們也無法知道是假設錯了,還是因為有某些系統誤差而產生偏高的信度。因此,只有當我們對所測量的特性充分了解時,才能對穩定性的意義作解釋。
2.被試遺忘與練習的效果基本相同或相互抵消
在做第一次測驗時,被試可能會獲得某種技巧,但只要間隔的時間適度,這種練習效果會基本上被遺忘掉。在任何一種情況下,假如遺忘和練習的影響對被試各不相同,信度就會降低。
3.在兩次施測的間隔時期內,被試的學習效果沒有差別
假如,拿同一測驗在課程開始時作為前測驗,在課程結束時作為後測驗。若學生所學的量不同,前測驗—后測驗的相關將反映出學習效果的差別,從而使信度降低。
由於以上三條假設很難做到,所以有些測驗不宜用再測法估計信度。一般只有在沒有複本可用,而現實條件又允許重複施測的情況下才採用此法。
一些測量推理和創造力的測驗,一旦被試掌握了解決問題的原則,在以後重測時,他就會很容易地做出反應,此時測驗的性質和功能就發生了變化。因此,只有那些不容易受重複使用影響的測驗才能用再測法估計信度,如感覺運動測驗、人格測驗,等。
用再測法估計信度,由於練習效應(指第一次測驗影響了第二次測驗的成績)的存在,所以必須謹慎選擇和評定測驗之間的時間間隔。
如果測驗的兩次施測時間非常接近,就得冒著更大的風險去承受練習效應。但隨著測試間隔時間的延長,又會有很多其它的因素介入進來,作為兩次測驗分數差異的替代解釋。
一般來說,相隔時間越長,穩定係數越低。最適宜的時距依據測驗的目的、性質及被試特點而異,短則幾分鐘、幾個小時,長則數月,甚至一、兩年之久。一般來說,無論對於哪種被試,初測與再測的間隔最好不超過六個月。
由於測驗的穩定性係數受時間和其它各種因素的影響,故任何一個測驗都可能不止一個再測信度係數,所以在編製測驗時應該在測驗手冊中報告重測信度的時間間隔以及在此間隔中被試的有關經歷,如受過何種教育訓練、心理治療及有何學習經歷等。
一份完備的測驗應有很多重測係數,分別與不同的測驗間隔時間相對應。
有時候,重測相關很低並不意味著測驗不可信,而是可能提示:被研究的特性發生了改變。
經典測驗理論的一個問題就是它假設行為傾向始終不隨時間的變化而變化;但一些重要的行為特徵,如動機就會隨時間而波動。因此需要測驗理論家們建立新的模型來解釋這些系統變異。