成就測驗

心理學

成就測驗(Achievement Test)就是我們通常所說的考試。成就測驗主要是針對特定領域為檢測應試者對有關知識和技能的掌握程度而設計的。桑代克被公認為是教育測驗的鼻祖。成就測驗和智力測驗、能力傾向測驗具有明顯區別。成就測驗在教育上的功能分為四種,即反饋、評價、科研和選拔安置。成就測驗根據不同分類方式可以分成不同的種類。我們必須根據自己的目的,合理選用不同的成就測驗。

概念


成就測驗(Achievement Test)就是我們通常所說的考試。成就測驗主要是針對特定領域為檢測應試者對有關知識和技能的掌握程度而設計的。
考試應用的領域非常廣泛,自我國科舉首創考試以來,一直沿用至今,並且現在考試已逐步向標準化、客觀化發展;但考試更偏重於知識和技能的考察,所以它考察人的素質的全面性程度常常受到質疑。

歷史發展


1.最遲在漢朝,中國便已經有了非正式的考試製度。公元1370年(明朝初期)筆試成為科舉取士的一部分,這可視為成就測驗的正式開始。
2.今天在世界各地廣泛應用的標準化成就測驗發源於美國,始創者是賴斯。另外一個早期的奠基人是愛德華·李·桑代克,並且桑代克被公認為是 教育測驗的鼻祖。

與其它概念的區別


成就測驗和智力測驗、能力傾向測驗的區別:成就測驗和智力測驗、能力傾向測驗的測量對象都是認知性特質。這三種測驗都是測量個體從與環境的相互作用經驗中發展出來的能力。所以在本質上,它們有相同之處。能力傾向、智力測驗所測量的也可以看作一種“成就”。不過,如果從測驗的目的、性質及所含蓋的經驗範圍來看,這三種測驗仍有某些不同之處,不能相互取代。
就測驗的對象而言,三者本質上有重疊之處,無法加以截然區分。大多學者認為成就測驗測量的是一些特定的、限定於某一範圍的能力和知識,而另兩者所測驗的則為一般性的、較為廣泛的能力。
從功能上看,成就測驗也不同於智力、能力傾向測驗。后兩者的主要功能是預測一個人在未來的教育、訓練或工作經驗中可能的表現,它們的使用是在教育或訓練程序以前,用以反映被試是否有接受某種課程或專業技能訓練的能力。成就測驗則是評估被試在接受一些教育或訓練程序后所獲得的學習成果,它的實施發生在教育、訓練過程后。在測驗的技術品質上,成就測驗要注重內容效度,而能力傾向、智力測驗則必須有較高的預測效度,否則就失去其基本價值。

功能


成就測驗主要用於 教育領域。概括地說,成就測驗在教育上的用途分為四種,即 反饋、評價、科研和選拔安置。
1.反饋功能
成就測驗的得分可以作為反饋信息,調節教師的教學活動。在某一教學階段開始前的成就測驗,能使教師了解學生對完成本階段學習任務的智力、知識和技能的準備情況,為修改教育目標和教學計劃提供依據。在教學過程中的檢查測驗,能使教師了解學生對有關知識、技能的掌握情況,診斷出學生的學習困難之所在,以便及時發現教和學中的問題,從而調整教學內容,改進教學方法。在某一教學階段終了后的總結測驗,能使教師了解教育目標是否達到,了解學生綜合應用和遷移知識、技能的能力,同時為制定新的教育目標提供依據。圖8-2表明了在教學的各個環節中測驗的反饋功能。
測驗的反饋信息還可促進學生的學習活動。考試結果能使學生明了自己的學習情況,作出自我評價,找出薄弱環節,調整自己的學習方法,並確定新的努力目標;考試的氣氛及對分數的正負強化,在一定程度上具有動機激發作用,能引起或滿足學生渴望成功、得到社會承認的需要,從而提高學習活動的積極性。
2.評價功能
成就測驗不但可用於評價學生,還可用於評價教師,評價一所學校或一個地區的教學質量;不但可作跨區域的橫向比較,還可作跨年代的縱向比較。但我們要注意,在評價時一定要參照許多其他信息,不能單看測驗分數。
3.研究工具
測驗對教育理論的研究和發展具有重要作用。好的教育體制、教材和教法,要通過教育效果來體現,而教育效果在一定程度上又要通過測驗成績來檢查。很多教改實踐的效果都要通過一定的成就測驗來檢驗。
4.人才選拔與安置
學績測驗經常用來作為選人的工具,例如各種升學考試、招工考試等;也可用來確定一個人是否達到了從事某項活動所需要的最低熟練水平;還可對人員進行分類,把每個人安置到適當的位置上去。

分類


成就測驗根據不同分類方式可以分成不同的種類。
1.按反應方式分
成就測驗從反應方式上,可分為實作測驗和紙筆測驗。這與我們前面介紹的概念是一致的。實作測驗需要具體操作,如表演體操、調整機器等。紙筆測驗又可分為再認式和回憶式兩類。再認式題目是把若干學習過的內容,重新呈現在被試面前,讓被試辨認或排列組合,如是非題、多選題、匹配題、順序題等。回憶式題目是所學過的內容不在眼前,要被試回憶,寫出一個答案來,如填空題、簡答題、論文題等。
2.按編製方法分
從編製方法上可分為標準化成就測驗和教師自編測驗。標準化成就測驗是由專門機構編製的,測驗內容和常模樣本較為普遍,而教師自編測驗通常因教師、課程、班級或教學單元的不同而有所更換,其內容範圍和常模樣本較為狹窄。
3.從用途上分
從總的用途上看可分為形成性測驗和總結性測驗。成就測驗的傳統用途是在學習單元或全部課程結束后實施測驗,以測量學生是否已達到教學目標。從技術上講,這種用途稱為總結性評估,它以測驗成績作為最終產物,目的是對學生的學習作一終結性的評價,如好壞、過關還是不過關。另一類是形成性評估,這種評估是把教育過程和評估結合起來,在教學進行過程中測量學生的進步情況。形成性測驗是教學活動中的一個有機部分,通過對學習者在學習過程中的表現進行評估,可以指導學生決定是複習還是繼續學習下一個單元。
4.按解釋分數的方法分
根據解釋分數的方法的不同,可分為標準參照測驗和常模參照測驗。這兩種測驗前面已經討論過。在實際應用中,許多成就測驗既可以是常模參照測驗,也可以是標準參照測驗,了解一個人已經學了多少(標準參照測驗的功能)和把一個人的成績與其他人作比較(常模參照測驗的功能),有時可以由同一個測驗來完成。
5.從測驗的功能上分
從測驗的功能上可分為檢查測驗、水平測驗、預測性測驗、診斷性測驗和準備性測驗。
(1)檢查測驗主要用來考察被試對某種知識、技能總的掌握情況,而不是被試所具有的長處和不足。
(2)水平測驗是一種標準參照測驗,是用來考察學生是否達到某種要求的能力水平的一種測試。它不是用來確定被試在人群中的位置,而是用來對被試達標情況進行判斷。這種測驗又可稱為基本技能最低限度測驗。
(3)預測性測驗通常用來預測被試未來的學習成就。一般它所包含的題目比相同學科的一般成就測驗複雜,在預測今後是否成功方面,其作用與性向測驗相類似。預測性測驗有閱讀測驗、算術測驗和外語測驗等等。
(4)診斷性測驗能鑒別被試在學習功課方面的困難。編製這種測驗必須把被試在各個學科上的成績分解成在各種技能上的成績,再分別設計出測量這些技能的題目。一般成就測驗只可用於比較被試在人群中的相對位置,卻不知道對具體技能的掌握情況,而診斷性測驗可以了解被試在幾個基本技能上的優劣,從而提供改進的依據。診斷性測驗包括的題目差別很大,施測時間比相同學科檢查測驗長,有時還要用到特殊儀器,如眼動儀等。在使用時,一般成就測驗通常是第一步,它給出被試在各個課程中表現的具體情況,如需要評估被試在特定領域的成就,可以實施單科檢查測驗,最後如果需要仔細分析個體在閱讀、算術等方面的困難及其原因時,可以實施診斷性測驗。
(5)準備性測驗主要考查學生在一個特定的教育任務上是否做好了準備,其效度由對有關領域的教學做好準備的學生同沒有做好準備的學生之間的有效區分決定。
6.從測驗的內容範圍分
從測驗的內容範圍上,可分為成套成就測驗和單科測驗。成套成就測驗是包括不同內容範圍的一套測驗,每個分測驗包括某種學科的知識,各分測驗得分可互相比較。當然分測驗也可以單獨使用,但這樣做比單科測驗的信度和效度低。單科測驗包括特殊領域的知識,適合於確定被試在該領域的成就大小。
Ø 選用
各種不同的成就測驗,其分類可以是重疊的。例如,單科檢查測驗既可以是總結性評估式的也可以是形成性評估式的,既可以是標準參照的也可以是常模參照的。我們必須根據自己的目的,合理選用不同的成就測驗。
選擇標準化成就測驗與編製隨堂測驗的基本原理一樣,主要是選擇與具體組織、班級、學校或教育系統的教育目標相匹配的內容及難度適宜的測驗。在決定所用測驗之前,必須先確定被試的知識或能力水平、教學內容和目標、分數的應用方式等,具體來說就是先確定使用測驗的目的和實際條件,如你是用來對學生進行評估、安置、診斷學習困難、安排學習計劃,還是用來評估教學進展情況。在使用測驗前應該認真閱讀測驗手冊,看測驗的目的是否符合自己的要求,施測條件是否能滿足等。
確定目的和實際條件后還需要了解測驗的信度、效度和常模等情況,這些內容在前面基本理論部分已經介紹過,這裡只討論成就測驗特殊的地方。對於成就測驗來說,一般信度係數應在0.80~0.90之間,複本信度應比內部一致性信度高。內容效度一般最為重要,但如果是預測性測驗,還需要提供預測效度的證據。常模資料也應滿足測驗的目的。