評價量規

連接教學與評價之間的重要橋樑

評價量規(rubric)是一個真實性評價工具,它是對學生的作品、成果、成長記錄袋或者表現進行評價或者等級評定的一套標準。同時也是一個有效的教學工具,是連接教學與評價之間的一個重要橋樑。

表現性評價


育評價專業術語,考察視角,量規的界定並不一致:Asmus(1999)認為,評分量規是由教師或評價者開發的一種描述性的評分量表,其目的是為了分析學生學習結果,包括學習作品和學習過程。Arter和McTigh(2000)把評分規則界定為準則的一種特定形式——是成文的準則,它對所有的評分點都做了說明和規定。最好的評分規則往往能體現出我們教師公認的課堂評價的實質,而且能對合格表現的組成要素提供很好的建議。評分規則一般會伴有成果或表現的具體例子,以闡明量表上不同評分點。(2001)指出,評分規則是相對核查表而言的,這種評分量表正式地規定了評分指南,它由事先建立的表現準則組成,常常在表現性評價中評估學生的作品。Heidi Goodrich(1996)則將它定義為為一項工作列出標準的評分工具,它包含評價作品的標準或所需的期望,它詳細地為各等級(從優到差)質量描述出其標準。
,評量規評價評價具,評價專業,詳細規達習標標準,評價複雜品。

量規類型


核查表

簡單量規類型核查,包含各征簡單列。“”“否”判斷,提供評價號某征。制訂質量判斷,征呈,。評價簡單,伴觀察觀察,核查。評價志,志求志容質量判斷,否按照提供提示,達。
核查表相對比較容易編製,也比較容易管理。它們很容易被理解(表上呈現了評價內容的幾個特徵),因為核查表常用於及時評價,所以也要求簡潔緊湊。它們對過程或表現質量(如關鍵要素)的評價是非常有用的。
運用核查表時,注意的第一個問題是,核查表上的所有元素都是同等重要的,因為它沒有用某種方法表明所評價的內容的這個特徵比另一個特徵更重要。運用核查表時注意的第二個問題是,在最初的學習階段,沒有一種方法能表明哪一個特徵會最早出現,除非在表現性評價標準中規定了要有某一個特徵的呈現,否則哪個特徵最先被檢查核實,我們一般無從知曉。最後,核查表幾乎不可能用來評定分數等級,因為對於教師來說,只有有了能夠嚴格區分不同能力的每一條評分標準,才能判斷學生的分數等級。

分值系統

第二種量規類型是分值系統。它很像一個核查表,但一一個重要的區別是,描述的每一條評分指標都分配了具體的分值,評價者能通過給予更多的分值來表明哪一條評分指標更重要。
如果和核查表相結合,分值系統量規是很容易編製的。因為每條評價細目都指定有分值,所以分值系統量規能用來評定分數等級。描述的每一條評分指標哪一條更重要,能通過賦予更多的分值而得到強調。
當教師運用分值量規評定其中某個特徵每條指標的得分時,如果沒有描述依據怎樣的表現得到某一具體的分值的話,分值系統量規的運用就會出現問題。當試圖開發一個更清晰的評價時,教師可能會憑著經驗列出幾個包含在被賦予分值的表現特徵之下的組成部分,如果漏掉某一特徵之下的某些要素,教師在標示那個特徵的分值時,就已經出現了問題。避免這一問題的方法是採用教師團隊的形式,集體開發評分量規。

分析性量規

分析性量規與核查表和分值系統量規不同。它要求評價者對描述的每一條評分指標的質量作出判斷。以前,只有當某個特徵完全展示出來才給予評分,但現在,只要一個特徵和特性的基本面貌呈現出來就可以給予評分了。因為對所描述的每一條評分指標的呈現程度作出判斷太費時間,所以一些特徵通常採用分析性量規。分析性量規有兩種類型:定量的分析性量規和定性的分析性量規。定量的分析性量規用數量表示所描述的每一條評分指標的呈現程度,這個數量應當用詞和短語來界定,這樣,這個數量就更有意義,關於這個數量表示什麼能給評價的人一些暗示,這樣也就能提高可靠性。定性的分析性量規用言語描述不同的水平,雖然任何水平都能用數字描述,但通常這只是一個數字。而運用定性的分析性量規,評價者被迫對表現質量的水平作出決定,而不是簡單地判定中間分數。
分析性量規在形成性評價中是非常有價值的,學生能看到它們的表現是怎樣被當作所描述的每一條評分指標評定的。這種描述和定性的分析性量規結合,能提供給學生提高學習水平的機會,讓他們看到進入下一個水平必須做什麼。因為學生知道評分的標準,他們能進行自我評價,這樣通常能激勵學生努力學習,進入高一級水平。
但分析性量規很難用於評定分數等級。例如,在一個分析性量規中確定有四個特徵,如果一個學生在兩條評分指標上得到2,在一條評分指標上得到3,在最後一條評分指標上得到l,它是很難轉換成分數等級的。分數等級不應基於所有得分平均數,因為這四個特徵並不是同等重要。

整體性量規

整體性量規也是用言語描述表現特徵的評價標準。相對於分析每一個特徵並單獨地給予評分,整體性量規把學生的表現看作一個整體,給表現和結果(作品)判定一個單一的得分。整體性量規為量規的每個水平編寫了一段包含有不同特徵的描述,所有的表現特徵都達到某一質量水平,才能得到該水平的得分。如果一條或兩條評分指標沒有達到該水平,只能給予低一級水平的得分。
整體性量規典型地用於總結性(終結性)評價,評價後學生沒有機會返回並改進自己的表現。它們通常適用於學期結束時的期末評價,或只需給予單個得分的分數等級評定。正因為只需作出單一的判斷,所以,它們比分析性量規使用起來更加快捷。
使用整體性量規的不足之處在於學生很少處在每個特徵或所描述的評價細目的單一的水平之上。對教師來說,當他們知道學生的部分表現實際上已處於高一級水平時,很難給予學生低一級水平的得分,這不太真實、也不太公平。整體性量規對學生解釋起來也較困難,當學生得到一個分數時,他們不知道自己的部分表現是否已高於所給予的得分,這就是整體性量規通常不用於形成性評價的原因。

量規建議


開發學生學業評價不是一項單獨完成的簡單的任務,在一個小組中工作,能得到更多的觀點和意見,小組中出現的不同意見的爭論,當通過妥協而解決時,有利於形成更完美的評價。下面的建議有利於幫助教師設計學生學業評價。
開發適用於同類內容的概括化程度高的評價
與任務具體的評價相比,使用概括化程度高的評價只需要編寫少量的幾個評價即可,並且,這意味著只要編寫少量的量規。教師可以選擇某一種類中的內容、活動來教重要的概念,這樣可以避免教每項內容或活動(因為學科內容多而課時少)。當學生聚焦於某類內容或活動的關鍵組成部分時,教授並強調概念,少教而多學。通過這種評價,學生能看到知識內容分類間的聯繫,能幫助學生理解同類知識、技能的基本特徵,產生遷移,學生會學得更有效。
用一種評價達成多條課程標準
開發學生學業評價時,不需要為每條課程標準開發不同的評價,開發的評價任務和量規應儘可能多地包含多條標準。例如,當呈現一個作品時,學生能展示動作技能方面的能力、認知性知識、與他人的關係、以及對這項內容和活動的樂趣。一個戶外教育中的顛峰活動能從不同行為現場提供評價多條標準的相同機會。使用少量具有深度的評價意味著教師只要管理少量的評價,完成少量的文書工作,節省用於評價的時間。
在教學過程開始之前開發評價
在過去,教師等到教學活動完成以後才開發評價,評價往往基於所教授的內容、活動、練習的時間來開發。而在基於標準的課程中,評價基於標準來設計,然後基於評價選擇內容和活動,所選的內容和活動將允許學生展示在某條標準上的能力,而不是在某個內容或活動上的能力。這對教師來說代表了一個巨大的範式轉型,但當課程使用這種方式評價時,學生的學習會更好地與課程標準保持一致。
採用適用於學習過程的評價
評價可以從兩方面來審視:為了學習而評價和對學習結果的評價。為了學習的評價通常與形成性評價聯繫在一起,它的意圖是促進學生的學習。教師可以用形成性評價來判斷學生已經學會了多少,然後規劃下面的課程和教學。在基於標準的課程中,學習是很難與評價區分開來的。安排一個特定的表現性任務或練習,它既是要學習的課程內容、學習活動,也是一種評價。為了學習,學生要積極地投入這項學習活動,同時他們也展示了知識、技能、體能、態度、方法以及與他人的關係。在這裡,評價是學習經驗,而學習經驗因為相伴的評價量規而成為評價。
確信學生知道你將怎樣評價
沒有理由把學生蒙在鼓裡,不讓他們知道你要評價什麼、你將依照什麼標準來評價。提前給予學生評價內容和評價標準,他們可以為此早作準備。許多教師擔心,這又將成為考什麼教什麼學什麼,wiggins(1989)指出,如果這個考試是有價值的、值得學生去花時間的,這不成什麼問題,關鍵是你考些什麼,是否能達成標準。