一提到評測, 人們想到的便是考試。一群人坐在房間里,拿著筆在試卷上勾選選擇題的答案。沒錯,紙筆考試的確是一種評測,但它僅僅是一種評測的方式。評測的本質(zhì),是我們用以理解學(xué)習(xí)者理解程度的方式(how we understand what learners are understanding)。這里的“我們”不僅僅是指教師,還有學(xué)生和研究者。
評測的三種類型
形成性測驗 formative assessment:
當一個測驗是主要用來輔助學(xué)生的學(xué)習(xí)時,這個測驗就是形成性測驗。老師在課堂上的提問,學(xué)生的家庭作業(yè),都是形成性測驗。形成性測驗?zāi)茏寣W(xué)生檢驗自己是否真的學(xué)懂了知識點。老師也能利用形成性測驗了解學(xué)生的學(xué)習(xí)進度,以便進行針對性的教學(xué)。形成性測驗的難度不會太高,也不會計入學(xué)生的最終表現(xiàn)成績。
總結(jié)性測驗 summative assessment:
總結(jié)性測驗是在課程結(jié)束后施驗,用以評估學(xué)生究竟學(xué)到了多少東西。期中考試和期末考試都是總結(jié)性測驗。全國性的高考等考試也都是總結(jié)性測驗。總結(jié)性測驗可以檢驗學(xué)生的水平是否達到了某個標準。通常來說,總結(jié)性測驗的難度比較高。
表現(xiàn)性測驗 performance assessment:
表現(xiàn)性測驗是指把學(xué)習(xí)者置于一個模擬環(huán)境下,以評判其解決問題的表現(xiàn)。比如讓學(xué)生設(shè)計物理實驗,動手操作一個物理實驗,然后根據(jù)實驗數(shù)據(jù)得出結(jié)論。這樣就能評判學(xué)生在該物理學(xué)實驗上的表現(xiàn)究竟如何。表現(xiàn)性測驗既可以是形成性測驗,也可以是總結(jié)性測驗。
評測真的有效嗎?
廣義地說,教育領(lǐng)域的評測就是以數(shù)字為抽象能力賦值。我們想要以數(shù)字的形式來表征學(xué)習(xí)者的知識量,表征學(xué)習(xí)者的能力水平。但是,知識量和能力水平并不像身高體重一樣,拿尺子和秤就能簡單地測量出來。所以我們需要為這些抽象的能力發(fā)明一把專用的尺子。在心理測量領(lǐng)域,這些尺子就叫做量表。
我們有抑郁癥量表、人格量表、智商量表等等量表。學(xué)生在學(xué)校里參加的紙筆考試,其實也是一種量表。托福雅思考試,GRE考試等等,也都可以看做量表。但無論是哪種量表,我們都會遇到一個問題,這些發(fā)明出來的尺子,真的能有效地丈量我們想要丈量的東西嗎?智商測驗得分高的人就真的更聰明嗎?通過GRE考試的人就真的更擅長做學(xué)術(shù)研究嗎?
在心理測量學(xué)中,我們有一個關(guān)鍵概念,叫做效度(Validity)。它是指測量工具能準確測出我們想要測量的東西的程度。完美的測驗,效度的值就應(yīng)該等于1。可在所有的心理測量和教育測量中,都不存在這樣完美的測驗。效度能達到0.7就已經(jīng)是非常好的測驗了。
或許,我們并不需要完美的評測。日常生活中的變量實在是太多太多,我們無法將之全部納入考慮中來。但是評測是我們用以理解學(xué)習(xí)者學(xué)習(xí)情況的非常有效的輔助手段。