在教育測評的世界中,常模參考測試(NRT)扮演著不可或缺的角色。這種測試旨在評估個體在特定群體中的表現位置,相較於他們所測量的特質。例如,心理測試或入學考試通常會使用這種方法來衡量學生的能力與潛力。
常模測試使得考生能夠了解自己的表現與同儕相比,這對許多人來說是個激勵。
許多高校入學考試和全國性的學校考試均使用常模參考測試。例如,SAT考試和研究生入學考試(GRE)都是以學生的表現與標準樣本進行比較。考生的成績通常以百分位數來表達,這意味著每位考生都可以看到自己在整體中的位置,而不是僅僅知道自己是否達到了一個最低標準。
常模參考測試採用一種相對評分的方式,這實際上是一種曲線評分的方法。這裡的“曲線”指的是鐘形曲線,展示的是一種正常分布的概率密度。測試成績將根據學生的相對表現進行轉換,依據一個預設的分數分佈。例如,80%的學生可能會被分配到B的分數區間,只有最優秀的20%才會得到A等級。
透過這種方式,學校能夠確保每個班級的成績分佈達到一定的標準。
然而,常模測試也會受到一些批評。主要的問題在於,所選定的參考群體可能並不代表當前的目標人群。根據一些研究,即使是經典的常模也可能會變得過時或不適用。
常模測試的主要優勢是能夠提供個體表現與同儕的對比信息。然而,這種方法的嚴重限制在於,它所依賴的參考群體可能無法真實反映正在評估的人口。這可能會導致某些群體的成績無法真實反映其實際能力。
依賴於舊有的常模可能會導致誤解,因為這些範本不一定能準確反映個體的實際情況。
對於教育者來說,理解學生的相對表現只是評估的一部分。這也展現了另兩種評估方法的必要性:自我基準評估(ipsative assessment)和標準基準評估(criterion-referenced assessment)。與常模測試相比,自我基準評估會將標準從他人的表現轉向個體的先前表現,這使得個體能更清楚自己的進步。
最終,雖然常模參考測試在制度內存在其價值,但教育者和政策制定者應謹慎考慮其局限性,以及與其他評估形式的整合。在當今多元化的學習和評估環境中,我們如何能夠更好地理解學生的真實能力與潛能呢?