考試與評估在教育體系中佔據著舉足輕重的地位。而在這些評估中,常模參考測試(NRT)因其特殊的評分方法而備受關注。這種測試不僅評估個體的能力,還將其表現與同儕群體進行比較,這樣的比較對學生未來的影響深遠,值得深入探討。
常模參考測試的主要目的是評估個體在群體中的相對表現,而非絕對知識的掌握程度。
常模參考測試的定義相對簡單,它引導我們了解一個考生在特定群體中的位置。在這個過程中,分數的分配不再是單純依賴於知識的多少,而是比對其他考生的表現。透過比較,學生被分為不同的類別,這種"曲線評分"的概念可在多種測試中看到,從標準化的SAT考試到GRE考試,這些都是依靠此系統來評估學生的能力。
對於學生而言,常模參考測試的一大好處在於,它不會使學生"失敗",因為每一位考生都可以在特定的百分位中獲得分數。這意味著,儘管考生的分數有所不同,但他們仍然能夠看出自己在群體中的相對位置,這在某種程度上減少了考試的壓力,尤其是在競爭激烈的環境中。
常模評估的正面效應能刺激學生追求更高的表現,但過度的競爭也可能導致行為的失衡。
然而,常模參考測試並非沒有缺陷。一個主要的問題在於,所參考的群體可能並不代表當前的學習人群。研究發現,使用固定的參考標準可能導致不準確的結果。例如,對於某些科目而言,過去的數據可能不能真實反映現今學生的實際情況。當考試的基準無法適應學生的多樣性時,常模參考測試就不能有效地評估進步。
此外,另一個需要注意的問題是,常模參考評估可能讓某些學生陷入自我懷疑的境地。當他們的表現低於平均水平時,可能會感到挫敗,這種負面情緒如果不加以調節,可能會對學習動機產生長期的不利影響。
在採用常模參考測試的同時,應該兼顧其他形式的評估,以提供全面的學生表現評價。
對比之下,還存在著其他兩種測試方法:本身比較法(ipsative assessment)和標準參考測試(criterion-referenced assessment)。本身比較法僅將個體目前的表現與其過去的表現進行比較,這種方式在某種程度上能夠減少與其他考生的競爭壓力。另一方面,標準參考測試則以明確的標準來衡量考生是否達到了特定的行為表現。在此類測試中,所有參試者都有可能通過該考試,這為教育評估提供了更為公平的環境。
有些專家建議,為了獲取更有效的學習評估結果,常模參考測試與標準參考測試可以結合使用。這樣,學生在了解自身相對競爭力的同時,也可以獲得針對其技能水平的具體反饋。然而,導致成績調整的不僅僅是考試本身的設計,還包括教師的評分方式和校方的考試設計。
教育者應注重設計能準確反映學習目標的評估,避免常模參考測試的狹隘視角。
至於曲線評分,它雖然能確保不同教師在相同課程中給予相對一致的評分,但也有可能導致過度競爭的環境。這樣的現象可能損害師生之間的信任感,對學習經歷產生負面影響。如果曲線調整反而降低了學生的分數,則學生可能會對這種評分方式持有反感。
常模參考測試作為一種相對評估方式,在學生學習過程中持續扮演著重要角色。然而,在實施此類評估時,教育者應該更謹慎地考慮其可能的限制與影響。是繼續依賴這種相對評估方法,還是採取更靈活的評估方式,這是教育界值得思考的問題?