教育評価の世界では、規範参照テスト (NRT) が重要な役割を果たします。このようなテストは、測定対象の特性に応じて、個人が特定のグループ内でどの位置にいるかを評価するように設計されています。たとえば、心理テストや入学試験では、学生の能力や可能性を測定するためにこの方法がよく使用されます。
規範テストでは、受験者は同僚と比較して自分のパフォーマンスを確認することができ、それが多くの人にとってモチベーションの要因となります。
多くの大学入学試験や全国学校テストでは、標準参照テストが使用されています。たとえば、SAT と Graduate Record Examination (GRE) はどちらも、学生の成績を標準サンプルと比較します。候補者の結果は通常、パーセンタイルで表されます。つまり、各候補者は、最低基準を達成したかどうかだけでなく、全体の中で自分がどの位置にいるのかを知ることができます。
標準参照テストでは相対スコアリング方式が使用されますが、これは実際には曲線スコアリング方式です。ここでの「曲線」は、正規分布の確率密度を示すベル曲線を指します。テストのスコアは、事前に設定されたスコア分布に従って、生徒の相対的なパフォーマンスに基づいて変換されます。たとえば、生徒の 80% に B の範囲の成績が割り当てられ、上位 20% の生徒のみが A を取得する場合があります。
このようにして、学校は各クラスの成績分布が一定の基準に達することを保証できます。
しかしながら、正規化されたテストには批判もあります。主な問題は、選択された参照グループが現在の対象集団を代表していない可能性があることです。いくつかの研究によれば、古典的な規範でさえ時代遅れになったり適用できなくなったりする可能性がある。
規範テストの主な利点は、個人のパフォーマンスが同僚と比較してどの程度であるかに関する情報が得られることです。しかし、このアプローチの重大な限界は、評価対象の人口を実際には反映していない可能性のある参照グループに依存していることです。その結果、一部のグループのスコアが実際の能力を正確に反映していない可能性があります。
古い基準に頼ると、これらのテンプレートが個人の実際の状況を正確に反映していない可能性があるため、誤解を招く結果につながる可能性があります。
教育者にとって、生徒の相対的なパフォーマンスを理解することは評価の一部にすぎません。これは、自己ベンチマーク評価と基準参照評価という他の 2 つの評価方法の必要性も示しています。規範的なテストと比較して、自己ベンチマーキングでは、基準が他人のパフォーマンスから個人の過去のパフォーマンスに移るため、個人は自分の進歩をより意識できるようになります。
結論結局のところ、規範参照型テストは教育機関内では価値がありますが、教育者や政策立案者はその限界と他の評価形式との統合を慎重に検討する必要があります。今日の多様化する学習・評価環境において、生徒の真の能力と可能性をよりよく理解するにはどうすればよいでしょうか?