在教育测评的世界中,常模参考测试(NRT)扮演着不可或缺的角色。这种测试旨在评估个体在特定群体中的表现位置,相较于他们所测量的特质。例如,心理测试或入学考试通常会使用这种方法来衡量学生的能力与潜力。
常模测试使得考生能够了解自己的表现与同侪相比,这对许多人来说是个激励。
许多高校入学考试和全国性的学校考试均使用常模参考测试。例如,SAT考试和研究生入学考试(GRE)都是以学生的表现与标准样本进行比较。考生的成绩通常以百分位数来表达,这意味着每位考生都可以看到自己在整体中的位置,而不是仅仅知道自己是否达到了一个最低标准。
常模参考测试采用一种相对评分的方式,这实际上是一种曲线评分的方法。这里的“曲线”指的是钟形曲线,展示的是一种正常分布的概率密度。测试成绩将根据学生的相对表现进行转换,依据一个预设的分数分布。例如,80%的学生可能会被分配到B的分数区间,只有最优秀的20%才会得到A等级。
透过这种方式,学校能够确保每个班级的成绩分布达到一定的标准。
然而,常模测试也会受到一些批评。主要的问题在于,所选定的参考群体可能并不代表当前的目标人群。根据一些研究,即使是经典的常模也可能会变得过时或不适用。
常模测试的主要优势是能够提供个体表现与同侪的对比信息。然而,这种方法的严重限制在于,它所依赖的参考群体可能无法真实反映正在评估的人口。这可能会导致某些群体的成绩无法真实反映其实际能力。
依赖于旧有的常模可能会导致误解,因为这些范本不一定能准确反映个体的实际情况。
对于教育者来说,理解学生的相对表现只是评估的一部分。这也展现了另两种评估方法的必要性:自我基准评估(ipsative assessment)和标准基准评估(criterion-referenced assessment)。与常模测试相比,自我基准评估会将标准从他人的表现转向个体的先前表现,这使得个体能更清楚自己的进步。
最终,虽然常模参考测试在制度内存在其价值,但教育者和政策制定者应谨慎考虑其局限性,以及与其他评估形式的整合。在当今多元化的学习和评估环境中,我们如何能够更好地理解学生的真实能力与潜能呢?