교육 평가 분야에서는 규범 참조 시험(NRT)이 필수적인 역할을 합니다. 이러한 테스트는 측정하려는 특성을 기준으로 개인이 특정 그룹 내에서 어떤 위치에 있는지 평가하도록 설계되었습니다. 예를 들어, 심리 테스트나 입학 시험에서 학생들의 능력과 잠재력을 측정하기 위해 종종 이 방법이 사용됩니다.
규범적 테스트를 통해 지원자는 동료들과 비교하여 자신의 성과가 어떤지 볼 수 있으며, 이는 많은 사람에게 동기를 부여하는 요소가 됩니다.
많은 대학 입학 시험과 국가 학교 시험에서는 규범 참조 시험을 사용합니다. 예를 들어, SAT와 GRE(대학원 입학 시험)는 모두 학생의 성취도를 규범적 표본과 비교합니다. 후보자의 결과는 일반적으로 백분위수로 표현되는데, 이는 각 후보자가 최소 기준을 달성했는지 여부만 아는 것이 아니라 전체에서 자신이 어떤 위치에 있는지 알 수 있다는 것을 의미합니다.
규범 참조 시험은 상대적 채점 방법을 사용하는데, 이는 실제로 곡선 채점 방법입니다. 여기서 "곡선"은 정규 분포의 확률 밀도를 나타내는 종 모양 곡선을 말합니다. 시험 점수는 미리 설정된 점수 분포에 따른 학생의 상대적 성취도를 기준으로 변환됩니다. 예를 들어, 학생의 80%가 B등급을 받고, 상위 20%만 A등급을 받을 수도 있습니다.
이런 식으로 학교는 각 학급의 성적 분포가 일정한 기준에 도달하도록 보장할 수 있습니다.
그러나 정규화된 테스트에는 비판도 따릅니다. 가장 큰 문제는 선정된 참조 집단이 현재 표적 인구를 대표하지 못할 수 있다는 것입니다. 일부 연구에 따르면, 고전적인 규범마저도 시대에 뒤떨어지거나 적용할 수 없게 될 수도 있다고 합니다.
규범적 테스트의 가장 큰 장점은 개인의 성취도가 동료들과 비교하여 어떤지에 대한 정보를 제공한다는 것입니다. 그러나 이 접근 방식의 심각한 한계는 평가 대상 인구를 실제로 반영하지 못할 수 있는 참조 그룹에 의존한다는 것입니다. 이로 인해 일부 그룹의 점수가 실제 능력을 정확히 반영하지 못할 수도 있습니다.
오래된 규범에 의존하면 이러한 템플릿이 개인의 실제 상황을 정확하게 반영하지 못해 오해의 소지가 있는 결과가 나올 수 있습니다.
교육자들에게 있어서 학생들의 상대적 성취도를 이해하는 것은 평가의 일부일 뿐입니다. 이는 또한 두 가지 다른 평가 방법, 즉 자체 벤치마킹 평가와 기준 참조 평가의 필요성을 보여줍니다. 규범적 테스트에 비해 자기 벤치마킹은 다른 사람의 성과에서 본인의 이전 성과로 기준을 전환하는데, 이를 통해 개인은 자신의 발전 상황을 더 잘 알 수 있습니다.
결론궁극적으로, 규범 참조 시험이 기관 내에서 가치가 있기는 하지만, 교육자와 정책 입안자는 규범 참조 시험의 한계와 다른 평가 형태와의 통합을 신중하게 고려해야 합니다. 오늘날 다양한 학습과 평가 환경에서 학생들의 진정한 능력과 잠재력을 어떻게 더 잘 이해할 수 있을까요?