随着科技的发展,传统的心理测量方法正在被新型技术所取代,计算机化分类测试(CCT)作为一种全新的评价系统,正日益受到关注。它不仅简化了测试过程,还提高了测试的准确性和效率。那么,CCT到底是如何运作的?其背后又蕴藏着哪些理论与实践呢?
计算机化分类测试是一种透过计算机进行评估的系统,旨在对考生进行分类。
CCT的运作方式与计算机化自适应测试(CAT)相似,考题一题一题地呈现给考生,每答完一题后,计算机会立即评分,并评估考生是否已经可以分类。如果可以,测试将终止,并对考生进行分类;如果不能,则会提供下一题。这个过程将重复进行,直到考生被分类或达到其他结束条件(如所有考题均已回答或测试长度达到上限)。
CCT的心理计量模型主要分为两种:古典测试理论(CTT)和项目反应理论(IRT)。前者透过对特定样本的考生分类,基于不同的考生群识别各项题目的难度和区分度,但这对于考生选样的要求较高。相对而言,IRT则假设能力是连续的,分类标准可能较为模糊但更具精确性。在选择这两种方法时,考量的因素各异,CTT提供了概念上的简单性,而IRT则能在资源充足时提供更高的具体性。
CTT虽然较为简单,但对于小型测试计划而言,能更有效率的样本校准考题参数.
CCT必须设置特定的起始点以运作特定的算法。如果采用序列概率比率测试作为终止标准,则默认起始比率为1.0;如果使用信心区间方法,则需指定起始点。通常,这样的起始点为0.0,表示分布的中心;不过根据考生的历史资料来设定起始点也是可行的。
在CCT中,题目的选择是灵活的,与传统的所有考生使用固定题组相比,可以根据考生的表现不断调整所考题目。题目选择方法主要可分为两类:基于临界分数的选择和基于估算的选择。前者能够最大化在临界分数周围提供的信息,而后者则是在考生能力的当前估算下作出选择,这两者的选择效率会因所用的终止标准而异。
依据所采用的终止标准,及时的题目选择将直接影响测试的成功与否。
CCT经常应用的终止标准有三种:贝叶斯决策理论、信心区间方法和序列概率比率测试。这些方法各具优缺点,能提供不同程度的灵活性和准确性,但也可能导致一些不必要的主观性。在信心区间方法下,考生当前的能力估算会对分类结果产生直接影响,而序列概率比率测试则以假设检验的形式进行分类。
随着时代的演进,CCT不仅建立了一种高效的考试标准,还对心理测量领域的未来产生深远影响。它的实际应用不断拓展,未来将如何影响我们的测试方式以及人们对于能力评估的理解,值得我们每一个人深思?