Com o desenvolvimento da ciência e da tecnologia, os métodos tradicionais de medição psicológica estão sendo substituídos por novas tecnologias. Os testes de classificação computadorizados (CCT), como um novo sistema de avaliação, estão ganhando cada vez mais atenção. Isso não apenas simplifica o processo de teste, mas também melhora a precisão e a eficiência dos testes. Então, como funciona o CCT? Que teorias e práticas estão escondidas por trás disso?
Um teste categorizado computadorizado é um sistema de avaliação baseado em computador projetado para categorizar candidatos.
O CCT opera de forma semelhante aos testes adaptativos computadorizados (CAT), onde as perguntas são apresentadas aos candidatos uma por uma e, depois que cada pergunta é respondida, o computador imediatamente a pontua e avalia se o candidato foi classificado. Se sim, o teste é encerrado e o candidato é classificado; caso contrário, a próxima pergunta é oferecida. Esse processo se repete até que o candidato seja classificado ou outros critérios finais sejam atendidos (como todas as perguntas terem sido respondidas ou o limite de duração do teste ter sido atingido).
Existem dois tipos principais de modelos psicométricos para CCT: teoria clássica de testes (CTT) e teoria de resposta ao item (IRT). O primeiro classifica os candidatos em uma amostra específica e identifica a dificuldade e a discriminação de cada questão com base em diferentes grupos de candidatos, mas isso impõe altas exigências à seleção de candidatos. Em contraste, a TRI assume que a habilidade é contínua e os critérios de classificação podem ser vagos, mas mais precisos. Há diferentes considerações na escolha entre essas duas abordagens, com a CTT oferecendo simplicidade conceitual e a IRT oferecendo maior especificidade quando os recursos são suficientes.
Embora o CTT seja relativamente simples, ele pode ser mais eficiente na calibração de parâmetros de teste para pequenos planos de teste.
O CCT deve ser definido como um ponto inicial específico para executar um algoritmo específico. Se você usar o teste de razão de probabilidade sequencial como critério de parada, a razão inicial padrão será 1,0; se você usar o método de intervalo de confiança, precisará especificar o ponto inicial. Normalmente, esse ponto de partida é 0,0, indicando o centro da distribuição; no entanto, também é possível definir o ponto de partida com base nos dados históricos do candidato.
No CCT, a seleção de perguntas é flexível. Comparado com o método tradicional de usar conjuntos de perguntas fixas para todos os candidatos, as perguntas podem ser continuamente ajustadas de acordo com o desempenho dos candidatos. Os métodos de seleção de perguntas podem ser divididos principalmente em duas categorias: seleção baseada em pontuação de corte e seleção baseada em estimativas. O primeiro maximiza as informações fornecidas sobre a nota de corte, enquanto o último faz escolhas com base nas estimativas atuais da capacidade do examinado, e a eficiência dessas duas escolhas variará dependendo do critério de parada usado.
Dependendo dos critérios de conclusão utilizados, a seleção oportuna das questões afetará diretamente o sucesso do teste.
Existem três critérios de terminação que são frequentemente usados em CCT: teoria de decisão bayesiana, método de intervalo de confiança e teste de razão de probabilidade de sequência. Cada um desses métodos tem suas próprias vantagens e desvantagens, proporcionando diferentes graus de flexibilidade e precisão, mas também podem introduzir alguma subjetividade desnecessária. Pelo método do intervalo de confiança, a estimativa atual da habilidade do examinado tem um impacto direto no resultado da classificação, enquanto o teste de razão de probabilidade sequencial realiza a classificação na forma de um teste de hipótese.
Com o passar dos tempos, o CCT não apenas estabelece um padrão de exame eficiente, mas também tem um impacto profundo no futuro do campo da psicometria. À medida que suas aplicações práticas continuam a se expandir, como isso afetará nossos métodos de teste e a compreensão das pessoas sobre avaliação de capacidade no futuro? Vale a pena ponderar isso para cada um de nós.