科学技術の発展に伴い、伝統的な心理測定方法は新しい技術に置き換えられつつあります。新しい評価システムとして、コンピューター分類テスト(CCT)がますます注目を集めています。テストプロセスが簡素化されるだけでなく、テストの精度と効率も向上します。それで、CCT はどのように機能するのでしょうか?その背後にはどのような理論と実践が隠されているのでしょうか?
コンピューター分類テストは、受験者を分類するために設計されたコンピューターベースの評価システムです。
CCT はコンピュータ適応型テスト (CAT) と同様の方法で動作します。CAT では、受験者に質問が 1 つずつ提示され、各質問への回答後、コンピュータが即座に採点し、受験者が分類されているかどうかを評価します。そうであれば、テストは終了し、受験者は分類されます。そうでない場合は、次の質問が提示されます。このプロセスは、候補者が分類されるか、その他の終了基準(すべての質問に回答するか、テストの長さの制限に達するなど)が満たされるまで繰り返されます。
CCT の心理測定モデルには、古典的テスト理論 (CTT) と項目反応理論 (IRT) という 2 つの主なタイプがあります。前者は、特定のサンプルで受験者を分類し、さまざまな受験者グループに基づいて各問題の難易度と差別化を特定しますが、受験者の選択に高い要求が課せられます。対照的に、IRT では能力は連続的であると想定されており、分類基準は曖昧ではあるがより正確です。これら 2 つのアプローチの選択にはさまざまな考慮事項があり、CTT は概念的な単純さを提供し、IRT はリソースが十分である場合に高い特異性を提供します。
CTT は比較的シンプルですが、小規模なテスト プランのテスト パラメータを調整する場合により効率的です。
特定のアルゴリズムを実行するには、CCT を特定の開始点に設定する必要があります。停止基準として順次確率比検定を使用する場合、デフォルトの開始比率は 1.0 です。信頼区間法を使用する場合は、開始点を指定する必要があります。通常、このような開始点は分布の中心を示す 0.0 ですが、候補者の履歴データに基づいて開始点を設定することもできます。
CCT では、質問の選択が柔軟です。すべての受験者に対して固定の質問セットを使用する従来の方法と比較して、受験者のパフォーマンスに応じて質問を継続的に調整できます。問題選択方法は、主にカットオフスコアベースの選択と推定ベースの選択の 2 つのカテゴリに分けられます。前者はカットオフスコア付近で提供される情報を最大化し、後者は受験者の能力の現在の推定に基づいて選択を行いますが、これら 2 つの選択の効率は、使用される停止基準によって異なります。
使用される終了基準に応じて、タイムリーな質問の選択がテストの成功に直接影響します。
CCT でよく使用される終了基準は、ベイズ決定理論、信頼区間法、シーケンス確率比検定の 3 つです。これらの方法にはそれぞれ長所と短所があり、柔軟性と精度の程度は異なりますが、不必要な主観が導入される可能性もあります。信頼区間法では、受験者の現在の能力の推定が分類結果に直接影響を及ぼしますが、順次確率比検定では仮説検定の形式で分類を実行します。
時代が進むにつれて、CCT は効率的な試験基準を確立するだけでなく、心理測定学の分野の将来に大きな影響を与えます。実用化が進むにつれて、それが将来的に私たちのテスト方法や能力評価に対する人々の理解にどのような影響を与えるのでしょうか。これは私たち一人一人が熟考する価値のあることです。