統計学や心理測定学では、信頼性は測定の全体的な一貫性を指します。一貫した条件下で同様の結果が得られる場合、測定の信頼性は高いとみなされます。専門家は次のように指摘している。「これは、測定プロセス中にテストスコアに埋め込まれる可能性のあるランダムエラーに関連するテストスコアのグループの特性です。」簡単に言えば、測定の信頼性が高いほど、テストの正確性、再現性、信頼性が高くなります。結果。一貫性が高くなります。
「テスト手順を繰り返し、同じグループの人々に対してほぼ同じ結果が得られた場合、その測定は信頼性が高いとみなされます。」
測定の信頼性にはいくつかの異なるカテゴリがあります。 1 つ目は、評価者間の信頼性、つまり、評価者が対象を測定する際の一貫性です。この場合、患者が胃の痛みを訴え、複数の医師から同じ診断を受けた場合、この指標は信頼性が高いと言えます。 2 番目に、再テスト信頼性は、異なるテストの実施間でのテストスコアの一貫性を指します。これには、テスト項目間の一致度を評価する内部一貫性評価が含まれます。相互検証の方法も、方法間の信頼性やフォーム間の信頼性など多岐にわたります。
信頼性は妥当性と同じではないことに注意することが重要です。信頼性の高い測定は、目的の特性を正しく測定することを意味するものではありません。たとえば、特定の能力を信頼性を持って定量化するテストは数多くありますが、それらは必ずしも職務遂行能力を予測するのに十分ではありません。この時点で、信頼性には妥当性に関するいくつかの制限があります。完全に信頼できないテストは、完全に有効であるとは言えません。たとえば、体重計が物体の重さを常に 500 グラムと表示する場合、体重計が信頼できるものであっても、表示される重さは実際の重さではないため、明らかに効果的ではありません。
「完全に信頼できる測定が必ずしも有効であるとは限りませんが、有効な測定は確かに信頼できるものです。」
実際には、テストの測定方法が完全に一貫していることはありません。テストの信頼性の理論は、不一致が測定精度に与える影響を推定することを目的としています。テストのスコアの変動は、一般的に 2 種類の要因によって影響を受けます。安定した要因は個人の安定した特性であり、不安定な要因は個人または状況におけるテストのスコアに影響を与える可能性のあるその他の要因です。これには、健康、疲労、モチベーションなどの一時的な要因が含まれる場合があり、テスト環境からの干渉や指示の明確さも含まれる場合があります。
高い信頼性を実現するための重要な方法は、項目の難易度と識別指数を計算する項目分析を行うことです。一部の質問が簡単すぎたり難しすぎたり、あるいはその判別力がゼロに近いかマイナスである場合は、測定の信頼性を高めるために、これらの質問をより有効な項目に置き換える必要があります。信頼性は、多くの場合、テストの明確さ、テストの長さ、またはその他の非公式な手段によって向上できます。
信頼性の本質を理解し、それをテストする方法を理解することは、あらゆる測定を設計および実装する際に非常に重要です。これにより、テスト結果の信頼性が確保されるだけでなく、テスト全体の妥当性も向上します。測定が信頼できない場合、望ましい効果は得られません。さまざまな測定の観点から信頼性を向上させるより良い方法を見つけられるかどうかを常に検討する必要がありますか?