심리측정학에서 내용타당성(논리적 타당성이라고도 함)은 측정 도구가 특정 심리적 특성의 모든 측면을 얼마나 잘 표현하는지를 나타냅니다. 예를 들어, 우울 척도가 우울증의 행동적 측면을 고려하지 않고 감정적 측면만을 평가한다면, 그 척도는 내용 타당성이 부족할 수 있습니다. 특정 성격 특성(예: 외향성)의 정의에는 어느 정도 주관성이 따르므로, 내용 타당성을 보장하려면 합의에 도달하는 것이 중요합니다.
내용 타당성은 표면적 타당성과 다릅니다. 표면적 타당성은 검사가 실제로 측정하는 내용이 아니라 표면적으로 타당한지 여부를 의미합니다.
내용 타당성 평가는 일반적으로 해당 분야 전문가가 시험 항목이 정의된 내용을 포함하고 있는지 평가하고 보다 엄격한 통계적 시험을 실시하도록 요구합니다. 이 과정은 학업 및 직업 시험에서 특히 중요한데, 그 이유는 시험 문항이 필요한 지식이나 기술을 반영해야 하기 때문입니다.
임상적 환경에서 내용 타당성은 검사 항목과 특정 증상 내용 간의 일치 정도를 나타냅니다. 검사의 타당성을 확보하기 위해서는 검사 문항이 증상의 다양성을 충분히 반영할 수 있는지에 대한 심층적인 분석이 필요합니다.
널리 사용되는 내용 타당성 측정 방법은 C.H. Lawshe가 제안한 것으로, 특정 항목의 중요성에 대한 검토자 간의 동의를 측정하는 것입니다.
1975년 기사에서 Lawshe는 각 주제 전문가가 각 항목에 대해 해당 기술이나 지식이 직무 수행에 "필수적"인지 "유용하지만 필수적이지는 않음"인지 답해야 한다고 제안했습니다. "필수적이지 않음"인가요?" 로셰에 따르면, 검토자의 절반 이상이 어떤 항목을 필요하다고 생각하면 그 항목은 적어도 어느 정도 내용타당성이 있다고 간주됩니다.
이러한 가정에 기초하여 Lawshe는 내용 타당성 비율(CVR)이라는 공식을 개발하여 내용 타당성을 정량화했습니다.
수식은 다음과 같습니다. CVR = (ne - N/2) / (N/2)
여기서 CVR은 콘텐츠 타당성 비율이고 ne는 "필요한"이라고 표시한 전문가 수입니다. " , N은 전문가의 총 수입니다. 이 공식은 +1과 -1 사이의 값을 취합니다. 양수 값은 전문가의 절반 이상이 해당 항목이 필요하다고 믿는다는 것을 의미합니다.
그러나 계산 과정과 결과는 고정되어 있지 않으며, 특히 평가 전문가의 수가 변경될 경우 예상치 못한 수학적 현상이 발생할 수 있습니다. 예를 들어, Lawshe가 제공한 주요 값 표에서는 전문가의 수가 8명이 되면 상황이 복잡해지는데, 이는 후대 학자들의 주목을 받았습니다.
일부 연구자들은 이 모델을 개선하려고 시도했고, Lawshe와 Schipper의 표가 실제로는 양측 검정에 대한 정규 근사에 해당하는데도 단측 검정으로 잘못 표시되어 있다는 것을 발견했습니다.
Wilson, Pan, Schumsky 등이 그들의 연구에서 지적했듯이, 재계산된 임계값 표의 내용 타당성 비율은 측정의 타당성을 더 잘 반영하고 다양한 유의 수준에서 임계값을 제공할 수 있습니다. 이러한 개정을 통해 내용 타당성 평가가 더 정확해질 뿐만 아니라, 향후 연구자들이 더욱 견고한 데이터를 기반으로 시험을 설계할 수 있게 되었습니다.
실무에서 내용 타당성을 지속적으로 개선하기 위해 노력하는 만큼, 각 시험 항목의 의미를 이해하는 것이 중요합니다. 특히 심리학 및 이와 관련된 분야에서 효과적인 테스트는 겉보기에 피상적인 타당성에 국한되지 않고 모든 심리적 특성이 완벽하게 표현되도록 보장해야 합니다.
내용 타당성은 단순히 시험 기준이 아니라, 우리가 연구하는 심리적 현상을 올바르게 이해하고 측정하는 방법에 대한 것입니다. 내용타당성의 원칙이 다양한 상황에 적절하게 적용될 수 있는지 여부는 향후 심리측정학에서 심도 있게 탐구할 가치가 있는 문제가 될 것입니다.