Dalam psikometrik, validitas isi adalah penilaian sejauh mana alat ukur secara memadai mewakili semua aspek suatu konstruk. Misalnya, jika skala depresi hanya menilai aspek emosional tetapi mengabaikan aspek perilaku, skala tersebut mungkin tidak memiliki validitas isi. Subjektivitas yang terlibat membuat penentuan validitas isi kurang jelas, karena interpretasi ciri-ciri kepribadian tertentu, seperti ekstroversi, sering kali berbeda. Jika ada ketidaksepakatan di antara para ahli tentang pemahaman mereka tentang ciri kepribadian, akan sulit untuk mencapai validitas isi yang tinggi.
Validitas isi berbeda dari validitas rupa. Validitas rupa hanya menilai apakah suatu tes tampak valid tetapi tidak benar-benar mencerminkan apa yang sebenarnya diukur.
Inti dari validitas rupa adalah apakah tes tersebut tampak "berfungsi" bagi peserta tes, administrator, dan pengamat lain yang tidak paham teknis. Misalnya, ketika kandidat melihat suatu materi, apakah mereka pikir materi itu akan menguji pengetahuan atau keterampilan mereka? Sebaliknya, validitas konten mengharuskan penggunaan peninjau konten profesional untuk mengevaluasi apakah butir-butir tes mencerminkan konten yang ditentukan, dan juga memerlukan pengujian statistik yang lebih ketat daripada validitas nominal. Validitas konten sering dikutip dalam pengujian akademis dan kejuruan karena butir-butir tes perlu mencerminkan pengetahuan yang dibutuhkan dalam bidang profesional tertentu (seperti sejarah) atau keterampilan kerja (seperti akuntansi). Dalam lingkungan klinis, validitas konten mengacu pada korespondensi antara butir-butir tes dan konten penyakit.
Metode pengukuran validitas konten yang diusulkan oleh Lawshe terutama mengevaluasi tingkat kesepakatan antara evaluator. Metode ini masih banyak digunakan hingga saat ini.
Sebuah metode terkenal yang diusulkan oleh Lawshe pada tahun 1975 dirancang untuk menilai pandangan peninjau tentang apakah suatu proyek "diperlukan." Menurut Lawshe, setiap pengulas ahli akan menjawab pertanyaan untuk setiap butir soal: "Apakah keterampilan atau pengetahuan yang diukur dengan butir soal ini 'diperlukan', 'berguna tetapi tidak perlu', atau 'tidak perlu'?" Jika lebih dari separuh pengulas percaya bahwa suatu butir soal diperlukan, maka butir soal tersebut setidaknya memiliki beberapa derajat validitas konten. Dan ketika lebih banyak pengulas yang setuju tentang perlunya suatu butir soal, derajat validitas konten akan meningkat sesuai dengan itu. Oleh karena itu Lawshe mengembangkan rumus yang disebut rasio validitas konten.
Rasio validitas konten dihitung antara +1 dan -1, dengan nilai positif yang menunjukkan bahwa setidaknya separuh pengulas ahli menganggap butir soal tersebut diperlukan.
Selama eksplorasi lebih lanjut terhadap metode Lawshe, para ilmuwan menemukan beberapa perubahan numerik yang tidak biasa dalam rasio validitas konten minimum yang diperlukan saat menggunakan delapan pengulas. Fenomena ini menarik perhatian para akademisi seperti Wilson, Pan, dan Schumsky, yang mengusulkan evaluasi ulang nilai-nilai ini pada tahun 2012. Dengan membandingkan nilai-nilai distribusi binomial yang mereka hitung dengan nilai-nilai Schipper, para akademisi menemukan bahwa tabel-tabel yang diberi label oleh Lawshe dan Schipper sebenarnya adalah hasil dari uji dua sisi, tetapi diberi label yang salah sebagai uji satu sisi, yang membingungkan nilai-nilai aslinya. Kesalahan-kesalahan seperti itu menyebabkan batas-batas rasio validitas konten menunjukkan ketidakkonsistenan ketika dihitung menggunakan jumlah pengulas yang berbeda.
Oleh karena itu, evaluasi ulang rasio validitas konten menjadi sangat penting. Proses perhitungan ulang ini memberikan informasi berharga yang memungkinkan kita untuk memeriksa pentingnya dan dampak validitas konten di bawah kerangka pemahaman baru. Rangkaian penelitian ini tidak hanya mengungkap kemungkinan bias dalam desain dan evaluasi pengujian, tetapi juga mendorong komunitas akademis untuk merenungkan keandalan dan validitas pengukuran konten.
Dari teori hingga praktik, rasio validitas konten Lawshe bukan sekadar serangkaian angka, tetapi juga jaminan untuk memastikan bahwa tes yang kita gunakan benar-benar dapat mencerminkan ciri kepribadian atau standar perilaku yang kita pedulikan.
Saat membahas masalah validitas konten, kita tidak dapat tidak bertanya, bagaimana kita dapat menemukan keseimbangan antara subjektivitas dan objektivitas, dan kemudian meningkatkan keyakinan kita terhadap hasil tes?