Dari Permukaan ke Substansi: Menghadapi Perbedaan Mengejutkan Antara Validitas dan Validitas Isi, Tahukah Anda?

Dalam psikometrika, "validitas isi" (content validate), atau validitas logis, merujuk pada sejauh mana alat ukur dapat mencakup semua aspek dari suatu konstruk tertentu. Misalnya, skala depresi yang hanya menilai dimensi afektif tetapi mengabaikan dimensi perilaku dapat dianggap tidak memiliki validitas isi. Ada sejumlah subjektivitas dalam menilai validitas isi, yang memerlukan tingkat konsensus tertentu pada ciri kepribadian tertentu (seperti ekstroversi). Jika ada ketidaksepakatan tentang ciri kepribadian tertentu, validitas isi yang tinggi tidak dapat dicapai.

Validitas isi berbeda dari validitas rupa, yang merujuk pada apa yang tampaknya diukur oleh suatu tes daripada apa yang sebenarnya diukur oleh tes tersebut.

Dalam aplikasi tes, validitas rupa menilai apakah suatu tes "tampak valid" bagi peserta, administrator, dan pengamat nonahli teknis lainnya. Sebaliknya, validitas isi memerlukan mobilisasi para ahli materi pelajaran yang diakui untuk mengevaluasi apakah butir-butir tes menilai isi yang ditetapkan, dan proses evaluasi ini memerlukan pengujian statistik yang lebih ketat daripada validitas nominal. Validitas isi paling sering ditemukan dalam pengujian akademis dan kejuruan, di mana butir-butir tes harus mencerminkan pengetahuan aktual yang dibutuhkan untuk suatu bidang mata pelajaran (seperti sejarah) atau keterampilan kerja (seperti akuntansi).

Dalam aplikasi klinis, validitas isi mengacu pada korespondensi antara butir-butir tes dan isi gejala suatu sindrom.

Metode untuk mengukur validitas isi

Sebuah metode yang banyak digunakan untuk menilai validitas isi diusulkan oleh C. H. Lawshe. Ini pada dasarnya adalah cara untuk menilai konsistensi kepentingan yang diberikan oleh para pengulas atau penilai pada suatu butir. Lawshe (1975) merekomendasikan agar para ahli materi pelajaran (SME) yang berpartisipasi dalam peninjauan menjawab pertanyaan berikut untuk setiap butir: "Apakah keterampilan atau pengetahuan yang diukur dengan butir tersebut 'penting' untuk kinerja pekerjaan, 'berguna tetapi tidak penting', atau 'berguna tetapi tidak perlu' untuk kinerja pekerjaan?" Menurut Lawshe, jika lebih dari separuh pengulas mengatakan bahwa suatu butir diperlukan, maka butir tersebut setidaknya memiliki beberapa validitas konten. Ketika lebih banyak pengulas setuju bahwa suatu butir diperlukan, tingkat validitas kontennya lebih tinggi.

Dengan menggunakan asumsi ini, Lawshe mengembangkan rumus yang disebut rasio validitas konten.

Ekspresi rumus ini adalah:

CVR = (ne - N/2) / (N/2)

Jika CVR merupakan singkatan dari rasio validitas konten, ne adalah jumlah ahli materi pelajaran yang ditandai sebagai "diperlukan", dan N adalah jumlah total ahli materi pelajaran. Rumus ini menghasilkan nilai berkisar antara +1 hingga -1, dengan nilai positif yang menunjukkan bahwa setidaknya setengah dari para ahli menilai butir soal tersebut sebagai perlu. Rata-rata CVR untuk butir soal dapat digunakan untuk menunjukkan validitas isi dari keseluruhan tes.

Lawshe (1975) memberikan tabel CVRambang batas yang dapat digunakan oleh evaluator pengujian untuk menentukan ukuran CVR terhitung yang diperlukan untuk mencapai probabilitas yang diharapkan dari terobosan yang diberikan sejumlah ahli materi pelajaran tertentu. Tinjauan lebih dekat pada tabel yang diterbitkan ini mengungkapkan sebuah anomali. Dalam tabel Schipper, nilai kritis CVR meningkat secara monoton dari 40 ahli (minimum = 0,29) menjadi 9 ahli (minimum = 0,78), tetapi tiba-tiba menurun pada 8 ahli (Nilai minimum adalah 0,75), dan nilai tertinggi dicapai dalam kasus 7 ahli (nilai minimum adalah 0,99). Namun, ketika rumus tersebut diterapkan pada 8 pengulas, data dari 7 pengulas yang menandainya sebagai perlu dan 1 pengulas yang menandainya secara berbeda menghasilkan CVR sebesar 0,75. Jika 0,75 bukan nilai kritis, maka 8 orang akan diperlukan untuk menandainya sebagai perlu untuk mendapatkan CVR sebesar 1,00. Dalam kasus ini, dalam urutan CVR menaik, 8 pengulas dan nilainya harus 1,00, yang akan melanggar prinsip yang sama, karena nilai "sempurna" untuk 8 pengulas tidak akan berlaku untuk jumlah pengulas lainnya.

Apakah penyimpangan dari pola peningkatan monoton pada tabel lainnya ini disebabkan oleh kesalahan perhitungan oleh Schipper atau kesalahan pengetikan atau penataan huruf masih belum jelas. Wilson, Pan, dan Schumsky mencoba untuk mengoreksi kesalahan tersebut pada tahun 2012, tetapi tidak dapat menemukan penjelasan dalam makalah Lawshe, juga tidak ada publikasi oleh Schipper untuk menjelaskan proses perhitungan tabel nilai kritis. Para peneliti percaya bahwa nilai Schipper mendekati perkiraan normal dari distribusi binomial. Dengan membandingkan nilai Schipper dengan nilai binomial yang baru dihitung, mereka menemukan bahwa Lawshe dan Schipper secara keliru memberi label pada tabel publik sebagai uji satu sisi, padahal sebenarnya nilai tersebut mencerminkan nilai binomial dari uji dua sisi. Selanjutnya, Wilson dan rekan-rekannya menerbitkan tabel nilai kritis yang dihitung ulang untuk rasio validitas isi, yang menyediakan nilai kritis pada beberapa tingkat signifikansi.

Pembahasan mendalam tentang validitas isi tidak hanya memiliki implikasi penting bagi desain uji, tetapi juga mendorong munculnya pola pikir baru dalam psikometrik. Dalam prosesnya, haruskah kita memikirkan kembali cara mengukur efektivitas uji secara efektif sehingga dapat diterapkan dengan lebih bijak dalam berbagai situasi kehidupan nyata?

Trending Knowledge

Mitos Perhitungan Validitas Konten: Mengapa Rumus Lawshe Begitu Penting dan Menarik?
<header> </header> Dalam psikometrik, validitas isi adalah penilaian sejauh mana alat ukur secara memadai mewakili semua aspek suatu konstruk. Misalnya, jika skala depresi hanya menilai aspek emosion
Kekuatan Penilaian Pakar: Mengapa Validitas Konten Sangat Penting untuk Pengujian Psikologis?
Dalam psikometrika, validitas isi (juga dikenal sebagai validitas logistik) mengacu pada sejauh mana alat ukur dapat mewakili semua aspek dari suatu konstruk tertentu. Misalnya, jika alat penilaian de
Rahasia Validitas Isi: Bagaimana Memastikan Butir Soal Anda Benar-benar Mencerminkan Karakteristik Psikologis?
Dalam psikometrika, validitas isi (juga disebut validitas logis) mengacu pada sejauh mana instrumen pengukuran mewakili semua aspek dari ciri psikologis tertentu. Misalnya, jika skala depresi hanya me

Responses