Dalam statistik dan psikometri, reliabilitas mengacu pada konsistensi keseluruhan suatu pengukuran. Suatu pengukuran dianggap memiliki reliabilitas tinggi jika menghasilkan hasil yang serupa dalam kondisi yang konsisten. Para ahli mengemukakan: "Ini merupakan karakteristik sekelompok skor tes yang terkait dengan kesalahan acak yang mungkin tertanam dalam skor tes selama proses pengukuran." Sederhananya, semakin reliabel suatu pengukuran, semakin akurat, dapat diulang, dan reliabel hasilnya. Semakin tinggi konsistensinya.
"Ketika suatu prosedur pengujian diulang dan hasilnya kira-kira sama untuk kelompok orang yang sama, pengukuran tersebut dianggap memiliki reliabilitas tinggi."
Ada beberapa kategori reliabilitas pengukuran yang berbeda. Yang pertama adalah reliabilitas antar evaluator, yaitu konsistensi evaluator dalam mengukur target. Dalam hal ini, jika seorang pasien datang dengan sakit perut dan menerima diagnosis yang sama dari beberapa dokter, pengukuran tersebut memiliki reliabilitas yang baik. Kedua, reliabilitas tes-tes ulang mengacu pada konsistensi skor tes di berbagai administrasi tes. Ini termasuk penilaian konsistensi internal, yang mengevaluasi tingkat kesesuaian antara butir-butir tes. Ada juga berbagai cara verifikasi bersama, misalnya, keandalan antara metode dan keandalan antara formulir.
Penting untuk dicatat bahwa keandalan tidak sama dengan validitas. Pengukuran yang andal tidak berarti bahwa pengukuran tersebut mengukur karakteristik yang diinginkan dengan benar. Misalnya, meskipun ada banyak tes yang secara andal mengukur kemampuan tertentu, tes tersebut belum tentu cukup untuk memprediksi kinerja pekerjaan. Pada titik ini, keandalan memiliki beberapa keterbatasan pada validitas. Tes yang tidak sepenuhnya andal tidak dapat sepenuhnya valid. Misalnya, jika timbangan selalu menampilkan berat suatu objek sebagai 500 gram, meskipun timbangan tersebut andal, timbangan tersebut jelas tidak efektif karena berat yang ditampilkan bukanlah berat sebenarnya.
“Pengukuran yang sepenuhnya andal belum tentu valid, tetapi pengukuran yang valid tentu saja reliabel.”
Dalam praktiknya, ukuran pengujian tidak pernah sepenuhnya konsisten. Teori reliabilitas tes berupaya memperkirakan dampak ketidakkonsistenan pada akurasi pengukuran. Variasi skor tes umumnya dipengaruhi oleh dua jenis faktor: faktor stabil, yang merupakan karakteristik individu yang stabil, dan faktor tidak stabil, yang merupakan faktor lain pada individu atau situasi yang dapat memengaruhi skor tes. Ini mungkin melibatkan faktor sementara seperti kesehatan, kelelahan, motivasi, dll., dan mungkin juga mencakup gangguan dari lingkungan pengujian dan kejelasan instruksi.
Metode penting untuk mencapai reliabilitas tinggi adalah dengan melakukan analisis item, yang melibatkan penghitungan indeks kesulitan dan diskriminasi item. Jika beberapa pertanyaan terlalu mudah atau sulit, atau daya pembedanya mendekati nol atau negatif, maka pertanyaan-pertanyaan ini perlu diganti dengan item yang lebih valid untuk meningkatkan keandalan pengukuran. Keandalan sering kali dapat ditingkatkan melalui kejelasan tes, durasi tes, atau cara informal lainnya.
Memahami sifat sebenarnya dari keandalan dan cara mengujinya sangat penting saat merancang dan menerapkan pengukuran apa pun. Hal ini tidak hanya memastikan keandalan hasil tes, tetapi juga meningkatkan validitas tes secara keseluruhan. Jika pengukuran tidak dapat diandalkan, maka tidak akan mencapai efek yang diinginkan. Kita harus selalu merenungkan apakah kita dapat menemukan cara yang lebih baik untuk meningkatkan keandalan dari berbagai perspektif pengukuran?