Dalam statistik, koefisien korelasi Pearson (PCC) adalah koefisien korelasi yang mengukur hubungan linier antara dua set data. Koefisien ini adalah rasio antara kovariansi dua variabel dan produk deviasi standarnya. Koefisien ini sebenarnya adalah ukuran kovariansi yang distandarkan sehingga hasilnya selalu antara -1 dan 1. Ini berarti bahwa koefisien ini dapat membantu kita memahami hubungan antara variabel, tetapi hanya dalam konteks korelasi linier.
"Jika koefisien korelasi Pearson dari dua variabel adalah 1, maka ada korelasi positif sempurna antara keduanya."
Misalnya, misalkan kita memeriksa hubungan antara usia dan tinggi badan siswa di sekolah dasar. Diharapkan bahwa koefisien korelasi Pearson untuk kedua variabel ini akan lebih besar dari 0 tetapi kurang dari 1 karena tidak realistis untuk memiliki usia dan tinggi badan yang sama persis.
Koefisien korelasi Pearson dikembangkan oleh Karl Pearson pada tahun 1880-an, berdasarkan konsep korelasi yang diajukan oleh Francis Galton. Perlu dicatat bahwa penamaan penemuan ini mencerminkan Hukum Stigler, yang menyatakan bahwa "nama penemu sering diabaikan."
“Pengembangan statistik bukan hanya evolusi angka, tetapi juga eksplorasi cerita di balik data.”
Dari sudut pandang geometri, koefisien korelasi dapat diperoleh dengan mempertimbangkan kosinus sudut antara titik-titik yang mewakili dua set data. Hal ini memungkinkan koefisien korelasi Pearson digunakan sebagai ukuran korelasi dari kumpulan data tertentu, dan nilainya berada di antara −1 dan 1, dengan 1 menjadi 1 ketika semua titik terletak pada garis lurus yang sama.
Koefisien korelasi Pearson didefinisikan sebagai kovariansi dua variabel dibagi dengan produk deviasi standarnya. Bentuk definisi ini melibatkan "produk" yang merupakan rata-rata (momentum pertama di sekitar titik asal) dikalikan dengan rata-rata variabel acak; oleh karena itu disebut kualifikasi "produk".
Ketika diterapkan pada suatu populasi, koefisien korelasi Pearson sering dilambangkan dengan huruf Yunani ρ (rho) dan disebut koefisien korelasi populasi atau koefisien korelasi Pearson populasi. Misalnya, perhatikan sepasang variabel acak (X, Y), yang koefisien korelasinya dapat dinyatakan sebagai produk dari kovariansi dan deviasi standar variabel. Akan tetapi, karena kompleksitas definisinya, tidaklah mudah untuk menunjukkan bentuk rumus spesifik di sini.
“Kovariansi adalah kunci untuk memahami interaksi antar variabel.”
Ketika koefisien korelasi Pearson diterapkan pada sampel, biasanya dilambangkan dengan simbol r dan dapat disebut koefisien korelasi sampel atau koefisien korelasi Pearson sampel. Nilai ini didasarkan pada estimasi kovariansi dan varians dalam sampel dan dapat mencerminkan hubungan antara kedua variabel.
Meskipun koefisien korelasi Pearson digunakan secara luas, koefisien ini hanya dapat mencerminkan hubungan linier dan mengabaikan jenis asosiasi lainnya, yang mengharuskan kita untuk sangat berhati-hati saat menggunakannya. Hasil atau pola spesifik dapat bervariasi tergantung pada pilihan data atau metode analisis, yang tidak terbatas pada perhitungan statistik langsung tetapi juga mencakup interpretasi dan penerapan."Data tidak dapat berbicara sendiri, tetapi makna potensialnya terungkap melalui interpretasi yang tepat."
Pada akhirnya, koefisien korelasi Pearson menyediakan alat yang ampuh untuk memahami hubungan antara variabel, tetapi kita harus selalu menggunakannya dengan berpikir kritis. Pernahkah Anda mempertimbangkan apakah ada faktor lain dalam hidup Anda yang mungkin memengaruhi hubungan antara kedua variabel tersebut?