Dalam statistik, estimasi kemungkinan maksimum (MLE) adalah metode untuk memperkirakan parameter dari distribusi probabilitas yang dihipotesiskan dari data yang diamati. Metode ini memaksimalkan fungsi kemungkinan untuk memastikan bahwa kemungkinan data yang diamati dimaksimalkan berdasarkan model statistik yang diasumsikan. Titik dalam ruang parameter tempat fungsi kemungkinan mencapai nilai maksimumnya adalah estimasi kemungkinan maksimum. Logika ini tidak hanya intuitif tetapi juga fleksibel, dan karenanya telah menjadi sarana utama inferensi statistik.
Estimasi kemungkinan maksimum membuat data tidak lagi diam, tetapi membangkitkan informasi tersembunyi dalam data melalui penyesuaian parameter.
Prinsip dasar estimasi kemungkinan maksimum adalah menganggap sekumpulan pengamatan sebagai sampel acak dari beberapa distribusi probabilitas gabungan yang tidak diketahui. Tujuannya adalah untuk menentukan nilai parameter yang memberikan probabilitas gabungan tertinggi untuk mengamati data.
Kami merepresentasikan parameter yang mengendalikan alokasi gabungan sebagai vektor θ = [θ1, θ2, ..., θk ] sehingga berada dalam keluarga parameter {f(⋅; θ) | θ ∈ Θ}, di mana Θ adalah ruang parameter, himpunan bagian berdimensi-hingga dari ruang Euclidean.
Ketika kami mengevaluasi kerapatan gabungan y = (y1, y2, ..., yn) pada sampel data yang diamati Ketika , kami dapat memperoleh fungsi bernilai riil, yang disebut fungsi kemungkinan Ln(θ) = Ln(θ; y). Untuk variabel acak yang independen dan terdistribusi identik, fungsi kemungkinan adalah hasil kali dari fungsi kerapatan univariat.
Tujuan estimasi kemungkinan maksimum adalah untuk menemukan nilai parameter yang meminimalkan fungsi kemungkinan dalam ruang parameter.
Proses ini dapat dipahami secara intuitif. Kunci estimasi kemungkinan maksimum adalah memilih nilai parameter yang membuat data yang diamati paling mungkin terjadi. Secara komputasional, pendekatan umum adalah menggunakan logaritma natural dari fungsi kemungkinan, yang disebut log-likelihood.
Dengan menghitung apa yang disebut fungsi kemungkinan, kita dapat menemukan nilai maksimum yang mungkin. Untuk beberapa model, persamaan ini dapat diselesaikan secara eksplisit, tetapi secara umum, tidak ada solusi bentuk tertutup, jadi seseorang harus mengandalkan optimasi numerik untuk menemukan estimasi kemungkinan maksimum.
Dalam analisis data, MLE bukan hanya rumus matematika, tetapi seni membiarkan data berbicara.
Selain optimasi numerik, penting juga untuk dicatat bahwa untuk sampel terbatas, mungkin ada beberapa solusi. Apakah solusi yang kami identifikasi benar-benar maksimum (lokal) bergantung pada matriks turunan orde kedua, yang disebut matriks Hessian.
Biasanya, estimasi kemungkinan maksimum juga dapat sesuai dengan inferensi Bayesian. Di bawah distribusi prior seragam, MLE dapat memperkirakan estimasi posteriori maksimum (MAP). Ini terutama penting saat melakukan inferensi statistik dan membangun model.
Keajaiban estimasi kemungkinan maksimum terletak pada kemampuannya untuk tidak hanya mengkarakterisasi data itu sendiri, tetapi juga memberikan dasar yang berarti untuk pengambilan keputusan. Oleh karena itu, baik dalam ekonomi, kedokteran, atau penelitian ilmiah lainnya, MLE menempati posisi yang sangat diperlukan.
Terakhir, kita harus merenungkan bahwa kekuatan data terletak pada proses memahaminya. Sudahkah kita memanfaatkan data sepenuhnya untuk menjelaskan cerita di baliknya?