在統計學中,最大似然估計(MLE)是一種從觀察數據出發估計假設概率分布參數的方法。這一方法通過最大化一個似然函數來確保在假設的統計模型下,觀遇數據的可能性最大化。在參數空間中使似然函數達到最大值的點,即為最大似然估計。這一邏輯不僅直觀且靈活,因此成為統計推斷的一個主流手段。
最大似然估計讓數據不再沉默,而是透過參數的調整,喚醒數據深藏的訊息。
最大似然估計的基本原理是將一組觀察樣本視為來自某個未知聯合概率分布的隨機樣本。目標在於確定使得觀察數據具有最高聯合概率的參數值。
我們將控制聯合分配的參數表示為一個向量 θ = [θ1, θ2, ..., θk],使之落在一個參數族 {f(⋅; θ) | θ ∈ Θ} 之內,這裡的 Θ 是參數空間,一個有限維度的歐幾里得空間子集。
當我們在觀察數據樣本上評估聯合密度 y = (y1, y2, ..., yn) 時,可以得到一個實值函數,這個函數被稱為似然函數 Ln(θ) = Ln(θ; y)。對於獨立且同分佈的隨機變量,似然函數是單變量密度函數的乘積。
最大似然估計的目的是找到使得似然函數在參數空間中取得最小值的參數值。
可以直觀地理解這一過程,最大似然估計的關鍵在於選擇那些使得觀察數據最有可能發生的參數值。在計算上,常見的做法是使用似然函數的自然對數,稱之為對數似然。
透過計算所謂的似然方程,我們能夠發現可能存在的最大值。對某些模型而言,這些方程可以顯式地被解出,但一般情況下,沒有封閉形式的解,因此只好依賴數值優化來找到最大似然估計。
在數據分析中,MLE不僅僅是數學公式,而是一種讓數據說話的藝術。
除了數值優化之外,還需要注意到對於有限樣本,可能會存在多重解的情況。而我們識別出的解是否確實是(局部)極大值,則依賴於二階導數矩陣,這一矩陣被稱為赫西恩矩陣。
通常,最大似然估計也可以和貝葉斯推斷相對應,在一個均勻的先驗分佈下,MLE可以近似最大後驗估計(MAP)。這一點在進行統計推理以及建立模型時尤為重要。
最大似然估計的靈魅之處在於其能力,不僅能夠數據本身的特徵,還能夠為決策提供有意義的依據。因此,無論是在經濟學、醫學還是其他科学研究中,MLE都佔據著不可或缺的地位。
最後,我們必須反思,數據的力量在於理解它的過程,我們是否已經充分利用數據來解釋背後的故事?