在統計學中,估計器(estimator)是用來根據觀察到的數據計算未知參數的規則。這個過程中,我們區分了估計器(rule)、感興趣的量(estimand)及其結果(estimate)。舉例來說,樣本均值被廣泛用作母體均值的估計器。這樣的估計器可以分為點估計器和區間估計器,前者提供單一數值的估計,而後者則是給出一系列可行的值。
“單一數值不一定意味著單一數字,還可以是向量值或函數值的估計器。”
估計理論關注的是估計器的性質,即用於比較不同估計器在相同數據下表現的定義性質。這些性質可以幫助我們在特定情況下判斷哪些估計規則更佳。然而,在穩健統計學中,研究不僅考慮在狹義假設下的良好性質,也涉及在更廣泛條件下可能出現的較差性質之間的平衡。
所謂的“估計器”或“點估計”是統計學中的一個術語,表示用來推斷統計模型中未知參數值得統計量。更具體地說,「估計器是用來獲取未知參數估計值的所選方法」。被估計的參數往往稱為估量量(estimand),其可以是有限維度(在參數化和半參數模型中)或無限維度(在半參數和非參數模型中)。
“作為數據的函數,估計器本身也是隨機變量;一個特定的隨機變量實現被稱為‘估計值’。”
雖然在實踐中,估計器的定義幾乎沒有對所用數據的函數形式進行限制,但其吸引力通常依賴於它們的性質,如無偏性、均方誤差、一致性及漸近分佈等。這些屬性為估計器的構建和比較提供了理論基礎。在決策理論的背景下,估計器被視為一種決策規則,其表現可以通過損失函數進行評估。
以下幾個定義和屬性是相關的:
對於給定的樣本 x,估計器的“誤差”定義為:
e(x) = 估計值(x) - 真實值
均方誤差(MSE)是估計值與真實值間誤差平方的期望值,公式為:
MSE = E[(估計值(X) - 真實值)²]
“如果將參數視為目標的靶心,那麼估計器便是射擊過程,而每一支箭即為估計值。”
估計器的偏差(Bias)定義為估計值的期望與真實值之間的距離,表示為:
Bias(估計器) = E(估計器) - 真實值
對於希望獲得無偏估計器的情境,無偏估計器不會系統性地生成大於或小於真實值的估計。而在實際問題中,若可以接受少量偏差,那麼可能會找到具有更小均方誤差的估計器。
對於估計器,無偏性是一個期望值屬性,它表明估計器在長期內不會系統性地偏離真實參數。理想的情況下,無偏估計器應該將均方誤差控制在最小。
最後,這些統計性質不僅幫助我們理解估計器的性能,也不斷推動著數據分析的發展。不同類型的數據和參數需求,如何影響估計器的選擇與利用?