在统计学中,估计器(estimator)是用来根据观察到的数据计算未知参数的规则。这个过程中,我们区分了估计器(rule)、感兴趣的量(estimand)及其结果(estimate)。举例来说,样本均值被广泛用作母体均值的估计器。这样的估计器可以分为点估计器和区间估计器,前者提供单一数值的估计,而后者则是给出一系列可行的值。
“单一数值不一定意味着单一数字,还可以是向量值或函数值的估计器。”
估计理论关注的是估计器的性质,即用于比较不同估计器在相同数据下表现的定义性质。这些性质可以帮助我们在特定情况下判断哪些估计规则更佳。然而,在稳健统计学中,研究不仅考虑在狭义假设下的良好性质,也涉及在更广泛条件下可能出现的较差性质之间的平衡。
所谓的“估计器”或“点估计”是统计学中的一个术语,表示用来推断统计模型中未知参数值得统计量。更具体地说,「估计器是用来获取未知参数估计值的所选方法」。被估计的参数往往称为估量量(estimand),其可以是有限维度(在参数化和半参数模型中)或无限维度(在半参数和非参数模型中)。
“作为数据的函数,估计器本身也是随机变量;一个特定的随机变量实现被称为‘估计值’。”
虽然在实践中,估计器的定义几乎没有对所用数据的函数形式进行限制,但其吸引力通常依赖于它们的性质,如无偏性、均方误差、一致性及渐近分布等。这些属性为估计器的构建和比较提供了理论基础。在决策理论的背景下,估计器被视为一种决策规则,其表现可以通过损失函数进行评估。
以下几个定义和属性是相关的:
对于给定的样本 x,估计器的“误差”定义为:
e(x) = 估计值(x) - 真实值
均方误差(MSE)是估计值与真实值间误差平方的期望值,公式为:
MSE = E[(估计值(X) - 真实值)²]
“如果将参数视为目标的靶心,那么估计器便是射击过程,而每一支箭即为估计值。”
估计器的偏差(Bias)定义为估计值的期望与真实值之间的距离,表示为:
Bias(估计器) = E(估计器) - 真实值
对于希望获得无偏估计器的情境,无偏估计器不会系统性地生成大于或小于真实值的估计。而在实际问题中,若可以接受少量偏差,那么可能会找到具有更小均方误差的估计器。
对于估计器,无偏性是一个期望值属性,它表明估计器在长期内不会系统性地偏离真实参数。理想的情况下,无偏估计器应该将均方误差控制在最小。
最后,这些统计性质不仅帮助我们理解估计器的性能,也不断推动着数据分析的发展。不同类型的数据和参数需求,如何影响估计器的选择与利用?