在日常用语中,平均是一个代表一组数据最佳的单一数字或值。最常被认为是数字列表最具代表性的平均值是算术平均,它是所有数字加总后除以数字的个数。例如,数字2、3、4、7和9的算术平均是5。根据上下文,最具代表性的统计数据可能会是其他衡量中心趋势的指标,例如中位数或几何平均。
某些情况下,例如个人收入的平均值,通常使用中位数,因为这样可以避免一些富豪的收入拉高整体的算术平均。
有关平均数的普遍性质,其中一个特性是,如果一组数字中的所有数字相同,那么它们的平均值也将等于这个数字。这一性质在各种类型的平均数中都是共享的。另一个普遍性质是单调性:如果两组数字A和B的长度相同,且A中的每个数字至少与B中的对应数字一样大,那么A的平均值将至少与B相等。
此外,所有的平均数都满足线性齐次性:如果一组数字都乘以同一个正数,那么其平均值也会按照相同的比例变化。对于某些类型的加权平均值,例如加权算术平均数或加权几何平均,数字列表中的项目在计算平均值之前会获得不同的权重。大多数平均数类型则满足置换不敏感性,即所有数字在计算其平均值时都同等计算,其在列表中的位置毫无关系。
算术平均、几何平均与调和平均被统称为毕达哥拉斯平均数。除了这些平均数外,模式和中位数也经常被用于估计中心趋势。
模式是列表中最常出现的数字,而中位数则是将数字按大小排序后位于中间的数字。
例如,在数字列表1、2、2、3、3、3、4中,模式是3,而经过排序的列表1、3、7、13,其中位数则是3和7的算术平均,即5。
虽然其他类型的平均数如 τ-th 像分位数不一定是平均数,但它们可以被视为最佳化问题的解。更为复杂的平均数还包括三均值、三中位数和标准化平均等。
在财务方面,平均百分比回报是一种特殊类型的平均,它实质上是几何平均的应用。当回报是年回报时,这一指标称为复合年增长率(CAGR)。例如,如果经历了第一年的投资回报为-10%,第二年为+60%,则可以通过解决总回报的方程来找到CAGR。
移动平均是分析数据时常用的工具,用于平滑时间序列,如每日股市价格或年份气温。人们通常选择一个n值,然后通过取前n个值的算术平均来创建新的序列,随后移动至下一位置,从而创建平滑数据序列。
移动平均的简单形式是取算术平均,但更复杂的形式则涉及加权平均,以提升或抑制不同的周期性行为。
理解平均的不同类型和其应用范围是掌握数据分析的基石。人们在进行数据分析和解释时,是否充分意识到自己使用的是哪一种平均?