日常会話では、平均とは、データのセットを最もよく表す単一の数値または値です。数値リストの中で最も代表的なものとして最もよく考えられている平均は算術平均であり、これはすべての数値の合計を数値の数で割ったものです。たとえば、2、3、4、7、9 の算術平均は 5 です。状況に応じて、最も代表的な統計は、中央値や幾何平均など、中心傾向の他の尺度である場合があります。
個人所得の平均など、一部のケースでは、少数の裕福な人の所得が全体の算術平均を押し上げるのを防ぐため、中央値がよく使用されます。
平均の普遍的な特性の 1 つは、一連の数値がすべて同じである場合、その平均もその数値に等しくなることです。この特性は、すべての種類の平均に共通します。もう一つの一般的な性質は単調性である。2つの数の集合AとBが同じ長さで、Aの各数がBの対応する数と少なくとも同じ大きさであれば、Aの平均は少なくともBの対応する数と同じ大きさになる。 Bのもの。
さらに、すべての平均は線形同次性という特性を満たします。つまり、一連の数値に同じ正の数を掛けると、その平均は同じ割合で変化します。加重算術平均や加重幾何平均などの一部の種類の加重平均では、平均を計算する前に、数値リスト内の項目に異なる重みが与えられます。ほとんどの平均型は順列を考慮せず、リスト内の位置に関係なく、平均を計算するときにすべての数値が平等に扱われることを意味します。
算術平均、幾何平均、調和平均は総称してピタゴラス平均と呼ばれます。これらの平均値に加えて、モードと中央値も中心傾向を推定するためによく使用されます。
モードはリスト内で最も一般的な数値であり、中央値は数値を並べ替えた後の中央にある数値です。
たとえば、数字のリスト 1、2、2、3、3、3、4 の場合、パターンは 3 ですが、ソートされたリスト 1、3、7、13 の場合、算術合計は 3 と 7 になります。平均すると5になります。
τ 番目の四分位数などの他の種類の平均は必ずしも平均ではありませんが、最適化問題の解として見ることができます。より複雑な平均には、三重平均、三重中央値、標準化平均などがあります。
金融において、平均パーセンテージ収益は、本質的に幾何平均を応用した特殊なタイプの平均化です。収益が年間の場合、その指標は複合年間成長率 (CAGR) と呼ばれます。たとえば、最初の年に投資収益が -10% で、2 年目に +60% の収益があった場合、総収益の式を解くことで CAGR を見つけることができます。
移動平均はデータ分析でよく使われるツールで、日々の株価や数年間の気温などの時系列を平滑化するために使用されます。通常、n の値を選択し、最初の n 個の値の算術平均を取得して新しいシリーズを作成し、次に次の位置に移動して平滑化されたデータ シリーズを作成します。
移動平均の最も単純な形式は算術平均を取ることですが、より複雑な形式では、さまざまな周期的な動作を強めたり弱めたりするために加重平均が使われます。
さまざまな種類の平均とその適用場所を理解することは、データ分析をマスターするための基礎となります。人々は、データを分析および解釈する際にどの平均値を使用しているかを十分に認識していますか?