일상 언어에서 평균은 데이터 집합을 가장 잘 나타내는 단일 숫자나 값을 말합니다. 숫자 목록을 가장 잘 나타낸다고 여겨지는 평균은 산술 평균인데, 이는 모든 숫자의 합을 숫자의 개수로 나눈 값입니다. 예를 들어, 숫자 2, 3, 4, 7, 9의 산술 평균은 5입니다. 맥락에 따라 가장 대표적인 통계는 중앙값이나 기하 평균과 같은 중심 경향을 측정하는 다른 방법이 될 수 있습니다.
개인 소득 평균과 같은 경우 중간값을 자주 사용하는데, 이는 일부 부유한 사람들의 소득이 전체 산술 평균을 끌어올리는 것을 방지하기 위해서입니다.
평균의 보편적인 속성 중 하나는 숫자 집합에 있는 모든 숫자가 같을 경우, 그 숫자들의 평균도 해당 숫자와 같다는 것입니다. 이 속성은 모든 유형의 평균에서 공통적으로 나타납니다. 또 다른 일반적인 속성은 단조성입니다. 두 숫자 집합 A와 B가 길이가 같고 A의 각 숫자가 B의 해당 숫자보다 크거나 같으면 A의 평균은 B의 해당 숫자보다 크거나 같을 것입니다. B의 것
또한, 모든 평균은 선형 동질성 속성을 만족합니다. 즉, 숫자 그룹을 같은 양수로 곱하면 평균이 같은 비율로 변경됩니다. 가중 산술 평균이나 가중 기하 평균과 같은 일부 가중 평균 유형의 경우, 평균을 계산하기 전에 숫자 목록에 있는 항목에 다른 가중치가 부여됩니다. 대부분의 평균 유형은 순열을 고려하지 않습니다. 즉, 목록의 위치와 관계없이 평균을 계산할 때 모든 숫자가 동등하게 취급됩니다.
산술 평균, 기하 평균, 조화 평균을 총칭하여 피타고라스 평균이라고 합니다. 이러한 평균 외에도 최빈값과 중앙값도 중심 경향을 추정하는 데 자주 사용됩니다.
최빈값은 목록에서 가장 일반적인 숫자이고, 중앙값은 숫자를 정렬한 후 중앙에 있는 숫자입니다.
예를 들어, 숫자 1, 2, 2, 3, 3, 3, 4의 목록에서 패턴은 3이지만, 정렬된 목록 1, 3, 7, 13의 산술 합은 3과 7입니다. 평균적으로는 5입니다.
τ-th 분위수와 같은 다른 유형의 평균은 반드시 평균은 아니지만, 최적화 문제에 대한 솔루션으로 볼 수 있습니다. 더 복잡한 평균에는 삼중 평균, 삼중 중앙값, 표준화 평균이 포함됩니다.
금융에서 평균 백분율 수익률은 본질적으로 기하 평균을 응용한 특별한 유형의 평균화입니다. 수익이 연간일 경우, 이 지표를 연평균 성장률(CAGR)이라고 합니다. 예를 들어, 첫 번째 해에 투자 수익률이 -10%였고 두 번째 해에 수익률이 +60%였다면 총 수익률에 대한 방정식을 풀어서 CAGR을 찾을 수 있습니다.
이동 평균은 데이터 분석에 일반적으로 사용되는 도구이며 일일 주식 시장 가격이나 몇 년간의 기온과 같은 시계열을 매끄럽게 만드는 데 사용됩니다. 사람들은 일반적으로 n에 대한 값을 선택한 다음 처음 n개 값의 산술 평균을 구하여 새로운 시리즈를 만든 다음 다음 위치로 이동하여 평활화된 데이터 시리즈를 만듭니다.
이동 평균의 간단한 형태는 산술 평균을 취하는 것이지만, 더 복잡한 형태는 다양한 순환적 행동을 강화하거나 완화하기 위해 가중 평균을 사용하는 것입니다.
다양한 유형의 평균과 그 적용 분야를 이해하는 것은 데이터 분석을 마스터하는 데 있어 초석이 됩니다. 사람들은 데이터를 분석하고 해석할 때 사용하는 평균을 충분히 알고 있나요?