과학 연구와 통계 분석에서 p값은 중요한 통계 개념이지만 종종 사람들을 혼란스럽게 합니다. p-값은 특히 귀무가설 검정을 수행할 때 위양성 검정에 반영되며, 귀무가설이 참일 경우 관찰된 데이터가 최소한 극단적일 가능성을 나타냅니다. 그러나 p-값에 대한 오해와 잘못된 사용은 수학과 관련 과학에서 흔히 발생합니다. 따라서 우리는 p-값이 실제로 무엇을 의미하는지와 그 적용에 대해 더 깊이 탐구할 필요가 있습니다.
통계 검정을 위해 p값을 보고하는 것은 많은 학술 출판물에서 일반적인 관행이지만, p값에 대한 오해와 잘못된 사용이 주요 주제가 되었습니다.
통계에서는 관찰된 데이터의 알 수 없는 확률 분포에 대한 모든 추측을 통계적 가설이라고 합니다. 가설만 진술하고 통계 검정의 목적이 가설이 타당한지 확인하는 것이라면 이러한 유형의 검정을 귀무가설 검정이라고 합니다. 귀무 가설은 가설의 속성이 존재하지 않는다는 것을 의미합니다. 일반적으로 귀무 가설은 상관 관계나 평균 차이와 같은 일부 매개 변수가 0이라고 가정합니다. 검사를 수행할 때 수치 통계를 계산하고 이를 사용하여 관찰된 데이터가 통계적으로 유의한지 여부를 추론합니다.
정의에 따르면 p-값은 귀무가설이 참일 경우 최소한 관측 결과만큼 극단적인 탐지 통계를 얻을 확률입니다. 따라서 p-값이 작을수록 귀무가설의 타당성을 의심할 수 있습니다. 그러나 이것이 귀무가설이 거짓이라는 의미는 아닙니다.
미국통계협회에서는 "p값은 연구 가설이 참일 확률을 측정하지 않으며, 데이터가 무작위로 생성될 확률도 측정하지 않습니다."라고 명시합니다.
p값은 통계적 가설 검정에 널리 사용됩니다. 연구를 수행하기 전에 연구자는 모델(귀무 가설)과 유의 수준 α(가장 일반적으로 0.05)를 선택합니다. p-값이 α보다 작으면 관측된 데이터가 귀무가설과 충분히 일치하지 않아 가설을 기각할 수 있음을 의미합니다. 그러나 많은 통계학자들은 p-값이 0.05보다 작은 경우 대립 가설을 뒷받침하는 것으로 간주하는 등 p-값의 오용 및 잘못된 해석 문제를 제기했습니다.
다른 통계학자들은 p값을 버리고 신뢰구간, 우도비, 베이즈 요인 등 다른 추론 통계 방법에 더 집중할 것을 권장합니다.
일반적으로 p-값을 계산하려면 검정 통계량, 연구자가 수행하기로 선택한 단측 또는 양측 검정, 데이터를 식별해야 합니다. 귀무가설이 참이면 p-값이 0과 1 사이에 고르게 분포되어야 하는데, 이는 동일한 검정을 반복하면 귀무가설이 참이더라도 대개는 다른 p-값을 얻게 된다는 의미입니다.
동전이 공정한지 테스트하기 위해 실험을 한다고 가정해 보겠습니다. 그 결과 20번의 동전 던지기 중 앞면이 14번 나온 것으로 나타났습니다. 이 경우 귀무가설은 동전이 공정하다는 것입니다. 오른쪽 꼬리 테스트, 즉 동전이 앞면 쪽으로 편향되어 있는지 확인하는 데 중점을 두면 p 값은 동전이 공정할 경우 앞면이 14번 이상 발생할 확률입니다.
요약하자면, p-값은 의심할 여지 없이 통계의 필수적인 부분이지만, 이를 연구 가설을 판단하는 도구로 사용할 때는 주의해야 합니다. p-값의 맥락과 해당 연구 설계를 신중하게 고려하는 것이 필요한 단계입니다. 당신은 이미 이 숫자에 대해 더 깊이 이해하고 있습니까?