科学研究や統計分析において、p 値は重要な統計概念ですが、人々を混乱させることがよくあります。 p 値は、特に帰無仮説検定を実行する場合の偽陽性検定に反映され、帰無仮説が正しい場合に観察されたデータが少なくとも極端である可能性を表します。ただし、数学および関連科学では、p 値の誤解や誤った使用がよく見られます。したがって、p 値の実際の意味とその応用についてさらに深く掘り下げる必要があります。
統計検定の p 値を報告することは多くの学術出版物で一般的に行われていますが、p 値の誤解と誤った使用が大きなトピックとなっています。
統計学では、観測データの未知の確率分布に関するすべての推測を統計的仮説と呼びます。仮説を述べるだけで、統計検定の目的がその仮説が合理的かどうかを確認することである場合、このタイプの検定は帰無仮説検定と呼ばれます。帰無仮説とは、仮説の性質が存在しないことを意味します。通常、帰無仮説は、相関や平均差などのパラメーターがゼロであると仮定します。検査を実行するときは、数値統計を計算し、それを使用して、観察されたデータが統計的に有意であるかどうかを推測します。
定義により、p 値は、帰無仮説が真である場合に、少なくとも観察された結果と同じくらい極端な検出統計が得られる確率です。したがって、p 値が小さいほど、帰無仮説の妥当性を疑う可能性が高くなります。ただし、これは帰無仮説が偽であることを意味するものではありません。
米国統計協会は、「p 値は研究仮説が真実である確率を測定するものではなく、データがランダムに生成された確率を測定するものでもありません。」
p 値は統計的仮説検定で広く使用されます。研究を実施する前に、研究者はモデル (帰無仮説) と有意水準 α (最も一般的には 0.05) を選択します。 p 値が α より小さい場合、観察されたデータが帰無仮説と十分に一致しないため、仮説を棄却できることを意味します。しかし、多くの統計学者は、0.05 未満の p 値を対立仮説を支持するものとして扱うなど、p 値の誤用と誤解の問題を提起しています。
他の統計学者は、p 値を放棄し、信頼区間、尤度比、ベイズ因子などの他の推論統計手法に重点を置くことを推奨しています。
通常、p 値を計算するには、検定統計量、研究者が実行することを選択した片側検定または両側検定、およびデータを特定する必要があります。帰無仮説が真である場合、p 値は 0 と 1 の間で均等に分布するはずです。つまり、同じ検定を繰り返すと、たとえ帰無仮説が真であっても、通常は異なる p 値が得られます。
コインが公正かどうかをテストする実験を行うとします。その結果、20 回のコイントスのうち、表が現れたのは 14 回でした。この場合、帰無仮説はコインが公正であるということです。ライトテールテストを実行する場合、つまり、コインが表に偏っているかどうかを確認することに重点を置く場合、p 値は、コインが公正である場合に少なくとも 14 個の表が発生する確率になります。
要約すると、p 値は間違いなく統計に不可欠な部分ですが、研究仮説を判断するツールとして p 値を使用する場合は注意が必要です。 p 値の背景とそれに対応する研究デザインを慎重に検討することが必要なステップです。この数字についてはすでに深く理解していますか?