統計において、ファミリーワイズ誤り率 (FWER) は、複数の仮説検定で 1 つ以上の誤検出 (タイプ I 誤り) が発生する確率を指します。これは、複数のテストを実行する際のエラー率を削減したい研究者にとって重要な概念です。
ジョン テューキーは、特定のグループで発生するタイプ I 過誤の確率を測定するために、1953 年にファミリータイプ過誤率の概念を導入しました。
家族性過誤率の概念は、実験に関連する概念を含む統計の重要な枠組みの中にあります。ライアンは 1959 年に、実験でタイプ I エラーが発生する確率を表す実験的エラー率を提案しました。実験誤差率は、セット内のすべてのテストが均一に制御される一連のテストと考えることができます。
統計では、「家族」という言葉にはいくつかの定義があります。 Hochberg と Tamhane (1987) は、「ファミリー」を「何らかの包括的な誤差の尺度を意味のある形で考慮する一連の推論」と定義しています。この定義は、統計分析における正確性と選択効果を強調しています。
<テーブル>複数の仮説テストを実行すると、複数の結果が生じる可能性があります。たとえば、m 個の仮説があると仮定すると、真の仮説の数と偽陽性の数が最終的な統計的結論に影響します。
家族性過誤率の中核は、少なくとも 1 つのタイプ I 過誤を制御することです。
家族性エラー率を制御するための従来の方法がいくつかあります。最もよく知られているものは次のとおりです。
ボンフェローニ手順を例に挙げます。これは、各仮説検定の有意水準を検定の合計数で割ることによって、全体の家族性過誤率を制御する非常に簡単な方法です。
研究では、ホルムのラダー法がボンフェローニ法よりも強力で、すべての仮定の誤り率を効果的に制御できることが指摘されています。
仮説をテストする場合、統計学者はテスト間の依存関係も考慮する必要があります。 Bonferroni や Holm などの従来の方法は、複数の仮説における相互テストの依存関係の検出に適した比較的保守的なソリューションを提供します。
ただし、これらのメソッドの保守的な性質は、そのパフォーマンスが何らかの依存構造によって制限される可能性があることも意味します。場合によっては、ブートストラップや置換方法の導入などのリサンプリング戦略を採用すると、エラー率を制御し、検出パフォーマンスを向上させることができます。
これらすべての戦略のうち、ファミリーベースのエラー率制御は、False Discovery Rate (FDR) 制御よりも厳格な保護を提供します。
エラー率の制御において、各方法にはそれぞれ長所と短所があることに注意してください。研究の背景と仮説の特性に基づいて、適切な制御戦略を選択することが重要です。さらに、家族性過誤率の制御は、科学研究において極めて重要である不確実性や意思決定のリスクを軽減する取り組みの一環であることがよくあります。
長期的には、エラー率の制御と結果の妥当性の維持のバランスをどのように取るかが、統計研究における課題であり続けるでしょう。この文脈において、ジョン・テューキーのイノベーションは私たちの考察に値するものであり、そのイノベーションがデータサイエンスに与える影響はどのように変化するのでしょうか?