在统计学中,家族型错误率(Family-wise Error Rate, FWER)是指在多次假设检验中,发生一次或多次错误发现(第一类错误)的概率。对于希望在进行多重检验时减少错误率的研究者而言,这是一个关键概念。
约翰·图基于1953年提出了家族型错误率的概念,旨在衡量在特定组中发生第一类错误的概率。
家族型错误率的概念位于统计学的重要框架中,当中包含了与实验相关的概念。 Ryan于1959年提出了实验型错误率(Experiment-wise Error Rate),它表示在一次实验中发生第一类错误的概率。可以视作实验型错误率是一组检验的集合,且该集合中的所有检验都受到了统一控制。
在统计上,"家族"这个词有数个定义。 Hochberg和Tamhane(1987年)定义「家族」为「任何一组推论,其有意义地考虑某种综合的错误度量。」而这个定义强调了统计分析中的正确性和选择效应。
假设 | 结果 |
---|---|
H1 | ... |
H2 | ... |
当进行多个假设检验时,可能会出现几种结果。例如,假设有m个假设,真假设的数量和假阳性的数量会影响最终的统计结论。
家族型错误率的核心在于控制至少一次的第一类错误。
控制家族型错误率的传统方法有多种。最知名的包括:
以Bonferroni程序为例,这是一种非常简单的方法,它将每个假设检验的显著性水平除以检验的总数,从而控制整体的家族型错误率。
有研究指出,Holm的阶梯法比Bonferroni方法更具强大性,且能够有效控制所有假设的错误率。
在对假设进行检验的过程中,统计学家还需考虑测试间的依赖关系。传统的方法如Bonferroni和Holm提供了一个相对保守的解决方案,适合于多元假设中检测的跨测试依赖情况。
然而,这些方法的保守性也意味着它们的效能可能受到某种依赖结构的限制。在某些情况下,采取重抽样策略,例如引入自举法和置换法,可以改善错误率控制的能力,同时增强检测的效能。
在所有这些策略之中,家族型错误率控制比假发现率(False Discovery Rate, FDR)控制提供了更为严格的保障。
值得注意的是,每种方法都对错误率的控制有其自身的强项与弱点,根据研究的背景和假设的特性,选择合适的控制策略至关重要。此外,控制家族型错误率通常是试图降低不确定性和决策风险的一部分,这在科学研究中至关重要。
从长远来看,如何平衡控制错误率和保持结果的有效性,将继续成为统计学研究中的一个挑战。在这种背景下,约翰·图基的创新值得我们反思,它对数据科学的影响又将如何变化?