في الإحصاء، يشير معدل الخطأ العائلي (FWER) إلى احتمال حدوث اكتشاف خاطئ واحد أو أكثر (أخطاء النوع الأول) في اختبارات الفرضيات المتعددة. وهذا مفهوم أساسي للباحثين الذين يرغبون في تقليل معدل الخطأ عند إجراء اختبارات متعددة.
اقترح جون توكي مفهوم معدل الخطأ على مستوى الأسرة في عام 1953 لقياس احتمال حدوث خطأ من النوع الأول في مجموعة معينة.
يقع مفهوم معدل الخطأ على مستوى الأسرة في إطار مهم من الإحصاء، والذي يتضمن مفاهيم مرتبطة بالتجارب. اقترح رايان معدل الخطأ التجريبي في عام 1959، والذي يمثل احتمال حدوث خطأ من النوع الأول في تجربة ما. يمكن اعتبار معدل الخطأ التجريبي بمثابة مجموعة من الاختبارات حيث يتم التحكم في جميع الاختبارات في المجموعة بشكل موحد.
إحصائيًا، كلمة "عائلة" لها عدة تعريفات. عرّف هوتشبيرج وتامهان (1987) "العائلة" بأنها "أي مجموعة من الاستدلالات التي تأخذ في الاعتبار بشكل هادف بعض مقاييس الخطأ الإجمالية". ويؤكد هذا التعريف على كل من صحة وتأثيرات الاختيار في التحليل الإحصائي.
<الجدول> <تر>عند إجراء اختبارات فرضية متعددة، قد تحدث عدة نتائج. على سبيل المثال، بافتراض وجود m فرضية، فإن عدد الفرضيات الصحيحة وعدد الإيجابيات الكاذبة سيؤثر على الاستنتاج الإحصائي النهائي.
جوهر معدل الخطأ على مستوى الأسرة هو التحكم في خطأ واحد على الأقل من النوع الأول.
توجد عدة طرق تقليدية للتحكم في معدل الخطأ على مستوى الأسرة. ومن أشهرها:
<أول>خذ إجراء بونفيروني كمثال، وهو أسلوب بسيط للغاية يقسم مستوى أهمية كل اختبار فرضية على العدد الإجمالي للاختبارات، وبالتالي التحكم في معدل الخطأ الإجمالي على مستوى الأسرة.
أظهرت الدراسات أن طريقة سلم هولم أقوى من طريقة بونفيروني ويمكنها التحكم بشكل فعال في معدل الخطأ لجميع الافتراضات.
في عملية اختبار الفرضيات، يحتاج الإحصائيون أيضًا إلى مراعاة التبعيات بين الاختبارات. توفر الطرق التقليدية مثل بونفيروني وهولم حلاً متحفظًا نسبيًا مناسبًا لاعتماد الاختبار المتقاطع في اختبار الفرضيات المتعددة المتغيرات.
ومع ذلك، فإن الطبيعة المحافظة لهذه الأساليب تعني أيضًا أن فعاليتها قد تكون محدودة بسبب هياكل التبعية المحددة. في بعض الحالات، يمكن لاستراتيجيات إعادة العينة، مثل إدخال أساليب التمهيد والتبديل، تحسين القدرة على التحكم في معدلات الخطأ وتعزيز أداء الاكتشاف.
من بين كل هذه الاستراتيجيات، يوفر التحكم في معدل الخطأ على مستوى الأسرة حماية أكثر صرامة من التحكم في معدل الاكتشاف الخاطئ (FDR).
ومن الجدير بالذكر أن لكل طريقة نقاط قوة ونقاط ضعف في التحكم في معدل الخطأ. ومن الأهمية بمكان اختيار استراتيجية التحكم المناسبة بناءً على سياق البحث وخصائص الفرضية. وعلاوة على ذلك، فإن التحكم في معدل الخطأ على مستوى الأسرة غالبا ما يكون جزءا من محاولة تقليل عدم اليقين والمخاطرة في اتخاذ القرارات، وهو أمر بالغ الأهمية في البحث العلمي.
على المدى الطويل، ستظل كيفية تحقيق التوازن بين التحكم في معدل الخطأ والحفاظ على صحة النتائج تشكل تحديًا في البحث الإحصائي. وفي هذا السياق، يجدر بنا أن نتأمل ابتكار جون توكي وكيف سيغير تأثيره على علم البيانات.