Dans divers domaines tels que l’économie, les sciences sociales et peut-être même la médecine, l’utilisation des valeurs p semble être devenue une entente tacite. Cependant, l’interprétation de ce nombre est souvent controversée. De nombreux scientifiques et chercheurs en données affirment que la véritable signification de la valeur p est souvent mal comprise, ce qui la rend vague dans la communauté universitaire. Cela soulève donc un certain nombre de questions importantes sur la relation entre la valeur p et l’hypothèse nulle.
La valeur p est une mesure de probabilité basée sur l'hypothèse nulle qui reflète à quel point la statistique de test observée serait extrême si l'hypothèse nulle était vraie.
Selon la définition statistique, l’hypothèse nulle est l’hypothèse testée, supposant généralement qu’un certain effet ou une certaine différence n’existe pas. Par exemple, si une étude est conçue pour tester l’efficacité d’un médicament pour une certaine condition, l’hypothèse nulle pourrait être « le médicament n’a aucun effet ». La valeur p est un outil utilisé pour quantifier cette hypothèse. Plus précisément, elle représente la probabilité d'obtenir un résultat ou un résultat plus extrême si l'hypothèse est vraie. Si la valeur p est très faible, cela indique que les résultats observés sont extrêmement peu susceptibles de se produire étant donné l’hypothèse nulle, ce qui peut inciter le chercheur à rejeter l’hypothèse nulle.
En 2016, l'American Statistical Association (ASA) a publié une déclaration indiquant que « la valeur p ne mesure pas la probabilité que l'hypothèse de recherche soit vraie, ni n'indique la probabilité que les données soient le fruit du hasard. »< /p>
En réponse à cela, de nombreux chercheurs et statisticiens ont appelé à une réévaluation de l’utilisation des valeurs p. Ils soutiennent que la valeur p ne représente pas la taille des preuves ou la signification des résultats, et ne devrait pas être utilisée simplement comme seul critère pour rejeter ou accepter une hypothèse. Des conclusions trompeuses sont susceptibles de se produire, en particulier lorsque plusieurs essais sont menés ou que la taille de l’échantillon est petite.
En pratique, les chercheurs définissent souvent un « niveau de signification », généralement de 0,05, ce qui signifie que lorsque la valeur p est inférieure à 0,05, le chercheur rejettera l’hypothèse nulle. Bien que cette norme soit largement utilisée dans la communauté statistique, de nombreux problèmes se cachent derrière elle. Les études utilisant cette norme ignorent parfois d’autres facteurs pertinents tels que la conception des tests et la qualité des mesures, ce qui conduit à une interprétation incorrecte des résultats des données.
« Dans des domaines tels que la santé mentale et la médecine clinique, les chercheurs doivent prendre en compte chaque aspect de la conception pour garantir des conclusions raisonnables. »
D'une part, la taille de la valeur p reflète dans une certaine mesure la confiance du résultat ; d'autre part, s'appuyer sur un seul chiffre comme base de prise de décision comporte également des risques et peut conduire à des phénomènes comme le « crochet de valeur p ». Dans ce cas, les chercheurs peuvent chercher à ajuster ou à filtrer les données lors de l’analyse des données pour les rendre significatives plutôt que de refléter objectivement la situation réelle.
Il convient de noter que la valeur p n’est pas seulement un nombre dérivé des données de l’échantillon, mais implique également l’interprétation de l’échantillon entier. Par conséquent, en plus de rapporter les valeurs p, la recherche devrait également se concentrer sur d’autres indicateurs statistiques, tels que les intervalles de confiance, les tailles d’effet, etc. Ces outils statistiques peuvent aider à fournir des résultats d’analyse plus complets.
De nombreux statisticiens ont suggéré qu’une plus grande attention devrait être accordée à d’autres méthodes statistiques inférentielles, telles que les intervalles de confiance et les rapports de vraisemblance, plutôt que de s’appuyer uniquement sur les valeurs p pour tirer des conclusions.
De tels débats ont conduit à repenser les méthodes statistiques en économie et dans d’autres domaines scientifiques. En 2019, l’ASA a formé un groupe spécial pour examiner l’utilisation des méthodes statistiques dans la recherche scientifique. Ils notent que différentes mesures d'incertitude peuvent se compléter et soulignent que « lorsque les valeurs p et les tests de signification sont correctement appliqués et interprétés, ils peuvent améliorer la rigueur des conclusions tirées des données ». Il est donc particulièrement important de trouver des outils statistiques appropriés et d’interpréter correctement les données.
Dans l’ensemble, la relation entre la valeur p et l’hypothèse nulle n’est pas simple et claire, mais contient davantage d’intersections de méthodes et de théories scientifiques. Le véritable défi n’est peut-être pas seulement de savoir comment calculer ou interpréter les valeurs p, mais comment garantir qu’elles sont utilisées correctement et raisonnablement dans la recherche. Avez-vous déjà réfléchi à la manière d’utiliser correctement la valeur p dans votre recherche, plutôt que de vous fier uniquement à sa taille pour prendre des décisions ?