Nella ricerca scientifica e nell'analisi statistica, il valore p è un concetto statistico importante, ma spesso confonde le persone. Il valore p si riflette nei test falsi positivi, soprattutto quando eseguiamo test di ipotesi nulla, e rappresenta la probabilità che i dati osservati siano almeno estremi dato che l'ipotesi nulla è vera. Tuttavia, incomprensioni e usi errati dei valori p sono comuni in matematica e nelle scienze correlate. Pertanto, dobbiamo approfondire il significato reale del valore p e le sue applicazioni.
Sebbene riportare i valori p per i test statistici sia una pratica comune in molte pubblicazioni accademiche, l'incomprensione e l'uso errato dei valori p è diventato un argomento importante.
In statistica, ogni congettura su una distribuzione di probabilità sconosciuta dei dati osservati è chiamata ipotesi statistica. Se affermiamo solo un'ipotesi e lo scopo del test statistico è verificare se l'ipotesi è ragionevole, allora questo tipo di test viene chiamato test di ipotesi nulla. L'ipotesi nulla significa che la proprietà dell'ipotesi non esiste. In genere, l'ipotesi nulla presuppone che alcuni parametri, come una correlazione o una differenza media, siano zero. Quando eseguiamo un'ispezione, calcoliamo una statistica numerica e la utilizziamo per dedurre se i dati osservati sono statisticamente significativi.
Per definizione, il valore p è la probabilità di ottenere una statistica di rilevamento estrema almeno quanto il risultato osservato se l'ipotesi nulla è vera. Pertanto, quanto più piccolo è il valore p, tanto più possiamo dubitare della validità dell’ipotesi nulla. Ciò però non significa che l’ipotesi nulla sia falsa.
L'American Statistical Association afferma: "Il valore p non misura la possibilità che l'ipotesi di ricerca sia vera, né misura la possibilità che i dati siano stati generati in modo casuale."
Il valore p è ampiamente utilizzato nei test di ipotesi statistiche. Prima di condurre uno studio, il ricercatore seleziona un modello (ipotesi nulla) e un livello di significatività α (più comunemente 0,05). Se il valore p è inferiore ad α, significa che i dati osservati sono sufficientemente incoerenti con l'ipotesi nulla da poter rifiutare l'ipotesi. Tuttavia, molti statistici hanno sollevato la questione dell’uso improprio e dell’errata interpretazione dei valori p, come trattare qualsiasi valore p inferiore a 0,05 come supporto dell’ipotesi alternativa.
Altri statistici consigliano di abbandonare i valori p e di concentrarsi maggiormente su altri metodi statistici inferenziali, come gli intervalli di confidenza, i rapporti di verosimiglianza o i fattori di Bayes.
In genere, per calcolare un valore p è necessario identificare la statistica del test, il test a una coda o a due code che il ricercatore ha scelto di eseguire e i dati. Se l'ipotesi nulla è vera, i valori p dovrebbero essere distribuiti equamente tra 0 e 1, il che significa che quando ripeti lo stesso test, di solito otterrai valori p diversi, anche se l'ipotesi nulla è vera.
Supponiamo di condurre un esperimento per verificare se una moneta è giusta. I risultati hanno mostrato che su 20 lanci di moneta è uscita testa 14 volte. In questo caso l’ipotesi nulla è che la moneta sia equa. Se eseguiamo il test della coda destra, cioè ci concentriamo sulla conferma se la moneta è sbilanciata verso testa, allora il valore p è la probabilità che si verifichino almeno 14 teste se la moneta è giusta.
In sintesi, i valori p sono senza dubbio parte integrante delle statistiche, ma dobbiamo fare attenzione quando li utilizziamo come strumento per giudicare ipotesi di ricerca. Un’attenta considerazione del contesto del valore p e del corrispondente disegno di ricerca è un passo necessario. Hai già una comprensione più approfondita di questo numero?