In statistica e psicometria, l'affidabilità si riferisce alla coerenza complessiva di una misurazione. Una misurazione è considerata altamente affidabile se produce risultati simili in condizioni costanti. Gli esperti sottolineano: "Questa è una caratteristica di un gruppo di punteggi dei test correlati a errori casuali che possono essere incorporati nei punteggi dei test durante il processo di misurazione". In parole povere, più affidabile è la misurazione, più accurata, ripetibile e affidabile è la risultati. Maggiore è la coerenza.
"Quando una procedura di test viene ripetuta e i risultati sono più o meno gli stessi per lo stesso gruppo di persone, la misurazione è considerata altamente affidabile."
Esistono diverse categorie di affidabilità delle misurazioni. Il primo è l'affidabilità tra i valutatori, cioè la coerenza dei valutatori nel misurare l'obiettivo. In questo caso, se un paziente presenta dolore allo stomaco e riceve la stessa diagnosi da più medici, la misura ha una buona affidabilità. In secondo luogo, l'affidabilità test-retest si riferisce alla coerenza dei punteggi dei test nelle diverse somministrazioni. Ciò include la valutazione della coerenza interna, che valuta il grado di concordanza tra gli elementi del test. Esistono anche vari metodi di verifica reciproca, ad esempio l'affidabilità tra metodi e l'affidabilità tra forme.
È importante notare che affidabilità e validità non sono la stessa cosa. Una misurazione affidabile non significa che misuri correttamente la caratteristica desiderata. Ad esempio, sebbene esistano molti test che quantificano in modo affidabile abilità specifiche, non sono necessariamente sufficienti per prevedere le prestazioni lavorative. A questo punto, l'affidabilità presenta alcuni limiti di validità. Un test che non è completamente affidabile non può essere completamente valido. Ad esempio, se una bilancia indica sempre il peso di un oggetto pari a 500 grammi, anche se la bilancia è affidabile, è ovvio che non è efficace perché il peso visualizzato non è il peso effettivo.
"Una misurazione completamente affidabile non è necessariamente valida, ma una misurazione valida è certamente affidabile."
Nella pratica, le misure di prova non sono mai completamente coerenti. La teoria dell'affidabilità dei test cerca di stimare l'effetto dell'incoerenza sulla precisione della misurazione. La variazione nei punteggi dei test è generalmente influenzata da due tipi di fattori: fattori stabili, che sono caratteristiche stabili degli individui, e fattori instabili, che sono altri fattori negli individui o nelle situazioni che possono influenzare i punteggi dei test. Ciò può dipendere da fattori temporanei quali salute, stanchezza, motivazione, ecc., e può includere anche interferenze dovute all'ambiente del test e alla chiarezza delle istruzioni.
Un metodo importante per raggiungere un'elevata affidabilità è quello di condurre un'analisi degli elementi, che comporta il calcolo della difficoltà e dell'indice di discriminazione degli elementi. Se alcune domande sono troppo facili o difficili, oppure il loro grado di discriminazione è prossimo allo zero o negativo, allora queste domande devono essere sostituite con elementi più validi per migliorare l'affidabilità della misurazione. Spesso l'affidabilità può essere migliorata aumentando la chiarezza dei test, aumentandone la lunghezza o tramite altri mezzi informali.
Quando si progetta e si implementa qualsiasi misurazione, è fondamentale comprendere la vera natura dell'affidabilità e come testarla. Ciò non solo garantisce l'affidabilità dei risultati del test, ma ne migliora anche la validità complessiva. Se la misurazione non è affidabile, non si otterrà l'effetto desiderato. Dovremmo sempre riflettere se possiamo trovare modi migliori per migliorare l'affidabilità da diverse prospettive di misurazione.