In psicometria, la validità del contenuto è la valutazione della misura in cui uno strumento di misurazione rappresenta adeguatamente tutti gli aspetti di un costrutto. Ad esempio, se una scala della depressione valuta solo gli aspetti affettivi ma ignora quelli comportamentali, la scala potrebbe non avere validità di contenuto. La soggettività coinvolta rende meno netta la determinazione della validità del contenuto, poiché le interpretazioni di specifici tratti della personalità, come l'estroversione, spesso differiscono. Se ci sono differenze nella comprensione di un tratto della personalità tra gli esperti, sarà difficile ottenere un'elevata validità di contenuto.
La validità del contenuto è diversa dalla validità apparente. La validità apparente valuta solo se un test appare valido, ma non riflette realmente ciò che misura.
La validità apparente si concentra sul fatto che un test sembri "funzionare" agli occhi di chi lo sottopone, degli amministratori e di altri osservatori tecnicamente poco esperti. Ad esempio, quando i candidati vedono un pezzo di materiale, pensano che metta alla prova le loro conoscenze o competenze? Al contrario, la validità del contenuto richiede l'impiego di revisori di contenuti professionisti per valutare se gli elementi del test riflettono il contenuto definito e richiede inoltre test statistici più rigorosi rispetto alla validità apparente. La validità del contenuto viene spesso citata nel contesto dei test accademici e professionali perché gli elementi del test devono riflettere le conoscenze richieste per uno specifico campo professionale (ad esempio, la storia) o per una competenza lavorativa (ad esempio, la contabilità). In ambito clinico, la validità del contenuto si riferisce alla corrispondenza tra gli elementi del test e il contenuto della malattia.
Il metodo di misurazione della validità del contenuto proposto da Lawshe valuta principalmente il grado di accordo tra i valutatori, ed è ancora ampiamente utilizzato oggi.
Un famoso metodo proposto da Lawshe nel 1975 per valutare il parere dei revisori sulla "necessità" di un progetto. Secondo Lawshe, ogni revisore esperto risponde alla domanda per ogni elemento del test: "L'abilità o la conoscenza misurata dall'elemento è 'essenziale', 'utile ma non essenziale' o 'non necessaria'?" Se più della metà dei revisori ritiene che un elemento sia essenziale, allora l'elemento ha almeno un certo grado di validità di contenuto. Man mano che più revisori concordano sulla necessità di un elemento, aumenta anche il grado di validità del contenuto. Lawshe sviluppò quindi una formula chiamata rapporto di validità del contenuto.
Il rapporto di validità del contenuto è calcolato tra +1 e -1, con valori positivi che indicano che almeno la metà dei revisori esperti ritiene l'elemento obbligatorio.
In un'ulteriore esplorazione del metodo di Lawshe, gli studiosi hanno riscontrato alcune variazioni insolite nel rapporto minimo di validità del contenuto richiesto quando si utilizzavano otto revisori. Questo fenomeno ha attirato l'attenzione di studiosi come Wilson, Pan e Schumsky, che nel 2012 hanno proposto una rivalutazione di questi valori. Confrontando i valori della distribuzione binomiale da loro calcolati con i valori di Schipper, gli studiosi hanno scoperto che la tabella contrassegnata da Lawshe e Schipper era in realtà il risultato di un test a due code, ma era etichettata erroneamente come test a una coda, il che ha causato confusione sui valori originali. Tali errori rendono incoerenti i valori critici dei rapporti di validità del contenuto quando vengono calcolati utilizzando un numero diverso di revisori.
Pertanto, è fondamentale rivalutare i rapporti di validità dei contenuti. Questo processo di ricalcolo fornisce informazioni preziose che ci consentono di esaminare l'importanza e l'impatto della validità del contenuto all'interno di un nuovo quadro di comprensione. Questa serie di studi non solo rivela possibili distorsioni nella progettazione e nella valutazione dei test, ma spinge anche la comunità accademica a riflettere sull'affidabilità e sulla validità della misurazione dei contenuti.
Dalla teoria alla pratica, il rapporto di validità del contenuto di Lawshe non è solo un insieme di numeri, ma anche una garanzia che il test che utilizziamo può realmente riflettere i tratti della personalità o gli standard comportamentali che ci interessano.
Quando si discute della validità del contenuto, non possiamo fare a meno di chiederci: come possiamo trovare un equilibrio tra soggettività e oggettività e quindi migliorare la nostra fiducia nei risultati dei test?