In statistica, econometria, epidemiologia e discipline correlate, i metodi delle variabili strumentali (IV) vengono utilizzati quando gli esperimenti controllati non sono fattibili o quando il trattamento desiderato non viene somministrato con successo a tutte le unità. Il fulcro di questo approccio è la stima delle relazioni causali, che consente ai ricercatori di ricercare inferenze causali valide anche in assenza di esperimenti randomizzati.
Le variabili strumentali vengono utilizzate per risolvere il problema di endogeneità tra le variabili esplicative e il termine di errore.
L'endogeneità è un problema comune. In un modello di regressione, se le variabili esplicative sono correlate con il termine di errore, i risultati dei minimi quadrati ordinari (OLS) e dell'analisi della varianza (ANOVA) saranno distorti e incoerenti. L'efficacia delle variabili strumentali risiede nella loro capacità di rivelare l'effetto causale di una variabile esplicativa (ad esempio il fumo) su una variabile dipendente (ad esempio lo stato di salute).
Ad esempio, quando un ricercatore vuole stimare l'effetto del fumo sulla salute, scoprirà che una correlazione tra fumo e salute non significa che il fumo causi direttamente una cattiva salute, perché potrebbero esserci altre variabili, come la depressione, che influenzano entrambi. Inoltre, le variabili strumentali diventano fondamentali quando non è possibile condurre esperimenti controllati sull'intera popolazione.
Se i ricercatori riescono a trovare una variabile correlata al fumo ma che non influisce direttamente sulla salute, come ad esempio le aliquote fiscali sulle sigarette, allora possono utilizzare tale variabile per trarre inferenze causali.
L'aliquota dell'imposta sulle sigarette è stata scelta come variabile strumentale proprio perché si può ragionevolmente dedurre che essa influisce sulla salute solo influendo sul fumo. Se i risultati dello studio dimostrassero una correlazione tra le aliquote fiscali sulle sigarette e lo stato di salute, ciò verrebbe considerato una prova degli effetti negativi del fumo sulla salute.
Il concetto di variabili strumentali ha avuto origine dal lavoro di Philip G. Wright del 1928, che analizzò la produzione, il trasporto e la vendita di oli vegetali e animali nei primi Stati Uniti. Nel 1945, Olav Reiersøl applicò questo metodo nel suo articolo e gli diede il nome di "variabile strumentale". Wright ha utilizzato questo approccio quando ha studiato la domanda e l'offerta di burro perché si è reso conto che il prezzo influenza sia la domanda che l'offerta, rendendo impossibile costruire una curva di domanda o di offerta basata solo su dati osservativi.
Wright ha scelto intelligentemente le precipitazioni come variabile strumentale perché le precipitazioni influiscono sulla produzione di foraggio, che a sua volta influisce sulla produzione di latte, ma non sulla domanda di burro.
Nel corso del tempo, la teoria delle variabili strumentali è stata ulteriormente sviluppata in numerosi studi, soprattutto nelle applicazioni in econometria, fornendo utili strumenti analitici. La definizione formale delle variabili strumentali data da Judea Pearl nel 2000 ha aperto la strada alle ricerche successive, mentre la ricerca di Angrist e Krueger ha brevemente delineato la storia e il contesto applicativo di queste tecniche.
La base teorica delle variabili strumentali si estende a un'ampia gamma di modelli, ma è particolarmente comune nelle applicazioni alla regressione lineare. Tradizionalmente, le variabili strumentali devono soddisfare due condizioni fondamentali: devono essere correlate con la variabile esplicativa endogena, ma non con il termine di errore. Se queste condizioni sono soddisfatte, le variabili strumentali possono fornire supporto alla stima e affrontare le sfide che il metodo OLS deve affrontare in termini di endogeneità.
L'efficacia di una variabile strumentale dipende dalla sua correlazione con la variabile endogena e dalla sua indipendenza dal termine di errore.
Per comprendere il ruolo delle variabili strumentali è necessaria anche una rappresentazione grafica. Utilizzando i diagrammi causali, i ricercatori possono determinare rapidamente se una variabile può essere considerata strumentale. Ad esempio, se i ricercatori vogliono stimare l'impatto di un programma di tutoraggio universitario sul rendimento scolastico, è probabile che si imbattano in problemi di confondimento causati da molteplici fattori. Questo è il caso in cui l'assegnazione casuale dei dormitori rende la vicinanza a un programma di tutoraggio una variabile strumentale ragionevole.
In definitiva, i metodi basati sulle variabili strumentali forniscono un modo efficiente e prezioso per esplorare il mondo dell'inferenza causale. Aiuta i ricercatori a superare i limiti degli esperimenti randomizzati e fornisce nuove idee per analizzare molti problemi causali. In questo processo non possiamo fare a meno di chiederci: di fronte a problemi sociali sempre più complessi, le variabili strumentali possono davvero risolvere tutti i problemi di inferenza causale che ci troviamo ad affrontare?