Dans la société d’aujourd’hui, comprendre les préférences des gens est extrêmement important pour la politique, les affaires et l’élaboration des politiques publiques. La régression multiniveau avec poststratification (MRP) est une technique statistique puissante qui peut corriger les différences connues entre la population de l'échantillon et la population cible afin de fournir des estimations plus précises.
Cette technique effectue d’abord une régression à plusieurs niveaux et utilise la post-stratification pour ajuster les estimations afin qu’elles ne soient pas affectées par de petits échantillons et reflètent mieux les préférences de l’ensemble de la population.
Le flux de travail MRP est principalement divisé en deux étapes. La première étape consiste à estimer la valeur prédite de chaque « cellule » post-stratifiée grâce à une modélisation de régression multicouche, qui classe les cellules en fonction de différentes caractéristiques telles que l’âge, le sexe et l’origine ethnique. La deuxième étape est la post-stratification, qui produit une moyenne pondérée pour corriger la prévision finale.
De cette manière, le MRP fournit non seulement une stratégie de lissage entre différents niveaux de données, mais capture également avec précision les préférences de la population de sous-régions spécifiques.
Le principal avantage de la technologie MRP est qu’elle peut intégrer des données d’enquête provenant d’un large éventail de pays et estimer les préférences d’une région spécifique en fonction de caractéristiques géographiques connues. Cela élimine le besoin d’enquêtes coûteuses dans chaque petit endroit.
En outre, le MRP permet aux analystes d’extraire des informations à partir d’échantillons plus grands, même si ces échantillons sont moins représentatifs d’une région particulière, ce qui est important pour garantir des résultats robustes et cohérents.
Contexte historiqueLa technologie MRP a été proposée pour la première fois par Gelman et T. Little en 1997, qui se sont basés sur les idées de Fay et Herriot et les ont développées. En 2009, Lax et Philips ont appliqué pour la première fois cette technique pour estimer les préférences des électeurs dans les différents États américains. Par la suite, Warshaw et Rodden (2012) ont proposé son utilisation pour estimer l’opinion publique au niveau régional.
Lors de l'élection présidentielle américaine de 2012, Wang et al. ont utilisé des données d'enquête auprès des utilisateurs de Xbox pour prédire avec succès les résultats des élections, démontrant ainsi les puissantes capacités du MRP.
Bien que la technologie MRP dispose de fonctions puissantes, elle présente encore certaines limites dans son application. Cette technique est mieux utilisée à l’approche du jour du vote, car elle ajoute la variable du temps. Plus tard, les chercheurs ont étendu ce modèle à d’autres domaines, notamment l’épidémiologie.
En outre, la régression multi-niveaux du MRP peut être combinée avec une régression non paramétrique ou une prédiction régularisée, et la post-stratification peut être appliquée à des variables qui ne se limitent pas aux données de recensement, formant ainsi un cadre d'application plus flexible.
Avec le développement de la technologie, le MRP deviendra-t-il l’outil principal de prévision des préférences à l’avenir ?