Revue D Epidemiologie Et De Sante Publique | 2019
Calcul du nombre de sujets nécessaire dans le contexte d’analyse du microbiome
Abstract
Introduction Le microbiote est l’ensemble des micro-organismes (bacteries, levures, champignons, virus) vivant dans un environnement specifique (appele microbiome) chez un hote. Dans la majorite des essais portant sur ce sujet, l’objectif principal est d’identifier les micro-organismes dont l’abondance est modifiee selon une condition, comme par exemple la presence d’une pathologie ou la prise d’un traitement. La composition du microbiote est mesuree par le sequencage de l’expression du gene 16S, ce qui en fait des donnees compositionnelles de grande dimension. Ces specificites sont a prendre en compte lors de l’analyse, ce qui necessite l’utilisation de methodes statistiques adaptees. Actuellement, il n’existe pas de methode d’estimation de taille d’etude qui soit en adequation avec les methodes utilisees pour l’analyse de ce type de donnees. Notre objectif est de proposer une methode d’estimation de taille d’etude coherente avec la strategie d’analyse pour l’etude du microbiote. Methode La methode proposee se decompose en deux etapes. Dans un premier temps, des jeux de donnees d’abondance artificiels sont generes a partir des abondances d’une etude pilote du microbiote sous forme de matrices de comptes, avec differents parametres dont les valeurs sont fixees\xa0: la taille d’etude, l’effet minimum a mettre en evidence (difference exprimee sous la forme de «\xa0fold change\xa0»), et la proportion de micro-organismes dont l’abondance est modifiee selon la condition. Dans un second temps, la methode ALDEx2 [1] est appliquee sur chacune des matrices de comptes simulees. Une puissance de detection d’abondance differentielle est ensuite calculee a partir des micro-organismes ayant ete simules pour avoir une abondance differente, et la moyenne des puissances obtenue sur l’ensemble des simulations estime la puissance attendue, pour les parametres utilises. Resultats Supposons que l’on souhaite mettre en evidence une sur-abondance de 10\xa0% des micro-organismes apres l’initiation d’un traitement et une multiplication des abondances relatives par 5\xa0de ces micro-organismes avec une puissance statistique de 80\xa0%. Sous ces hypotheses, en utilisant les donnees d’une etude pilote ou l’on a sequence 576\xa0micro-organismes presents dans l’intestin il faut alors inclure 60\xa0patients. Pour une taille d’etude fixee, les resultats obtenus montrent que plus l’effet minimum a mettre en evidence est grand, plus la puissance de detection est elevee. De meme, pour un nombre de sujets fixe, plus la proportion de micro-organismes dont l’abondance est modifiee suite a un evenement est elevee, plus la puissance de detection est grande. Conclusion Le developpement d’un package R implementant une methode de calcul de taille d’etude en adequation avec les methodes d’analyse realisees in fine est un outil indispensable au montage des projets de microbiome. En parallele, la constitution d’une banque de donnees d’etude pilote serait un atout majeur car elle permettrait a l’utilisateur de disposer de donnees, les plus proches possibles de sa question de recherche.