Phylodynamique des virus évoluant rapidement : approches par calcul bayésien approché et par vraisemblance - Agropolis Accéder directement au contenu
Thèse Année : 2021

Rapidly evolving viruses phylodynamics : approximate bayesian computation and likelihood-based aproaches

Phylodynamique des virus évoluant rapidement : approches par calcul bayésien approché et par vraisemblance

Résumé

Controlling infectious diseases is a major issue for human, animal, and plant public health. In addition to traditional epidemiological data such as incidence or prevalence, genetic data resulting from advances in sequencing techniques are now available. The abundance of these data associated with the rapid evolution of pathogens, in particular RNA viruses, has led to the development of a disciplinary field called phylodynamics. One of the underlying hypotheses of this field is that the way viruses spread leaves footprints in their genomes. Phylodynamic methods take advantage of this genomic information to estimate epidemiological parameters such as the growth rates of an epidemic, the number of secondary infections caused, or the average infection duration.Bayesian phylodynamic inference methods are the most commonly used and are generally based on likelihood functions. However, they can be unsuitable for models with many parameters, e.g. those that capture transmission heterogeneity. Other inference methods are based on Approximate Bayesian Computation (ABC) and do not require a likelihood function. These approaches involve simulations from epidemiological models, summary statistics capturing epidemiological information from phylogenies, and regression techniques. So far, phylodynamic ABC approaches have focused on simple epidemiological models.This thesis work comprises two main parts. The first part consisted in developing a tool for rapid simulations of time series and phylogenies, which can be used in ABC approaches. This simulator, TiPS, has the advantage to include a large diversity of epidemiological models while being faster than many existing tools. The second part of the thesis consisted of studying epidemics in different contexts using ABC or likelihood-based approaches.The first application consisted of a phylodynamic analysis of the spread of hepatitis C virus (HCV) in Lyon. The epidemiological context led us to extend the application of the ABC method to a structured model with two types of hosts. For this purpose, we developed new summary statistics adapted to labeled phylogenies, where leaves are associated with a risk group. This ABC approach was then also used in another context to study the transmission advantage that the presence of a certain mutation would confer to HIV-1/O. The last study is devoted to epidemiological and phylodynamic analyses of SARS-CoV-2 from French data using Bayesian likelihood-based inference methods.Although in full expansion, the field of phylodynamics is poorly known and studied in France. In addition to its methodological developments and its analyses on current epidemics, this work illustrates, at a national scale, the potential of genomic sequence data analysis to help public health organisms to establish more efficient control measures, especially in times of crisis.
Le contrôle des maladies infectieuses est un enjeu majeur en santé publique humaine, animale et végétale. Aux données épidémiologiques classiques telles que l'incidence ou la prévalence, se sont ajoutées des données génétiques issues des progrès des techniques de séquençage. L’abondance de ces données associée à l’évolution rapide des pathogènes, en particulier des virus à ARN, a entraîné l’essor d’un champ disciplinaire appelé phylodynamique dont une des hypothèses sous-jacentes est que la manière dont les virus se propagent laisse des traces dans leurs génomes. Les méthodes phylodynamiques tirent parti des ces informations génomiques pour estimer des paramètres épidémiologiques tels que les taux de croissance d’une population virale, le nombre d’infections ou leur durée moyenne.Les méthodes d’inférence phylodynamique bayésienne sont les plus couramment utilisées et reposent en général sur des fonctions de vraisemblance. Cependant, elles peuvent rapidement se révéler inadaptées pour des modèles composés de beaucoup de paramètres, par exemple pour refléter des hétérogénéités de transmission.D’autres méthodes d’inférence sont basées sur le calcul bayésien approché (ABC) et ne nécessitent aucune fonction de vraisemblance. Ces approches reposent sur des simulations à partir de modèles épidémiologiques, des statistiques de résumé capturant l’information épidémiologique des phylogénies et des techniques de régression. Jusqu'ici, les approches de phylodynamique avec ABC ont étudié des modèles épidémiologiques relativement simples.Cette thèse se compose en deux principales parties.La première partie a consisté à développer un outil de simulations rapides de séries temporelles et de phylogénies, qui soit utilisable dans les approches ABC. Ce simulateur, TiPS, présente l’avantage de pouvoir inclure une grande diversité de modèles épidémiologiques tout en étant plus rapide que beaucoup d'outils existants.La seconde partie de la thèse a consisté à étudier des épidémies dans des contextes différents en utilisant des approches ABC ou de vraisemblance.La première étude a concerné l’analyse phylodynamique de la propagation du virus de l’hépatite C (VHC) à Lyon. Le conexte épidémiologique nous a conduit à étendre l’application de la méthode ABC à un modèle structuré avec deux types d'hôtes. Pour cela, nous avons développé de nouvelles statistiques de résumé adaptées aux phylogénies dites labellisées dont les feuilles sont associées à un groupe à risque. Cette approche ABC a ensuite été utilisée pour étudier l'avantage de transmission que conférerait la présence d’une certaine mutation aux VIH-1/O. La dernière étude est consacrée aux analyses épidémiologiques et phylodynamiques du SARS-CoV-2 à partir de données françaises en utilisant des méthodes d’inférence bayésienne basées sur la vraisemblance.Bien qu’en plein essor, le domaine de la phylodynamique est encore peu connu et peu étudié en France. En plus de ses développements méthodologiques et de ses analyses d'épidémies en cours, ce travail de thèse illustre, à l’échelle nationale, le potentiel d’analyses de données de séquences génomiques pour aider à la prise de décision en santé publique surtout en temps de crise.
Fichier principal
Vignette du fichier
2021_DANESH_archivage.pdf (13.15 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)

Dates et versions

tel-03346462 , version 1 (16-09-2021)
tel-03346462 , version 2 (18-04-2023)

Identifiants

  • HAL Id : tel-03346462 , version 1

Citer

Gonché Danesh. Phylodynamique des virus évoluant rapidement : approches par calcul bayésien approché et par vraisemblance. Sciences agricoles. Université Montpellier, 2021. Français. ⟨NNT : 2021MONTG016⟩. ⟨tel-03346462v1⟩

Collections

STAR
184 Consultations
111 Téléchargements

Partager

Gmail Facebook X LinkedIn More