Analyse à grande échelle des textures des séquences protéiques via l'approche Hydrophobic Cluster Analysis (HCA). - Université Pierre et Marie Curie Accéder directement au contenu
Thèse Année : 2005

Analyze on a large scale of textures in protein sequences via the Hydrophobic Cluster Analysis (HCA) approach.

Analyse à grande échelle des textures des séquences protéiques via l'approche Hydrophobic Cluster Analysis (HCA).

Résumé

The accurate delineation of domains within protein sequences is of count most importance in biology, especially for optimizing the structural and functional genomics investigations. Various approaches based on the composition in amino acids, the complexity of the sequence or the construction of ab initio 3D models, were developed in the past to predict functional domains. We propose a new and original approach to automatically delineate within proteins sequences distinct structured regions by exploring their texture. This approach is based on the Hydrophobic Cluster Analysis (HCA) method. The distribution of the various categories of hydrophobic clusters, as defined by HCA, and the analysis of their secondary structures characteristics, discriminate different textures and is used as an efficient tool to distinguish structured regions, disordered regions, repeat regions and potential single or multiple transmembrane segments. The DomHCA approach, allows to delineate regions characterized by particular textures in a protein sequence. This segmentation, applied on the scale of genomes, authorizes a fast and original comparison of the whole sequences. As an example, we applied DomHCA on the Plasmodium falciparum genome sequences, for which standard tools of similarity searches are generally poorly efficient, due to their high content in N and K residues.
Découper, a priori et de façon précise, les séquences en domaines est d'une grande importance dans le champ de la biologie, notamment pour optimiser les études de génomique structurale et de génomique fonctionnelle. Différentes approches basées sur la composition en acides aminés, la complexité de la séquence ou la construction de modèles 3D ab initio, ont été développées par le passé. Nous proposons, dans le cadre de ce travail, une approche nouvelle et originale pour le découpage automatique et sensible des séquences protéiques en domaines structurés distincts par exploitation de leur texture. Cette approche bénéficie de l'information de voisinage 2D apportée par la méthodologie « Hydrophobic Cluster Analysis » (HCA). La distribution des différentes catégories d'amas hydrophobes, tels que définis par l'intermédiaire de HCA, ainsi que l'analyse de leurs caractéristiques en termes de structures secondaires, permettent d'appréhender de façon différenciée les textures des régions globulaires, non globulaires et/ou désordonnées, répétitives, passages membranaires isolés ou multiples.... L'approche développée, DomHCA, permet in fine de segmenter une séquence protéique en une série de régions et sous-régions caractérisées par des textures précises, segmentation qui, appliquée à l'échelle des génomes, autorise une comparaison rapide et originale de l'ensemble des séquences. Une des applications concerne les séquences du génome de Plasmodium falciparum qui, par leurs fortes proportions en acides aminés N et K, rendent les méthodes classiques de détection de similarité peu efficaces.
Fichier principal
Vignette du fichier
These_versionpdf.pdf (3.32 Mo) Télécharger le fichier
Loading...

Dates et versions

tel-00011139 , version 1 (01-12-2005)

Identifiants

  • HAL Id : tel-00011139 , version 1

Citer

Karine Albeau. Analyse à grande échelle des textures des séquences protéiques via l'approche Hydrophobic Cluster Analysis (HCA).. Autre [q-bio.OT]. Université de Versailles-Saint Quentin en Yvelines, 2005. Français. ⟨NNT : ⟩. ⟨tel-00011139⟩
300 Consultations
785 Téléchargements

Partager

Gmail Facebook X LinkedIn More