CE45 - Mathématique, informatique, automatique, traitement du signal pour répondre aux défis de la biologie et de la santé

Vers une meilleure connaissance des protéomes – DeepProt

Résumé de soumission

Le séquençage d’ADN haut débit révèle progressivement les secrets des gènes pour tous les organismes, mais le monde complexe des protéines reste largement méconnu malgré le rôle essentiel qu'elles jouent dans les organismes vivants. Pour une même protéine, il existe une diversité qui provient d’une part de variants génétiques ou d’un épissage alternatif affectant sa séquence d'acides aminés et d’autre part de modifications post-traductionnelles (PTMs) modifiant sa chimie après synthèse. La diversité des PTMs serait un élément majeur pour expliquer l'écart entre le petit nombre de gènes et la machinerie complexe des organismes.

La «protéomique» fait référence à la discipline scientifique qui vise à identifier, quantifier et caractériser les protéines à grande échelle. L'approche expérimentale la plus utilisée, appelée «bottom-up», est capable de générer des dizaines de milliers de spectres expérimentaux en environ une heure d’analyse. L’usage d’un logiciel est indispensable pour traiter ce volume de données, mais à l’heure actuelle, 40 à 75 % des spectres restent non interprétés après analyse. La présence de modifications portées par les protéines est l'hypothèse la plus répandue pour expliquer ce faible taux d’interprétation.

En renouvelant le paradigme de la comparaison de grands volumes de spectres, deux partenaires du projet ont déjà levé un premier verrou méthodologique pour résoudre ce problème. Le logiciel SpecOMS permet de comparer des dizaines de milliers de spectres expérimentaux à des centaines de milliers de spectres modélisés sans filtre sur leur masse à partir d'une banque de protéines, ceci en quelques minutes sur un poste de travail standard. En s’appuyant sur la puissance de cette nouvelle approche, l’objectif du projet DeepProt est de développer de nouveaux algorithmes pour interpréter l'ensemble quasi-exhaustif des spectres expérimentaux générés par les expériences de protéomique - même celles issues d'études métaprotéomiques complexes – puis d’en déduire la liste des protéines présentes dans le mélange analysé avec des informations détaillées sur leurs PTMs. Ces algorithmes devront répondre à plusieurs défis: (i) mieux identifier les spectres porteurs de plusieurs modifications, (ii) améliorer l'inférence des protéines et décrire leurs modifications, (iii) faire face au changement d’échelle entre le protéome d’un seul organisme et un métaprotéome (plus de deux ordres de grandeur pour le microbiote intestinal humain).

Pour relever ces défis, DeepProt s'appuiera sur un consortium multidisciplinaire maîtrisant toute la chaîne d'une analyse protéomique complexe et traitera des jeux de spectres issus de deux questions scientifiques majeures: l'étude des modifications protéiques induites par les procédés alimentaires (étude en relation avec l’allergénicité des aliments) et la métaprotéomique du microbiote intestinal (pour de nouvelles perspectives thérapeutiques). Ainsi, en plus des avancées algorithmiques, DeepProt permettra des avancées significatives applicables à la fois aux études du microbiote intestinal et en « foodomics ».

Les nouveaux modèles et algorithmes développés par DeepProt seront implémentés dans un logiciel convivial déjà existant et utilisé, permettant de gérer une analyse protéomique de bout en bout et de quantifier les protéines identifiées. Au travers de cet outil destiné à la communauté protéomique, le projet DeepProt fournira les moyens d'obtenir une vision plus complète des protéomes complexes et de leurs variations. DeepProt ouvrira ainsi des perspectives de recherche dans de nombreux domaines de la biologie et de la santé.

Coordination du projet

Hélène ROGNIAUX (Biopolymères, Interactions Assemblages)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

BIA Biopolymères, Interactions Assemblages
LS2N Laboratoire des Sciences du Numérique de Nantes
GQE Génétique quantitative et Evolution - Le Moulon

Aide de l'ANR 505 661 euros
Début et durée du projet scientifique : septembre 2018 - 48 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter