Mathématiques et Informatique Appliquées
du Génome à l'Environnement

 

 

Genoscapist, un outil d’exploration de profils quantitatifs le long des génomes

Body

Résumé

L'analyse de données “omiques” enrichit continuellement l'annotation structurelle et fonctionnelle des génomes procaryotes et eucaryotes. En particulier, l’exploration de grandes collections des profils de transcription le long des chromosomes, non agrégés par gènes, est essentielle pour la délimitation des unités de transcription et la caractérisation de nouveaux gènes tels que les ARN antisens et autres ARN non codants. Genoscapist est un outil web pour réaliser cette tâche de façon interactive grâce à des représentations graphiques de haute résolution et personnalisées de profils quantitatifs le long des chromosomes. Il permet aussi de mettre à disposition de la communauté des scientifiques des sites web et de générer des images dans un contexte de publication des données. Initialement déployé sur des jeux de données transcriptomiques de l’une des principales bactéries modèles (Bacillus subtilis) et un pathogène majeur (Staphylococcus aureus), il a depuis été utilisé dans de nombreux projets de recherche. Ces déploiements successifs ont permis de faire évoluer le logiciel pour répondre à différentes questions de recherche et représenter d’autres types de données. Il a principalement été déployé sur des jeux de données procaryotes (bactéries modèles, d’intérêt biotechnologiques, et pathogènes) mais les adaptations en cours permettent de visualiser également des jeux de données eucaryotes (testé sur la truite arc-en-ciel).

 


 

Contexte et enjeux

L'analyse de données “omiques” améliore continuellement l'annotation structurelle et fonctionnelle des génomes. L’exploration de grandes collections de profils de transcription le long des chromosomes, non agrégés par gènes, est essentielle pour délimiter des unités de transcription et caractériser de nouveaux gènes. De nombreux outils avaient déjà été développés pour répondre à ce type de besoins tels que IGV et JBrowse. Cependant, ces solutions ne combinent pas la sélection et la coloration interactives des profils avec l'accès facile d'un outil en ligne. Genoscapist1 répond à ces besoins spécifiques.


 

Résultats

Genoscapist est une application indépendante plutôt qu’un plugin à un outil préexistant (liberté de développement, d’intégration de représentations graphiques, de navigation…). Genoscapist fonctionne sur un serveur web Apache. Il est écrit en HTML5/Javascript et Python avec le framework web Flask. Le rendu graphique suit le standard du web SVG (Scalable Vector Graphics). Les annotations du génome et les profils quantitatifs sont stockés dans une base de données relationnelle PostgreSQL.


 

Les vues de Genoscapist fournissent un cadre intégré pour explorer interactivement des données en naviguant le long des relations dans l'espace d'expression (corrélations entre gènes) et des chromosomes. Pour démontrer sa pertinence, nous avons déployé Genoscapist (http://genoscapist.migale.inrae.fr/) sur des données transcriptomiques provenant d'études de réannotation de B. subtilis et de S. aureus. Nous avons ainsi fourni aux utilisateurs une interface intuitive et puissante pour sélectionner les profils pertinents, définir leurs couleurs associées, modifier les paramètres de la représentation graphique (zoom, méthode de normalisation des profils, affichage des noms de gènes...). Une attention particulière a été portée à certaines fonctionnalités : obtention de liens pour partager des vues personnalisées et exportation des fichiers SVG afin de servir de base à la préparation de figures de haute qualité.


 

Perspectives

Genoscapist continue à évoluer afin de répondre aux problématiques de visualisation des microbiologistes. Initialement déployé sur des données transcriptomiques (tiling-array, RNA-Seq, +1 de transcription…), des développements en cours permettront rapidement d'explorer des données de type RIP-Seq mais également Dual RNA-Seq.


 

Valorisation

Genoscapist est avant tout un outil de valorisation (exploration et ouverture à la communauté scientifique) de grands jeux de données transcriptomiques. Parmi les instances de l’outil déjà déployées, certaines sur la bactérie modèle B. subtilis ont donné lieu à des publications scientifiques en 2023 : une étude sur l’implication du facteur de terminaison Rho dans la reprogrammation transcriptionnelle lors de l’entrée en phase stationnaire2 ; un travail sur l'impact de la réduction drastique du génome afin d’évaluer la pertinence de l'approche pour la création de châssis biotechnologiques et d'acquérir des connaissances fondamentales3 ; une comparaison approfondie des types de biofilms4.


 

Références bibliographiques

1 Dérozier et al. 2021, Bioinformatics, DOI: 10.1093/bioinformatics/btab079

2 Bidnenko et al. 2023, PLOS Genet., DOI: 10.1371/journal.pgen.1010618

3 Dervyn et al. 2023, Nucleic Acids Res., DOI: 10.1093/nar/gkad145 

4 Dergham et al. 2023, Nat. Commun., DOI: 10.1038/s41467-023-43386-w


 

 

 

 

 

Logo ou schéma
Logo de Genoscapist. « Un peintre de paysages génomiques