GoTriple - Contribution bioinformatique à l' analyse du transcriptome humain

Abstract

Dans la première partie j'ai analysé des jeux de données de RNA-seq de transcriptome de petits ARNs disponibles dans les bases de données publiques. J'y ai observé 2 points intrigants : - une grande partie des lectures (bien que courtes) ne peux pas être alignée sur le génome de référence sans discordance et cette fraction non-alignable est parfois majoritaire. - de nombreuses lectures ont des tailles autours de 15-18nt qui ne correspondent à aucun type de petits ARNs connues, cette fraction est également majoritaires dans certains cas. Ces expériences sont souvent conçues pour la détection des miRNAs et l'analyse bioinformatique de ces données passent toujours par un alignement sur le génome de référence ou sur des séquences connues pour donner des petits ARNs. J'ai donc simplement éliminé la contrainte d'alignement dans l'analyse de ces données et effectué un regroupement des lectures par similarité (à la manière des ESTs). Ce regroupement donne une vision différente des données dans laquelle la notion de position génomique n'est plus centrale et ouvre la possibilité d'y découvrir des phénomènes non-standard. La deuxième partie est tirée d'une collaboration avec le laboratoire U675 INSERM. J'ai fait l'analyse bioinformatique des gènes dérégulés par la répression par RNAi du gène REST dans une lignée de neuroblastome de souris (N18). Ce gène est un facteur de transcription qui réprime les gènes neuronaux dans les cellules non neuronales. Ce répertoire de gènes dérégulés est potentiellement constitué de gènes clefs dans la biologie des neurones.