Qu'est-ce que le séquençage haut débit ?
Le génome d'un individu est composé de 3,3 milliards de paires de bases (acides nucléiques) et contient une constellation d'informations pertinentes sur le plan médical. Le séquençage de ces acides nucléiques est sans aucun doute le domaine analytique ayant bénéficié de l'évolution la plus importante au cours des 20 dernières années. La méthode enzymatique de Sanger utilisant des séquenceurs à capillaires a été l'objet d'une automatisation conduisant à la mise au point d'appareils de plus en plus performants, et à l'origine du décryptage du génome humain, projet phare de la génétique à la fin des années 2000.
Au cours des dernières années est apparue une nouvelle génération de séquenceurs dits à haut débit opérant en parallèle sur un très grand nombre de séquences courtes, reposant sur de nouvelles technologies physico-chimiques avec des débits jusqu'à 1000 fois supérieurs. Les capacités de ces nouveaux séquenceurs sont de plus en plus grandes pour un prix de revient de plus en plus faible : actuellement 400 millions à 1 milliard de paires de bases par jour pour moins d'un euro par million de paires de base. Ainsi, deux importants travaux publiés en 2005 ont pavé la voie au développement de ces technologies appelées « séquençage massif en parallèle » ou « séquençage haut débit ».
La commercialisation de ces méthodes permet actuellement de séquencer de façon routinière des génomes entiers ou leurs régions codantes : l'exome soit 1% du génome, de même qu'un panel de gènes choisis. Cette évolution technique permet également de faire des analyses systématiques en transcriptomique (RNA-Seq) et protéomique (ChIP-Seq), en épigénomique ou en métagénomique.
Ces analyses nécessitent la présence de plateformes bio-informatiques rodées à ces nouvelles technologies. En avant-garde, la FHU-TRANSLAD, consciente de l'intérêt majeur de ces technologies pour le diagnostic des maladies rares, soutient le développement d'une plateforme bioinformatique d'analyses des données de séquençage haut débit en Bourgogne.
La technique de séquençage haut débit
L'ADN génomique est d'abord fragmenté en petits morceaux aux extrémités desquelles sont liées des séquences adaptatrices. Les librairies ainsi préparées sont ensuite fixées sur un support solide et chaque fragment est amplifié environs 1000 fois pour former des « clusters » clonaux qui seront séquencés en parallèle. À chaque cycle, l'ajout d'un nucléotide se traduit par un signal fluorescent associé à chacun des quatre nucléotides de l'ADN.
Un excès de séquençage est effectué pour minimiser la non-uniformité des différents processus techniques (typiquement > 30X pour un génome entier et > 60X pour un exome) ainsi que pour augmenter la sensibilité et la spécificité de la détection des variations génétiques.
Dans le cas du séquencage d'exome ou de cibles spécifiques, la préparation des librairies requiert une étape additionnelle visant à capturer les régions d'intérêt. Différentes méthodes peuvent être utilisées à cette fin en fonction du type d'expérience : la capture par hybridation (généralement utilisée pour les exomes), l'enrichissement par réaction en chaîne par polymérase (PCR) et la capture par sondes moléculaires inversées. Enfin, plusieurs échantillons différents peuvent être séquencés simultanément sur le même appareil en utilisant des séquences index pour les identifier.
Quelles utilisations en diagnostic ?
De nombreuses applications médicales voient le jour, que ce soit par l'utilisation de panels de gènes choisis, ou le séquençage d'exome. Largement exploitée en recherche, cette technologie est aussi utilisée en diagnostic dans des laboratoires du monde entier, car c'est l'outil le plus performant dans le diagnostic de maladies rares avec anomalie du développement. En effet, pour les patients atteints de déficience intellectuelle syndromique sans diagnostic clinique, cette technologie permet d'identifier une cause génétique chez 50% d'entre eux.