Séquençage par colorant Illumina

Bibliothèque génomiqueEdit

Après la purification de l’ADN, une bibliothèque d’ADN, bibliothèque génomique, doit être générée. Il y a deux façons de créer une bibliothèque génomique, la sonification et la tagmentation. Avec la tagmentation, les transposases coupent aléatoirement l’ADN en fragments de 50 à 500 pb et ajoutent simultanément des adaptateurs. Une bibliothèque génétique peut également être générée en utilisant la sonification pour fragmenter l’ADN génomique. La sonification fragmente l’ADN en tailles similaires à l’aide d’ondes sonores ultrasoniques. Les adaptateurs de droite et de gauche devront être fixés par l’ADN polymérase T7 et l’ADN ligase T4 après la sonification. Les brins dont les adaptateurs ne sont pas ligaturés sont éliminés par lavage.

L’ADN double brin est clivé par les transposomes. Les extrémités coupées sont réparées et des adaptateurs, des indices, des sites de liaison d’amorce et des sites terminaux sont ajoutés à chaque brin de l’ADN. Image basée en partie sur la vidéo de séquençage d’illumina

AdapteursEdit

Les adaptateurs contiennent trois segments différents : la séquence complémentaire au support solide (oligonucléotides sur la cellule à flux), la séquence du code-barres (indices) et le site de liaison pour l’amorce de séquençage. Les indices ont généralement une longueur de six paires de bases et sont utilisés pendant l’analyse des séquences d’ADN pour identifier les échantillons. Les indices permettent d’analyser jusqu’à 96 échantillons différents ensemble, ce que l’on appelle également le multiplexage. Pendant l’analyse, l’ordinateur regroupe toutes les lectures ayant le même indice. Illumina utilise une approche de « séquence par synthèse ». Ce processus se déroule à l’intérieur d’une cellule à circulation en verre revêtue d’acrylamide. Des oligonucléotides (courtes séquences de nucléotides) recouvrent le fond de la cellule et servent de support solide pour maintenir les brins d’ADN en place pendant le séquençage. Lorsque l’ADN fragmenté est lavé sur la cellule à flux, l’adaptateur approprié se fixe au support solide complémentaire.

Des millions d’oligos tapissent le fond de chaque couloir de la cellule à flux.

Amplification par pontageModifier

Une fois fixés, la génération de clusters peut commencer. L’objectif est de créer des centaines de brins d’ADN identiques. Certains seront le brin avant ; les autres, le brin arrière. C’est pourquoi des adaptateurs de droite et de gauche sont utilisés. Les clusters sont générés par amplification par pontage. L’ADN polymérase se déplace le long d’un brin d’ADN, créant son brin complémentaire. Le brin original est éliminé par lavage, ne laissant que le brin inverse. Au sommet du brin inverse se trouve une séquence adaptatrice. Le brin d’ADN se courbe et se fixe à l’oligo qui est complémentaire de la séquence adaptatrice supérieure. Les polymérases s’attachent au brin inverse, et son brin complémentaire (qui est identique à l’original) est fabriqué. L’ADN maintenant double brin est dénaturé afin que chaque brin puisse se fixer séparément à une séquence oligonucléotidique ancrée à la cellule à circulation. L’un sera le brin inverse, l’autre le brin direct. Ce processus est appelé amplification par pontage, et il se produit pour des milliers de grappes partout dans la cellule à écoulement en même temps.

Amplification clonaleModifié

A plusieurs reprises, les brins d’ADN vont se plier et se fixer au support solide. L’ADN polymérase va synthétiser un nouveau brin pour créer un segment double brin, et celui-ci sera dénaturé afin que tous les brins d’ADN d’une zone proviennent d’une seule source (amplification clonale). L’amplification clonale est importante pour le contrôle de la qualité. Si un brin présente une séquence étrange, les scientifiques peuvent vérifier le brin inverse pour s’assurer qu’il présente le complément de la même anomalie. Les brins avant et arrière servent de contrôle pour éviter les artefacts. Le séquençage Illumina utilisant l’ADN polymérase, des erreurs de substitution de base ont été observées, notamment à l’extrémité 3′. Les lectures d’extrémités appariées combinées à la génération de clusters peuvent confirmer qu’une erreur a eu lieu. Les brins avant et arrière doivent être complémentaires l’un de l’autre, toutes les lectures inverses doivent correspondre les unes aux autres, et toutes les lectures avant doivent correspondre les unes aux autres. Si une lecture n’est pas suffisamment similaire à ses homologues (avec lesquels elle devrait être un clone), une erreur peut s’être produite. Un seuil minimum de 97% de similarité a été utilisé dans les analyses de certains laboratoires.

Séquence par synthèseEdit

À la fin de l’amplification clonale, tous les brins inverses sont lavés de la cellule à flux, ne laissant que les brins directs. Une amorce se fixe au site de liaison d’amorce adaptateur des brins avant, et une polymérase ajoute un dNTP marqué par fluorescence au brin d’ADN. Une seule base peut être ajoutée par cycle en raison du fluorophore qui agit comme un groupe bloquant ; cependant, le groupe bloquant est réversible. En utilisant la chimie des quatre couleurs, chacune des quatre bases a une émission unique, et après chaque tour, la machine enregistre quelle base a été ajoutée. Une fois la couleur enregistrée, le fluorophore est éliminé par lavage et un autre dNTP est lavé sur la cellule d’écoulement et le processus est répété. Les dATP, dTTP, dGTP et dCTP sont lavés sur la cellule séparément afin que chaque nucléotide puisse être identifié.

A partir du lancement du NextSeq et plus tard du MiniSeq, Illumina a introduit une nouvelle chimie de séquençage à deux couleurs. Les nucléotides se distinguent soit par l’une des deux couleurs (rouge ou vert), soit par aucune couleur (« noir »), soit par la combinaison des deux couleurs (apparaissant orange comme un mélange entre le rouge et le vert).

Les nucléotides marqués sont ajoutés dans l’ordre au brin d’ADN. Chacun des quatre nucléotides possède une étiquette d’identification qui peut être excitée pour émettre une longueur d’onde caractéristique. Un ordinateur enregistre toutes les émissions, et à partir de ces données, des appels de base sont effectués.

Une fois que le brin d’ADN a été lu, le brin qui vient d’être ajouté est lavé. Puis, l’amorce d’index 1 se fixe, polymérise la séquence d’index 1, et est emportée par lavage. Le brin forme à nouveau un pont, et l’extrémité 3′ du brin d’ADN se fixe à un oligo sur la cellule à circulation. L’amorce d’indice 2 se fixe, polymérise la séquence, et est éliminée par lavage.

Une polymérase séquence le brin complémentaire sur le dessus du brin arqué. Ils se séparent, et l’extrémité 3′ de chaque brin est bloquée. Le brin avant est emporté par lavage, et le processus de séquence par synthèse se répète pour le brin inverse.

Analyse des donnéesModification

Le séquençage se produit pour des millions de grappes à la fois, et chaque grappe comporte ~1 000 copies identiques d’un insert d’ADN. Les données de séquence sont analysées en trouvant des fragments avec des zones de chevauchement, appelés contigs, et en les alignant. Si une séquence de référence est connue, les contigs sont ensuite comparés à celle-ci pour l’identification des variantes.

Ce processus fragmentaire permet aux scientifiques de voir la séquence complète même si une séquence non fragmentée n’a jamais été exécutée ; cependant, comme les longueurs de lecture d’Illumina ne sont pas très longues (le séquençage HiSeq peut produire des longueurs de lecture d’environ 90 pb), il peut être difficile de résoudre les zones de répétition en tandem courtes. De plus, si la séquence est de novo et qu’une référence n’existe pas, les zones répétées peuvent causer beaucoup de difficultés dans l’assemblage de la séquence. Les difficultés supplémentaires comprennent les substitutions de bases (en particulier à l’extrémité 3′ des lectures) par des polymérases imprécises, les séquences chimériques et les biais de PCR, qui peuvent tous contribuer à générer une séquence incorrecte.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.