Illumina Farbstoffsequenzierung
Genomische BibliothekBearbeiten
Nach der Reinigung der DNA muss eine DNA-Bibliothek, eine genomische Bibliothek, erstellt werden. Es gibt zwei Möglichkeiten, eine genomische Bibliothek zu erzeugen: Sonifikation und Tagmentierung. Bei der Tagmentierung schneiden Transposasen die DNA nach dem Zufallsprinzip in 50 bis 500 bp große Fragmente und fügen gleichzeitig Adaptoren hinzu. Eine genetische Bibliothek kann auch durch Beschallung erzeugt werden, um genomische DNA zu fragmentieren. Bei der Sonifikation wird die DNA mithilfe von Ultraschallwellen in ähnliche Größen zerlegt. Nach der Sonifikation müssen rechte und linke Adapter durch die T7-DNA-Polymerase und die T4-DNA-Ligase angefügt werden. Stränge, an denen keine Adapter ligiert werden, werden weggewaschen.
AdapterEdit
Adapter enthalten drei verschiedene Segmente: die zum festen Träger komplementäre Sequenz (Oligonukleotide auf der Fließzelle), die Barcode-Sequenz (Indizes) und die Bindungsstelle für den Sequenzierungsprimer. Die Indizes sind in der Regel sechs Basenpaare lang und werden bei der DNA-Sequenzanalyse zur Identifizierung der Proben verwendet. Anhand der Indizes können bis zu 96 verschiedene Proben zusammen durchgeführt werden, was auch als Multiplexing bezeichnet wird. Während der Analyse fasst der Computer alle Reads mit demselben Index zusammen. Illumina verwendet einen „Sequenz durch Synthese“-Ansatz. Dieser Prozess findet in einer acrylamidbeschichteten Glasdurchflusszelle statt. Der Boden der Fließzelle ist mit Oligonukleotiden (kurzen Nukleotidsequenzen) beschichtet, die als fester Träger dienen, um die DNA-Stränge während der Sequenzierung an Ort und Stelle zu halten. Wenn die fragmentierte DNA über die Fließzelle gewaschen wird, heftet sich der entsprechende Adapter an den komplementären festen Träger.
BrückenamplifikationBearbeiten
Nach der Anheftung kann die Clusterbildung beginnen. Das Ziel ist es, Hunderte von identischen DNA-Strängen zu erzeugen. Ein Teil davon wird der Vorwärtsstrang sein, der Rest der Rückwärtsstrang. Aus diesem Grund werden rechte und linke Adapter verwendet. Cluster werden durch Brückenamplifikation erzeugt. Die DNA-Polymerase bewegt sich entlang eines DNA-Strangs und bildet dessen Komplementärstrang. Der ursprüngliche Strang wird weggewaschen, so dass nur der Rückwärtsstrang übrig bleibt. An der Spitze des Rückwärtsstrangs befindet sich eine Adaptersequenz. Der DNA-Strang biegt sich und bindet an das Oligo, das komplementär zur oberen Adaptersequenz ist. Polymerasen lagern sich an den Rückwärtsstrang an, und der komplementäre Strang (der mit dem ursprünglichen identisch ist) wird hergestellt. Die nun doppelsträngige DNA wird denaturiert, so dass jeder Strang separat an eine an der Fließzelle verankerte Oligonukleotidsequenz gebunden werden kann. Der eine Strang ist der Rückwärtsstrang, der andere der Vorwärtsstrang. Dieser Prozess wird als Brückenamplifikation bezeichnet und findet für Tausende von Clustern überall auf der Fließzelle gleichzeitig statt.
Klonale AmplifikationBearbeiten
Immer wieder biegen sich die DNA-Stränge und heften sich an den festen Träger. Die DNA-Polymerase synthetisiert einen neuen Strang, so dass ein Doppelstrangsegment entsteht, das dann denaturiert wird, so dass alle DNA-Stränge in einem Bereich aus einer einzigen Quelle stammen (klonale Amplifikation). Die klonale Amplifikation ist für die Qualitätskontrolle wichtig. Wird bei einem Strang eine ungerade Sequenz festgestellt, können die Wissenschaftler den Rückwärtsstrang überprüfen, um sicherzustellen, dass er das Komplement der gleichen Unregelmäßigkeit aufweist. Der Vorwärts- und der Rückwärtsstrang dienen als Kontrollen zum Schutz vor Artefakten. Da bei der Illumina-Sequenzierung die DNA-Polymerase verwendet wird, wurden Basensubstitutionsfehler beobachtet, insbesondere am 3′-Ende. Paired-End-Reads in Kombination mit Clustergenerierung können bestätigen, dass ein Fehler aufgetreten ist. Der Rückwärts- und der Vorwärtsstrang sollten komplementär zueinander sein, alle Reverse-Reads sollten übereinstimmen, und alle Forward-Reads sollten übereinstimmen. Wenn ein Read seinen Gegenstücken (mit denen er ein Klon sein sollte) nicht ähnlich genug ist, liegt möglicherweise ein Fehler vor. In den Analysen einiger Labors wurde ein Mindestwert von 97 % Ähnlichkeit verwendet.
Sequenz durch SyntheseBearbeiten
Am Ende der klonalen Amplifikation werden alle Rückwärtsstränge von der Fließzelle gewaschen, so dass nur die Vorwärtsstränge übrig bleiben. Ein Primer wird an die Adapter-Primer-Bindungsstelle des Vorwärtsstrangs angehängt, und eine Polymerase fügt ein fluoreszierend markiertes dNTP an den DNA-Strang an. Pro Runde kann nur eine Base hinzugefügt werden, da das Fluorophor als Blockierungsgruppe wirkt; die Blockierungsgruppe ist jedoch reversibel. Durch die Vier-Farben-Chemie hat jede der vier Basen eine einzigartige Emission, und nach jeder Runde zeichnet das Gerät auf, welche Base hinzugefügt wurde. Sobald die Farbe aufgezeichnet ist, wird der Fluorophor abgewaschen und ein anderes dNTP über die Durchflusszelle gewaschen, und der Vorgang wird wiederholt. dATPs, dTTPs, dGTPs und dCTPs werden separat über die Zelle gewaschen, so dass jedes Nukleotid identifiziert werden kann.
Mit der Einführung des NextSeq und später des MiniSeq hat Illumina eine neue zweifarbige Sequenzierungschemie eingeführt. Nukleotide werden entweder durch eine von zwei Farben (rot oder grün), durch keine Farbe („schwarz“) oder durch eine Kombination beider Farben (die als Mischung aus rot und grün orange erscheint) unterschieden.
Nach dem Ablesen des DNA-Strangs wird der gerade hinzugefügte Strang abgewaschen. Dann bindet der Index-1-Primer an, polymerisiert die Index-1-Sequenz und wird weggewaschen. Der Strang bildet wieder eine Brücke, und das 3′-Ende des DNA-Strangs bindet an ein Oligo auf der Fließzelle. Der Index-2-Primer lagert sich an, polymerisiert die Sequenz und wird weggewaschen.
Eine Polymerase sequenziert den komplementären Strang auf dem gebogenen Strang. Sie trennen sich, und das 3′-Ende jedes Strangs wird blockiert. Der Vorwärtsstrang wird weggewaschen, und der Prozess der Sequenzierung durch Synthese wird für den Rückwärtsstrang wiederholt.
DatenanalyseBearbeiten
Die Sequenzierung erfolgt für Millionen von Clustern gleichzeitig, und jeder Cluster hat ~1.000 identische Kopien eines DNA-Inserts. Die Sequenzdaten werden analysiert, indem Fragmente mit überlappenden Bereichen, so genannte Contigs, gefunden und aneinandergereiht werden. Wenn eine Referenzsequenz bekannt ist, werden die Contigs dann zur Variantenidentifizierung mit dieser verglichen.
Dieser stückweise Prozess ermöglicht es den Wissenschaftlern, die vollständige Sequenz zu sehen, auch wenn nie eine unfragmentierte Sequenz ausgeführt wurde; da die Leselängen bei Illumina jedoch nicht sehr lang sind (bei der HiSeq-Sequenzierung können Leselängen von etwa 90 bp erzeugt werden), kann es schwierig sein, kurze Tandemwiederholungsbereiche aufzulösen. Wenn es sich um eine De-novo-Sequenz handelt und keine Referenz vorhanden ist, können sich wiederholende Bereiche bei der Sequenzzusammenstellung große Schwierigkeiten verursachen. Weitere Schwierigkeiten sind Basensubstitutionen (insbesondere am 3′-Ende von Reads) durch ungenaue Polymerasen, chimäre Sequenzen und PCR-Bias, die alle zur Erzeugung einer falschen Sequenz beitragen können.