Sekwencjonowanie barwnikowe Illumina
Biblioteka genomowaEdit
Po oczyszczeniu DNA należy wygenerować bibliotekę DNA, bibliotekę genomową. Istnieją dwa sposoby tworzenia biblioteki genomowej, sonifikacja i tagowanie. Przy tagowaniu transpozazy losowo tną DNA na fragmenty o rozmiarach od 50 do 500 bp i jednocześnie dodają adaptory. Biblioteka genetyczna może być również wygenerowana przy użyciu sonifikacji do fragmentacji genomowego DNA. Sonifikacja fragmentuje DNA do podobnych rozmiarów za pomocą ultradźwiękowych fal dźwiękowych. Prawe i lewe adaptery będą musiały być dołączone przez polimerazę T7 DNA i ligazę T4 DNA po sonifikacji. Nici, które nie mają podwiązanych adapterów są wypłukiwane.
AdapteryEdit
Adaptery zawierają trzy różne segmenty: sekwencję komplementarną do stałego nośnika (oligonukleotydy na komórce przepływowej), sekwencję kodu kreskowego (indeksy) i miejsce wiązania startera sekwencjonowania. Indeksy mają zwykle długość sześciu par zasad i są używane podczas analizy sekwencji DNA do identyfikacji próbek. Indeksy pozwalają na łączne badanie do 96 różnych próbek, co znane jest również jako multipleksowanie. Podczas analizy komputer będzie grupował wszystkie odczyty o tym samym indeksie razem. Illumina stosuje podejście „sekwencja przez syntezę”. Proces ten odbywa się wewnątrz szklanej komory przepływowej pokrytej akrylamidem. Komórka przepływowa posiada oligonukleotydy (krótkie sekwencje nukleotydów) pokrywające dno komórki, które służą jako stałe podparcie do utrzymywania nici DNA na miejscu podczas sekwencjonowania. Gdy pofragmentowane DNA jest przepłukiwane przez komórkę przepływową, odpowiedni adapter dołącza się do komplementarnej stałej podpory.
Amplifikacja mostkowaEdit
Po dołączeniu można rozpocząć generowanie klastrów. Celem jest stworzenie setek identycznych nici DNA. Niektóre z nich będą nićmi do przodu, pozostałe – do tyłu. Dlatego właśnie stosuje się adaptery prawy i lewy. Klastry są generowane poprzez amplifikację mostkową. Polimeraza DNA przesuwa się wzdłuż nici DNA, tworząc jej komplementarną nić. Oryginalna nić jest wymywana, pozostawiając jedynie nić odwrotną. Na szczycie nici odwrotnej znajduje się sekwencja adaptorowa. Nitka DNA zagina się i przyłącza do oligo, które jest komplementarne do górnej sekwencji adaptera. Polimerazy przyłączają się do nici odwrotnej, a jej komplementarna nić (identyczna z oryginalną) jest tworzona. Teraz dwuniciowe DNA jest denaturowane tak, aby każda z nici mogła oddzielnie przyłączyć się do sekwencji oligonukleotydowej zakotwiczonej w komórce przepływowej. Jedna z nich będzie stanowić nić wsteczną, a druga – nić do przodu. Proces ten nazywany jest amplifikacją mostkową i zachodzi dla tysięcy klastrów w całej komórce przepływowej jednocześnie.
Amplifikacja klonalnaEdit
Kilkakrotnie, nitki DNA będą się wyginać i przyłączać do stałego podłoża. Polimeraza DNA zsyntetyzuje nową nić, aby utworzyć dwuniciowy segment, który zostanie zdenaturowany, tak aby wszystkie nici DNA w jednym obszarze pochodziły z jednego źródła (amplifikacja klonalna). Klonalna amplifikacja jest ważna dla celów kontroli jakości. Jeśli okaże się, że jakaś nić ma dziwną sekwencję, wówczas naukowcy mogą sprawdzić nić odwrotną, aby upewnić się, że ma ona dopełnienie tej samej dziwności. Nić do przodu i nić wsteczna działają jak kontrole chroniące przed artefaktami. Ponieważ sekwencjonowanie Illumina wykorzystuje polimerazę DNA, zaobserwowano błędy substytucji zasad, szczególnie na 3′ końcu. Odczyty sparowanych końców w połączeniu z generowaniem klastrów mogą potwierdzić, że wystąpił błąd. Nici wsteczna i naprzód powinny być komplementarne względem siebie, wszystkie odczyty wsteczne powinny pasować do siebie, a wszystkie odczyty naprzód powinny pasować do siebie. Jeśli odczyt nie jest wystarczająco podobny do swoich odpowiedników (z którymi powinien być klonem), mógł wystąpić błąd. Minimalny próg 97% podobieństwa został użyty w niektórych analizach laboratoryjnych.
Sekwencja przez syntezęEdit
Na końcu amplifikacji klonalnej, wszystkie odwrotne nici są wypłukiwane z komórki przepływowej, pozostawiając tylko nici do przodu. Starter przyłącza się do miejsca wiązania adaptera startera nici forward, a polimeraza dodaje fluorescencyjnie znakowany dNTP do nici DNA. Tylko jedna zasada może być dodana na rundę z powodu fluoroforu działającego jako grupa blokująca; jednakże grupa blokująca jest odwracalna. Wykorzystując chemię czterech kolorów, każda z czterech zasad ma unikalną emisję, a po każdej rundzie urządzenie rejestruje, która zasada została dodana. Po zarejestrowaniu koloru fluorofor jest wymywany, a inny dNTP jest wymywany nad komórką przepływową i proces jest powtarzany. dATP, dTTP, dGTP i dCTP są wymywane nad komórką oddzielnie, więc każdy nukleotyd jest w stanie być zidentyfikowany.
Począwszy od wprowadzenia na rynek NextSeq, a później MiniSeq, firma Illumina wprowadziła nową chemię sekwencjonowania dwukolorowego. Nukleotydy są rozróżniane przez jeden z dwóch kolorów (czerwony lub zielony), brak koloru („czarny”) lub połączenie obu kolorów (pojawiające się pomarańczowe jako mieszanina czerwonego i zielonego).
Po odczytaniu nici DNA, nić, która została właśnie dodana jest wypłukiwana. Następnie dołącza się primer indeksu 1, polimeryzuje sekwencję indeksu 1 i jest wypłukiwany. Nić ponownie tworzy mostek, a 3′ koniec nici DNA przyłącza się do oligo na komórce przepływowej. Dołącza się primer indeksu 2, polimeryzuje sekwencję i jest wypłukiwany.
Polimeraza sekwencjonuje komplementarną nić na szczycie łukowatej nici. Rozdzielają się one, a 3′ koniec każdej z nici zostaje zablokowany. Nić do przodu jest wymywana, a proces sekwencjonowania przez syntezę powtarza się dla nici odwrotnej.
Analiza danychEdit
Sekwencjonowanie zachodzi dla milionów klastrów jednocześnie, a każdy klaster ma ~1000 identycznych kopii wstawki DNA. Dane sekwencyjne są analizowane poprzez znalezienie fragmentów z nakładającymi się obszarami, zwanych kontigami, i ustawienie ich w rzędzie. Jeśli znana jest sekwencja referencyjna, kontigi są z nią porównywane w celu identyfikacji wariantów.
Ten fragmentaryczny proces pozwala naukowcom zobaczyć kompletną sekwencję, nawet jeśli nigdy nie wykonano sekwencji niefragmentowanej; jednakże, ponieważ długości odczytów Illumina nie są zbyt długie (sekwencjonowanie HiSeq może produkować odczyty o długości około 90 bp), może być trudno rozwiązać problem krótkich obszarów powtórzeń tandemowych. Ponadto, jeśli sekwencja jest de novo i nie istnieje referencja, powtarzające się obszary mogą powodować wiele trudności w składaniu sekwencji. Dodatkowe trudności to substytucje zasad (szczególnie na 3′ końcu odczytu) przez niedokładne polimerazy, sekwencje chimeryczne i PCR-bias, z których wszystkie mogą przyczynić się do wygenerowania nieprawidłowej sekwencji.