Sekvenování barvivem Illumina

Genomová knihovnaEdit

Po přečištění DNA je třeba vytvořit knihovnu DNA, genomovou knihovnu. Existují dva způsoby, jak lze genomovou knihovnu vytvořit, sonifikace a tagmentace. Při tagmentaci transpozáza náhodně rozřeže DNA na fragmenty o velikosti 50 až 500 bp a současně přidá adaptory. Genetickou knihovnu lze také vytvořit pomocí sonifikace k fragmentaci genomové DNA. Sonifikace fragmentuje DNA na podobné velikosti pomocí ultrazvukových zvukových vln. Po sonifikaci bude třeba připojit pravý a levý adaptér pomocí T7 DNA polymerázy a T4 DNA ligázy. Vlákna, která nemají ligované adaptéry, se odplaví.

Dvouvláknová DNA se štěpí transpozomy. Odříznuté konce jsou opraveny a do každého vlákna DNA jsou přidány adaptéry, indexy, vazebná místa primerů a koncová místa. Obrázek částečně založený na videu o sekvenování společnosti illumina

AdaptéryUpravit

Adaptéry obsahují tři různé segmenty: sekvenci komplementární k pevné podpoře (oligonukleotidy na průtokové buňce), sekvenci čárového kódu (indexy) a vazebné místo pro sekvenační primer. Indexy jsou obvykle dlouhé šest párů bází a používají se při analýze sekvence DNA k identifikaci vzorků. Indexy umožňují provádět až 96 různých vzorků společně, což je také známo jako multiplexování. Během analýzy počítač seskupí všechna čtení se stejným indexem dohromady. Společnost Illumina používá přístup „sekvenování syntézou“. Tento proces probíhá uvnitř skleněné průtokové buňky potažené akrylamidem. Průtoková buňka má oligonukleotidy (krátké sekvence nukleotidů), které pokrývají dno buňky a slouží jako pevná podpora, která udržuje vlákna DNA na místě během sekvenování. Jak se fragmentovaná DNA promývá přes průtokovou buňku, příslušný adaptér se připojí ke komplementární pevné podpoře.

Miliony oligonukleotidů lemují dno každého pruhu průtokové buňky.

Amplifikace můstkuEdit

Po připojení může začít generování klastrů. Cílem je vytvořit stovky identických vláken DNA. Část z nich bude tvořit přední vlákno, zbytek opačné. Proto se používají pravý a levý adaptér. Klastry se vytvářejí pomocí amplifikace můstku. DNA polymeráza se pohybuje podél vlákna DNA a vytváří jeho komplementární vlákno. Původní vlákno se odplaví a zůstane pouze reverzní vlákno. V horní části reverzního vlákna se nachází sekvence adaptéru. Vlákno DNA se ohne a připojí se k oligu, které je komplementární k horní adaptační sekvenci. Polymerázy se připojí k reverznímu vláknu a vznikne jeho komplementární vlákno (které je identické s původním). Nyní dvouvláknová DNA je denaturována, aby se každé vlákno mohlo samostatně připojit k oligonukleotidové sekvenci ukotvené na průtokové buňce. Jedno bude reverzní vlákno, druhé dopředné. Tento proces se nazývá můstková amplifikace a probíhá pro tisíce klastrů po celé průtokové cele najednou.

Klonová amplifikaceEdit

Znovu a znovu se budou vlákna DNA ohýbat a připojovat k pevnému nosiči. Polymeráza DNA syntetizuje nové vlákno a vytvoří tak dvouvláknový segment, který se denaturuje, takže všechna vlákna DNA v jedné oblasti pocházejí z jednoho zdroje (klonální amplifikace). Klonální amplifikace je důležitá pro účely kontroly kvality. Pokud se zjistí, že některé vlákno má zvláštní sekvenci, mohou vědci zkontrolovat opačné vlákno, aby se ujistili, že má komplement stejné zvláštnosti. Přední a zpětné vlákno slouží jako kontrola, která chrání před artefakty. Protože sekvenování Illumina používá DNA polymerázu, byly pozorovány chyby při záměně bází, zejména na 3′ konci. Párová čtení na konci v kombinaci s generováním klastrů mohou potvrdit, že k chybě došlo. Reverzní a forwardové vlákno by měly být vzájemně komplementární, všechna reverzní čtení by se měla vzájemně shodovat a všechna forwardová čtení by se měla vzájemně shodovat. Pokud čtení není dostatečně podobné svým protějškům (se kterými by mělo být klonem), mohlo dojít k chybě. V analýzách některých laboratoří byla použita minimální hranice 97% podobnosti.

Sekvence syntézouUpravit

Na konci klonální amplifikace jsou všechna reverzní vlákna vymyta z průtokové cely a ponechána pouze dopředná vlákna. Primer se připojí k vazebnému místu adaptérového primeru dopředných vláken a polymeráza přidá k vláknu DNA fluorescenčně značený dNTP. V každém kole je možné přidat pouze jednu bázi, protože fluorofor působí jako blokovací skupina; blokovací skupina je však reverzibilní. Při použití čtyřbarevné chemie má každá ze čtyř bází jedinečnou emisi a po každém kole přístroj zaznamená, která báze byla přidána. Jakmile je barva zaznamenána, fluorofor se smyje a přes průtokovou celu se promyje další dNTP a proces se opakuje. dATP, dTTP, dGTP a dCTP se přes celu promyjí zvlášť, takže je možné identifikovat každý nukleotid.

Začínaje uvedením NextSeq a později MiniSeq zavedla společnost Illumina novou dvoubarevnou sekvenační chemii. Nukleotidy jsou rozlišeny buď jednou ze dvou barev (červenou nebo zelenou), žádnou barvou („černou“), nebo kombinací obou barev (jeví se oranžově jako směs červené a zelené).

Označené nukleotidy se přidávají do vlákna DNA v pořadí. Každý ze čtyř nukleotidů má identifikační značku, kterou lze excitovat tak, aby vyzařovala charakteristickou vlnovou délku. Počítač zaznamenává všechny emise a z těchto údajů se provádí volání bází.

Po přečtení vlákna DNA se právě přidané vlákno odmyje. Poté se připojí primer indexu 1, polymerizuje sekvenci indexu 1 a je vymyt. Vlákno opět vytvoří můstek a 3′ konec vlákna DNA se připojí k oligu na průtokové cele. Primer indexu 2 se připojí, polymerizuje sekvenci a je odmyt.

Polymeráza sekvenuje komplementární vlákno na vrcholu obloukového vlákna. Oddělí se a 3′ konec každého vlákna se zablokuje. Přední vlákno se odplaví a proces sekvenování syntézou se opakuje pro reverzní vlákno.

Analýza datUpravit

Sekvenování probíhá pro miliony klastrů najednou a každý klastr má ~1 000 identických kopií vložené DNA. Sekvenční data se analyzují vyhledáním fragmentů s překrývajícími se oblastmi, tzv. kontigů, a jejich seřazením. Pokud je známa referenční sekvence, kontigy se s ní následně porovnávají za účelem identifikace variant.

Tento postup po částech umožňuje vědcům vidět kompletní sekvenci, i když nefragmentovaná sekvence nebyla nikdy spuštěna; protože však délka čtení u sekvenátorů Illumina není příliš dlouhá (při sekvenování HiSeq lze získat čtení o délce kolem 90 bp), může být problém vyřešit krátké oblasti tandemových repetic. Také pokud je sekvence de novo a neexistuje reference, mohou opakované oblasti způsobit při sestavování sekvence velké potíže. Mezi další obtíže patří záměny bází (zejména na 3′ konci čtení) nepřesnými polymerázami, chimérické sekvence a PCR-bias, které mohou přispět ke generování nesprávné sekvence.

.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.