Illumina dye sequencing

Biblioteca genomicăEdit

După ce ADN-ul este purificat, trebuie generată o bibliotecă de ADN, biblioteca genomică. Există două moduri în care poate fi creată o bibliotecă genomică, sonificarea și marcarea. În cazul marcării, transpaza taie aleatoriu ADN-ul în fragmente de dimensiuni cuprinse între 50 și 500 bp și adaugă simultan adaptoare. O bibliotecă genetică poate fi generată, de asemenea, prin utilizarea sonificării pentru a fragmenta ADN-ul genomic. Sonificarea fragmentează ADN-ul în dimensiuni similare cu ajutorul undelor sonore ultrasonice. Adaptorii din dreapta și din stânga vor trebui să fie atașați de ADN polimeraza T7 și de ADN ligazele T4 după sonificare. Șirurile care nu reușesc să aibă adaptorii legați sunt spălate.

ADN-ul dublu catenar este scindat de transpozomi. Capetele tăiate sunt reparate și adaptorii, indicii, situsurile de legare a amorselor și situsurile terminale sunt adăugate la fiecare catenă de ADN. Imagine bazată parțial pe videoclipul de secvențiere de la illumina

AdaptoriiEdit

Adaptorii conțin trei segmente diferite: secvența complementară suportului solid (oligonucleotide pe celula de flux), secvența codului de bare (indici) și locul de legare pentru amorsă de secvențiere. Indicii au de obicei o lungime de șase perechi de baze și sunt utilizați în timpul analizei secvenței de ADN pentru a identifica probele. Indicii permit ca până la 96 de probe diferite să fie analizate împreună, acest lucru fiind cunoscut și sub numele de multiplexare. În timpul analizei, computerul va grupa toate citirile cu același index. Illumina utilizează o abordare de tip „secvență prin sinteză”. Acest proces are loc în interiorul unei celule de curgere din sticlă acoperită cu acrilamidă. Celula de curgere are oligonucleotide (secvențe scurte de nucleotide) care acoperă partea de jos a celulei, iar acestea servesc drept suport solid pentru a menține șirurile de ADN la locul lor în timpul secvențierii. Pe măsură ce ADN-ul fragmentat este spălat peste celula de curgere, adaptorul corespunzător se atașează la suportul solid complementar.

Milioane de oligotipuri căptușesc fundul fiecărui culoar al celulei de curgere.

Amplificare în punteEdit

După ce sunt atașate, poate începe generarea de clustere. Scopul este de a crea sute de șiruri identice de ADN. Unele vor fi șirul de față; restul, cel invers. Acesta este motivul pentru care se folosesc adaptoare dreapta și stânga. Clusterele sunt generate prin amplificare în punte. ADN polimeraza se deplasează de-a lungul unui șir de ADN, creând șirul său complementar. Șirul original este îndepărtat prin spălare, lăsând doar șirul invers. În partea superioară a șirului invers se află o secvență adaptoare. Șirul de ADN se îndoaie și se atașează la oligo care este complementar cu secvența adaptoare de sus. Polimerazele se atașează la șirul invers, iar șirul său complementar (care este identic cu cel original) este creat. ADN-ul acum dublu catenar este denaturat, astfel încât fiecare catenă să se poată atașa separat la o secvență oligonucleotidă ancorată la celula de curgere. Unul va fi șirul invers; celălalt, șirul direct. Acest proces se numește amplificare în punte și se întâmplă pentru mii de clustere pe toată celula de curgere în același timp.

Amplificare clonalăEdit

În repetate rânduri, șirurile de ADN se vor îndoi și se vor atașa la suportul solid. ADN polimeraza va sintetiza un nou catenar pentru a crea un segment dublu catenar, iar acesta va fi denaturat astfel încât toate catenele de ADN dintr-o zonă să provină dintr-o singură sursă (amplificare clonală). Amplificarea clonală este importantă în scopul controlului calității. Dacă se constată că un lanț are o secvență ciudată, atunci oamenii de știință pot verifica lanțul invers pentru a se asigura că acesta are complementul aceleiași ciudățenii. Șirul înainte și cel invers acționează ca verificări pentru a se feri de artefacte. Deoarece secvențierea Illumina utilizează ADN polimeraza, au fost observate erori de substituție de baze, în special la capătul 3′. Citirile la capătul perechilor, combinate cu generarea de clustere, pot confirma că a avut loc o eroare. Șirurile invers și înainte ar trebui să fie complementare unul față de celălalt, toate citirile inverse ar trebui să se potrivească între ele, iar toate citirile înainte ar trebui să se potrivească între ele. În cazul în care o citire nu este suficient de asemănătoare cu omologii săi (cu care ar trebui să fie o clonă), este posibil să se fi produs o eroare. Un prag minim de 97% similaritate a fost folosit în analizele unor laboratoare.

Secvență prin sintezăEdit

La sfârșitul amplificării clonale, toate șirurile inverse sunt spălate de pe celula de curgere, lăsând doar șirurile directe. Un primer se atașează la situsul de legare a primerului adaptor al șuvițelor directe, iar o polimerază adaugă un dNTP marcat fluorescent la șuvița de ADN. Se poate adăuga doar o singură bază pe rundă datorită faptului că fluoroforul acționează ca un grup de blocare; cu toate acestea, grupul de blocare este reversibil. Utilizând chimia cu patru culori, fiecare dintre cele patru baze are o emisie unică, iar după fiecare rundă, aparatul înregistrează ce bază a fost adăugată. Odată ce culoarea este înregistrată, fluoroforul este îndepărtat prin spălare și un alt dNTP este spălat peste celula de curgere, iar procesul se repetă. dATPs, dTTPs, dGTPs și dCTPs sunt spălate peste celulă separat, astfel încât fiecare nucleotidă să poată fi identificată.

Începând cu lansarea NextSeq și ulterior a MiniSeq, Illumina a introdus o nouă chimie de secvențiere în două culori. Nucleotidele se disting fie prin una dintre cele două culori (roșu sau verde), fie prin nicio culoare („negru”), fie prin combinarea ambelor culori (apărând portocaliu ca un amestec între roșu și verde).

Nucleotidele marcate sunt adăugate în ordine la șirul de ADN. Fiecare dintre cele patru nucleotide are o etichetă de identificare care poate fi excitată pentru a emite o lungime de undă caracteristică. Un computer înregistrează toate emisiile și, din aceste date, se fac apeluri de bază.

După ce șirul de ADN a fost citit, șirul care tocmai a fost adăugat este îndepărtat prin spălare. Apoi, amorsa index 1 se atașează, polimerizează secvența index 1 și este spălată. Șirul formează din nou o punte, iar capătul 3′ al șirului de ADN se atașează la un oligo de pe celula de debit. Primerul index 2 se atașează, polimerizează secvența și este îndepărtat prin spălare.

O polimerază secvențiază șirul complementar deasupra șirului arcuit. Acestea se separă, iar capătul 3′ al fiecărei catene este blocat. Șirul înainte este spălat, iar procesul de secvențiere prin sinteză se repetă pentru șirul invers.

Analiza datelorEdit

Secvențierea are loc pentru milioane de clustere deodată, iar fiecare cluster are ~1.000 de copii identice ale unei inserții de ADN. Datele de secvență sunt analizate prin găsirea fragmentelor cu zone suprapuse, numite contigs, și alinierea lor. Dacă se cunoaște o secvență de referință, contigurile sunt apoi comparate cu aceasta pentru identificarea variantelor.

Acest proces fragmentat permite oamenilor de știință să vadă secvența completă, chiar dacă nu a fost rulată niciodată o secvență nefragmentată; cu toate acestea, deoarece lungimile de citire Illumina nu sunt foarte lungi (secvențierea HiSeq poate produce lungimi de citire de aproximativ 90 bp), poate fi o luptă pentru a rezolva zonele scurte de repetări în tandem. De asemenea, dacă secvența este de novo și nu există o referință, zonele repetate pot cauza multe dificultăți în asamblarea secvenței. Dificultăți suplimentare includ substituțiile de baze (în special la capătul 3′ al citirilor) de către polimeraze imprecise, secvențe chimerice și PCR-bias, toate acestea putând contribui la generarea unei secvențe incorecte.

.

Lasă un răspuns

Adresa ta de email nu va fi publicată.