Illumina dye sequencing

Genomic LibraryEdit

Após a purificação do DNA, uma biblioteca de DNA, biblioteca genômica, precisa ser gerada. Há duas formas de criar uma biblioteca genómica, a sonificação e a tagmentation. Com a tagmentation, transpõe aleatoriamente o DNA em tamanhos entre 50 a 500 bp fragmentos e adiciona adaptadores simultaneamente. Uma biblioteca genética também pode ser gerada usando a sonificação para fragmentar o DNA genómico. A sonificação fragmenta o ADN em tamanhos semelhantes utilizando ondas sonoras ultra-sónicas. Os adaptadores direito e esquerdo terão de ser ligados por ADN T7 Polimerase e ADN T4 ligase após a sonificação. Os fios que não têm os adaptadores ligados são lavados.

O ADN duplamente encalhado é clivado por transposomes. As extremidades cortadas são reparadas e os adaptadores, índices, sítios de encadernação e sítios terminais são adicionados a cada filamento do DNA. Imagem baseada em parte no vídeo de sequenciamento da illumina

AdaptersEdit

Adaptadores contêm três segmentos diferentes: a sequência complementar ao suporte sólido (oligonucleotídeos na célula de fluxo), a sequência do código de barras (índices), e o local de encadernação para o primer do sequenciamento. Os índices têm geralmente seis pares de bases e são usados durante a análise da sequência de ADN para identificar amostras. Os índices permitem que até 96 amostras diferentes sejam executadas em conjunto, o que também é conhecido como multiplexação. Durante a análise, o computador agrupa todas as leituras com o mesmo índice. O Illumina utiliza uma abordagem de “sequência por síntese”. Este processo ocorre dentro de uma célula de fluxo de vidro revestida de acrilamida. A célula de fluxo tem oligonucleotídeos (sequências curtas de nucleotídeos) cobrindo o fundo da célula, e eles servem como suporte sólido para manter os fios de DNA no lugar durante a sequenciação. Como o DNA fragmentado é lavado sobre a célula de fluxo, o adaptador apropriado se fixa ao suporte sólido complementar.

Milhões de oligonucleotídeos formam o fundo de cada faixa de células de fluxo.

Amplificação de ponteEditar

Após anexado, a geração de clusters pode começar. O objetivo é criar centenas de fios idênticos de DNA. Alguns serão o fio da frente; o resto, o inverso. É por isso que são usados adaptadores para a direita e esquerda. Os clusters são gerados através da amplificação da ponte. A DNA polimerase move-se ao longo de uma cadeia de DNA, criando a sua cadeia complementar. A cadeia original é lavada, deixando apenas a cadeia inversa. No topo da cadeia reversa há uma sequência de adaptadores. A cadeia de DNA se dobra e se liga ao oligo, que é complementar à seqüência de adaptação superior. As polimerases são ligadas à cadeia reversa, e sua cadeia complementar (que é idêntica à original) é feita. O agora DNA de cadeia dupla é desnaturado para que cada cadeia possa se ligar separadamente a uma seqüência de oligonucleotídeos ancorada à célula de fluxo. Um será a cadeia inversa; o outro, a cadeia dianteira. Este processo é chamado de amplificação de ponte, e acontece para milhares de clusters por toda a célula de fluxo de uma vez.

Amplificação ClonalEditar

Acima e de novo, as cordas de DNA se dobrarão e se ligarão ao suporte sólido. A DNA polimerase sintetizará uma nova cadeia para criar um segmento de cadeia dupla, e que será desnaturada para que todas as cadeias de DNA em uma área sejam de uma única fonte (amplificação clonal). A amplificação clonal é importante para fins de controle de qualidade. Se uma cadeia tiver uma sequência estranha, os cientistas podem verificar a cadeia inversa para se certificarem de que ela tem o complemento da mesma estranheza. Os fios para a frente e para trás funcionam como controlos para se protegerem contra artefactos. Como a sequência de Illumina utiliza DNA polimerase, foram observados erros de substituição de base, especialmente no final de 3′. Leituras de extremidade emparelhadas combinadas com a geração de agregados podem confirmar a ocorrência de um erro. As leituras inversa e avançada devem ser complementares entre si, todas as leituras inversa devem corresponder umas às outras, e todas as leituras avançada devem corresponder umas às outras. Se uma leitura não for suficientemente semelhante às suas contrapartidas (com as quais deveria ser um clone), pode ter ocorrido um erro. Um limiar mínimo de 97% de similaridade foi usado em algumas análises de laboratório.

Sequência por sínteseEditar

No final da amplificação clonal, todos os fios invertidos são lavados da célula de fluxo, deixando apenas os fios para a frente. Um primer se prende ao local de ligação do primer adaptador dos fios da frente, e uma polimerase adiciona um dNTP fluorescentemente marcado ao fio de DNA. Apenas uma base pode ser adicionada por rodada devido ao fluoróforo agir como um grupo de bloqueio; no entanto, o grupo de bloqueio é reversível. Usando a química de quatro cores, cada uma das quatro bases tem uma emissão única, e após cada rodada, a máquina registra qual base foi adicionada. Uma vez que a cor é registrada, o fluoróforo é lavado e outro dNTP é lavado sobre a célula de fluxo e o processo é repetido. dATPs, dTTPs, dGTPs e dCTPs são lavados sobre a célula separadamente para que cada nucleotídeo possa ser identificado.

Começando com o lançamento do NextSeq e mais tarde do MiniSeq, o Illumina introduziu uma nova química de sequenciamento de duas cores. Os nucleotídeos são distinguidos por uma de duas cores (vermelho ou verde), sem cor (“preto”) ou combinando ambas as cores (parecendo laranja como uma mistura entre vermelho e verde).

Os nucleotídeos marcados são adicionados para a cadeia de DNA. Cada um dos quatro nucleotídeos tem uma etiqueta identificadora que pode ser excitada para emitir um comprimento de onda característico. Um computador registra todas as emissões, e a partir destes dados são feitas chamadas de base.

Após a fita de DNA ter sido lida, a fita que acabou de ser adicionada é lavada. Em seguida, o primer índice 1 se liga, polimeriza a seqüência índice 1, e é lavado. O cordão forma uma ponte novamente, e a extremidade de 3′ do cordão de DNA se liga a um oligo na célula de fluxo. O iniciador índice 2 se liga, polimeriza a seqüência e é lavado.

A seqüências de polimerase o cordão complementar no topo do cordão arqueado. Eles se separam, e a extremidade de 3′ de cada filamento é bloqueada. A cadeia dianteira é lavada e o processo de seqüência por síntese se repete para a cadeia reversa.

Análise de dadosEditar

A seqüência ocorre para milhões de clusters de uma vez, e cada cluster tem ~1.000 cópias idênticas de uma inserção de DNA. Os dados da sequência são analisados encontrando fragmentos com áreas sobrepostas, chamadas contigs, e alinhando-as. Se uma seqüência de referência é conhecida, as contigs são então comparadas a ela para identificação de variantes.

Este processo fragmentado permite aos cientistas ver a seqüência completa mesmo que uma seqüência não fragmentada nunca tenha sido executada; entretanto, como os comprimentos de leitura do Illumina não são muito longos (o seqüenciamento HiSeq pode produzir comprimentos de leitura em torno de 90 bp de comprimento), pode ser uma luta para resolver áreas curtas de repetição tandem. Além disso, se a sequência é de novo e não existe uma referência, as áreas repetidas podem causar muita dificuldade na montagem da sequência. Dificuldades adicionais incluem substituições de base (especialmente no final das leituras de 3′) por polimerases imprecisas, seqüências quiméricas e polarização PCR, tudo isso pode contribuir para gerar uma seqüência incorreta.

Deixe uma resposta

O seu endereço de email não será publicado.