Illumina dye sequencing
Genomic LibraryEdit
DNAを精製した後は、DNAライブラリー(ゲノムライブラリー)を作成する必要があります。 ゲノムライブラリーの作成方法には、超音波処理とタグ付けの2種類があります。 タグメンテーションでは、トランスポザーゼがDNAを50~500bpの断片にランダムに切断し、同時にアダプターを付加する。 また、超音波処理でゲノムDNAを断片化することによっても、遺伝子ライブラリーを作成することができます。 超音波洗浄は、超音波を利用してDNAを同じようなサイズに断片化する。 超音波処理後、T7 DNA PolymeraseとT4 DNA ligaseによって、左右のアダプターを付ける必要がある。 アダプターが結合しなかった鎖は洗い流されます。
AdaptersEdit
アダプターには、固体支持体(フローセル上のオリゴヌクレオチド)と相補的な配列、バーコード配列(インデックス)、配列決定プライマーの結合サイトの3種類のセグメントを含んでいます。 インデックスは通常6塩基対の長さで、DNA配列解析の際にサンプルを識別するために使用されます。 インデックスを使用することで、最大96種類のサンプルを同時に分析することができます(これはマルチプレキシングとしても知られています)。 解析中、コンピュータは同じインデックスを持つリードをすべてグループ化します。 イルミナは「シーケンス・バイ・シンセシス」方式を採用しています。 このプロセスは、アクリルアミドでコーティングされたガラス製のフローセル内で行われます。 フローセルの底面にはオリゴヌクレオチド(短い塩基配列)がコーティングされており、シーケンス中にDNA鎖を所定の位置に保持するための固体支持体として機能します。
Bridge amplificationEdit
一度付着したら、クラスター生成を開始できます。 目標は何百本もの同じDNAの鎖を作ることである。 一部は順鎖になり、残りは逆鎖になる。 このため、右アダプター、左アダプターが使用される。 クラスターは橋渡し増幅によって生成される。 DNAポリメラーゼがDNAの鎖に沿って移動し、その相補鎖を作る。 元の鎖は洗い流され、逆鎖だけが残る。 逆鎖の先端にはアダプター配列がある。 DNA鎖は曲がって、上のアダプター配列に相補的なオリゴに付着する。 ポリメラーゼが逆鎖に結合し、その相補鎖(元の鎖と同じもの)が作られる。 二本鎖になったDNAは、それぞれの鎖がフローセルに固定されたオリゴヌクレオチド配列に別々に結合できるように、変性される。 一方は逆鎖となり、もう一方は順鎖となる。
Clonal amplificationEdit
何度も何度も、DNA鎖は曲がり、固体支持体にくっつきます。 DNAポリメラーゼが新しい鎖を合成して二本鎖のセグメントを作り、それが変性して、ある領域のすべてのDNA鎖が単一のソースからのものであるようにします(クローン増幅)。 クローン増幅は品質管理上、重要である。 ある鎖が奇妙な配列を持っていることが分かったら、科学者は逆鎖をチェックして、同じ奇妙な配列の補集合を持っていることを確認することができます。 順鎖と逆鎖は、アーティファクトを防ぐためのチェックの役割を果たす。 イルミナシーケンスではDNAポリメラーゼを使用するため、特に3’末端で塩基置換エラーが観察されている。 ペアエンドリードとクラスター生成を組み合わせることで、エラーが発生したことを確認することができます。 逆鎖と順鎖は互いに相補的であるべきで、すべての逆方向リードは互いに一致し、すべての順方向リードは互いに一致するはずである。 もし、リードが対応するもの(クローンとなるべきもの)と十分に類似していない場合、エラーが発生した可能性がある。
Sequence by synthesisEdit
クローン増幅の最後に、すべての逆鎖がフローセルから洗い流され、順鎖だけが残ります。 プライマーは順鎖のアダプタープライマー結合部位に付着し、ポリメラーゼは蛍光標識されたdNTPをDNA鎖に付加する。 蛍光色素がブロッキング基として働くため、1回に1塩基しか付加できないが、このブロッキング基は可逆的である。 4色の化学反応により、4つの塩基はそれぞれ固有の発光を示し、各ラウンド終了後、どの塩基が付加されたかを記録することができる。 dATP、dTTP、dGTP、およびdCTPは別々にフローセル上で洗浄されるので、各ヌクレオチドを識別することができます。
NextSeqとその後のMiniSeqの発売を皮切りに、イルミナは新しい2色配列ケミストリーを導入しました。 ヌクレオチドは、2色のうちの1色(赤または緑)、無色(「黒」)、または両方の色の組み合わせ(赤と緑の混合物としてオレンジ色に見える)で区別されます。
DNA鎖が読み取られると、先ほど加えた鎖は洗い流される。 次にindex 1のプライマーが付着し、index 1の配列を重合し、洗い流される。 再び橋渡しとなり、DNA鎖の3’末端はフローセル上のオリゴに付着する。
ポリメラーゼは、アーチ状の鎖の上に相補鎖を配列します。 両者は分離し、それぞれの鎖の3’末端はブロックされる。
データ解析編集
配列決定は一度に数百万のクラスタに対して行われ、各クラスタはDNA挿入物の約1000の同一コピーを持っている。 配列データの解析は、コンティグと呼ばれる重なり合う部分のある断片を探し出し、それらを並べることで行われる。
この断片的なプロセスにより、科学者は断片化されていない配列が実行されなかったとしても、完全な配列を見ることができます。しかし、イルミナのリード長はあまり長くないため(HiSeqシーケンスは90bp程度のリード長を生成できます)、短いタンデムリピート領域を解決するのは大変なことかもしれません。 また、配列がde novoでリファレンスが存在しない場合、繰り返し領域は配列アセンブリに多くの困難をもたらす可能性があります。 さらに、不正確なポリメラーゼによる塩基置換(特にリードの3’末端)、キメラ配列、PCRバイアスなども、不正確な配列の生成に寄与することがある
。