DNAシーケンシングのための代替戦略は、いくつかのカテゴリーにグループ化することができ 4). これらには、(i)微小電気泳動法9(Box1)、(ii)hybridization10(Box2)による配列決定、(iii)単一分子のリアルタイム観察11、12(Box3)および(iv)環状アレイ配列決定(J.S.et al.13およびref. 14)., ここで、我々は、市販製品(例えば、454シーケンシング(454Genome Sequencers、Roche Applied Science;Baselで使用)、Solexaテクノロジー(Illumina(San Diego)Genome Analyzerで使用)、SOLiD platform(Applied Biosystems;Foster City,CA,USA)、Polonator(Dover/Harvard)およびHeliScope Single Molecule Sequencer technology(Helicos;Cambridge,MA,USA)で最近実現されているサイクリックアレイシーケンシングのさまざまな実装に関して”第二世代”を使用する。, サイクリックアレイシーケンシングの概念は、酵素操作とイメージングベースのデータ収集の反復サイクルによってDNAの特徴の密な配列のシーケンシングとして要約することができる15(Shendureとcolleagues16)。 2005年の二つの報告では、従来のシーケンシングと実用的でコスト競争力のあるサイクリックアレイ戦略の最初の統合実装について説明した(J.S.et al.13およびref. 14)、および他のグループはすぐに17、18に従っています。,

これらのプラットフォームは、シーケンシング生化学およびアレイの生成方法において非常に多様であるが、それらのワークフローは概念的に類似している(Fig. 第1回)。 図書館の準備はランダムに断片化DNAの後、in vitroでのライゲーション共通のアダプタのdnaの塩基配列を決定した。 代替プロトコルを使用して、制御可能な距離分布を持つメイトペアのタグのジャンプライブラリを生成することができます13,19., シーケンシング機能として機能するクローンクラスタ化アンプリコンの生成は、in situ polonies15、エマルジョンPCR20またはブリッジPCR21、22を含むいくつかのアプローチによって達成することができる(図。 2). これらの方法に共通しているのは、任意の単一ライブラリー分子から派生したPCRアンプリコンが、平面基質上の単一の場所(in situ polonies、bridge PCR)または回収およびアレイすることができるミクロンスケールのビーズの表面(エマルジョンPCR)に空間的にクラスタ化されることである。, シーケンシングプロセス自体は、酵素駆動生化学とイメージングベースのデータ収集の交互サイクルで構成されています 3). ここで議論されているプラットフォームはすべて、合成による配列決定、すなわちプライミングされたテンプレートの連続拡張に依存するが、合成を駆動する酵素はpolymerase16,23またはligase13,24のいずれかであり得る。 データは、各サイクル(例えば、ポリメラーゼによって組み込まれた蛍光標識されたヌクレオチドの)における全アレイの撮像によって取得される。

図2:シーケンシング機能のクローン増幅。,

(a)454、ポロネーターおよび固体プラットフォームは、クローンシーケンシング機能を増幅するためにエマルジョンPCR20に依存しています。 要するに、in vitroで構築されたアダプター隣接ショットガンライブラリー(ユニークなインサートに隣接するゴールドとターコイズのアダプターとして示されている)は、油中水, PCRプライマーの一つは、反応に含まれるミクロンスケールのビーズの表面(5’付着)につながれています。 低い鋳型濃度は、ゼロまたは一つの鋳型分子のいずれかが存在するほとんどのビーズ含有区画になります。 (ビーズとテンプレート分子の両方が存在する)生産的なエマルジョンコンパートメントでは、PCRアンプリコンは、ビーズの表面にキャプチャされます。 破れた後は、エマルジョン、ビーズの軸受増幅可能な製品を選択的に充分とはいえません。, それぞれのクローン増幅ビーズは、鋳型ライブラリからの単一分子の増幅に対応するその表面PCR産物を有するであろう。 (b)Solexaの技術は橋PCR21、22(別名”集りPCR”)にクローン配列決定の特徴を増幅するために頼ります。 簡単に言えば、in vitroで構築されたアダプター隣接ショットガンライブラリーはPCR増幅されますが、両方のプライマーは密に柔軟なリンカーによって彼らの5’端に取り付けられた固体基質の表面をコートします。, 結果として、テンプレートライブラリの任意の所与のメンバーに由来する増幅産物は、原点の近くで局所的に連結されたままである。 PCRの終了時に、各クローンクラスターは、テンプレートライブラリの単一のメンバーの≥1,000コピーが含まれています。 テンプレートライブラリの濃度を正確に測定することは、クラスター密度を最大化すると同時に過密を回避するために重要です。

図3:サイクリックアレイシーケンシングのための戦略。,

(a)454プラットフォームでは、エマルジョンPCRによって生成されたクローン増幅された28μmビーズは、シーケンシング機能として機能し、ランダムにピコリットルスケール パイロシークエンシングでは、各サイクルは、そのヌクレオチドのポリメラーゼ駆動の取り込みが行われた井戸で光生産を駆動するために基質(ルシフェリン、アデノシン5′-ホスホスルフェート)の添加に続いて、一塩基種の導入で構成されています。, これに続いて、未編入のヌクレオチドを除去するためのアピラーゼ洗浄が行われる。 Marguliesらからの画像。 (2005)14. (b)Solexaの技術によって、clonally増幅された配列の特徴の密な配列は橋PCR(aka集りPCR)によって表面で直接発生する。 各シーケンシングサイクルには、四つの修飾されたデオキシヌクレオチド種の混合物の同時添加が含まれ、それぞれが3’ヒドロキシル位置に四つの蛍光標識のいずれかと可逆的に終端部分を有する。 変更したものがDNAポリメラーゼドライブ同期延長の衛配列が特徴です。, これに続いて四つのチャネルでイメージングし、次に蛍光標識および終端部分の両方の切断が続く。 (c)固体およびPolonatorのプラットホームと、clonally増幅された1µmのビーズが配列のfeatures13の無秩序で、密な配列を発生させるのに使用されています。 配列決定は、ポリメラーゼ13、24、26、27、28ではなく、リガーゼを用いて行われる。 固体では、各シーケンシングサイクルは、蛍光標識された八量体の部分的に縮退した集団を導入する。, 集団は、ラベルが八量体の中心2bpの同一性と相関するように構成されている(2bpとの相関は、1bpではなく、二塩基エンコーディングの基礎である)26。 四つのチャネルでのライゲーションとイメージングの後、オクタマーの標識部分(すなわち、”zzz”)は、塩基5と6の間の修飾された結合を介して切断され、ライゲーションの別のサイクルのための自由端を残す。 そのようないくつかのサイクルは、等間隔の不連続基底のセットを反復的に調べます。, その後、システムは(拡張されたプライマーの変性によって)リセットされ、プロセスは異なるオフセット(例えば、一つまたはいくつかの塩基によって元の位置から戻って設定されたプライマー)で繰り返され、次のラウンドのシリアルライゲーションで異なるセットの不連続塩基が尋問される。 (d)HeliScopeプラットフォームでは、単一の核酸分子が直接配列決定され、すなわち、クローン増幅ステップが必要とされない。, ポリテールテンプレート分子は、プライミングされた単一分子シーケンシングテンプレートの無秩序な配列を得るために表面テザーポリTオリゴマーへのハイ テンプレートはCy3でラベル付けされ、シーケンシング読み取りが期待される配列座標のサブセットをイメージング 各サイクルは、テンプレートのサブセットで蛍光標識されたヌクレオチドの単一種のポリメラーゼ駆動の取り込みから構成され、その後、完全なアレイの蛍光イメージングおよびラベルの化学的切断が続く。 Braslavskyらからの画像。 (2003)30.,

第二世代またはサイクリックアレイ戦略のグローバルな利点は、サンガーシーケンシングに比べて、次のものが含まれます。(i)シーケンシングライブラリのin vitro構築、シーケンシング機能を生成するためのin vitroクローン増幅に続いて、従来のシーケンシングの並列性を制限するいくつかのボトルネックを回避する(すなわち、大腸菌の変換およびコロニーピッキング)。 (ii)アレイベースのシーケンシングは、従来のキャピラリーベースのシーケンシングよりもはるかに高い, シーケンシングフィーチャの有効サイズは1μmオーダーであるため、合理的なサイズの表面積のラスターイメージングによって、数億のシーケンシングリードを並列に得ることができる。 (iii)アレイの特徴は平面表面に固定化されるので、それらは単一の試薬容積によって酵素的に操作することができる。 実際にはマイクロリットルスケールの試薬量が使用されていますが、これらは本質的にアレイ上のシーケンシングフィーチャの完全なセットにわたって償却, 以下、これらの違いで大幅にコスト削減のためのDNA配列。

第二世代DNA配列決定の利点は、現在、いくつかの欠点によって相殺されている。 これらの中で最も顕著なものには、読み取り長(新しいプラットフォームのすべてについて、読み取り長は現在、従来のシーケンシングよりもはるかに短い), これらの制限は、近い将来のための重要なアルゴリズムの課題を作成しますが、我々は、これらの技術は、従来のシーケンシングは、技術的なパフォーマンスの

454パイロシークエンシング。 454システムは、商用製品として利用可能な最初の次世代シーケンシングプラットフォームでした14。 このアプローチでは、ライブラリは、短い、アダプタ隣接フラグメントの混合物を生じさせる任意の方法によって構築することができる。, クローン配列の特徴は、エマルジョンPCR20によって生成され、28μmのビーズの表面にアンプリコンが捕捉される(Fig. 2a)。 エマルジョンを破った後、ビーズを変性剤で処理してテザリングされていないストランドを除去し、アンプリコンベアリングビーズ(すなわち、生産的なPCR シーケンシングプライマーをユニバーサルアダプタに適切な位置と向きでハイブリダイズする。,

シーケンシングは、パイロシークエンシング方法25によって行われる(Fig. 3a)。 簡単に言えば、アンプリコンベアリングビーズは、アレイベースのシーケンシングと互換性のあるこの生化学をレンダリングするために、バチルスstearothermophilus(Bst)ポリメラーゼと一本鎖結合タンパク質でpreincubatedし、ピコリットルスケールのウェルのマイクロファブリクスアレイ(一つだけのビーズがウェルあたりに収まるような寸法で)に堆積している。 より小さなビーズも加えられ、固定化された酵素もパイロシークエンシングに必要とされる(ATPスルフリラーゼおよびルシフェラーゼ)。, シーケンシングの間、半秩序アレイの片側はシーケンシング試薬を導入および除去するためのフローセルとして機能し、他方の側はCCD(charge-coupled device)ベースの信号検出のための光ファイババンドルに結合している。 数百サイクルのそれぞれにおいて、単一の種の無標識ヌクレオチドが導入される。 これにより、ピロリン酸が放出される。, ATPスルフリラーゼとルシフェラーゼを介して、取り込みイベントはすぐに特定のウェルのアレイ座標に対応するようにCCDによって検出される光のバーストの生成を駆動する。 他のプラットフォームとは対照的に、したがって、合成によるシーケンシングを監視する必要があります’ライブ(つまり、カメラはアレイに対して相対的に動 複数のサイクルにわたって(例えば、A-G-C-T-A-G-C-T。..のパターンの検出法のイベントから配列のテンプレートに代表される個々のビーズ., ヘリスコープ(以下に論じる)と同様に、配列決定は、いくつかの特徴が、塩基添加の順序に対するそれらの配列に応じて、他の特徴の前または後ろに得ることができるという点で、”非同期”である。

454技術の主要な制限は、ホモポリマー(すなわち、AAAまたはGGGなどの同じ塩基の連続したインスタンス)に関する。 所定のサイクルで複数の連続した取り込みを防止する終端部分が存在しないので、すべてのホモポリマーの長さは、シグナル強度から推測されなければならない。, これは、法人化と非法人の区別よりも大きな誤り率になりやすいです。 結果として、454プラットフォームの支配的なエラータイプは、置換ではなく挿入-削除です。 他の次世代プラットフォームと比較して、454プラットフォームの主な利点は読み取り長です。 例えば、454FLXの器械は器械ごとの≥400,000の読み取りを発生させる-200から300bpの長さで動く。 現在、454プラットフォームでのシーケンシングのベースあたりのコストは、他のプラットフォーム(例えば, しかしそれは長い読み取り長が重大であるある特定の適用のための選択の方法であるかもしれません(例えば、de novo assemblyおよびmetagenomics)。

イルミナゲノムアナライザ。 一般的に”Solexa”と呼ばれるこのプラットフォームは、Turcattiとcolleages22、23、およびSolexa(エセックス、英国)、Lynx Therapeutics(ヘイワード、カリフォルニア州、米国)、Manteia Predictive Medicine(Coinsins、スイス)とIlluminaの合併による仕事に起源を持っています。, ライブラリーは、長さが数百塩基対(bp)までのアダプター隣接フラグメントの混合物を生じさせる任意の方法によって構築することができる。 増幅解の特徴によ橋PCR21、22日(Fig. 第2回)を開催した。 このアプローチでは、両方の前方および逆PCRプライマーは、増幅中に任意の単一のテンプレート分子から生じるすべてのアンプリコンが固定化され、アレイ上の単一の物理的な場所にクラスタ化されたままになるように、柔軟なリンカーによって固体基質に連結される。, Illuminaプラットフォームでは、bridge PCRは、Bstポリメラーゼによる拡張とホルムアミドによる変性の交互サイクルに依存する点で、やや型破りです。 この結果、’クラスターの各構成∼1,000クローナルamplicons. 数百万のクラスターは、単一のフローセル上にある八つの独立した”レーン”のそれぞれ内の識別可能な場所に増幅することができます(八つの独立したライブラリが同じ機器の実行中に並列に配列することができるように)。, クラスター生成後、アンプリコンは一本鎖(線形化)であり、シーケンシングプライマーは、関心領域に隣接する普遍的なシーケンスにハイブリダイズされます。 配列質問の各サイクルは、修飾されたDNAポリメラーゼと四つのヌクレオチドの混合物による単一塩基拡張からなる(Fig. 3)。 これらのヌクレオチドは二つの方法で修飾される。, それらは”可逆的なターミネーター”であり、3’ヒドロキシル位置に化学的に切断可能な部分が各サイクルで単一塩基の取り込みのみを可能にし、化学的に切断可能な四つの蛍光標識のうちの一つは、各ヌクレオチド23の同一性に対応する。 四つのチャネルにおける単一塩基拡張および画像の取得の後、両方のグループの化学的開裂は次のサイクルのために設定される。 36bpまでの読み取り長さは現在ルーチンです。,読み取り長は、蛍光標識または終端部分の不完全な切断のような、シグナル減衰およびデフェージングを引き起こす複数の要因によって制限される。

支配的なエラータイプは、挿入または削除ではなく置換です(ホモポリマーは確かに454などの他のプラットフォームよりも問題が少ないです)。 平均生のエラー率は1-1.5%程度ですが、各ベースコールに関連付けられた品質指標によって、エラー率が0.1%以下のより高い精度のベースを識別できます。, たとえば、各シーケンシング機能は、与えられたライブラリ分子の各端から数百塩基の長さに由来する2×36bpの独立した読み取りをもたらします。

アブソリッド。 このプラットフォームは、J.S.とcolleagues13によって2005年に記述されたシステムと、Agencourt Personal Genomics(Beverly、MA、USA)のMcKernanとcolleagues26による研究(Applied Biosystems(Foster City、CA、USA)によって2006年に買収された)に起源があります。, ライブラリは、短いアダプタフランクフラグメントの混合物を生じさせる任意の方法によって構築することができるが、このシステムでは、制御可能で柔軟性の高い距離分布を持つメイトペアタグライブラリのためのプロトコルに多くの努力が払われている13,19。 クローンシーケンシングの特徴は、エマルジョンPCRによって生成され、アンプリコンは1μmの常磁性beads20の表面に捕捉される(Fig. 2a)。 エマルジョンを破壊した後、増幅生成物を有するビーズを選択的に回収し、次いで固体平面基質に固定化して、高密度の無秩序なアレイを生成する。, 合成による配列決定は、ポリメラーゼではなく、DNAリガーゼ13、24、26、27、28によって駆動される。 は、ユニバーサルプライマーを補完するアダプタのシーケンスはハイブリッド化して、配列のamplicon-ベビーズ. 配列決定の各サイクルは、蛍光標識された八量体の縮退集団のライゲーションを伴う(Fig. 3c)。 オクタマー混合物は、オクタマー(例えば、塩基5)内の特定の位置の同一性が蛍光標識の同一性と相関するという点で構造化される。, ライゲーション後、画像を取得しているた四つのチャネルを効果的にデータを収集し、同じベース位置のすべてのテンプレート有利子負ビーズ. 次いで、5位と6位の間でオクタマーを化学的に切断し、蛍光標識を除去する。 オクタマーライゲーションのプログレッシブラウンドは、すべての5塩基(例えば、塩基5、10、15、20)の配列を可能にする。 複数のそのような周期を完了するとシステムを再調節するために、延長プライマーは変性する。 このプロセスの後続の反復は、異なる位置のセットに向けることができます(例えば,、塩基4、9、14、19)アダプター-インサート接合から一つ以上の塩基をセットバックされたプライマーを使用することによって、または異なる位置(例えば、塩基2)がラベ このプラットフォームの追加の特徴は、単一の塩基ではなく二つの隣接する塩基がlabel26と相関する誤り訂正方式である二塩基符号化の使用を含む。, それぞれのベース位置は、ミスコールをより容易に識別できるように、(一塁として一度、一塁として一度、二塁として、与えられたサイクルで質問された2bpのセットで)二回クエリされる。

固体に関連するシステムはPolonatorであり、J.S.とハーバード大学の教会group13によって開発されたシステムにも部分的に基づいています。 このプラットフォームは、エマルジョンPCRによって生成されたシーケンシング機能 しかしながら、この装置のコストは、他の第二世代シーケンシング装置のコストよりも実質的に低い。, さらに、器械は開いた源およびプログラム可能で、可能性としてはユーザーの革新(例えば、代わりとなる生化学的の使用)を可能にする。 しかし、現在の読み取り長は著しく制限されている可能性があります。

454に共通する追加の欠点は、固体およびポロネーターであり、エマルジョンPCRが面倒で技術的に困難である可能性があることである。, 一方、非常に小さな(1μm)ビーズの高密度アレイ上のシーケンシング(ライゲーション、ポリメラーゼ拡張、または他の生化学によるシーケンシング)は、1μmビーズが回折限界オーダーの間隔で物理的に互いを排除するため、非常に高いデータ密度を達成する最も簡単な機会を表す可能性がある。 さらに、1μmビーズアレイのhigh解能秩序は、最近described29として、密接に近づくためにシーケンシング機能あたりの一つのピクセルの限界を可能にすること

ヘリスコープ。, Helicos sequencer18は、Quakeのgroup30による研究に基づいており、シーケンシング機能の密な配列の周期的な質問にも依存しています。 しかし、このプラットフォームのユニークな側面は、クローン増幅が必要ないことです。 代わりに、高感度蛍光検出システムを使用して、合成による配列決定を介して単一のDNA分子を直接質問する。, ランダムフラグメンテーションとポリ-Aテーリング(つまり、PCR増幅なし)によって調製されたテンプレートライブラリは、プライミングされた単一分子シーケンシングテンプレートの無秩序な配列 各サイクルで、DNAポリメラーゼおよび蛍光標識されたヌクレオチドの単一種が添加され、その結果、表面固定化されたプライマー-テンプレート二本鎖のテンプレート依存的な拡張が生じる(Fig. 3d)。, 完全な配列をタイルするイメージの獲得の後で蛍光ラベルの化学開裂そして解放は延長およびイメージ投射のそれに続く周期を可能にする。 最近のレポート18に記載されているように、数百サイクルの単一塩基拡張(すなわち、A、G、C、T、A、G、C、Tである。..)平均読み取り-25bp以上の長さをもたらします。 このシステムの注目すべき側面は次のとおりです。 最初の454プラットフォームの配列は非同期であるため、一部の素線が下が進出した後は他のシーケンスに依存します。, ある型板が次の位置で適切な基盤を持っているにもかかわらずある特定の周期で組み込まないかもしれないのでチャンスはまた役割を、担う。 しかし、これらは単一の分子であるため、デフェージングは問題ではなく、そのようなイベント自体がエラーにつながることはありません。

第二に、標識されたヌクレオチド上に終端部分は存在しない。 従って454システムと同じように、ホモポリマーの操業は重要な問題である。 しかしながら、単一分子が配列決定されているので、問題は取り込み事象の速度を制限することによって軽減することができる。 さらに、Harris et al.,18は、ホモポリマーにおける標識されたヌクレオチドの連続した取り込みが消光相互作用を生み出し、著者らは取り込みの控えめな数(例えば、A対AA対AAA)を推論することを可能にしたことに留意した。

第三に、生の配列決定精度は、単一分子テンプレートの配列(ここでは両端にアダプタを有する)が上記のように配列され、次に完全にコピーされるツーパス 新たに合成された鎖が表面テザーされるので、元の鋳型は変性することによって除去することができる。, 遠位アダプターから下塗りされた配列決定は、反対の向きで得られた同じテンプレートの第二の配列をもたらす。 二つの読み取りの間に一致している位置は、30に近づいphredのような品質スコアを持っています(refs. 8,18).

そして最後に、汚染、ラベルなしまたは非エミット塩基の取り込みに主に二次的に、支配的なエラータイプは削除(一つのパスで2–7%のエラー率、二つのパスで0.2-1%) しかし、置換誤り率は実質的に低い(ワンパスで0.01–1%)。, 二つのパスでは、ベースごとの生置換エラー率(0.001%に近づく)は、現在、すべての第二世代のプラットフォームの中で最も低い可能性があります。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です