strategii Alternative pentru secvențierea ADN-ului pot fi grupate în mai multe categorii (așa cum sa discutat anterior în ref. 4). Acestea includ (i) microelectrophoretic methods9 (Caseta 1), (ii) secvențierea de hybridization10 (Caseta 2), (iii) observarea în timp real de unică molecules11,12 (Caseta 3) și (iv) ciclic-matrice de secvențiere (J. S. et al.13 și ref. 14)., Aici, vom folosi „a doua generație”, cu referire la diferitele implementări ale ciclic-matrice de secvențiere care au fost recent realizat într-un produs comercial (de exemplu, 454 de secvențiere (utilizate în 454 Genomului Secvente, Roche applied Science; Basel), „Solea” tehnologie (utilizate în Illumina (San Diego) Genomul Analizor), o platformă Solidă (applied Biosystems; Foster City, CA, statele UNITE ale americii), la Polonator (Dover/Harvard) și HeliScope Singură Moleculă Sequencer tehnologie (Helicos; Cambridge, MA, Statele UNITE ale americii)., Conceptul de ciclic-matrice de secvențiere pot fi rezumate după cum succesiunea de un dens serie de ADN caracteristici de cicluri iterative de enzimatică manipulare și imagistică pe bază de date collection15 (Shendure și colleagues16). Două rapoarte în 2005 a descris prima integrat implementări ale ciclic-serie de strategii care au fost atât practice, cât și costuri competitive cu convenționale de secvențiere (J. S. et al.13 și ref. 14), iar alte grupuri au urmat rapid17, 18.,deși aceste platforme sunt destul de diverse în biochimia secvențierii, precum și în modul în care este generată matricea, fluxurile lor de lucru sunt conceptual similare (Fig. 1b). Pregătirea bibliotecii se realizează prin fragmentarea aleatorie a ADN-ului, urmată de ligarea in vitro a secvențelor adaptoare comune. Protocoalele Alternative pot fi utilizate pentru a genera biblioteci de sărituri de etichete pereche cu distribuții la distanță controlabile13, 19., Generarea de clonal grupate ampliconilor pentru a servi ca succesiunea caracteristici poate fi realizat prin mai multe abordări, inclusiv in situ polonies15, emulsie PCR20 sau podul PCR21,22 (Fig. 2). Ceea ce este comun pentru aceste metode este că fragmentelor adn derivate din orice bibliotecă unică moleculă ajunge spațial grupate, fie pentru o singură locație de pe un substrat planar (in situ polonies, pod PCR), sau la suprafața de microni-o scară de margele, care pot fi recuperate și îmbrăcat (emulsie PCR)., Procesul de secvențiere în sine constă în cicluri alternante de biochimie bazată pe enzime și achiziție de date bazate pe imagistică (Fig. 3). Platformele care sunt discutate aici se bazează pe secvențiere prin sinteză, adică extinderea serială a șabloanelor amorsate, dar enzima care conduce sinteza poate fi fie o polimerază16,23 sau o ligază13,24. Datele sunt obținute prin imagistica matrice completă la fiecare ciclu (de exemplu, de nucleotide marcate fluorescent încorporate printr-o polimerază).
Global de avantaje de a doua generație sau ciclic-matrice strategii, în raport cu secvențiere Sanger, includ următoarele: (i) in vitro construirea unui secvențiere bibliotecă, urmat de in vitro clonală amplificare a genera secvențiere caracteristici, ocolește mai multe blocaje care limitează paralelismul convenționale de secvențiere (care este, de transformare a E. coli și colonie de cules). (ii) secvențierea bazată pe matrice permite un grad mult mai mare de paralelism decât secvențierea convențională bazată pe capilare., Ca dimensiunea efectivă de secvențiere caracteristici pot fi de ordinul a 1 µm, sute de milioane de secvențiere citește pot fi obținute în paralel de baleiată imagistica de dimensiuni rezonabile suprafață. (iii) deoarece caracteristicile matricei sunt imobilizate pe o suprafață plană, ele pot fi manipulate enzimatic de un singur volum de reactiv. Deși microlitru la scară reactiv volume sunt utilizate în practică, acestea sunt, în esență, amortizat de-a lungul set complet de secvențiere caracteristici pe matrice, in scadere eficient volumul de reactiv per caracteristică a scalei de picături sau femtoliters., În mod colectiv, aceste diferențe se traduc în costuri dramatic mai mici pentru producerea secvenței ADN.avantajele secvențierii ADN de a doua generație sunt în prezent compensate de mai multe dezavantaje. Cele mai proeminente dintre acestea includ lungimea de citire (pentru toate noile platforme, lungimile de citire sunt în prezent mult mai scurte decât secvențierea convențională) și precizia brută (în medie, apelurile de bază generate de noile platforme sunt de cel puțin zece ori mai puțin precise decât apelurile de bază generate de secvențierea Sanger)., Deși aceste limitări creează provocări algoritmice importante pentru viitorul imediat, ar trebui să avem în vedere faptul că aceste tehnologii vor continua să se îmbunătățească în ceea ce privește acești parametri, la fel cum secvențierea convențională a progresat treptat pe parcursul a trei decenii pentru a atinge nivelul actual de performanță tehnică.
454 pyrosequencing. Sistemul 454 a fost prima platformă de secvențiere de ultimă generație disponibilă ca produs comercial14. În această abordare, bibliotecile pot fi construite prin orice metodă care dă naștere unui amestec de fragmente scurte, flancate de adaptor., Caracteristicile de secvențiere clonală sunt generate de emulsia PCR20, cu ampliconi capturați pe suprafața granulelor de 28 µm (Fig. 2a). După ruperea emulsiei, margele sunt tratate cu agent de denaturare pentru a elimina untethered fire, și apoi supus la o hibridizare pe bază de îmbogățire pentru amplicon purtătoare de margele (care este, cei care au fost prezenți într-o emulsie compartimentului sprijin productiv reacția PCR). Un primer de secvențiere este hibridizat la adaptorul universal în poziția și orientarea corespunzătoare, adică imediat adiacent la începutul secvenței necunoscute.,
secvențierea se realizează prin metoda pirosecvenței25 (Fig. 3a). Pe scurt, amplicon-rulment margele sunt preincubated cu Bacillus stearothermophilus (Bst) polimerazei și singur-stranded binding proteine, și apoi depuse pe un microfabricated serie de picoliter scară wells (cu dimensiuni astfel încât doar un singur șirag de mărgele se va potrivi pe ei) pentru a face acest lucru biochimie compatibil cu matrice pe baza de secvențiere. Se adaugă, de asemenea, margele mai mici, care poartă enzime imobilizate, de asemenea, necesare pentru pirosequencing (ATP sulfurilază și luciferază)., În timpul secvențierii, o parte a matricei semi-ordonate funcționează ca o celulă de flux pentru introducerea și îndepărtarea reactivilor de secvențiere, în timp ce cealaltă parte este legată de un pachet de fibră optică pentru detectarea semnalului bazat pe CCD (charge-coupled device). La fiecare dintre câteva sute de cicluri, se introduce o singură specie de nucleotidă neetichetată. Pe șabloane în cazul în care acest lucru duce la un eveniment de încorporare, pirofosfat este eliberat., Prin intermediul ATP sulfurilazei și luciferazei, evenimentele de încorporare conduc imediat la generarea unei explozii de lumină, care este detectată de CCD ca corespunzând coordonatelor matricei de puțuri specifice. Spre deosebire de alte platforme, prin urmare, secvențierea prin sinteză trebuie monitorizată ” live (adică camera nu se mișcă în raport cu matricea). Pe mai multe cicluri (de exemplu, A-G-C-T-A-G-C-T…), modelul evenimentelor de încorporare detectate dezvăluie secvența șabloanelor reprezentate de margele individuale., Ca și Heliscopul (discutat mai jos), secvențierea este „asincronă” prin faptul că unele caracteristici pot merge înainte sau în spatele altor caracteristici, în funcție de secvența lor în raport cu ordinea adăugării de bază.o limitare majoră a tehnologiei 454 se referă la homopolimeri (adică instanțe consecutive ale aceleiași baze, cum ar fi AAA sau GGG). Deoarece nu există nici o fracțiune de terminare care să împiedice încorporări consecutive multiple la un anumit ciclu, lungimea tuturor homopolimerilor trebuie dedusă din intensitatea semnalului., Acest lucru este predispus la o rată de eroare mai mare decât discriminarea încorporării față de neincorporare. În consecință, tipul de eroare dominant pentru platforma 454 este inserarea-ștergerea, mai degrabă decât substituirea. În raport cu alte platforme de generație următoare, avantajul cheie al platformei 454 este lungimea citită. De exemplu, instrumentul 454 FLX generează ∼400.000 de citiri pe instrument-rulate la lungimi de 200 până la 300 bp. În prezent, costul per bază al secvențierii cu platforma 454 este mult mai mare decât cel al altor platforme (de ex.,, SOLiD și Solexa), dar poate fi metoda de alegere pentru anumite aplicații în care lungimile de citire sunt critice (de exemplu, asamblarea de novo și metagenomica).
Illumina Genome Analyzer. Denumit în mod obișnuit ca „Solea”‘, această platformă își are originile în munca de Turcatti și colleages22,23 și fuziunea a patru companii— „Solea” (Essex, marea BRITANIE), Lynx Terapeutica (Hayward, CA, statele UNITE ale americii), Manteia Medicina Predictiva (Coinsins, Elveția) și Illuminati., Bibliotecile pot fi construite prin orice metodă care dă naștere unui amestec de fragmente flancate de adaptor până la câteva sute de perechi de bază (bp) în lungime. Caracteristicile de secvențiere amplificate sunt generate de Podul PCR21, 22 (Fig. 2b). În această abordare, atât primerii PCR înainte cât și invers sunt legați de un substrat solid printr-un linker flexibil, astfel încât toți ampliconii care rezultă din orice moleculă șablon unică în timpul amplificării rămân imobilizați și grupați într-o singură locație fizică pe o matrice., Pe platforma Illumina, bridge PCR este oarecum neconvențional în a se baza pe cicluri alternative de extensie cu polimeraza Bst și denaturarea cu formamidă. „Clusterele” rezultate constau fiecare din ∼1,000 ampliconi clonali. Mai multe milioane de clustere pot fi amplificate de a distinge locații în fiecare dintre cele opt independent lanes, care sunt pe un singur flux de celule (astfel că opt biblioteci independente pot fi ordonate în paralel în același instrument rula)., După cluster generație, ampliconilor sunt single stranded (liniarizare) și secvențierea primer este hibridizat cu un universal secvență flanchează regiunea de interes. Fiecare ciclu de interogare a secvenței constă dintr-o extensie cu o singură bază cu o polimerază ADN modificată și un amestec de patru nucleotide (Fig. 3b). Aceste nucleotide sunt modificate în două moduri., Ele sunt reversibile terminatori’, în care o compoziție chimică cleavable constituită la 3′ hidroxil poziție permite numai o singură bază de încorporare să apară în fiecare ciclu; și una din cele patru etichete fluorescente, de asemenea, din punct de vedere chimic cleavable, corespunde identității fiecărui nucleotide23. După extinderea cu o singură bază și achiziționarea de imagini în patru canale, scindarea chimică a ambelor grupuri se stabilește pentru următorul ciclu. Citește-lungimi de până la 36 bp sunt în prezent de rutină; Citește mai mult sunt posibile, dar poate suporta o rată de eroare mai mare.,
Citeste-lungimi sunt limitat de mai mulți factori care determina semnalul de degradare și dephasing, cum ar fi incompletă clivaj de etichete fluorescente sau de încheiere moieties. Tipul de eroare dominant este substituția, mai degrabă decât inserțiile sau ștergerile (iar homopolimerii sunt cu siguranță mai puțin o problemă decât cu alte platforme, cum ar fi 454). Ratele medii de eroare brute sunt de ordinul a 1-1, 5%, dar bazele de precizie mai mari cu rate de eroare de 0,1% sau mai puțin pot fi identificate prin intermediul măsurătorilor de calitate asociate fiecărui apel de bază., Ca și în cazul altor sisteme, modificările au permis recent citirile pereche pereche; de exemplu, fiecare caracteristică de secvențiere care produce 2 × 36 bp independente citește derivate de la fiecare capăt al unei molecule de bibliotecă date de câteva sute de baze în lungime.
AB SOLiD. Această platformă își are originile în sistemul descris de J. S. și colleagues13 în 2005 și în munca de McKernan și colleagues26 la Agencourt Personal Genomica (Beverly, MA, statele UNITE ale americii) (dobândite de către applied Biosystems (Foster City, CA, statele UNITE ale americii) în 2006)., Bibliotecile pot fi construite prin orice metodă care dă naștere la un amestec de scurt, adaptor-flancat fragmente, deși mult efort cu acest sistem a fost pus în protocoalele de partener-asociat biblioteci de taguri cu controlabile și extrem de flexibil distanța distributions13,19. Caracteristicile de secvențiere clonală sunt generate prin emulsie PCR, cu ampliconi capturați pe suprafața margelelor paramagnetice de 1-µm20 (Fig. 2a). După ruperea emulsiei, perlele care poartă produse de amplificare sunt recuperate selectiv și apoi imobilizate la un substrat plan solid pentru a genera o matrice densă, dezordonată., Secvențierea prin sinteză este condus de un ADN ligase13,24,26,27,28, mai degrabă decât un polimeraza. Un primer universal complementar secvenței adaptorului este hibridizat la gama de margele purtătoare de amplicon. Fiecare ciclu de secvențiere implică ligarea unei populații degenerate de octameri marcați fluorescent (Fig. 3c). Amestecul octamer este structurat, în sensul că identitatea poziției(pozițiilor) specifice din octamer (de exemplu, baza 5) se corelează cu identitatea etichetei fluorescente., După ligare, imaginile sunt achiziționate în patru canale, colectând în mod eficient date pentru aceleași poziții de bază pe toate margelele purtătoare de șabloane. Apoi, octamerul este scindat chimic între pozițiile 5 și 6, îndepărtând eticheta fluorescentă. Rundele progresive de ligare octamer permit secvențierea fiecărei baze a 5-a (de exemplu, bazele 5, 10, 15, 20). După finalizarea mai multor astfel de cicluri, grundul extins este denaturat pentru a reseta sistemul. Iterațiile ulterioare ale acestui proces pot fi direcționate către un set diferit de poziții (de ex.,, baze de 4, 9, 14, 19), fie prin utilizarea unui primer care este setat înapoi una sau mai multe baze de adaptor-inserare nod, sau prin folosirea diferitelor amestecuri de octamers în cazul în care o altă poziție (de exemplu, baza 2) este corelată cu eticheta. O caracteristică suplimentară a acestei platforme implică utilizarea codificării cu două baze, care este o schemă de corectare a erorilor în care două baze adiacente, mai degrabă decât o singură bază, sunt corelate cu eticheta26., Fiecare poziție de bază este apoi interogată de două ori (o dată ca prima bază și o dată ca a doua bază, într-un set de 2 bp interogat pe un ciclu dat), astfel încât greșelile pot fi identificate mai ușor.
Un sistem legate de SOLiD este Polonator, de asemenea, bazate în parte pe sistemul dezvoltat de J. S. și Biserica group13 la Harvard. Această platformă utilizează, de asemenea, caracteristici de secvențiere generate de emulsie PCR și secvențiere prin ligare. Cu toate acestea, costul instrumentului este substanțial mai mic decât cel al altor instrumente de secvențiere de a doua generație., În plus, instrumentul este open source și programabil, care ar putea permite inovarea utilizatorilor (de exemplu, utilizarea biochimiilor alternative). Cu toate acestea, lungimile de citire actuale pot fi limitate semnificativ.un dezavantaj suplimentar, comun pentru 454, SOLiD și Polonator, este că emulsia PCR poate fi greoaie și dificilă din punct de vedere tehnic., Pe de altă parte, este posibil ca secvențiere pe o mare densitate serie de foarte mici (1 µm) margele (cu succesiunea de ligatura, polimeraza extensie, sau un alt biochimie) ar putea reprezenta cel mai simplu posibilitatea de a realiza extrem de mare de date densități, pur și simplu pentru că 1-µm margele fizic exclude unul pe altul la o distanță, care este pe ordinea de limita de difractie. În plus, de înaltă rezoluție comanda de 1 µm șirag de mărgele, tablouri, ca recent described29, pot permite limita de un pixel pe secvențierea caracteristică să fie abordat cu atenție.
Heliscop., Helicos sequencer18, bazat pe munca lui Quake group30, se bazează, de asemenea, pe interogarea ciclică a unei game dense de caracteristici de secvențiere. Cu toate acestea, un aspect unic al acestei platforme este că nu este necesară amplificarea clonală. În schimb, un sistem de detectare a fluorescenței extrem de sensibil este utilizat pentru a interoga direct molecule unice de ADN prin secvențiere prin sinteză., Bibliotecile de șabloane, pregătite prin fragmentare aleatorie și poly – a (adică fără amplificare PCR), sunt capturate prin hibridizare la oligomeri poly-T legați la suprafață pentru a obține o gamă dezordonată de șabloane de secvențiere cu o singură moleculă amorsată. La fiecare ciclu, se adaugă ADN polimerază și o singură specie de nucleotidă marcată fluorescent, rezultând o extensie dependentă de șablon a duplexurilor de șablon de grund imobilizat la suprafață (Fig. 3d)., După achiziționarea de imagini tigla matrice completă, clivaj chimic și eliberarea etichetei fluorescente permite ciclul ulterior de extindere și imagistică. Așa cum este descris într-un raport recent18, câteva sute de cicluri de extensie cu o singură bază (adică A, G, C, T, A, G, C, T…) randament mediu citit-lungimi de 25 bp sau mai mare. Aspecte notabile ale acestui sistem includ următoarele. În primul rând, la fel ca platforma 454, secvențierea este asincronă, deoarece unele componente vor cădea înainte sau în spatele altora într-o manieră dependentă de secvență., Șansa joacă, de asemenea, un rol, deoarece unele șabloane pot pur și simplu să nu se încorporeze într-un anumit ciclu, în ciuda faptului că au baza corespunzătoare în poziția următoare. Cu toate acestea, deoarece acestea sunt molecule unice, dephasing-ul nu este o problemă și astfel de evenimente nu duc în sine la erori.
În al doilea rând, nu există nicio parte terminală pe nucleotidele marcate. Ca și în cazul sistemului 454, prin urmare, rulările homopolimer sunt o problemă importantă. Cu toate acestea, deoarece moleculele unice sunt secvențiate, problema poate fi atenuată prin limitarea ratei evenimentelor de încorporare. În plus, Harris și colab.,18 a menționat că încorporările consecutive ale nucleotidelor etichetate la homopolimeri au produs o interacțiune de stingere care a permis autorilor să deducă numărul discret de încorporări (de exemplu, A versus AA versus AAA).în al treilea rând, precizia secvențierii brute poate fi îmbunătățită substanțial printr-o strategie cu două treceri în care matricea șabloanelor cu o singură moleculă (aici cu adaptoare la ambele capete) este secvențiată așa cum este descris mai sus și apoi copiată complet. Deoarece firul nou sintetizat este legat la suprafață, șablonul original poate fi îndepărtat prin denaturare., Secvențierea amorsată de la adaptorul distal produce apoi oa doua secvență pentru același șablon, obținută în orientarea opusă. Pozițiile care sunt concordante între cele două citiri au scoruri de calitate asemănătoare phred care se apropie de 30 (refs. 8,18).
și în cele din urmă, în mare parte secundar încorporării bazelor contaminante, neetichetate sau neetichetate, tipul de eroare dominant este ștergerea (rata de eroare 2-7% cu o singură trecere; 0.2–1% cu două treceri). Cu toate acestea, ratele de eroare de substituție sunt substanțial mai mici (0,01–1% cu o singură trecere)., Cu două treceri, rata de eroare de substituție brută per bază (care se apropie de 0,001%) poate fi în prezent cea mai scăzută dintre toate platformele din a doua generație.