alternativní strategie sekvenování DNA lze seskupit do několika kategorií(jak již bylo popsáno v ref. 4). Mezi ně patří (i) microelectrophoretic methods9 (Box 1), (ii) sekvenční tím, hybridization10 (Box 2), (iii) v reálném čase pozorování z jednoho molecules11,12 (Box 3) a (iv) cyklické-pole sekvenování (J. S. et al.13 a ref. 14)., Zde jsme používat „druhé generace“, s odkazem na různé implementace cyklický-pole sekvenování, které byly nedávno realizovány v komerčním produktu (např. 454 sekvenování (používá se v 454 Genome Sekvencery, Roche Applied Science; Basel), Solexa (použitá technologie v Illumina (San Diego) Genome Analyzer), Solidní platformu (Applied Biosystems; Foster City, CA, USA), Polonator (Dover/Harvard) a HeliScope jedné Molekuly Sekvencer technologie (Helicos; Cambridge, MA, USA)., Pojem cyklické-pole sekvenování lze shrnout jako sekvenování husté pole DNA funkce iterační cykly enzymatickou manipulaci a zobrazování dat na bázi collection15 (Shendure a colleagues16). Dvě zprávy v roce 2005 popsaly první integrované implementace cyklických strategií, které byly praktické i nákladově konkurenceschopné s konvenčním sekvenováním (J.S. et al.13 a ref. 14) a další skupiny rychle následovaly17,18.,
přestože jsou tyto platformy velmi rozmanité v sekvenční biochemii i v tom, jak je pole generováno, jejich pracovní toky jsou koncepčně podobné (obr. 1b). Příprava knihovny se provádí náhodnou fragmentací DNA, následovanou in vitro ligací běžných adaptorových sekvencí. Alternativní protokoly mohou být použity pro generování skákacích knihoven značek spárovaných s ovladatelnými distribucemi vzdálenosti13, 19., Generace klonově seskupený amplikony sloužit jako sekvenční funkce může být dosaženo pomocí několika přístupů, včetně in situ polonies15, emulze PCR20 nebo most PCR21,22 (Obr. 2). Co je společné pro tyto metody je, že PCR amplikony získané z dané jedné knihovny molekula skončit prostorově sdružené, a to buď na jednom místě na planární substrát (in situ polonies, bridge PCR), nebo na povrchu micron měřítku korálky, které mohou být navrácena, a uspořádaný (emulzní PCR)., Samotný proces sekvenování se skládá ze střídavých cyklů biochemie řízené enzymem a získávání dat na bázi zobrazování (obr. 3). Platformy, které jsou popsány zde všichni spoléhají na sekvenování syntézou, která je, sériové rozšíření nátěrem šablony, ale enzym řízení syntézy může být buď polymerase16,23 nebo ligase13,24. Data jsou získávána zobrazením celého pole v každém cyklu (např. fluorescenčně značených nukleotidů začleněných polymerázou).
Globální výhody druhé generace nebo cyklické-pole strategií, vzhledem k Sanger sekvenování, zahrnují následující: (i) in vitro výstavbu sekvenování knihovna, následuje in vitro klonální amplifikace generovat sekvenční funkce, obchází několik překážek, které omezují paralelismus konvenční sekvenování (to znamená, že transformace E. coli a colony picking). (ii) sekvenování založené na poli umožňuje mnohem vyšší stupeň paralelismu než konvenční sekvenování založené na kapilárách., Jako efektivní velikost sekvenční funkce, může být v řádu 1 µm, stovky milionů sekvenování čte může být potenciálně získané v paralelních, o rastered zobrazování přiměřeně velikosti plochy. (iii) vzhledem k tomu, že vlastnosti pole jsou imobilizovány na rovinný povrch, mohou být enzymaticky manipulovány jediným objemem činidla. I když mikrolitr měřítku objemy činidla se používají v praxi, jsou to v podstatě odepisován kompletní sadu sekvenčních funkcí na pole, klesá efektivní objem činidla na funkce rozsah picoliters nebo femtoliters., Souhrnně se tyto rozdíly promítají do dramaticky nižších nákladů na produkci sekvencí DNA.
výhody sekvenování DNA druhé generace jsou v současné době kompenzovány několika nevýhodami. Nejvýznamnějším z nich patří čtení-délka (pro všechny nové platformy, čtení délky jsou v současné době mnohem kratší, než konvenční sekvenování) a raw přesnost (v průměru base-volání generované nové platformy jsou nejméně desetkrát méně přesné než base-volání generované Sanger sekvenování)., Přestože se tato omezení vytvořit důležité algoritmické úkoly pro nejbližší budoucnost, měli bychom mít na paměti, že tato technologie bude i nadále zlepšovat s ohledem na tyto parametry, stejně jako konvenční sekvenční postupoval postupně po tři desetiletí k dosažení své současné úrovni technického výkonu.
454 pyrosekvencování. Systém 454 byl první sekvenční platformou nové generace, která byla k dispozici jako komerční produkt14. V tomto přístupu, knihovny mohou být konstruovány jakoukoli metodou, která vede ke směsi krátkých, adaptorem lemovaných fragmentů., Klonální sekvenační funkce jsou generovány emulzí PCR20, s amplikony zachycenými na povrchu 28-µm kuliček(obr. 2a). Po rozbití emulze, korálky jsou léčeni denaturační přísada k odstranění untethered pramenů, a potom se podrobí křížení založené na obohacení pro amplikon-ložiska kuličky (tedy těch, které byly přítomny ve emulze prostoru podpoře produktivní PCR reakce). Sekvenční primer je hybridizován s univerzálním adaptérem ve vhodné poloze a orientaci, tedy bezprostředně sousedící se začátkem neznámé sekvence.,
sekvenování se provádí metodou pyrosekvenace25 (obr. 3a). Stručně řečeno, amplikonu-ložiska korálky jsou preincubated s Bacillus stearothermophilus (Bst) polymeráza a single-stranded vázající protein, a pak uloženy na microfabricated pole pikolitry měřítku studny (s rozměry takové, že pouze jeden korálek se hodí na no) k tomu, aby tuto biochemie kompatibilní s array-based sekvenování. Přidávají se také menší kuličky, které nesou imobilizované enzymy také potřebné pro pyrosekvencování (ATP sulfuryláza a luciferáza)., Během sekvenování, na jedné straně částečně seřazeném poli funkce jako průtokové cely pro zavedení a odstranění sekvenování činidla, vzhledem k tomu, že na druhé straně je vázané na optický svazek pro CCD (charge-coupled device)-na základě signálu detekce. Při každém z několika stovek cyklů je zaveden jediný druh neznačeného nukleotidu. Na šablonách, kde to vede k události inkorporace, se uvolňuje pyrofosfát., Prostřednictvím ATP sulfurylázy a luciferázy události inkorporace okamžitě pohánějí vznik výbuchu světla, který je detekován CCD jako odpovídající souřadnicím pole specifických vrtů. Na rozdíl od jiných platforem proto musí být sekvenování syntézou sledováno “ živě (to znamená, že se kamera nepohybuje vzhledem k poli). V průběhu několika cyklů (např. A-G-C-T-A-G-C-T…), vzor zjištěných událostí inkorporace odhaluje posloupnost šablon reprezentovaných jednotlivými korálky., Jako HeliScope (popsány níže), sekvenování je „asynchronní“ v tom, že některé funkce se mohou dostat před nebo za jiné funkce v závislosti na jejich pořadí oproti pořadí základně toho.
hlavní omezení technologie 454 se týká homopolymerů (tj. po sobě jdoucích instancí stejné základny, jako je AAA nebo GGG). Protože tam není žádné ukončení složkou prevence více po sobě jdoucích začlenění v daném cyklu, délka všech homopolymery musí být odvozena z intenzity signálu., To je náchylné k větší míře chyb než diskriminace začlenění versus neinkorporace. V důsledku toho je dominantním typem chyby pro platformu 454 vložení-vymazání, spíše než nahrazení. Ve srovnání s jinými platformami nové generace je klíčovou výhodou platformy 454 délka čtení. Například 454 FLX přístroj generuje ∼400,000 čte na nástroj-běh v délkách 200 na 300 bp. V současné době jsou náklady na sekvenování s platformou 454 mnohem vyšší než náklady na jiné platformy (např.,, SOLiD a Solexa), ale může to být metoda volby pro určité aplikace, kde jsou kritické dlouhé délky čtení (například sestava de novo a metagenomika).
Illumina Genome Analyzer. Obyčejně odkazoval se na jako ‚Solexa‘, tato platforma má svůj původ v práci Turcatti a colleages22,23 a fúze čtyř společností—Solexa (Essex, UK), Lynx Therapeutics (Hayward, CA, USA), Manteia Prediktivní Medicíny (Coinsins, Švýcarsko) a Illumina., Knihovny mohou být konstruovány libovolnou metodou, která vede ke směsi fragmentů lemovaných adaptorem až do délky několika set párů bází (bp). Zesílené funkce sekvenování jsou generovány bridge PCR21, 22 (obr. 2b). V tomto přístupu jsou přední i reverzní PCR primery přivázány k pevnému substrátu pružným linkerem, takže všechny amplikony vznikající z jakékoli molekuly jediné šablony během amplifikace zůstávají imobilizovány a seskupeny do jediného fyzického umístění na poli., Na platformě Illumina je most PCR poněkud nekonvenční, když se spoléhá na střídavé cykly rozšíření s BST polymerázou a denaturací s formamidem. Výsledné ‚shluky‘ se skládají z ∼1000 klonálních amplikonů. Několik milionů klastry mohou být zesíleny, aby odlišitelné umístění v rámci každé z osmi nezávislých ‚pruhů‘, které jsou na jednu proudění-buňky (jako že osm nezávislých knihoven mohou být seřazeny souběžně během stejného nástroje spustit)., Po clusteru generace, amplikony jsou single stranded (linearizace) a sequencing primer je křížený univerzální sekvence lemující oblast zájmu. Každý cyklus sekvence výslech se skládá z single-base extension s modifikovanou DNA polymerázy a směs čtyř nukleotidů (Obr. 3b). Tyto nukleotidy jsou modifikovány dvěma způsoby., Jsou reverzibilní terminátory‘, v tom, že chemicky štěpitelné skupinu na 3′ hydroxylové pozici umožňuje pouze jeden-základní začlenění se vyskytují v každém cyklu, a jeden ze čtyř fluorescenčních štítky, také chemicky štěpitelné, odpovídá identitě každého nucleotide23. Po jednostranném rozšíření a pořízení snímků ve čtyřech kanálech se chemické štěpení obou skupin nastaví na další cyklus. Read-délky až 36 bp jsou v současné době rutinní; delší čtení je možné, ale může dojít k vyšší chybovosti.,
délky čtení jsou omezeny několika faktory, které způsobují rozpad signálu a defasing, jako je neúplné štěpení fluorescenčních štítků nebo ukončení Moodies. Dominantním typem chyby je substituce, spíše než vložení nebo odstranění (a homopolymery jsou určitě méně problémem než u jiných platforem, jako je 454). Průměrné raw chybové sazby jsou v pořadí 1-1, 5%, ale vyšší přesnost báze s mírou chyb 0,1% nebo méně lze identifikovat pomocí metrik kvality spojených s každým base-call., Stejně jako u jiných systémů, úpravy v poslední době povoleno mate-spárované čte; například, každé sekvenční funkci výtěžkem 2 × 36 bp nezávislé čte odvozen od každého konce dané knihovny molekule několik set bází dlouhý.
AB SOLiD. Tato platforma má svůj původ v systému popsal J. S. a colleagues13 v roce 2005 a v práci McKernan a colleagues26 na Agencourt Osobní Genomika (Beverly, MA, USA) (získané Applied Biosystems (Foster City, CA, USA) v roce 2006)., Knihovny mohou být postaveny tím, že každá metoda, která dává vzniknout směs krátkých, adaptér-lemované fragmenty, i když hodně úsilí se tento systém byl uveden do protokolů pro vazbu-párové značky knihovny s ovladatelné a vysoce flexibilní vzdálenost distributions13,19. Klonální sekvenační funkce jsou generovány emulzí PCR, s amplikony zachycenými na povrchu 1-µM paramagnetických beads20 (obr. 2a). Po rozbití emulze, korálky ložiska amplifikační produkty jsou selektivně obnovit, a pak imobilizovány na pevný rovinný substrát pro generování husté, neuspořádané pole., Sekvenování syntézou je poháněn DNA ligase13,24,26,27,28, spíše než polymerázy. Univerzální primer komplementární k sekvenci adaptéru je hybridizován s řadou kuliček nesoucích amplicon. Každý cyklus sekvenování zahrnuje ligaci degenerované populace fluorescenčně značených oktamerů(obr. 3c). Oktamerová směs je strukturována v tom, že identita specifické polohy(y) v oktameru (např. báze 5) koreluje s identitou fluorescenčního štítku., Po ligaci, snímky jsou pořízeny ve čtyřech kanálech, efektivně sbírat data pro stejné základní pozice napříč všemi šablony-ložiska korálky. Potom se oktamer chemicky štěpí mezi polohami 5 a 6 a odstraní se fluorescenční štítek. Progresivní kola oktamerové ligace umožňují sekvenování každé 5. základny (např. báze 5, 10, 15, 20). Po dokončení několika takových cyklů se prodloužený základní nátěr denaturuje, aby se systém resetoval. Následné iterace tohoto procesu mohou být směrovány na jinou sadu pozic (např.,, báze 4, 9, 14, 19) buď pomocí primeru, který je nastaven zpět jeden nebo více bází z adaptéru-insert křižovatky, nebo pomocí různých směsí oktamerů, kde je jiná Poloha (např., báze 2) koreluje s štítkem. Dalším rysem této platformy je použití dvouzákladového kódování, což je schéma korekce chyb, ve kterém jsou dvě sousední základny, spíše než jedna základna, korelovány s label26., Každé základny pozice je pak dotazovány dvakrát (jednou jako první základnu, a jakmile je na druhé metě, v sadě 2 bp vyslýchán na daném cyklu) takové, že miscalls může být více snadno identifikovat.
související systém na Pevnou je Polonator, také částečně založeny na systému, který vyvinul J. S. a Církev group13 na Harvardu. Tato platforma také používá funkce sekvenování generované emulzí PCR a sekvenováním ligací. Náklady na tento nástroj jsou však podstatně nižší než náklady na ostatní sekvenční nástroje druhé generace., Nástroj je navíc open source a programovatelný, což potenciálně umožňuje inovaci uživatelů (např. použití alternativních biochemiků). Současné délky čtení však mohou být výrazně omezující.
Další nevýhodou, společná pro 454, pevná látka a Polonátor, je to, že emulze PCR může být těžkopádná a technicky náročná., Na druhou stranu, je možné, že sekvenování s vysokou hustotou pole velmi malé (1 µm) korálky (s sekvenování ligací, polymerázová rozšíření, nebo další biochemie) může představovat nejjednodušší možnost dosáhnout extrémně vysoké hustoty dat, jednoduše proto, že 1-µm korálky fyzicky vyloučit jeden druhému na vzdálenost, která je na pořadí difrakční limit. Kromě toho může uspořádání 1-µm korálkových polí s vysokým rozlišením, jak bylo nedávno popsáno29, umožnit úzké přiblížení limitu jednoho pixelu na sekvenování.
Heliskop., Helicos sequencer18, založený na práci Quake ‚ s group30, se také spoléhá na cyklický výslech husté řady sekvenačních funkcí. Jedinečným aspektem této platformy je však to, že není vyžadováno žádné klonální zesílení. Místo toho se vysoce citlivý fluorescenční detekční systém používá k přímému dotazování jednotlivých molekul DNA pomocí sekvenování syntézou., Šablony knihoven, připravil náhodné fragmentace a poly-sledoval (to je, ne PCR amplifikace), jsou zachyceny hybridizaci na povrchu-upoutané poly-T oligomery, aby výnos neuspořádanou řadu nátěrem single-molecule sekvenování šablony. V každém cyklu se přidá DNA polymeráza a jediný druh fluorescenčně značeného nukleotidu, což vede k rozšíření duplexů povrchově imobilizovaného primeru (obr. 3d)., Po pořízení snímků obkladů celé pole, chemické štěpení a uvolnění fluorescenčního štítku umožňuje následný cyklus rozšíření a zobrazování. Jak je popsáno v nedávné zprávě18, několik set cyklů rozšíření s jednou základnou (tj. A, G, C, T, A, G, C, T…) výnos průměrné délky čtení 25 bp nebo vyšší. Pozoruhodné aspekty tohoto systému zahrnují následující. Za prvé, stejně jako platforma 454, sekvenování je asynchronní, protože některé prameny budou klesat dopředu nebo za ostatními způsobem závislým na sekvenci., Chance také hraje roli, protože některé šablony mohou jednoduše selhat při začlenění do daného cyklu, přestože mají odpovídající základnu na další pozici. Nicméně, protože se jedná o jednotlivé molekuly, dephasing není problém a takové události samy o sobě nevedou k chybám.
za druhé, na značených nukleotidech není přítomna žádná uzavírací část. Stejně jako u systému 454 jsou proto homopolymerové běhy důležitou otázkou. Nicméně, protože jednotlivé molekuly jsou sekvenovány, problém může být zmírněn omezením rychlosti inkorporace událostí. Navíc, Harris et al.,18 poznamenat, že po sobě jdoucí incorporations značených nukleotidů na homopolymery vyrábí kalení interakce, která umožnila autorům k odvození diskrétní počet incorporations (např. oproti AA oproti AAA).
za Třetí, raw sekvenční přesnost může být podstatně zlepšena tím, že dva-pass strategie, ve které pole single-molecule šablony (zde s adaptéry na obou koncích) je sekvenován, jak je popsáno výše, a pak plně kopírovat. Vzhledem k tomu, že nově syntetizovaný pramen je povrchově vázán, může být původní šablona odstraněna denaturací., Sekvenování připravené z distálního adaptéru pak poskytuje druhou sekvenci pro stejnou šablonu, získanou v opačné orientaci. Pozice, které jsou shodné mezi těmito dvěma čteními, mají skóre kvality podobné phredu blížící se 30 (refs. 8,18).
a konečně, z velké části sekundární k začlenění kontaminujících, neznačených nebo neemitujících bází, dominantním typem chyby je vymazání (2-7% chybovost s jedním průchodem; 0,2–1% se dvěma průchody). Míra chyb u substituce je však podstatně nižší (0,01-1% s jedním průchodem)., Se dvěma průchody může být chybová frekvence raw substituce na bázi (blížící se 0.001%) V současné době nejnižší ze všech platforem druhé generace.