Alternative strategier for DNA-sekvensering kan bli gruppert inn i flere kategorier (som diskutert tidligere i ref. 4). Disse er (i) microelectrophoretic methods9 (Boks 1), (ii) sekvensering av hybridization10 (Boks 2), (iii) real-time observasjon av enkelt molecules11,12 (Boks 3) og (iv) syklisk-array sekvensering (J. S. et al.13 art. 14)., Her bruker vi informasjonskapsler («andre generasjon» i referanse til de ulike implementeringer av syklisk-array-sekvensering som har nylig blitt realisert i et kommersielt produkt (f.eks., 454-sekvensering (brukes i 454 Genom Sequencere, Roche Anvendt Vitenskap; Basel), Solexa teknologi (brukes i Illumina (San Diego) Genom Analyzer), SOLiD plattform (Applied Biosystems; Foster City, CA, USA), den Polonator (Dover/Harvard) og HeliScope Enkelt Molekyl Sequencer teknologi (Helicos; Cambridge, MA, USA)., Konseptet av syklisk-array sekvensering kan oppsummeres som sekvensering av en tett rekke DNA-funksjoner ved iterativ sykluser av enzymatisk manipulasjon og imaging-baserte data collection15 (Shendure og kolleger16). To rapporter i 2005 beskrev den første integrerte implementeringer av syklisk-array strategier som var både praktisk og kostnadsmessig konkurransedyktige med konvensjonelle sekvensering (J. S. et al.13 art. 14), og andre grupper har raskt followed17,18.,
Selv om disse plattformene er ganske variert i sekvensering biokjemi så vel som i hvordan tabellen er generert, deres arbeid strømmer er konseptuelt lignende (Fig. 1b). Biblioteket tilberedning skjer ved tilfeldig fragmentering av DNA, etterfulgt av in vitro-ligation av felles adapter sekvenser. Alternative protokoller kan brukes til å generere hoppe biblioteker av mate-sammenkoblede koder med kontrollerbar avstand distributions13,19., Generering av clonally gruppert amplikoner å tjene som sekvensering funksjonene kan oppnås ved flere tilnærminger, inkludert in situ polonies15, emulsjon PCR20 eller bridge PCR21,22 (Fig. 2). Hva er felles for disse metodene er at PCR-amplikoner avledet fra noen gitt enkelt bibliotek molekyl ende opp romlig gruppert, enten til et enkelt sted på en plan substrat (in situ polonies, bridge PCR), eller til overflaten av micron-skala perler, som kan utvinnes og klædde (emulsjon PCR)., Den sekvensering prosessen i seg selv består av vekslende sykluser av enzym-drevet biokjemi og imaging-basert datainnsamling (Fig. 3). De plattformer som er diskutert her er alle avhengige av sekvensering av syntese, som er, seriell forlengelse av forberedt maler, men enzymet kjøring syntesen kan enten være en polymerase16,23 eller en ligase13,24. Data er innhentet ved avbildning av hele utvalget i hver syklus (f.eks., av fluoriserende fargestoff nukleotider inngår ved en polymerase).
Globale fordeler av andre generasjon eller syklisk-array strategier, i forhold til Sanger-sekvensering, inkluderer følgende: (i) in vitro-bygging av en sekvensering bibliotek, etterfulgt av in vitro-clonal forsterkning for å generere sekvenser funksjoner, omgår flere flaskehalser som begrenser parallellitet av konvensjonelle sekvensering (som er transformasjonen av E. coli og koloni plukking). (ii) Array-basert sekvensering gir en mye høyere grad av parallellitet enn konvensjonelle kapillær-baserte sekvenser., Som den effektive størrelsen av sekvensering funksjoner kan være på ordre over 1 µm, hundrevis av millioner av sekvensering leser kan potensielt bli hentet parallelt med rastered avbildning av en rimelig størrelse overflate. (iii) Fordi matrise funksjoner er immobilisert på en plan overflate, kan de være enzymatically manipulert av en enkelt reagens volum. Selv om microliter-skala reagens-volumer blir brukt i praksis, disse er i hovedsak amortiseres over hele settet av sekvensering funksjoner på tabellen, slippe den effektive reagens volum per funksjonen til omfanget av picoliters eller femtoliters., Samlet er disse forskjellene fører til dramatisk lavere kostnader for DNA-sekvens produksjon.
fordelene av andre generasjon DNA-sekvensering er for tiden motvirket av flere ulemper. Den mest fremtredende av disse inkluderer les-lengde (for alle nye plattformer, lese-lengder er for tiden mye kortere enn konvensjonelle sekvensering) og raw-nøyaktighet (i gjennomsnitt base-anrop som er generert av nye plattformer er minst ti ganger større enn mindre nøyaktige enn base-anrop generert av Sanger-sekvensering)., Selv om disse begrensningene opprette viktig algoritmisk utfordringer for den umiddelbare fremtid, vi skal huske på at disse teknologiene vil fortsette å forbedre seg med hensyn til disse parametrene, mye som vanlig sekvensering utviklet seg gradvis over tre tiår å nå sin nåværende nivå av teknisk ytelse.
454 pyrosequencing. Den 454 systemet var først neste generasjons sekvensering plattform tilgjengelig som en kommersiell product14. I denne tilnærmingen, biblioteker kan være konstruert ved enhver metode som gir opphav til en blanding av korte, adapter-flankert fragmenter., Clonal sekvensering funksjoner som er generert av emulsjon PCR20, med amplikoner tatt til overflaten av 28-mikrometer perler (Fig. 2a). Etter å bryte emulsjonen, perler er behandlet med denaturant å fjerne oversiktlig tråder, og deretter utsatt for en hybridisering-basert berikelse for amplikon-lager perler (som er, de som var til stede i en emulsjon rommet som støtter en produktiv PCR-reaksjon). En sekvensering primer er hybridiserte til universal adapter i riktig posisjon og orientering, som er rett ved siden starten av ukjent sekvens.,
Sekvensering er utført av pyrosequencing method25 (Fig. 3a). I korte trekk, amplikonet-lager perler er preincubated med Bacillus stearothermophilus (Bst) – polymerase og enkelt-strandet bindende protein, og deretter satt på en microfabricated utvalg av picoliter-skala brønner (med dimensjoner slik at det kun er en perle vil passe per brønn) til å gjengi dette biokjemi kompatibel med array-basert sekvensering. Mindre perler er også lagt til, lager immobilisert enzymer også nødvendig for pyrosequencing (ATP sulfurylase og luciferase)., Under sekvensering, en side av semi-ordnet utvalg funksjoner som en strøm celle for å innføre og fjerne sekvensering reagenser, mens den andre siden er bundet til en fiberoptisk bundle for CCD (charge-coupled device)-basert signal deteksjon. På hver av de flere hundre ganger, én art av umerket nukleotid er innført. På maler der dette resulterer i en inkorporering hendelse, pyrophosphate er utgitt., Via ATP sulfurylase og luciferase, inkorporering hendelser umiddelbart drive generasjon av et utbrudd av lys, som er oppdaget av CCD-som svarer til den matrisen koordinatene for spesifikke brønner. I motsetning til andre plattformer, derfor sekvensering av syntese må overvåkes ‘live (det vil si at kameraet ikke flytter seg i forhold til tabellen). På tvers av flere sykluser (f.eks., A-G-C-T-A-G-C-T…), mønsteret oppdaget inkorporering hendelser viser sekvensen av maler representert ved enkelte perler., Som HeliScope (diskutert nedenfor), sekvensering er «asynkron» i at enkelte funksjoner kan komme foran eller bak andre funksjoner avhengig av rekkefølgen i forhold til rekkefølgen av base tillegg.
En stor begrensning av 454-teknologien knyttet til homopolymers (som er, sammenhengende forekomster av samme base, for eksempel AAA eller GGG). Fordi det er ingen avslutte fraksjonen å hindre flere påfølgende incorporations på en gitt syklus, lengden på alle homopolymers må forstås ut fra signal intensitet., Dette er utsatt for en større feil enn diskriminering av inkorporering versus nonincorporation. Som en konsekvens, den dominerende feil type for 454 plattformen er innsetting-sletting, heller enn en erstatning. I forhold til andre neste generasjon plattformer, den viktigste fordelen av 454-plattformen er lese-lengde. For eksempel, den 454 FLX instrumentet genererer ∼400,000 leser per instrument-kjør på lengder fra 200 til 300 bp. Foreløpig per-base-kostnad av sekvensering med 454-plattformen er mye større enn på andre plattformer (f.eks., SOLiD og Solexa), men det kan være metoden for utvalg for visse bruksområder hvor lang lese-lengder er kritisk (for eksempel, de novo montering og metagenomics).
Illumina Genom Analyzer. Ofte referert til som «den Solexa’, denne plattformen har sin opprinnelse i arbeidet med Turcatti og colleages22,23 og sammenslåingen av fire selskaper, Solexa (Essex, STORBRITANNIA), Gaupe Therapeutics (Hayward, CA, USA), Manteia Intelligent Medisin (Coinsins, Sveits) og Illumina., Bibliotekene kan være konstruert ved enhver metode som gir opphav til en blanding av adapter-flankert fragmenter opp til flere hundre base-par (bp) i lengde. Forsterket sekvensering funksjoner er generert via en bro PCR21,22 (Fig. 2b). I denne tilnærmingen, både framover og bakover PCR-primere som er bundet til et fast substrat av en fleksibel linker, slik at alle amplikoner fremkommer fra en enkelt mal molekyl under forsterkning forbli immobilisert og gruppert til en enkelt fysisk plassering på en rekke., På Illumina-plattformen, broen PCR er noe ukonvensjonelle i å basere seg på vekslende sykluser av utvidelse med Bst-polymerase og denaturering med formamide. Den resulterende ‘klynger’ består hver av ∼1,000 clonal amplikoner. Flere millioner klynger kan forsterkes til skjelnes steder innenfor hver av åtte uavhengige ‘baner’ som er på et enkelt flyt-celle (slik at åtte uavhengige biblioteker kan bli sekvensert parallelt i samme instrument kjøre)., Etter klynge generasjon, amplikoner er enkelt strandet (linearisering) og en sekvensering primer er hybridiserte til en universell sekvens som flankerer regionen av interesse. Hver syklus av sekvensen avhør består av enkelt-base-utvidelse med en modifisert DNA-polymerase og en blanding av fire nukleotider (Fig. 3b). Disse nukleotider er endret på to måter., De er reversible terminators’, i og med at en kjemisk cleavable fraksjonen ved 3′ – hydroksyl stilling gir bare en enkelt-base inkorporering til å skje i hver syklus, og en av fire fluorescerende etiketter, også kjemisk cleavable, svarer til den identiteten til hver nucleotide23. Etter enkelt-base-extension og kjøp av bilder i fire kanaler, kjemisk spalting av begge gruppene stiller opp for neste syklus. Lese-lengder opp til 36 bp er for øyeblikket rutine, lenger leser er mulig, men kan medføre en høyere feilrate.,
Lese-lengder er begrenset av flere faktorer som forårsaker signal forfall og dephasing, for eksempel ufullstendig spalting av fluorescerende etiketter eller avslutte moieties. Den dominerende feil type er substitusjon, snarere enn innsetting eller sletting (og homopolymers er sikkert mindre av et problem enn med andre plattformer som for eksempel 454). Gjennomsnittlig raw-feil-priser på rekkefølgen på 1-1.5%, men høyere nøyaktighet baser med feil priser på 0,1% eller mindre, kan identifiseres gjennom kvalitet beregninger knyttet til hver base-anrop., Som med andre systemer, endringer har nylig aktivert mate-sammenkoblede leser, for eksempel, hver sekvensering funksjonen gir 2 × 36 bp uavhengig leser avledet fra hver ende av en gitt biblioteket molekyl flere hundre baser i lengden.
AB SOLiD. Denne plattformen har sin opprinnelse i det system som er beskrevet av J. S. og colleagues13 i 2005 og i arbeidet med McKernan og colleagues26 på Agencourt Personlige Genomics (Beverly, MA, USA) (kjøpt opp av Applied Biosystems (Foster City, CA, USA) i 2006)., Bibliotekene kan være konstruert ved enhver metode som gir opphav til en blanding av korte, adapter-flankert fragmenter, selv om mye arbeid med dette systemet har blitt satt inn protokoller for mate-sammenkoblede tag biblioteker med kontrollerbar og meget fleksible avstand distributions13,19. Clonal sekvensering funksjoner som er generert av emulsjon PCR, med amplikoner tatt til overflaten av 1-mikrometer paramagnetiske beads20 (Fig. 2a). Etter å bryte emulsjonen, perler lager forsterkning produkter er selektivt gjenopprettet, og så immobilisert til en solid plane underlag for å generere en tett, uordnede utvalg., Sekvensering av syntese er drevet av en DNA-ligase13,24,26,27,28, snarere enn en polymerase. En universal primer som er komplementære til adapter sekvensen er hybridiserte til rekken av amplikon-lager perler. Hver syklus av sekvensering innebærer ligation av en degenerert befolkningen i fluoriserende fargestoff octamers (Fig. 3c). Den octamer blandingen er strukturert i at identiteten til den enkelte stilling(s) i octamer (f.eks., base 5) i samsvar med identiteten til den fluorescerende etiketten., Etter ligation, bilder er kjøpt i fire kanaler, effektivt kan samle inn data for de samme base-stillinger på tvers av alle mal-lager perler. Deretter, octamer er kjemisk spaltet mellom posisjonene 5 og 6, fjerne fluorescerende etiketten. Progressive runder av octamer ligation aktivere sekvensering av hver 5. base (f.eks., baser 5, 10, 15, 20). Etter å ha fullført flere slike sykluser utvidet primer er denaturert for å tilbakestille systemet. Senere iterasjoner av denne prosessen kan være rettet mot et annet sett av posisjoner (f.eks., baserer 4, 9, 14, 19) enten ved å bruke en primer som er satt tilbake en eller flere baser fra adapter-sett inn kryss, eller ved hjelp av ulike blandinger av octamers der en annen posisjon (f.eks., base 2) er korrelert med etiketten. En ekstra funksjon til denne plattformen innebærer bruk av to-base-koding, noe som er en feil-korrigering ordning to tilstøtende baser, snarere enn en enkelt base, er korrelert med label26., Hver base-posisjon er så spørres to ganger (en gang som den første base, og en gang som den andre basen, i et sett med 2 bp avhørt på en gitt syklus) slik at miscalls kan være mer lett identifisert.
Et system i slekt å SOLiD er Polonator, også delvis basert på systemet er utviklet av J. S. og Kirken group13 ved Harvard. Denne plattformen også bruker sekvensering har generert av emulsjon PCR og sekvensering av ligation. Kostnaden av apparatet, er imidlertid vesentlig lavere enn for andre andre generasjons sekvensering instrumenter., I tillegg apparatet er åpen kildekode og programmerbare, potensielt slik at brukeren innovasjon (f.eks., bruk av alternative biochemistries). Gjeldende lese-lengder, kan imidlertid bli betydelig begrenset.
En ekstra ulempe, som er felles for 454, SOLiD og Polonator, er at emulsjon PCR kan være tungvint og teknisk utfordrende., På den annen side er det mulig at sekvensering på en high-density rekke veldig små (1 µm) perler (med sekvensering av ligation, polymerase extension, eller en annen biokjemi) kan representere den mest enkel mulighet til å oppnå ekstremt data med høy tetthet, rett og slett fordi 1-mikrometer perler fysisk utelukke hverandre på en avstand som er på rekkefølgen av diffraksjon grense. Videre, høy oppløsning og bestilling av 1-mikrometer perle-matriser, som nylig described29, kan du aktivere grense på én piksel per sekvensering funksjonen for å være tett nærmet seg.
HeliScope., Den Helicos sequencer18, basert på arbeid av Skjelvet er group30, også er avhengig av syklisk avhør av en tett rekke sekvensering funksjoner. Men, et unikt aspekt av denne plattformen er at ingen clonal forsterkning er nødvendig. I stedet, en svært følsom fluorescens detection system brukes til direkte å avhøre enkelt DNA-molekyler via sekvensering av syntese., Mal biblioteker, utarbeidet av tilfeldige fragmentering og poly-En tailing (det vil si at ingen PCR-amplifikasjon), er tatt med hybridisering til overflaten-tethered poly-T oligomers å gi en uordnede utvalg av primet enkelt-molekylet sekvensering maler. I hver syklus, DNA-polymerase og en enkelt arter av fluoriserende fargestoff nukleotid er lagt til, noe som resulterer i mal-avhengige forlengelse av overflate-immobiliserte primer-mal duplex (Fig. 3d)., Etter oppkjøpet av bilder flislegging hele utvalget, kjemisk spalting og utgivelsen av det fluorescerende label tillater påfølgende syklus av utvidelse og bildebehandling. Som beskrevet i en fersk report18, flere hundre sykluser for enkelt-base-utvidelsen (som er, A, G, C, T, A, G, C, T..) avkastning gjennomsnittlig lese-lengder på 25 bp eller større. Viktige aspekter ved dette systemet inkluderer følgende. Først, som den 454 plattform, sekvensering er asynkron, som noen tråder vil falle foran eller bak andre i en sekvens-avhengig måte., Tilfeldigheter spiller også en rolle, som noen maler kan rett og slett ikke klarer å innlemme på en gitt syklus til tross for å ha riktig base på den neste posisjonen. Imidlertid, fordi disse er enkle molekyler, dephasing er ikke et problem, og slike hendelser ikke i seg selv føre til feil.
Andre, ikke avslutte fraksjonen er til stede på merket nukleotider. Som med 454-systemet, derfor, homopolymer kjører er en viktig sak. Imidlertid, fordi enkelt molekyler blir sekvensert, problemet kan reduseres ved å begrense hastigheten av inkorporering hendelser. I tillegg, Harris et al.,18 bemerket at etterfølgende incorporations av merket nukleotid på homopolymers produsert en leskende interaksjon som gjorde forfatterne til å utlede diskret antall incorporations (f.eks., Et versus AA versus AAA).
Tredje, raw-sekvensering kan nøyaktigheten bli betydelig forbedret ved en to-pass strategi der en rekke enkelt-molekylet maler (her med adaptere i begge ender) er sekvensert, som beskrevet ovenfor, og deretter helt kopiert. Som nylig syntetisert strand bakke-bundet, den opprinnelige malen kan fjernes ved denaturing., Sekvensering primet fra den distale adapter deretter gir en annen rekkefølge for de samme mal, som er innhentet i motsatt retning. Stillinger som er concordant mellom de to leser har phred-som kvalitetspoeng nærmer seg 30 (refs. 8,18).
Og til slutt, i stor grad sekundært til inkorporering av forurensende, umerket eller nonemitting baser, den dominerende feil type sletting (2-7% feilrate med en skje; 0.2–1% med to omganger). Imidlertid, substitusjon feil priser er vesentlig lavere (0.01–1% med ett pass)., Med to omganger, per-base-raw-substitusjon error rate (nærmer seg 0.001%) kan være den laveste av alle andre generasjon plattformer.