Alternative strategier for DNA-sekventering kan inddeles i flere kategorier (som tidligere omtalt i ref. 4). Disse omfatter (i) microelectrophoretic methods9 (Boks 1), (ii) sekventering af hybridization10 (Boks 2), (iii) real-time overvågning af enkelt molecules11,12 (Boks 3), og (iv) cyklisk-array-sekventering (J. S. et al.13 og ref. 14)., Her bruger vi ‘anden generation’ i forhold til de forskellige implementeringer af cyklisk-array-sekventering, der for nylig er blevet realiseret i et kommercielt produkt (fx, 454 sekventering (bruges i 454 Genom-Sequencere, Roche Applied Science, Basel), Solexa teknologi (bruges i Illumina (San Diego) Genom Analyzer), SOLiD platform (Applied Biosystems; Foster City, CA, USA), den Polonator (Dover/Harvard) og HeliScope Enkelt Molekyle-Sequencer-teknologi (Helicos; Cambridge, MA, Amerikas forenede stater)., Begrebet cyklisk-array sekventering kan sammenfattes som sekventering af en tæt række af DNA-funktioner ved gentagne cyklusser af enzymatisk manipulation og afbildning-baserede data collection15 (Shendure og kolleger16). To rapporter i 2005 beskrev de første integrerede implementeringer af cykliske array-strategier, der var både praktiske og omkostningseffektive med konventionel sekventering (J. S. et al .13 og ref. 14), og andre grupper har hurtigt fulgt med17, 18.,

selvom disse platforme er ret forskellige i sekventering af biokemi såvel som i hvordan arrayet genereres, er deres arbejdsstrømme konceptuelt ens (fig. 1b). Bibliotek forberedelse opnås ved tilfældig fragmentering af DNA, efterfulgt af in vitro-ligering af fælles adapter sekvenser. Alternative protokoller kan bruges til at generere hoppebiblioteker af mate-parrede tags med styrbare afstandsfordelinger13,19., Den generation af clonally grupperet amplikoner til at tjene som sequencing funktioner, der kan opnås ved flere forskellige tilgange, herunder in situ polonies15, emulsion PCR20 eller bro PCR21,22 (Fig. 2). Hvad der er fælles for disse metoder er, at PCR-amplifikation, der stammer fra en given enkelt bibliotek molekyle ender rumligt klynger, enten til en enkelt placering på et fladt underlag (in situ polonies, bro PCR), eller til overfladen af micron-skala perler, der kan inddrives, og klædt (emulsion PCR)., Selve sekventeringsprocessen består af skiftende cyklusser af en .ymdrevet biokemi og billedbaseret dataindsamling (fig. 3). De platforme, der diskuteres her, er alle afhængige af sekventering ved syntese, det vil sige seriel udvidelse af primede skabeloner, men en .ymet,der driver syntesen,kan enten være en polymerase16, 23 eller en ligase13, 24. Data erhverves ved billeddannelse af det fulde array ved hver cyklus (f.af fluorescerende mærkede nukleotider inkorporeret af en polymerase).

figur 2: klonal forstærkning af sekventeringsfunktioner.,

(a) 454, Polonatoren og faste platforme er afhængige af emulsion PCR20 for at forstærke klonale sekventeringsfunktioner. Kort sagt, en in–konstrueret adapter-flankeret shotgun bibliotek (vist som guld og turkis adaptere flankerende unikke skær) er PCR-amplificeret (det er, multi-skabelon PCR, ikke multiplex PCR, som kun en enkelt primer par er brugt, svarende til guld og turkis adaptere) i forbindelse med en vand-i-olie-emulsion., En af PCR-primerne er bundet til overfladen (5 ‘ – fastgjort) af mikron-skala perler, der også er inkluderet i reaktionen. En lav skabelonkoncentration resulterer i de fleste perleholdige rum, der enten har nul eller et skabelonmolekyle til stede. I produktive emulsionsrum (hvor både et perle-og skabelonmolekyle er til stede) fanges PCR-ampliconer til overfladen af perlen. Efter at have brudt emulsionen, kan perler, der bærer amplifikationsprodukter, selektivt beriges., Hver klonalt forstærket perle vil bære på sin overflade PCR produkter svarende til amplifikation af et enkelt molekyle fra skabelonbiblioteket. (B) Sole .a-teknologien er afhængig af bridge pcr21,22 (aka ‘cluster PCR’) for at forstærke klonale sekventeringsfunktioner. Kort sagt, et in vitro–konstrueret adapter-flankeret haglgeværbibliotek forstærkes PCR, men begge primere dækker tæt overfladen af et fast substrat, fastgjort i deres 5′ ender af en fleksibel linker., Som følge heraf forbliver amplifikationsprodukter, der stammer fra et givet medlem af skabelonbiblioteket, lokalt bundet nær oprindelsesstedet. Ved afslutningen af PCR indeholder hver klonal klynge 1,000 1.000 eksemplarer af et enkelt medlem af skabelonbiblioteket. Nøjagtig måling af koncentrationen af skabelonbiblioteket er afgørende for at maksimere klyngetætheden samtidig med at man undgår overfyldning.

Figur 3: Strategier for cyklisk array-sekventering.,

(a) Med 454 platform, clonally forstærket 28-µm-perler, der genereres af emulsion PCR tjene som sequencing funktioner og er tilfældigt indbetalt til en microfabricated vifte af picoliter-skala brønde. Med pyrosekventering, hver cyklus består af indførelsen af en single nucleotide arter, efterfulgt af tilsætning af substrat (luciferin, adenosin 5′-phosphosulphate) til at drive lys produktion på wells, hvor polymerase-drevet inkorporering af, at nukleotid fandt sted., Dette efterfølges af en apyrasevask for at fjerne ikke-inkorporeret nukleotid. Billede fra Margulies et al. (2005)14. (B) med Sole .a-teknologien genereres et tæt udvalg af klonalt forstærkede sekventeringsfunktioner direkte på en overflade ved hjælp af bridge PCR (aka cluster PCR). Hver sekventering cyklus omfatter samtidig tilsætning af en blanding af fire ændret deoxynucleotide arter, der hver er forsynet med en af fire fluorescerende etiketter og et reversibelt afslutning-delen på 3′ – hydroxyl-position. En modificeret DNA-polymerase driver synkron forlængelse af primet sekventering funktioner., Dette efterfølges af billeddannelse i fire kanaler og derefter spaltning af både de fluorescerende etiketter og den afsluttende del. (C) med de faste og Polonatorplatforme bruges klonalt forstærkede 1-µm perler til at generere et uordnet, tæt udvalg af sekventeringsfunktioner13. Sekventering udføres med en ligase, snarere end en polymerase13,24,26,27,28. Med fast, hver sekventeringscyklus introducerer en delvist degenereret population af fluorescerende mærkede octamere., Befolkningen er struktureret således, at etiketten korrelerer med identiteten af den centrale 2 bp i octamer (korrelationen med 2 bp, snarere end 1 bp, er grundlaget for to-base kodning)26. Efter ligering og billeddannelse i fire kanaler spaltes den mærkede del af octamer (det vil sige ‘z..’) via en modificeret kobling mellem baser 5 og 6, hvilket efterlader en fri ende for en anden ligationscyklus. Flere sådanne cyklusser vil iterativt forhøre et jævnt fordelt, diskontiguøst sæt baser., Systemet nulstilles derefter (ved denaturering af den udvidede primer), og processen gentages med en anden forskydning (f.eks. en primer, der er sat tilbage fra den oprindelige position med en eller flere baser), således at et andet sæt diskontiguøse baser forhøres i den næste runde af serielle ligationer. (d) med HeliScope-platformen sekventeres enkelt nukleinsyremolekyler direkte, det vil sige, at der ikke kræves noget klonal amplifikationstrin., Poly-A-tailed template molekyler er fanget ved hybridisering til overflade-bundet poly-t oligomerer at give en uordnet vifte af primet enkelt-molekyle sekventering skabeloner. Skabeloner er mærket med Cy3, således at billeddannelse kan identificere den delmængde af array koordinater, hvor en sekventering læsning forventes. Hver cyklus består af den polymerasedrevne inkorporering af en enkelt art fluorescerende mærket nukleotid ved en undergruppe af skabeloner, efterfulgt af fluorescensafbildning af hele array og kemisk spaltning af etiketten. Billede fra Braslavsky et al. (2003)30.,

Globale fordele af anden generation eller cyklisk-array strategier, i forhold til Sanger-sekventering, omfatter følgende: (i) in vitro-konstruktion af et sequencer-biblioteket, efterfulgt af in vitro en forstærkning til at generere sequencing funktioner, omgår flere flaskehalse, der begrænser den parallelitet af konventionelle rækkefølge (det vil sige, transformation af E. coli og koloni picking”). (ii) Array-baseret sekventering muliggør en meget højere grad af parallelisme end konventionel kapillærbaseret sekventering., Da den effektive størrelse af sekventeringsfunktioner kan være i størrelsesordenen 1 µm, kan hundreder af millioner af sekventeringslæsninger potentielt opnås parallelt ved rastered billeddannelse af et rimeligt stort overfladeareal. (iii) da array-funktioner er immobiliseret til en plan overflade, kan de en .ymatisk manipuleres af et enkelt reagensvolumen. Selvom der anvendes mikroliterskala reagensvolumener i praksis, afskrives disse i det væsentlige over det fulde sæt sekventeringsfunktioner på arrayet, droppe det effektive reagensvolumen pr., Kollektivt, disse forskelle oversætte til dramatisk lavere omkostninger til DNA-sekvens produktion.

fordelene ved anden generation af DNA-sekventering opvejes i øjeblikket af flere ulemper. Den mest fremtrædende af disse omfatter læse-længde (for alle de nye platforme, læse-længder er i øjeblikket meget kortere end konventionelle sekventering) og rå nøjagtighed (i gennemsnit base-opkald, der er genereret af de nye platforme, der er mindst ti gange mindre præcise end base-opkald, der er genereret af Sanger-sekventering)., Selv om disse begrænsninger skaber vigtige algoritmiske udfordringer for den nærmeste fremtid, bør vi huske på, at disse teknologier vil fortsætte med at forbedre med hensyn til disse parametre, meget som konventionelle sekventering udviklet sig gradvist over tre årtier at nå frem til sit nuværende niveau af teknisk ydeevne.

454 pyrosekventering. 454-systemet var den første næste generations sekventeringsplatform, der var tilgængelig som et kommercielt produkt14. I denne tilgang kan biblioteker konstrueres ved enhver metode, der giver anledning til en blanding af korte, adapter-flankerede fragmenter., Klonale sekventeringsfunktioner genereres af emulsion PCR20, med ampliconer fanget til overfladen af 28-µm perler (fig. 2a). Efter at bryde den emulsion, perlerne er behandlet med denatureringsmiddel at fjerne løsgående strenge, og derefter udsat for en hybridisering-baseret berigelse for amplikon-forsynet med perler (der er, dem, der var til stede i en emulsion rum understøtter en produktiv PCR-reaktion). En sekventeringsprimer hybridiseres til den universelle adapter i den passende position og orientering, det vil sige umiddelbart ved siden af starten af ukendt sekvens.,

sekventering udføres ved pyrosekventeringsmetoden25 (fig. 3a). I korte amplikon-bærende perler er preincubated med Bacillus stearothermophilus (Bst) – polymerase og enkelt-strenget bindende protein, og derefter deponeres på en microfabricated vifte af picoliter-skala wells (med dimensioner, sådan at kun én perle vil passe per godt) for at gøre dette biokemi kompatibel med array-baseret sekventering. Mindre perler tilsættes også, idet der også kræves immobiliserede en .ymer til pyrosekventering (ATP-svovlylase og luciferase)., Under sekventeringen fungerer den ene side af det semi-ordnede array som en Flo .celle til introduktion og fjernelse af sekventeringsreagenser, mens den anden side er bundet til et fiberoptisk bundt til CCD (charge-coupled device)-baseret signaldetektion. Ved hver af flere hundrede cyklusser introduceres en enkelt art af umærket nukleotid. På skabeloner, hvor dette resulterer i en inkorporeringsbegivenhed, frigives pyrophosphat., Via ATP sulfurylase og luciferase, inkorporeringsbegivenheder driver straks genereringen af en lysudbrud, som detekteres af CCD som svarende til arraykoordinaterne for specifikke brønde. I modsætning til andre platforme skal sekventeringen ved syntese derfor overvåges ‘live (dvs.kameraet bevæger sig ikke i forhold til arrayet). På tværs af flere cyklusser (f T. A-G-C-T-A-G-C-T…), afslører mønsteret af detekterede inkorporeringshændelser sekvensen af skabeloner repræsenteret af individuelle perler., Ligesom HeliScope (diskuteret nedenfor) er sekventeringen ‘asynkron’, idet nogle funktioner kan komme foran eller bag andre funktioner afhængigt af deres rækkefølge i forhold til rækkefølgen af basistilsætningen.

en væsentlig begrænsning af 454-teknologien vedrører homopolymerer (det vil sige på hinanden følgende tilfælde af den samme base, såsom AAA eller GGG). Da der ikke er nogen afsluttende del, der forhindrer flere på hinanden følgende inkorporeringer i en given cyklus, skal længden af alle homopolymerer udledes af signalintensiteten., Dette er tilbøjelig til en større fejlprocent end forskelsbehandling af inkorporering versus nonincorporation. Som følge heraf er den dominerende fejltype for 454 platformen indsættelse-sletning, snarere end substitution. I forhold til andre næste generations platforme er den vigtigste fordel ved 454-platformen læselængde. For eksempel genererer 454 FL.-instrumentet ∼400.000 læsninger pr. instrumentkørsel i længder på 200 til 300 bp. Base-omkostningerne ved sekventering med 454-platformen er meget større end for andre platforme (f. eks., Sole anda), men det kan være den valgte metode til visse anvendelser, hvor lange læselængder er kritiske (f.eks. de novo assembly og metagenomics).

Illumina Genome Analy .er. Almindeligvis omtales som “Solexa’, denne platform har sin oprindelse i arbejde ved Turcatti og colleages22,23 og fusionen af fire virksomheder—Solexa (Essex, UK), Lynx Therapeutics (Hayward, CA, amerikas forenede stater), Manteia Prædiktiv Medicin (Coinsins, Schweiz) og Illumina., Biblioteker kan konstrueres ved enhver metode, der giver anledning til en blanding af adapter-flankerede fragmenter op til flere hundrede basepar (bp) i længden. Forstærkede sekventering funktioner genereres af broen PCR21, 22 (fig. 2b). I denne tilgang er både fremadrettede og omvendte PCR-primere bundet til et fast substrat af en fleksibel linker, således at alle ampliconer, der stammer fra et enkelt skabelonmolekyle under amplifikationen, forbliver immobiliserede og grupperet til en enkelt fysisk placering på et array., På Illumina-platformen er bro-PCR noget ukonventionel ved at stole på skiftende forlængelsescykler med BST-polymerase og denaturering med formamid. De resulterende ‘klynger’ hver består af 1,000 1.000 klonale ampliconer. Flere millioner klynger kan forstærkes til forskellige steder inden for hver af otte uafhængige ‘baner’, der er på en enkelt Flo .celle (således at otte uafhængige biblioteker kan sekventeres parallelt under det samme instrumentkørsel)., Efter klyngegenerering er ampliconerne enkeltstrengede (linearisering), og en sekventeringsprimer hybridiseres til en universel sekvens, der flankerer regionen af interesse. Hver cyklus af sekvensafhør består af enkeltbaseforlængelse med en modificeret DNA-polymerase og en blanding af fire nukleotider (fig. 3b). Disse nukleotider ændres på to måder., De er reversible, terminators’, i og med at en kemisk cleavable-delen på 3′ – hydroxyl-position tillader kun en enkelt-base indbygning at forekomme i hver cyklus, og en af fire fluorescerende etiketter, også kemisk cleavable, svarer til den identitet, hver nucleotide23. Efter enkeltbaseforlængelse og erhvervelse af billeder i fire kanaler sætter kemisk spaltning af begge grupper op til den næste cyklus. Læselængder op til 36 bp er i øjeblikket rutinemæssige; længere læsninger er mulige, men kan medføre en højere fejlrate.,Læselængder er begrænset af flere faktorer, der forårsager signalfald og dephasing, såsom ufuldstændig spaltning af fluorescerende etiketter eller afsluttende dele. Den dominerende fejltype er substitution, snarere end Indsætninger eller sletninger (og homopolymerer er bestemt mindre af et problem end med andre platforme som 454). Gennemsnitlige ra.fejl-satser er i størrelsesordenen 1-1, 5%, men højere nøjagtighed baser med fejlhastigheder på 0,1% eller mindre kan identificeres ved hjælp af kvalitet målinger forbundet med hver base-opkald., Som med andre systemer, modifikationer har for nylig aktiveret mate-parret læser; for eksempel, hver sekventering funktion giver 2 36 36 bp uafhængig læser afledt fra hver ende af et givet bibliotek molekyle flere hundrede baser i længden.

AB faststof. Denne platform har sin oprindelse i det system, der er beskrevet af J. S. og colleagues13 i 2005 og i arbejde ved McKernan og colleagues26 på Agencourt Personlige Genomics (Beverly, MA, USA) (erhvervet af Applied Biosystems (Foster City, CA, amerikas forenede stater) i 2006)., Biblioteker kan konstrueres ved enhver metode, der giver anledning til en blanding af kort, adapter-flankerede fragmenter,skønt der er lagt stor indsats med dette system i protokoller til mate-parrede tagbiblioteker med kontrollerbare og meget fleksible afstandsfordelinger 13, 19. Klonale sekventeringsfunktioner genereres ved emulsion PCR, med ampliconer fanget til overfladen af 1-µM paramagnetiske perler20 (fig. 2a). Efter at have brudt emulsionen genvindes perler, der bærer amplifikationsprodukter, selektivt og immobiliseres derefter til et fast plan substrat for at generere et tæt, uordnet array., Sekventering ved syntese drives af en DNA-ligase13, 24,26,27, 28 snarere end en polymerase. En universel primer komplementær til adaptersekvens hybridiseres til arrayet af amplicon-bærende perler. Hver sekventeringscyklus involverer ligering af en degenereret population af fluorescerende mærkede octamere (fig. 3c). Octamer-blandingen er struktureret, idet identiteten af den eller de specifikke positioner inden for octamer (f.eks. base 5) korrelerer med identiteten af den fluorescerende etiket., Efter ligering erhverves billeder i fire kanaler, der effektivt indsamler data for de samme basepositioner på tværs af alle skabelonbærende perler. Derefter spaltes octamer kemisk mellem positionerne 5 og 6, idet den fluorescerende etiket fjernes. Progressive runder af octamer ligering muliggøre sekventering af hver 5. base (f bases baser 5, 10, 15, 20). Efter afslutningen af flere sådanne cyklusser denatureres den udvidede primer for at nulstille systemet. Efterfølgende iterationer af denne proces kan rettes mod et andet sæt positioner (f. eks.,, baser 4, 9, 14, 19) enten ved hjælp af en primer, der er sat tilbage en eller flere baser fra adapter-insert junction, eller ved anvendelse af forskellige blandinger af octamers hvor en anden position (f.eks base 2) er korreleret med etiketten. Et yderligere træk ved denne platform indebærer brugen af to-basiskodning, hvilket er et fejlkorrektionsskema, hvor to tilstødende baser, snarere end en enkelt base, er korreleret med etiket26., Hver base position er derefter forespørges to gange (en gang som den første base, og en gang som den anden base, i et sæt af 2 bp forhørt på en given cyklus), således at fejlopkald lettere kan identificeres.

et relateret system til det faste stof er Polonatoren, også delvist baseret på systemet udviklet af J. S. og Church group13 ved Harvard. Denne platform bruger også sekventering funktioner genereret af emulsion PCR og sekventering ved ligering. Omkostningerne ved instrumentet er imidlertid væsentligt lavere end for andre anden generation af sekventeringsinstrumenter., Derudover er instrumentet open source og programmerbart, hvilket potentielt muliggør brugerinnovation (f.eks. De nuværende læselængder kan dog være væsentligt begrænsende.

en yderligere ulempe, fælles for 454, SOLiD og Polonatoren, er, at emulsions-PCR kan være besværlig og teknisk udfordrende., På den anden side, er det muligt at rækkefølgen på en high-density vifte af meget små (1 µm) perler (med sekventering af æggelederne, polymerase udvidelse, eller en anden biokemi) kan repræsentere den mest ligetil mulighed for at opnå en meget høj data tætheder, simpelthen fordi 1-µm-perler fysisk udelukke hinanden på en afstand, der er på rækkefølgen af diffraktion grænse. Endvidere, høj opløsning bestilling af 1-µm perle arrays, som for nylig beskrevet29, kan gøre det muligt for grænsen for en PI .el pr sekventering funktion at være tæt nærmede.

HeliScope., Helicos se .uencer18, baseret på arbejde ved Quuake ‘ s group30, også er afhængig af cyklisk forhør af en tæt vifte af sekventering funktioner. Et unikt aspekt af denne platform er imidlertid, at der ikke kræves nogen klonal forstærkning. I stedet bruges et meget følsomt fluorescensdetektionssystem til direkte at forhøre enkelt DNA-molekyler via sekventering ved syntese., Skabelonbiblioteker, udarbejdet af tilfældig fragmentering og poly-A hale (dvs.ingen PCR amplifikation), indfanges ved hybridisering til overflade-bundet poly-t oligomerer at give en uordnet vifte af primet enkelt-molekyle sekventering skabeloner. Ved hver cyklus, DNA-polymerase, og en enkelt art af fluorescensmærkede nukleotid er tilføjet, hvilket resulterer i skabelon-afhængige forlængelse af overflade-immobiliseret primer-skabelon dobbelthuse (Fig. 3d)., Efter erhvervelse af billeder fliser hele array, kemisk spaltning og frigivelse af fluorescerende etiket tillader den efterfølgende cyklus af forlængelse og billeddannelse. Som beskrevet i en nylig rapport18, flere hundrede cykler af single-base forlængelse (det vil sige A, G, C, T, A, G, C, T…) udbytte gennemsnitlige læselængder på 25 bp eller derover. Bemærkelsesværdige aspekter af dette system omfatter følgende. For det første, ligesom 454-platformen, er sekventeringen asynkron, da nogle tråde vil falde foran eller bag andre på en sekvensafhængig måde., Chance spiller også en rolle, da nogle skabeloner simpelthen ikke kan inkorporere i en given cyklus på trods af at de har den passende base i den næste position. Men fordi disse er enkeltmolekyler, er dephasing ikke et problem, og sådanne begivenheder fører ikke i sig selv til fejl.

for det andet er der ingen terminerende del på de mærkede nukleotider. Som med 454-systemet er homopolymerkørsler derfor et vigtigt spørgsmål. Men fordi enkeltmolekyler bliver sekventeret, kan problemet afhjælpes ved at begrænse inkorporeringshastigheden. Derudover Harris et al.,18 bemærkede, at på hinanden følgende inkorporeringer af mærket nukleotid hos homopolymerer producerede en slukkende interaktion, der gjorde det muligt for forfatterne at udlede det diskrete antal inkorporeringer (F.A versus AA versus AAA).

for det tredje kan RA.-sekventeringsnøjagtigheden forbedres væsentligt ved en to-pass-strategi, hvor arrayet af enkeltmolekylskabeloner (her med adaptere i begge ender) sekventeres som beskrevet ovenfor og derefter kopieres fuldt ud. Da den nyligt syntetiserede streng er overfladebundet, kan den originale skabelon fjernes ved denaturering., Sekventering primet fra den distale adapter giver derefter en anden sekvens for den samme skabelon, opnået i den modsatte retning. Positioner, der er enige mellem de to læsninger, har phred-lignende kvalitetsresultater, der nærmer sig 30 (refs. 8,18).

og endelig, stort set sekundært til inkorporering af kontaminerende, umærkede eller nonemitting baser, er den dominerende fejltype sletning (2-7% fejlrate med et pass; 0.2–1% med to pas). Imidlertid er substitutionsfejlfrekvensen væsentligt lavere (0,01–1% med et pass)., Base ra.-substitutionsfejlfrekvens (nærmer sig 0.001%) kan i øjeblikket være den laveste af alle andengenerationsplatforme.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *