Vaihtoehtoiset strategiat DNA-sekvensointi voi olla ryhmitelty osaksi useita luokat (kuten keskusteltu aiemmin ref. 4). Näitä ovat (i) microelectrophoretic methods9 (Laatikko 1), (ii) sekvensointi, jonka hybridization10 (Laatikko 2), (iii) reaaliaikainen havainto yhden molecules11,12 (Kohta 3) ja (iv) syklinen-array sekvensointi (J. S. et al.13 ja viite. 14)., Täällä, käytämme ”toisen sukupolven” viitaten eri toteutuksia syklinen-array sekvensointi, jotka ovat viime aikoina toteutuneet kaupallinen tuote (esim., 454-sekvensointi (käytetään 454 Genomin Sekvensserit, Roche Applied Science; Basel), Solexa-tekniikka (käytetään Illumina (San Diego) Genome Analyzer), Kiinteän alustan (Applied Biosystems; Foster City, CA, USA), Polonator (Dover/Harvard) ja HeliScope Yhden Molekyylin Sekvensseri-tekniikka (Helicos; Cambridge, MA, USA)., Käsite syklinen-array sekvensointi voidaan tiivistää sekvensointi tiheä joukko DNA: n ominaisuuksia, joita iteratiivinen sykliä entsymaattinen manipulointi ja imaging-based data collection15 (Shendure ja colleagues16). Kaksi raportoi vuonna 2005 kuvattu ensimmäinen integroitu toteutuksia syklinen-joukko strategioita, jotka ovat sekä käytännöllisiä ja kustannuksiltaan kilpailukykyisiä perinteisten sekvensointi (J. S. et al.13 ja viite. 14), ja muut ryhmät ovat nopeasti seuranneet 17, 18.,
Vaikka nämä alustat ovat varsin erilaisia sekvensointi biokemia sekä miten taulukko on luotu, heidän työnsä virrat ovat rakenteeltaan samanlaisia (Kuva. 1 B). Kirjaston valmistelu tapahtuu DNA: n satunnaisella pirstoutumisella, jota seuraa yhteisten adapterisekvenssien in vitro-ligaatio. Vaihtoehtoisia protokollia voidaan käyttää Mate-paritettujen tagien hyppykirjastojen tuottamiseen ohjattavilla etäisyysjakeluilla13, 19., Sukupolven clonally aihekokonaisuuksien amplicons palvelemaan sekvensointi ominaisuudet voidaan saavuttaa useita lähestymistapoja, mukaan lukien in situ polonies15, emulsio PCR20 tai silta PCR21,22 (Fig. 2). Mikä on yhteistä näillä menetelmillä on se, että PCR-amplicons peräisin minkä tahansa yksittäisen kirjaston molekyyli päätyy alueellisesti aihekokonaisuuksien, joko yhden sijainti planar alustan (in situ polonies, silta PCR), tai pinta apple-asteikko helmiä, jotka voidaan ottaa talteen ja puettu (emulsio-PCR)., Sekvensointi prosessi itsessään koostuu vuorottelevat sykliä entsyymi-ajettu biokemian ja imaging-based data acquisition (Fig. 3). Alustat, jotka ovat täällä puhuneet, kaikki luottavat sequencing by synthesis, että on, serial laajentaminen pohjamaalattu malleja, mutta entsyymi ajo synteesi voi olla joko polymerase16,23 tai ligase13,24. Tiedot ovat hankittu kuvantaminen täyden valikoiman jokaisen syklin aikana (esim. fluoresoivasti merkitty nukleotidien sisällytetään polymeraasiketjureaktio).
Global edut toisen sukupolven tai syklinen-array strategioita suhteessa Sanger sekvensointi, ovat seuraavat: (i) in vitro-rakentaminen sekvensointi kirjasto, jonka jälkeen in vitro-klonaalinen vahvistus tuottaa sekvensointi ominaisuudet, kiertää useita pullonkauloja, jotka rajoittavat rinnakkaisuus tavanomainen sekvensointi (eli transformaatio E. coli-ja siirtokunta-poiminta). II) Matriisipohjainen sekvensointi mahdollistaa paljon suuremman rinnakkaisuuden kuin tavanomainen kapillaaripohjainen sekvensointi., Mahdollisimman tehokas koko sekvensointi ominaisuudet, voi olla suuruusluokkaa 1 µm, satoja miljoonia sekvensointi lukee voi mahdollisesti olla saatu rinnakkain rastered kuvantaminen kohtuullisen kokoinen pinta-ala. (iii) koska matriisiominaisuudet on immobilisoitu tasopintaan, niitä voidaan manipuloida entsymaattisesti yhdellä reagenssimäärällä. Vaikka mikrolitra-asteikko reagenssin määriä käytetään käytännössä, nämä ovat pääosin jaksotettuun koko joukko sekvensointi ominaisuudet array, pudottamalla tehokas reagenssi tilavuus per ominaisuus mittakaavassa pikolitran tai femtoliters., Nämä erot johtavat yhdessä dramaattisesti alhaisempiin kustannuksiin DNA-sekvenssituotannossa.
toisen sukupolven DNA-sekvensoinnin etuja kompensoivat tällä hetkellä useat haitat. Näkyvin näistä ovat luku-pituus (kaikki uusia alustoja, luku-pituudet ovat tällä hetkellä paljon lyhyempi kuin tavanomainen sekvensointi) ja raaka-tarkkuus (keskimäärin base-puhelut syntyy uusia alustoja ovat vähintään kymmenkertaiseksi vähemmän tarkka kuin base-puhelut syntyy Sanger-sekvensointi)., Vaikka nämä rajoitukset luoda tärkeitä algoritmista haasteita lähitulevaisuudessa, meidän olisi pidettävä mielessä, että nämä tekniikat ovat edelleen parantaa osalta nämä parametrit, paljon kuin tavanomainen sekvensointi eteni vähitellen yli kolmen vuosikymmenen päästä sen nykyinen taso tekninen suorituskyky.
454 pyrosekvencing. 454 järjestelmä oli ensimmäinen seuraavan sukupolven sekvensointi alustan saatavilla kaupallisena product14. Tässä lähestymistavassa kirjastot voidaan rakentaa millä tahansa menetelmällä, joka aiheuttaa sekoituksen lyhyitä, adapterin reunustamia katkelmia., Klonaalinen sekvensointi ominaisuudet syntyvät emulsio PCR20, jossa amplicons kiinni pintaan 28-µm helmiä (Kuva. 2 a). Rikkomisen jälkeen emulsio, helmiä käsitellään denaturointiaine poistaa untethered säikeet, ja sitten altistettiin hybridisaatio-pohjainen rikastus varten amplicon-laakeri helmiä (eli ne, jotka olivat läsnä emulsio lokero tukee tuottava PCR-reaktio). Sekvensointi pohjamaali on hybridisoitiin universal adaptor klo asianmukaiset sijainti ja suunta, joka on heti vieressä aloittaa tuntematon sekvenssi.,
sekvensointi suoritetaan pyrosekvenssimenetelmällä 25 (Kuva. 3 A). Lyhyesti, amplicon-laakeri helmet ovat preincubated kanssa Bacillus stearothermophilus (Bst) polymeraasi-ja single-stranded sitova proteiini, ja sitten talletetaan päälle microfabricated valikoimaan picoliter mittakaavan wells (mitat siten, että vain yksi helmi mahtuu kohti) tehdä tämän biokemia yhteensopiva array-pohjainen sekvensointi. Myös pienempiä helmiä lisätään, joissa on immobilisoituja entsyymejä, joita tarvitaan myös pyrosekvensointiin (ATP-sulfurylaasi ja luciferaasi)., Aikana sekvensointi, toinen puoli semi-määräsi joukko toiminnot kuin virtauksen solun käyttöön ja poistaminen sekvensointi reagenssit, kun taas toinen puoli on sidottu fiber-optic nippu CCD (charge-coupled device)-perustuu signaalien havaitseminen. Jokaisessa sadassa syklissä otetaan käyttöön yksi yksilöimätön nukleotidilaji. Malleille, joissa tämä johtaa yhtiöittämistapahtumaan, pyrofosfaatti vapautetaan., Kautta ATP sulfurylase ja luciferase, yhtiöittäminen tapahtumia välittömästi ajaa sukupolven puhkeamisen valo, joka havaitaan CCD vastaavan matriisin koordinaatit erityisiä wells. Toisin kuin muilla alustoilla, siksi sequencing by synthesis on seurattava ’live (eli kamera ei liiku suhteessa array). Useita syklejä (esim. A-G-C-T-A-G-C-T…), kuvio osoittaa, yhtiöittäminen tapahtumia paljastaa, sekvenssi malleja edustaa yksittäisiä helmiä., Kuten HeliScope (käsitellään jäljempänä), sekvensointi on ’asynkroninen’ in, että jotkut ominaisuudet voivat saada edellä tai jäljessä muita ominaisuuksia riippuen niiden järjestys suhteessa järjestyksen perusta lisäksi.
merkittävä rajoitus 454 teknologia liittyy homopolymeerit (joka on, peräkkäisen tapauksissa sama pohja, kuten AAA tai GGG). Koska ei ole päättämisestä komponenttina estää useita peräkkäisiä yhtiöittämisten tiettynä aikana, pituus kaikki homopolymeerit on pääteltävä signaalin voimakkuus., Tämä on altis suuremmille virheille kuin yhtiöittämisen syrjintä ja yhtiöittämättömyys. Tämän seurauksena 454-Alustan hallitseva virhetyyppi on pikemminkin lisäys-deleetio kuin substituutio. Muihin seuraavan sukupolven alustoihin verrattuna 454-Alustan keskeinen etu on luettava pituus. Esimerkiksi 454 FLX väline tuottaa ∼400,000 lukee per väline-ajaa pituudet 200-300 bp. Tällä hetkellä 454-Alustan sekvensoinnin peruskustannukset ovat paljon suuremmat kuin muiden alustojen (esim.,, Vankka ja Solexa), mutta se voi olla menetelmän valinta tiettyihin sovelluksiin, joissa pitkä luku-pituudet ovat kriittisiä (esim. de novo-kokoonpano ja metagenomics).
Illumina Genomianalysaattori. Yleisesti nimitystä ’Solexa’, tämä foorumi on saanut alkunsa työn Turcatti ja colleages22,23 ja sulautumisen neljä yritystä—Solexa (Essex, UK), Lynx Therapeutics (Hayward, CA, USA), Manteia Ennustava Lääketiede (Coinsins, Sveitsi) ja Illumina., Kirjastot voidaan rakentaa millä tahansa menetelmällä, joka aiheuttaa sovittimen reunustamien katkelmien sekoituksen jopa useiden satojen emäsparien (BP) pituisiksi. Täydennettyjä sekvensointiominaisuuksia syntyy bridge PCR21, 22 (Kuva. 2 B). Tämä lähestymistapa, sekä eteen-ja taaksepäin PCR-alukkeet ovat kytkettynä kiinteään alustaan joustava linkkeri, niin että kaikki amplicons, jotka aiheutuvat yhden mallin molekyyli aikana vahvistus jää liikkumattomaksi ja aihekokonaisuuksien yksi fyysinen sijainti array., On Illumina foorumi, silta PCR on hieman epäsovinnainen vedota vuorottelevat sykliä extension Bst-polymeraasi ja denaturointi kanssa formamidi. Tuloksena olevat ”klusterit” koostuvat kukin ∼1 000 kloonisesta ampliconista. Useita miljoonia klustereita voi olla täydennetty erotettavissa paikoissa kussakin kahdeksan itsenäistä ’kaistaa’, jotka ovat single flow-cell (siten, että kahdeksan itsenäistä kirjastot voivat olla sekvensoitiin rinnakkain samaan väline ajaa)., Kun klusterin sukupolven, amplicons on yhden pulaan (linearisointi) ja sekvensointi pohjamaali on hybridisoituvan yleinen järjestys reunustavat alueen etua. Jokainen sekvenssikuulustelusykli koostuu yhden emäslaajennuksesta modifioidulla DNA-polymeraasilla ja neljän nukleotidin seoksesta (Kuva. 3 B). Näitä nukleotideja muokataan kahdella tavalla., He ovat palautuvia terminaattoreita’, että kemiallisesti cleavable osa 3′ hydroksyyli-asema sallii vain yhden pohja yhtiöittäminen tapahtuu jokaisen jakson, ja yksi neljästä loisteputki tarroja, myös kemiallisesti cleavable, vastaa kunkin nucleotide23. Kun yksipohjainen laajennus ja kuvien hankkiminen neljässä kanavassa, molempien ryhmien kemiallinen pilkkoutuminen asettuu seuraavaa sykliä varten. Jopa 36 bp: n lukemat ovat tällä hetkellä rutiininomaisia; pidemmät lukemat ovat mahdollisia, mutta voivat aiheuttaa suuremman virhetason.,
Lue-pituudet ovat rajalliset useita tekijöitä, jotka aiheuttavat signaalin hajoaminen ja dephasing, kuten epätäydellinen pilkkominen loisteputki tarroja tai päättämisestä moieties. Vallitseva virhetyyppi on korvaaminen eikä lisäykset tai poistot (ja homopolymeerit ovat varmasti vähemmän ongelma kuin muut alustat, kuten 454). Keskimääräinen raw virhe-hinnat ovat järjestyksessä 1-1, 5%, mutta korkeampi tarkkuus emäkset virhetasot 0,1% tai vähemmän voidaan tunnistaa laatumittarit liittyvät kunkin base-call., Kuten muiden järjestelmien kanssa, muutokset ovat viime aikoina käytössä mate-pariksi lukee; esimerkiksi jokainen sekvensointi-ominaisuus, jolloin saadaan 2 × 36 bp riippumaton lukee johdettu kunkin loppuun tietyn kirjaston molekyyli useita satoja tukikohtia pituus.
AB SOLiD. Tämä foorumi on saanut alkunsa järjestelmän kuvattu J. S. ja colleagues13 vuonna 2005 ja työn McKernan ja colleagues26 klo Agencourt Henkilökohtainen Genomiikka (Beverly, MA, USA) (osti Applied Biosystems (Foster City, CA, USA) vuonna 2006)., Kirjastot voivat olla rakennettu millä tahansa menetelmällä, joka synnyttää sekoitus lyhyt, sovitin-tukena fragmentteja, vaikka paljon vaivaa tämä järjestelmä on otettu protokollia mate-pariksi tag kirjastot hallittavissa ja erittäin joustava etäisyys distributions13,19. Klonaalinen sekvensointi ominaisuudet syntyvät emulsio-PCR, jossa amplicons kiinni pintaan 1-µM paramagneettinen beads20 (Fig. 2 a). Rikkomisen jälkeen emulsio, helmiä laakeri vahvistus tuotteet ovat selektiivisesti talteen, ja sitten liikkumattomaksi vankka planar alustan tuottaa tiheä, sekainen joukko., Sekvensointia synteesillä ohjaa polymeraasin sijaan DNA-ligase13, 24, 26, 27, 28. Muuntimen sekvenssiä täydentävä universal primer hybridisoituu amplicon-kantavien helmien joukkoon. Jokainen sekvensointisykli sisältää fluoresenssilla merkittyjen oktamerien degeneroituneen populaation ligaation (Kuva. 3 C). Se octamer seos on jäsennelty, että identiteetti erityinen asema(s) sisällä octamer (esim. pohja 5) korreloi identiteetti fluoresenssileimalla., Ligaation jälkeen, kuvat ovat hankittu neljä kanavaa, tehokkaasti tietojen kerääminen sama pohja kantoja kaikissa malli-laakeri helmiä. Sitten, octamer on kemiallisesti halkaistut välillä sijoilla 5 ja 6, poistamalla fluoresenssileimalla. Progressiiviset octamer-ligaation kierrokset mahdollistavat jokaisen 5. pohjan jaksottamisen (esim.emäkset 5, 10, 15, 20). Kun olet suorittanut useita tällaisia syklejä, laajennettu pohjamaali on denaturoitu nollata järjestelmän. Tämän prosessin myöhemmät iteraatiot voidaan kohdistaa eri asemiin (esim.,, emäkset 4, 9, 14, 19) joko käyttämällä pohjamaali, joka on asetettu takaisin yhden tai useamman emäksen päässä sovitin-aseta risteyksessä, tai käyttämällä erilaisia seoksia octamers, jossa eri asennossa (esim, pohja 2) korreloi etiketti. Lisäominaisuus tämä foorumi liittyy käytön kaksi-base-koodausta, joka on virhe-korjaus järjestelmä, jossa kaksi vierekkäistä emäkset, pikemminkin kuin yhden pohja, eivät korreloi label26., Jokainen pohja kanta on sitten kysyi kahdesti (kerran, koska ensimmäinen base, ja kerran toinen pohja, joukko 2 bp kuulusteltiin tietyllä cycle) siten, että miscalls voidaan helpommin tunnistaa.
liittyvä järjestelmä SOLiD on Polonator, perustuu myös osittain kehittämä J. S. ja Kirkon group13 Harvardin. Tämä alusta käyttää myös sekvensointi ominaisuuksia syntyy emulsio PCR ja sekvensointi ligation. Instrumentin kustannukset ovat kuitenkin huomattavasti alhaisemmat kuin muiden toisen sukupolven sekvensointilaitteiden., Lisäksi laite on avoimen lähdekoodin ja ohjelmoitavat, mahdollisesti mahdollistaa käyttäjän innovaatioita (esim., vaihtoehtoisten biochemistries). Nykyiset lukemat voivat kuitenkin olla merkittävästi rajoittavia.
ylimääräinen haitta, yhteinen 454, Kiinteä ja Polonator, on se, että emulsio-PCR voi olla raskas ja teknisesti haastava., Toisaalta, on mahdollista, että sekvensointi korkea-tiheys joukko hyvin pieniä (1 µm) helmet (ja sekvensointi, jonka sitomiseen, – polymeraasi tiedostotunnistetta, tai toinen biokemia) voi edustaa selkein mahdollisuus saavuttaa erittäin korkea tiedot tiheys, yksinkertaisesti, koska 1-µm helmiä fyysisesti sulje pois toista väli, joka on order of the diffraction limit. Lisäksi korkean resoluution tilaaminen 1-µm helmi paneelit, kuten äskettäin described29, voi mahdollistaa raja yksi pikseli per sekvensointi-ominaisuus tiiviisti lähestyi.
Heliskooppi., Helicos-sekvenssi18, joka perustuu Quaken group30: n työhön, perustuu myös tiheän sekvensointiominaisuuksien sykliseen kuulusteluun. Ainutlaatuinen piirre tässä alustassa on kuitenkin se, että kloonista vahvistusta ei tarvita. Sen sijaan erittäin herkällä fluoresenssitunnistusjärjestelmällä voidaan suoraan kuulustella yksittäisiä DNA-molekyylejä sekvensoimalla synteesillä., Malli kirjastot, valmistettu satunnainen hajanaisuus ja poly-A pyrstön (eli n PCR-monistus), ovat vangiksi hybridisaatio pinta-kytkettynä poly-T-oligomeerejä tuottaa sekainen joukko pohjamaalattu yhden molekyylin sekvensointi malleja. Jokaisen syklin aikana DNA-polymeraasi ja yhden lajin fluoresoivasti merkitty nukleotidi lisätään, jolloin malli-riippuvainen laajentaminen pinta-liikkumattomaksi primer-malli duplexes (Fig. 3D)., Hankinnan jälkeen kuvia laatoitus koko array, kemiallinen pilkkoutuminen ja vapauttamaan fluoresoiva etiketti mahdollistaa seuraavan syklin laajentaminen ja kuvantaminen. Kuten tuoreessa raportissa18 on kuvattu, useita satoja syklejä yksipohjaista laajennusta (eli A, G, C, T, A, G, C, T…) saadaan keskimääräinen lukupituus 25 bp tai enemmän. Järjestelmän merkittäviä näkökohtia ovat seuraavat. Ensinnäkin, kuten 454-alusta, sekvensointi on asynkroninen, koska jotkut säikeet putoavat eteenpäin tai toisten taakse sekvenssiriippuvaisesti., Mahdollisuus on myös tärkeä rooli, kuten jotkut mallit voivat yksinkertaisesti epäonnistua sisällyttää tietyn syklin huolimatta sopiva pohja seuraavaan asentoon. Koska nämä ovat kuitenkin yksittäisiä molekyylejä, defasointi ei ole ongelma, eivätkä tällaiset tapahtumat itsessään johda virheisiin.
Toiseksi, ei päättämisestä komponenttina on läsnä merkitty nukleotidit. Kuten 454-järjestelmässä, homopolymeerien juoksut ovat siis tärkeä kysymys. Koska yksittäisiä molekyylejä kuitenkin sekvensoidaan, ongelmaa voidaan lieventää rajoittamalla käyttötapahtumia. Lisäksi Harris ym.,18 huomattava, että peräkkäisenä yhtiöittämisten leimatun nukleotidin homopolymeerit tuottanut sammutus vuorovaikutus, joka mahdollisti kirjoittajat päättelevät, huomaamaton määrä yhteisöiltä (esim., vs. AA vs. AAA).
Kolmanneksi, raaka-sekvensointi tarkkuutta voidaan merkittävästi parantaa kaksi-pass strategia, jossa joukko yksi-molekyyli malleja (täällä adapterit molemmissa päissä) on sekvensoitiin kuten edellä on kuvattu, ja sitten täysin kopioida. Kuten äskettäin syntetisoitu juoste on pinta-kytkettynä, alkuperäinen malli voidaan poistaa denaturointi., Sekvensointi pohjustetaan distaalinen sovitin sitten tuottaa toisen sekvenssin samalle mallille, saatu vastakkaiseen suuntaan. Kantoja, jotka ovat sopusoinnussa kahden lukee on phred-kuten laatupisteet lähestyy 30 (refs. 8,18).
Ja lopuksi, suurelta osin toissijainen sisällyttäminen saastuttaa, leimaamaton tai nonemitting emäkset, hallitseva tyyppi virhe on poistaminen (2-7% virhetaso yhdellä pass; 0.2–1% – kaksi kulkee). Korvausvirheitä on kuitenkin huomattavasti vähemmän (0,01-1% yhdellä syötöllä)., Kaksi kulkee, per-pohjan raaka-korvaaminen virhetaso (lähestyy 0.001%) voi tällä hetkellä olla kaikista pienimmät toisen sukupolven alustoille.