第三代測序的希望與陷阱
日期:2012-07-27 08:42:23
去年4月當(dāng)美國太平洋生物科學(xué)公司Pacific Biosciences ( PacBio)宣布它將開始銷售其商業(yè)PacBio RS系統(tǒng)時(shí),該公司預(yù)計(jì)第三代測序產(chǎn)品的發(fā)售將“立馬擴(kuò)展DNA測序在諸如癌癥研究、病原體檢測和農(nóng)業(yè)等領(lǐng)域的應(yīng)用”。不同于市場上的第二代系統(tǒng),PacBio RS系統(tǒng)能夠?qū)崿F(xiàn)單分子實(shí)時(shí)測序反應(yīng),在一天內(nèi)生成結(jié)果。此外,跨越幾千個(gè)DNA堿基的長序列讀取將使從頭測序成為可能,通過跨越重復(fù)區(qū)域可簡化序列組裝,并增進(jìn)對拷貝數(shù)變異的檢測。由于不需要DNA擴(kuò)增,這一系統(tǒng)將減少基因組覆蓋度中的某些人為假象(artifact)和偏差。
然而一年多過去了,現(xiàn)在看來研究人員對采用第三代測序技術(shù)一直保持慎重。為何?其中一個(gè)缺點(diǎn)就是錯(cuò)誤率相對較高。盡管通過環(huán)形共有序列(CCS),包括多次測序較短模板,可以獲得高準(zhǔn)確度,PacBio RS儀器生成了平均不到85%核苷酸準(zhǔn)確度的單次讀取。“這些測序讀取的高錯(cuò)誤率已經(jīng)被視為這一技術(shù)的主要限制,”國家生物防御分析與對策中心基因組學(xué)研究人員Adam Phillippy說。
為了解決這一問題,馬里蘭大學(xué)國家生物防衛(wèi)分析和反制中心的Adam Phillippy及同事們開發(fā)了一種新的融合技術(shù)將第二代和第三代測序技術(shù)結(jié)合到一起生成了近乎完全準(zhǔn)確的長讀取,這一成果報(bào)道在7月1日的《自然生物技術(shù)》(Nature Biotechnology)雜志上。將這一技術(shù)應(yīng)用到鸚鵡基因組,通過首先繪制短讀序列,計(jì)算高度準(zhǔn)確的融合共有序列,校正了個(gè)別的長讀序列。短讀和PacBio RS CCS是通過454 和Illumina測序儀生成,長單次讀取是通過PacBio RS生成。“我們開發(fā)了首個(gè)能夠校正和組裝PacBio RS單分子序列讀取的算法,并證實(shí)PacBio RS技術(shù)的高錯(cuò)誤率可以設(shè)法得到控制,從而大大改善基因組和轉(zhuǎn)錄組的組裝,”Phillippy說。
和平共存?
但是仍有許多的工作要做。例如,軟件開發(fā)商需要更多時(shí)間來趕上新儀器。Phillippy 說:“第三代測序儀正在生成一種全新類型的測序數(shù)據(jù)。過去5年或更長時(shí)間以來算法開發(fā)幾乎完全集中于高通量、高準(zhǔn)確度的短讀數(shù)據(jù)。將軟件開發(fā)過程轉(zhuǎn)向一個(gè)新焦點(diǎn)還需要相當(dāng)長的時(shí)間。”Phillippy的算法是朝著這一正確方向邁出的一步,因?yàn)樾U淖x取可以利用現(xiàn)有無法處理高錯(cuò)誤率的生物信息工具來進(jìn)行分析。
該技術(shù)還需要改善其可靠性、通量及成本才能具有競爭力。Phillippy說:“從454 和 Illumina技術(shù)引入到被廣泛接受,并將Sanger測序推至小角色之前,也存在相似的兩至三年的滯后。”
Pacific Biosciences正處于改善儀器通量及延伸讀取長度的進(jìn)程中。公司產(chǎn)品管理總監(jiān)Edwin Hauw說:“系統(tǒng)硬件本身并沒有改變,但我們正在改善化學(xué)和軟件。”目前,該系統(tǒng)非常適用于研究微生物基因組,但它的通量限制了對更大基因組的研究。“對于某些應(yīng)用它的成本高昂,因此對人類基因組或其他大型基因組采用針對性測序是當(dāng)下最佳的策略,”Hauw說。
一旦這些障礙被克服,新技術(shù)將使研究人員能夠深入了解許多與拷貝數(shù)變異和其他不容易用第二代測序技術(shù)研究的大型結(jié)構(gòu)變異相關(guān)的疾病,例如癌癥、自閉癥和染色體疾病。長單分子測序也可以揭示對于包含在基因組非編碼內(nèi)含子和基因內(nèi)區(qū)域中的“無用DNA”的認(rèn)識,這些“無用DNA”被認(rèn)為起著重要的調(diào)控作用,但由于無法正確組裝而沒有得到廣泛研究。
但第三代測序技術(shù)不太可能很快取代之前的技術(shù)。最終,對于測序技術(shù)的選擇將取決于特異的研究問題。例如種群研究需要高深度測序,人類單核苷酸多態(tài)性調(diào)查或表達(dá)研究等仍然最好用第二代技術(shù)開展研究以非常低的成本生成大量的數(shù)據(jù)。“直到第三代技術(shù)能夠與這種每個(gè)堿基的成本相稱,其在讀長尤其重要的應(yīng)用例如基因組組裝或結(jié)構(gòu)變異研究中將會受到限制。我期望第二代和第三代技術(shù)將可以和平共存直至產(chǎn)生另一個(gè)巨變,”Phillippy說。






