2011年7月21日 星期四

從3億到1000:3天定序是怎麼辦到的?

A $1000 Genome by 2013? - ScienceNOW

還記得五月在德國開始流行的出血性大腸桿菌O104嗎?後來這隻大腸桿菌,在三天之內就定序完成,不知道有沒有人想到是怎麼辦到的啊?

當時的文章裡面只提到是所謂的第三代的定序儀,但沒有說第三代的定序儀是怎麼回事,畢竟它雖然不大,但也有460萬個鹼基對(base pairs),要在三天內定序完真的是很不容易。

今天在「自然」期刊上面的一篇文章,說明了第三代定序儀是怎樣辦到的。

最早的定序,是使用同位素(磷32或硫35)標定的雙去氧核糖核苷酸(dideoxy nucleotide),利用DNA鏈延長需要核糖上面的3號碳的OH基與下一個核苷酸上面的磷酸根反應,當我們以人工合成3號碳上帶有H基的核苷酸(雙去氧核糖核苷酸),並將它加入反應時,一旦DNA聚合酶抓到一個雙去氧核糖核苷酸後,會因為產生的DNA末端的3號碳不具有OH基,使DNA聚合反應終止。接著再用凝膠電泳把一條條DNA分開後,讓乾燥的電泳膠片上面的同位素信號在X光片上面顯影,接著就是讀出序列了。

圖片來源:維基百科
上圖就是壓出來的X光片,然後我們就是一個一個序列去讀。純苦工。做反應、跑膠、壓片、讀序列,整個再快也要三天,然後讀出500鹼基對的序列。所以,如果用大腸桿菌來算,460萬個鹼基對,大概需要10,200個定序反應,如果從兩頭一起做,大概需要15,300天才做得完,也就是要42年~

當然,實際上我們都知道當時是很多實驗室一起做,同時技術也在進步,所以並沒有花那麼久的時間來訂出大腸桿菌的序列。

後來,開始有所謂的自動定序儀,雖然一樣是用雙去氧核糖核苷酸,但是這回這些雙去氧核糖核苷酸上面放了不同顏色的發色基,跑膠的部分則是以毛細管電泳來代替,由於這些雙去氧核糖核苷酸上面帶有不同的顏色(核苷酸只有四種,A腺嘌呤,T胸腺嘧啶,G鳥糞嘌呤,C胞嘧啶),當用雷射刺激的時候會發出不同的色光,然後由偵測器來判讀。讀出來的東西像下圖這樣:


圖片來源:維基百科
由於偵測儀器的敏感度較高,自動定序儀至少可以讀到700個鹼基對,如果遇到技術好的公司,甚至還可以更多。目前大部分實驗室送定序都是用這樣的儀器。但是還是相當耗時費事囉,只是耗時費事的不是學生或博士後研究員,而是廠商。


那第三代是怎麼回事呢?第三代定序完全揚棄了使用雙去氧核糖核苷酸!他們利用DNA進行鏈延長反應時,每併入一個核苷酸會產生一個氫離子(H+),使用晶片(ISFET, ion-sensitive field-effect transistor)來偵測由於氫離子的產生造成的酸鹼度的改變(下降0.02pH),得知是否有DNA的合成。

要定序的DNA先打碎,接上帶有已知序列的adaptor DNA並固定在直徑為2微米(2μm)的珠子上,然後將珠子放進有晶片的小洞裡。

圖片網址:自然期刊網站
中間那個圖就是一個個小洞,下面是晶片。

藉由儀器不斷的重複加入四個核苷酸的溶液(中間當然要洗乾淨),偵測,如果使用有120萬個小洞的晶片,跑兩個鐘頭的反應可以讀出2千5百萬個鹼基對!所以大腸桿菌460萬算什麼呢?

當然可能有讀者想,如果兩個鐘頭就可以把大腸桿菌定序完,為什麼上次花了三天呢?事實上定完序列是一件事,但是要把一段段的序列組合、確認、分析,這些部分才是更花時間的。光把一堆ATGC交出來是沒有用的,要整理要分析才能發揮功用不是嗎?所以上次花了三天其實是包括瞭解這大腸桿菌不簡單,它是一個集各家所長的大腸精,這並不是定序儀可以做到的。

定序得那麼快,準確嗎?目前根據研究團隊的分析,準確度比起過去的方法是差不多的,但是光是可以在兩小時內讀出2千5百萬個鹼基對,傳統的定序就遠遠不及啊!更不用提第一次定人類基因序列時,花了3億美金定完3億個鹼基對(真是字字珠璣),以目前的第三代定序儀,未來想要瞭解你自己,可以先花個1000美金把自己的基因定序一下,再請電腦分析、分析,或許比什麼血型、星座更準確喔!

筆者想到當年當研究生的時候,花了半年的功夫定出一萬個鹼基對(10 kb)的序列,看到現在2小時就可以定2千5百萬個,真覺得自己老了....

1 則留言: