圖片來源:Science Now |
當初很多人的想法都以為人類基因體計畫一定可以讓我們充分瞭解自己,卻沒想到,當我們把所有的30億(3 billions)GATC都讀完的時候,卻陷入一團迷霧中。
因為:只有3%的基因體帶有產生蛋白質(protein)的基因。
我們一向以為,產生蛋白質的基因應該是最重要的;因為蛋白質會產生「活性」(activity)、形成結構...可是,如果蛋白質就是一切,我們如何去解釋我們的30億核苷酸(nucleotide)序列中,能夠產生蛋白質的序列,只有3%?
為了要解開這個迷霧,美國整府啟動了一個新的大計劃,聯合了32個研究機構,想要進一步解釋餘下的97%的用途。這個大計劃全名是the Encyclopedia of DNA Elements,縮寫成ENCODE,也就是「編碼」。
「編碼」計畫主要的工作包括針對147種細胞(其中有六種做得很詳細)進行電腦分析、進行生化測試、以及定序(1)。為什麼當我們已經知道人類基因體所有30億核苷酸怎麼排列了,還要再去看那147種細胞,或是那6種細胞的基因體呢?他們不是長得跟其他的細胞裡的基因體一樣嗎?
事實上,容或核苷酸的排列是一樣的,但是科學家發現,真正決定為什麼這個細胞會發育成心肌細胞,那個細胞就只能變成骨骼肌,關鍵在於另外那97%的核苷酸序列。
雖然只有3%的人類基因體帶有產生蛋白質的基因,但是「編碼」計畫的科學家發現,80%的基因體是具有生化活性的。他們或許不能產生蛋白質,但是他們可以決定哪一個蛋白質、在哪一個時間點應該要產生,或是不應該產生;有些則會直接產生具有生物化學活性的核糖核酸(RNA, ribonucleic acid),直接參與細胞內的種種反應;而很多基因體上的核苷酸序列,在被化學修飾(chemical modification,最常見的是甲基化methylation)後,會影響到附近的基因是否能被用來產生蛋白質...
雖然只有3%的基因體可以產生蛋白質(大約是21,000基因,比原先想像得要少得多),但是76%的人類基因體其實都有被「翻」(轉錄,transcribe)成核糖核酸;其中包括產生8,800個小核糖核酸的「基因」,以及9,600個產生「長」核糖核酸(由至少200個核糖核苷酸組成)的「基因」。另外,還有11,224個「假」基因,這些序列具有跟產生蛋白質的基因很相似的構造,但是不產生蛋白質(事實上,可能什麼也不做)。
既然決定我們的細胞要怎麼發育成骨骼肌或心肌的關鍵不在那21,000個產生蛋白質的基因上,而是在另外那些會產生核糖核酸的、會被化學修飾的部分,可以想到這中間牽涉到的調節是非常複雜的。「編碼」計畫的科學家們,在我們的基因體上面找到了四百萬個調節點。這些調節點不必然很靠近他負責調節的基因,而且幾個不同的調節點也可以合作。
所以,從兩萬一千個產生蛋白質的基因(原先預估超過十萬個)開始,為了要產生種種不同的人體細胞(2, 有人說210種,有人說411種),那些數不清的小核糖核酸、以及四百萬個調節點,必須要很精密的調節---差之毫釐,失之千里,可能就是遺傳的缺損,或是癌症了。
光是我們自己,這個小乾坤,我們現在可能只瞭解了一個點;我們怎能那麼放心大膽的去玩弄其他生物的基因,期待他會「乖乖」的聽我們的呢?
參考文獻:
1. Elizabeth Pennisi. 2012/9/5. Human Genome Is Much More Than Just Genes - ScienceNOW.
2. Wikipedia. 2012/9/4. List of distinct cell types in the adult human body.
沒有留言:
張貼留言