2021年6月2日 星期三

人類基因體定序(genome sequencing)終於全部完成

 

人類基因體序列印成書的樣子。圖片來源:維基百科

雖然Celera Genomics與國際人類基因體定序集團(International Human Genome Sequencing Consortium)都在2001年宣稱他們完成了人類基因體定序,但其實他們只完成了真染色質(euchromatin,也稱為常染色質)的部分。至於異染色質(heterochromatin)部分以及一些構造比較複雜的部分--加起來總共約佔整個基因體的8%--要不就是沒有完成、要不就是有許多錯誤。

異染色質區域之所以難以解讀,主要是因為它們結構緊密,造成解讀上的困難。異染色質一般分布於細胞核的邊緣地帶,包括了不具遺傳活性的衛星序列、著絲粒及端粒區域,其中的基因皆受到不同程度抑制,在細胞週期的S期(S phase)中,異染色質也比真染色質更晚進行複製。

最近,端粒到端粒集團(Telomere-to-Telomere (T2T) Consortium)運用新的技術,把剩下的8%定序完成了。整個人類基因體約為30.55億鹼基對(base pairs),新增加的兩億鹼基對的序列,共有2,226個基因,其中115個可產生蛋白質。

目前研究團隊先把資料發表在bioRxiv這個平台上(也就是說,還沒經過同儕審查)。

參考文獻:

The complete sequence of a human genome. bioRxiv.

沒有留言:

張貼留言