跳至內容

比較基因組學

維基百科,自由的百科全書
全基因組比對是比較基因組學的經典方法。此處為耶爾辛氏菌屬的八種細菌的比對:可以看出在所有八株菌種中都有這78個保守序列模塊。Each chromosome has been laid out horizontally and homologous blocks in each genome are shown as identically colored regions linked across genomes. Regions that are inverted relative to Y. pestis KIM are shifted below a genome's center axis.[1]

比較基因組學Comparative genomics)是基於基因組圖譜和測序技術,對已知的基因特徵和基因組結構進行比較以了解基因的功能、表達機制和不同物種親緣關係生物學研究[2][3]。基因組的特徵可包括的DNA序列基因,基因順序,調控序列,和其它的基因組結構標誌[3]

種間比較基因組學研究

通過對不同親緣關係物種的基因組序列進行比較,能夠鑑定出編碼序列、非編碼調控序列及給定物種獨有的序列。而基因組範圍之內的序列比對,可以了解不同物在核苷酸組成、同線性關係和基因順序方面的異同,進而得到基因分析預測與定位、生物系統發生進化關係等方面的信息。

全基因組的比較研究

比較基因組學的基礎是相關生物基因組的相似性。兩種具有較近共同祖先的生物,它們之間具有種屬差別的基因組是由祖先基因組進化而來,兩種生物在進化的階段上越接近,它們的基因組相關性就越高。如果生物之間存在很近的親緣關係,那麼它們的基因組就會表現出同線性(synteny),即基因序列的部分或全部保守。這樣就可以利用模基因組之間編碼順序上和結構上的同源性,通過已知基因組的作圖信息定位另外基因組中的基因,從而揭示基因潛在的功能、闡明物種進化關係及基因組的內在結構。

系統發生的進化關係分析

生物其中一個特徵是進化,比較基因組學同樣以進化理論作為理論基石,同時其研究結果又前所未有地豐富和發展了進化理論。當在兩種以上的基因組間進行序列比較時,實質上就得到了序列在系統發生樹中的進化關係。基因組信息的增多使得在基因組水平上研究分子進化、基因功能成為可能。通過對多種生物基因組數據及其垂直進化、水平演化過程進行研究,就可以對與生命至關重要的基因的結構及其調控作用有所了解。但由於生物基因組中約有1.5%~14.5%的基因與「橫向遷移現象」有關,即基因可以在同時存在的種群間遷移,這樣就會導致與進化無關的序列差異。因此在系統發生分析中需要建立較完整的生物進化模型,以避免基因轉移和欠缺合適的多物種共有保守序列的影響。

種內比較基因組學研究

同種群體內基因組存在大量的變異和多態性,正是這種基因組序列的差異構成了不同個體與群體對疾病的易感性和對藥物與環境因子不同反應的遺傳學基礎。

單核苷酸多態性

單核苷酸多態性(single-nucleotide polymorphism,SNP)是指在基因組水平上由於單個核苷酸位置上存在轉換或顛換等變異所引起的DNA序列多態性。根據SNP 在基因中的位置,可分為基因編碼區SNP(coding-region SNP,cSNP)、基因周邊SNP(perigenic SNP,pSNP)以及基因間SNP(intergenic SNP,iSNP)等3 類。2005年2月17日公佈的第一份人類基因多態性圖譜是依據基因「連鎖不平衡原理」,利用基因晶片在71 個歐洲裔美國人(白色人種)、非洲裔美國人(黑色人種)和漢族華裔美國人(黃色人種)中鑑別出了158 萬個單一核苷酸變異的DNA 位點,這個圖譜將有助於預測某些疾病發生的可能性以及施以最佳治療方案,在實現基於基因的個體化醫療目標的征途上走出了重要的一步。

拷貝數多態性

在全基因組測序和基因晶片技術發明前,受限於基因組內高通量DNA拷貝數檢測手段,人們對全基因組範圍內的拷貝數多態性英語Copy-number variation(Copy-number variation, or copy number polymorphism,CNP)數量和分佈知之甚少。2004年,全球內數個「人類基因組計劃」研究基地意外地發現,表型正常的人群中,不同的個體間在某些基因的拷貝數上存在差異,一些人丟失了大量的基因拷貝,而另一些人則擁有額外、延長的基因拷貝,研究人員稱這種現象為「基因拷貝數多態性」。正是由於CNP 才造成了不同個體間在疾病、食慾和藥效等方面的差異。研究表明,平均2 個個體間存在11 個CNP的差異,CNP 的平均長度為465 kb,其中半數以上的CNP 在多個個體中重複出現,並經常定位於其他類型的染色體重排附近。

應用

農業

農業是獲取比較基因組學的好處的領域。識別有利基因的基因座是為優化產量,成本效益,質量和抗病性而優化的作物的關鍵步驟。例如,對517個水稻地方品種進行的一個全基因組關聯研究揭示了與幾種農藝性狀相關的80個基因座,如穀物重量,直鏈澱粉含量,和耐旱性。許多基因座以前沒有表徵[4]。這種方法不僅功能強大,而且速度也快。識別與農藝性狀相關的基因座的先前方法需要幾代仔細監測親本菌株的繁殖,而這耗時的努力在比較基因組研究就不需要了[5]

醫學

醫學領域也受益於比較基因組學研究。由於基因組方法的問題,特別是疫苗技術已經在技術上取得了有益的進展。在反向疫苗學英語Reverse vaccinology的方法中,研究人員可以通過分析病原體或病原體家族的基因組來發現疫苗開發的候選抗原[6]

研究

比較基因組學在其他研究領域也開闢了新的途徑。隨着DNA定序技術的發展,出現越來越多樣不同的定序方式,同次定序能檢驗出的基因組數量也有所增加。 隨着可用基因組數據的不斷增加,比較基因組推斷的效力也在增長。 在最近的靈長類動物研究中發現了這種增加的效力的一個顯着的例子。 比較基因組方法使得研究人員可以使用先前的數據和方法收集關於靈長類動物遺傳變異,差異基因表達和進化動態的信息[7]

參閱

參考資料

  1. ^ Darling AE, Miklós I, Ragan MA. Dynamics of Genome Rearrangement in Bacterial Populations. PLOS Genetics. 2008, 4 (7): e1000128. doi:10.1371/journal.pgen.1000128.  開放獲取
  2. ^ Touchman, J. Comparative Genomics. Nature Education Knowledge. 2010, 3 (10): 13 [2014-01-02]. (原始內容存檔於2013-11-01). 
  3. ^ 3.0 3.1 Xia, X. Comparative Genomics. Heidelberg: Springer. 2013 [2016-06-19]. ISBN 978-3-642-37145-5. (原始內容存檔於2016-08-14). 
  4. ^ Huang, X.H.; et al. Genome-wide association studies of 14 agronomic traits in rice landraces. Nature Genetics. 2010, 42 (11): 961-U76. doi:10.1038/ng.695.  開放獲取
  5. ^ Morrell, P.L., Buckler, E.S., Ross-Ibara, J. Crop genomics: advances and applications. Nature Reviews Genetics. 2012, 13 (2): 85–96. doi:10.1038/nrg3097.  開放獲取
  6. ^ Seib, K.L., Zhao, X., Rappuoli, R. Developing vaccines in the era of genomics: a decade of reverse vaccinology. Clinical Microbiology and Infection. 2012, 18 (SI): 109–116. doi:10.1111/j.1469-0691.2012.03939.x.  開放獲取
  7. ^ Rodgers J.; Gibbs R.A. Applications of Next-Generation Sequencing Comparative primate genomics: emerging patterns of genome content and dynamics. Nature Reviews Genetics. 2014, 15 (5): 347–359. doi:10.1038/nrg3707.  開放獲取

外部連結