跳转到内容

比较基因组学

维基百科,自由的百科全书
全基因组比对是比较基因组学的经典方法。此处为耶尔辛氏菌属的八种细菌的比对:可以看出在所有八株菌种中都有这78个保守序列模块。Each chromosome has been laid out horizontally and homologous blocks in each genome are shown as identically colored regions linked across genomes. Regions that are inverted relative to Y. pestis KIM are shifted below a genome's center axis.[1]

比较基因组学Comparative genomics)是基于基因组图谱和测序技术,对已知的基因特征和基因组结构进行比较以了解基因的功能、表达机制和不同物种亲缘关系生物学研究[2][3]。基因组的特征可包括的DNA序列基因,基因顺序,调控序列,和其它的基因组结构标志[3]

种间比较基因组学研究

通过对不同亲缘关系物种的基因组序列进行比较,能够鉴定出编码序列、非编码调控序列及给定物种独有的序列。而基因组范围之内的序列比对,可以了解不同物在核苷酸组成、同线性关系和基因顺序方面的异同,进而得到基因分析预测与定位、生物系统发生进化关系等方面的信息。

全基因组的比较研究

比较基因组学的基础是相关生物基因组的相似性。两种具有较近共同祖先的生物,它们之间具有种属差别的基因组是由祖先基因组进化而来,两种生物在进化的阶段上越接近,它们的基因组相关性就越高。如果生物之间存在很近的亲缘关系,那么它们的基因组就会表现出同线性(synteny),即基因序列的部分或全部保守。这样就可以利用模基因组之间编码顺序上和结构上的同源性,通过已知基因组的作图信息定位另外基因组中的基因,从而揭示基因潜在的功能、阐明物种进化关系及基因组的内在结构。

系统发生的进化关系分析

生物其中一个特征是进化,比较基因组学同样以进化理论作为理论基石,同时其研究结果又前所未有地丰富和发展了进化理论。当在两种以上的基因组间进行序列比较时,实质上就得到了序列在系统发生树中的进化关系。基因组信息的增多使得在基因组水平上研究分子进化、基因功能成为可能。通过对多种生物基因组数据及其垂直进化、水平演化过程进行研究,就可以对与生命至关重要的基因的结构及其调控作用有所了解。但由于生物基因组中约有1.5%~14.5%的基因与“横向迁移现象”有关,即基因可以在同时存在的种群间迁移,这样就会导致与进化无关的序列差异。因此在系统发生分析中需要建立较完整的生物进化模型,以避免基因转移和欠缺合适的多物种共有保守序列的影响。

种内比较基因组学研究

同种群体内基因组存在大量的变异和多态性,正是这种基因组序列的差异构成了不同个体与群体对疾病的易感性和对药物与环境因子不同反应的遗传学基础。

单核苷酸多态性

单核苷酸多态性(single-nucleotide polymorphism,SNP)是指在基因组水平上由于单个核苷酸位置上存在转换或颠换等变异所引起的DNA序列多态性。根据SNP 在基因中的位置,可分为基因编码区SNP(coding-region SNP,cSNP)、基因周边SNP(perigenic SNP,pSNP)以及基因间SNP(intergenic SNP,iSNP)等3 类。2005年2月17日公布的第一份人类基因多态性图谱是依据基因“连锁不平衡原理”,利用基因芯片在71 个欧洲裔美国人(白色人种)、非洲裔美国人(黑色人种)和汉族华裔美国人(黄色人种)中鉴别出了158 万个单一核苷酸变异的DNA 位点,这个图谱将有助于预测某些疾病发生的可能性以及施以最佳治疗方案,在实现基于基因的个体化医疗目标的征途上走出了重要的一步。

拷贝数多态性

在全基因组测序和基因芯片技术发明前,受限于基因组内高通量DNA拷贝数检测手段,人们对全基因组范围内的拷贝数多态性英语Copy-number variation(Copy-number variation, or copy number polymorphism,CNP)数量和分布知之甚少。2004年,全球内数个“人类基因组计划”研究基地意外地发现,表型正常的人群中,不同的个体间在某些基因的拷贝数上存在差异,一些人丢失了大量的基因拷贝,而另一些人则拥有额外、延长的基因拷贝,研究人员称这种现象为“基因拷贝数多态性”。正是由于CNP 才造成了不同个体间在疾病、食欲和药效等方面的差异。研究表明,平均2 个个体间存在11 个CNP的差异,CNP 的平均长度为465 kb,其中半数以上的CNP 在多个个体中重复出现,并经常定位于其他类型的染色体重排附近。

应用

农业

农业是获取比较基因组学的好处的领域。识别有利基因的基因座是为优化产量,成本效益,质量和抗病性而优化的作物的关键步骤。例如,对517个水稻地方品种进行的一个全基因组关联研究揭示了与几种农艺性状相关的80个基因座,如谷物重量,直链淀粉含量,和耐旱性。许多基因座以前没有表征[4]。这种方法不仅功能强大,而且速度也快。识别与农艺性状相关的基因座的先前方法需要几代仔细监测亲本菌株的繁殖,而这耗时的努力在比较基因组研究就不需要了[5]

医学

医学领域也受益于比较基因组学研究。由于基因组方法的问题,特别是疫苗技术已经在技术上取得了有益的进展。在反向疫苗学英语Reverse vaccinology的方法中,研究人员可以通过分析病原体或病原体家族的基因组来发现疫苗开发的候选抗原[6]

研究

比较基因组学在其他研究领域也开辟了新的途径。随着DNA定序技术的发展,出现越来越多样不同的定序方式,同次定序能检验出的基因组数量也有所增加。 随着可用基因组数据的不断增加,比较基因组推断的效力也在增长。 在最近的灵长类动物研究中发现了这种增加的效力的一个显着的例子。 比较基因组方法使得研究人员可以使用先前的数据和方法收集关于灵长类动物遗传变异,差异基因表达和进化动态的信息[7]

参阅

参考资料

  1. ^ Darling AE, Miklós I, Ragan MA. Dynamics of Genome Rearrangement in Bacterial Populations. PLOS Genetics. 2008, 4 (7): e1000128. doi:10.1371/journal.pgen.1000128.  开放获取
  2. ^ Touchman, J. Comparative Genomics. Nature Education Knowledge. 2010, 3 (10): 13 [2014-01-02]. (原始内容存档于2013-11-01). 
  3. ^ 3.0 3.1 Xia, X. Comparative Genomics. Heidelberg: Springer. 2013 [2016-06-19]. ISBN 978-3-642-37145-5. (原始内容存档于2016-08-14). 
  4. ^ Huang, X.H.; et al. Genome-wide association studies of 14 agronomic traits in rice landraces. Nature Genetics. 2010, 42 (11): 961-U76. doi:10.1038/ng.695.  开放获取
  5. ^ Morrell, P.L., Buckler, E.S., Ross-Ibara, J. Crop genomics: advances and applications. Nature Reviews Genetics. 2012, 13 (2): 85–96. doi:10.1038/nrg3097.  开放获取
  6. ^ Seib, K.L., Zhao, X., Rappuoli, R. Developing vaccines in the era of genomics: a decade of reverse vaccinology. Clinical Microbiology and Infection. 2012, 18 (SI): 109–116. doi:10.1111/j.1469-0691.2012.03939.x.  开放获取
  7. ^ Rodgers J.; Gibbs R.A. Applications of Next-Generation Sequencing Comparative primate genomics: emerging patterns of genome content and dynamics. Nature Reviews Genetics. 2014, 15 (5): 347–359. doi:10.1038/nrg3707.  开放获取

外部链接