單核苷酸多態性
單核苷酸多態性(英語:Single-Nucleotide Polymorphism,簡稱SNP,讀作/snɪp/)是DNA序列中單個核苷酸的替代導致的、且分佈於種群中相當一部分個體(如:1%以上)中的基因多樣性。例如,對於某種生物,同一位置基因組片段一部分為AAGCCTA,另一部分為AAGCTTA,則認為此處存在SNP、兩種基因型屬於等位基因。
幾乎所有常見的單核苷酸多態性(SNP)位點只有兩個等位基因。單核苷酸態性(SNP)位點的分佈是均勻的,在非編碼區比在編碼區更常見。一般來說,自然選擇傾向於保留最益於遺傳適應性的單核苷酸多態性(SNP)位點。[1]其他因素,如基因重組和突變率也可判斷單核苷酸多態性(SNP)位點的密度。 [2]
單核苷酸多態性(SNP)的密度可以通過微衛星DNA進行預測。AT微衛星是單核苷酸多態性(SNP)密度有效的檢測方式,在單核苷酸多態性(SNP)顯著降低及較低GC含量的區域,AT出現大片重複。 [3]
在一個種群中,單核苷酸多態性(SNP)可以以次要等位基因頻率的形式體現,即那些等位基因頻率很低的基因座。單核苷酸多態性(SNP)等位基因的頻率在不同人群中具有差異性,因此,常見於某地區或民族的單核苷酸多態性(SNP)等位基因在其他的地區或民族則可能很少見。
DNA指紋圖譜是指個體間的遺傳變異(尤其是在基因組的非編碼區),常被用於法醫學。同時,這些遺傳變異也構成了人體對疾病易感性的差異,以及疾病的嚴重程度及治療效果的差異。例如,載脂蛋白E(APOE)的單鹼基突變與阿爾茲海默病發生低風險相關。[4]
人類遺傳基因的各種差異,90%可歸因於SNP引起的基因變異。在人類基因組中,每隔100至300個鹼基就會存在一處SNP位點。每3個SNP位點中有2個會是胞嘧啶(C)和胸腺嘧啶(T)的相互轉變。
類型
SNP類型 |
---|
|
單核苷酸多態性(SNP)根據其在基因中的位置,可以分為基因編碼區、基因非編碼區、基因間隔區(基因之間的區域)。由於基因序列的簡併性,含有編碼序列的單核苷酸多態性(SNP)不一定會改變蛋白質的氨基酸序列。
編碼區的單核苷酸多態性(SNP)有兩種類型:同義和非同義。同義單核苷酸多態性(SNP)並不影響蛋白質序列,而非同義單核苷酸多態性(SNP)則會改變蛋白質的氨基酸序列。
不在蛋白質編碼區的單核苷酸多態性(SNP)仍可能影響基因剪接、轉錄因子結合、信使RNA降解或非編碼區的RNA序列。受到這種單核苷酸多態性(SNP)影響的基因表達被稱為單核苷酸多態性表達(ESNP),可能發生在此基因的上游或下游。
單核苷酸多態性(SNP)可能分佈於編碼基因段或非編碼基因段。由於存在冗餘基因序列,編碼段中的單核苷酸多態性(SNP)不一定會影響蛋白質中的氨基酸序列。
利用及重要性
人類DNA序列的變化可以影響人類疾病的發展和對病原體、化學品、藥品、疫苗等的機體反應。單核苷酸多態性(SNP)也是個性化醫療的關鍵。[5]然而,在生物醫學中最重要的是在全基因組關聯研究中比較同類基因組的不同區域。
單核苷酸多態性的研究在農作物和家畜育種項目中也很重要。識別單核苷酸多態性各種方法的詳細信息,請參閱單核苷酸多態性基因分型。
單核苷酸多態性(SNP)通常是雙等位基因,因此容易檢測分析。[6]單個的單核苷酸多態性(SNP)可能導致孟德爾疾病。對於骨質疏鬆症這種更複雜的疾病,一個位點的單核苷酸多態性(SNP)通常不能單獨起作用,而是與其他位點的單核苷酸多態性(SNP)相互作用而表現出病情。 [7]
截至2012年6月26日,單核苷酸多態性數據庫(dbSNP)已列出人類的53,558,214個單核苷酸多態性(SNP)位點。 [8]單核苷酸多態性(SNP)位點已被用於全基因組關聯研究(GWAS),例如,基因圖譜中的高解像度標記與疾病或正常的特徵有關。單核苷酸多態性(SNP)的知識將有助於了解藥物的代謝動力學(PK)或藥效動力學,即在不同的遺傳變異個體中藥物是如何發揮作用的。單核苷酸多態性(SNP)可能會導致廣泛的人類疾病,如癌症、傳染性疾病(愛滋病,麻風病,肝炎等)、自體免疫性疾病、神經精神性疾病、鐮狀細胞貧血、β地中海貧血症及囊性纖維化等。[9][10][11]與不同單核苷酸多態性(SNP)相關的疾病將可能成為藥物治療的主要基因組目標。 [12]某些單核苷酸多態性(SNP)與不同藥物的代謝有關。[13][14][15]因其世代中的數量及穩定遺傳,對表型沒有影響的單核苷酸多態性(SNP)在全基因組關聯研究(GWAS)中也仍然有用。 [16]
舉例
- rs6311和rs6313是人類13號染色體上HTR2A基因的單核苷酸多態性。
- F5基因的單核苷酸多態性導致血液高凝狀態失調的基因突變。
- rs3091244是人類1號染色體的CRP基因上的三等位基因的單核苷酸多態性。 [17]
- TAS2R38為品嘗能力的遺傳密碼,包含6個標註的單核苷酸多態性位點。[18]
- FCN1基因rs148649884和rs138055828編碼可削弱重組M-ficolin配體的結合能力。 [19]
數據庫
生物信息學數據庫用於對單核苷酸多態性(SNP)相關研究的檢索。單核苷酸多態性數據庫(dbSNP)信息來自生物技術信息中心 (NCBI)。以下列出一些常用SNP相關的數據庫:
數據庫或工作組名稱 | 主要特點 |
---|---|
SNPedia(頁面存檔備份,存於互聯網檔案館) | 維基風格的數據庫,可用於支持人類基因組註釋,解釋和分析 |
OMIM數據庫(頁面存檔備份,存於互聯網檔案館) | 描述多態性與疾病之間的關聯(例如以文本形式給出疾病) |
人類基因突變數據庫(頁面存檔備份,存於互聯網檔案館) | 提供人類遺傳性疾病和功能性單核苷酸多態性(SNP)的基因突變 |
全基因組關聯分析中心(頁面存檔備份,存於互聯網檔案館) | 允許用戶查看目前單個或多個全基因組關聯研究(GWAS)的大體水平 |
國際單核苷酸多態性(SNP)圖譜工作組 | 通過校對嵌入的較大克隆體的基因組序列繪製出基因庫中每個單核苷酸多態性(SNP)的周圍序列[20] |
國際人類基因組單體圖譜計劃 | 在每個項目中研究能識別標記的單核苷酸多態性(SNP)用於確定單倍體的採集 |
命名
單核苷酸多態性(SNP)的命名可能容易混淆:單個的單核苷酸多態性(SNP)可能有幾種表現形式,並且尚未達成共識。其中一種單核苷酸多態性(SNP)的書寫形式是採用前綴,以及周期和「大於」符號來表示野生型和改變後的核苷酸或氨基酸,如c.76A>T。[21][22][23]如上文所示,通常採用核苷酸多態性數據庫的rs號來表示。
單核苷酸多態性(SNP)分析
用於發現新SNP及檢測已知SNP的分析方法包括:
單核苷酸多態性模擬及標籤單核苷酸多態性 (tag SNP) 免費工具:
- GWAsimulator
- PLINK(模塊)
標籤單核苷酸多態性(SNP)表示基因組中具有高的連鎖不平衡的區域中具有代表性的單核苷酸多態性(tag SNP)。它可以識別遺傳變異和關聯的表型基因分型,而無需在染色體區域每個單核苷酸多態性(SNP)進行基因分型,這減少了與疾病相關的基因組分型(genotyping)的費用和時間,因為它不需要研究每一個個體的單核苷酸多態性(SNP)。國際HapMap計劃其中一個應用是由人類基因組圖譜,獲得標籤SNP信息,從而減少了遺傳研究的基因組分型的費用和時間。[27]
Tagger是一種可用於評估基因型數據和選擇標籤單核苷酸多態性 (tag SNP) 的工具,可用於如國際HapMap項目的資料。它是由保羅·德·巴克(Paul de Bakker)在馬薩諸塞州醫院(Massachusetts General Hospital)人類遺傳研究中心和哈佛醫學院Broad研究院的大衛阿特舒勒和馬克 - 達利在中心(Labs of David Altshuler and Mark Daly)的實驗室開發。[28]
CLUSTAG和WCLUSTAG是免費軟件,包含集群和覆蓋算法(cluster and set-cover algorithms)來獲得一組標籤單核苷酸多態性(tag SNP)位點,用來代表一個染色體區域所有已知的單核苷酸多態性(SNP)。該程序用Java實現,並且可以在Windows平台和Unix環境中運行。它們是由區小勇(SIO IONG AO)等人在香港大學開發的。[29][30]
參考文獻
- ^ Barreiro LB, Laval G, Quach H, Patin E, Quintana-Murci L. (2008). "Natural selection has driven population differentiation in modern humans.". Nature Genetics 40: 340–345. doi:10.1038/ng.78. PMID 18246066.
- ^ Nachman, Michael W. (2001). "Single nucleotide polymorphisms and recombination rate in humans". Trends in genetics 17 (9):
- ^ M.A. Varela and W. Amos (2010). "Heterogeneous distribution of SNPs in the human genome: Microsatellites as predictors of nucleotide diversity and divergence".Genomics 95: 151–159. doi:10.1016/j.ygeno.2009.12.003. PMID 20026267.
- ^ Wolf, A. B.; Caselli, R. J.; Reiman, E. M.; Valla, J. (2012). "APOE and neuroenergetics: An emerging paradigm in Alzheimer's disease". Neurobiology of Aging.doi:10.1016/j.neurobiolaging.2012.10.011. PMID 23159550. edit
- ^ Carlson, Bruce (2008-06-15). "SNPs — A Shortcut to Personalized Medicine". Genetic Engineering & Biotechnology News (Mary Ann Liebert, Inc.) 28 (12). Retrieved 2008-07-06. "(subtitle) Medical applications are where the market's growth is expected"
- ^ Sachidanandam, Ravi; Weissman, David; Schmidt, Steven C.; Kakol, Jerzy M.; Stein, Lincoln D.; Marth, Gabor; Sherry, Steve; Mullikin, James C. et al. (2001). "A map of human genome sequence variation containing 1.42 million single nucleotide polymorphisms". Nature 409 (6822): 928–33. doi:10.1038/35057149. PMID 11237013.|displayauthors= suggested (help)
- ^ Singh, Monica; Singh, Puneetpal; Juneja, Pawan Kumar; Singh, Surinder; Kaur, Taranpal (2010). "SNP–SNP interactions within APOE gene influence plasma lipids in postmenopausal osteoporosis". Rheumatology International 31 (3): 421–3. doi:10.1007/s00296-010-1449-7. PMID 20340021.
- ^ 8. NCBI dbSNP build 137 for human.
- ^ Ingram, V. M. (1956). "A specific chemical difference between the globins of normal human and sickle-cell anaemia haemoglobin". Nature 178 (4537): 792–794.PMID 13369537. edit
- ^ Chang, J. C.; Kan, Y. W. (1979). "Beta 0 thalassemia, a nonsense mutation in man". Proceedings of the National Academy of Sciences of the United States of America76 (6): 2886–2889. PMC 383714. PMID 88735. edit
- ^ Hamosh, A.; King, T. M.; Rosenstein, B. J.; Corey, M.; Levison, H.; Durie, P.; Tsui, L. C.; McIntosh, I.; Keston, M.; Brock, D. J.; Macek, M.; Zemková, D.; Krásničanová, H.; Vávrová, V.; Macek, M.; Golder, N.; Schwarz, M. J.; Super, M.; Watson, E. K.; Williams, C.; Bush, A.; O'Mahoney, S. M.; Humphries, P.; Dearce, M. A.; Reis, A.; Bürger, J.; Stuhrmann, M.; Schmidtke, J.; Wulbrand, U.; Dörk, T. (1992). "Cystic fibrosis patients bearing both the common missense mutation Gly----Asp at codon 551 and the delta F508 mutation are clinically indistinguishable from delta F508 homozygotes, except for decreased risk of meconium ileus". American journal of human genetics 51 (2): 245–250. PMC 1682672. PMID 1379413. edit
- ^ Fareed, M., Afzal, M (2013) "Single nucleotide polymorphism in genome-wide association of human population: A tool for broad spectrum service". Egyptian Journal of Medical Human Genetics 14: 123–134. http://dx.doi.org/10.1016/j.ejmhg.2012.08.001 (頁面存檔備份,存於互聯網檔案館).
- ^ Goldstein, J. A. (2001). "Clinical relevance of genetic polymorphisms in the human CYP2C subfamily". British journal of clinical pharmacology 52 (4): 349–355.doi:10.1046/j.0306-5251.2001.01499.x. PMC 2014584. PMID 11678778. edit
- ^ Lee, C. R. (2004). "CYP2C9 genotype as a predictor of drug disposition in humans". Methods and findings in experimental and clinical pharmacology 26 (6): 463–472.PMID 15349140. edit
- ^ Yanase, K.; Tsukahara, S.; Mitsuhashi, J.; Sugimoto, Y. (2006). "Functional SNPs of the breast cancer resistance protein ‐ therapeutic effects and inhibitor development". Cancer Letters 234 (1): 73–80. doi:10.1016/j.canlet.2005.04.039. PMID 16303243. edit
- ^ Thomas, P. E.; Klinger, R.; Furlong, L. I.; Hofmann-Apitius, M.; Friedrich, C. M. (2011). "Challenges in the association of human single nucleotide polymorphism mentions with unique database identifiers". BMC Bioinformatics 12: S4. doi:10.1186/1471-2105-12-S4-S4. PMC 3194196. PMID 21992066. edit
- ^ Morita, Akihiko; Nakayama, Tomohiro; Doba, Nobutaka; Hinohara, Shigeaki; Mizutani, Tomohiko; Soma, Masayoshi (2007). "Genotyping of triallelic SNPs using TaqMan PCR". Molecular and Cellular Probes 21 (3): 171–6. doi:10.1016/j.mcp.2006.10.005. PMID 17161935.
- ^ Prodi, D.A.; Drayna, D; Forabosco, P; Palmas, MA; Maestrale, GB; Piras, D; Pirastu, M; Angius, A (2004). "Bitter Taste Study in a Sardinian Genetic Isolate Supports the Association of Phenylthiocarbamide Sensitivity to the TAS2R38 Bitter Receptor Gene". Chemical Senses 29 (8): 697–702. doi:10.1093/chemse/bjh074.PMID 15466815.
- ^ Ammitzbøll, Christian Gytz (28). "Non-Synonymous Polymorphisms in the FCN1 Gene Determine Ligand-Binding Ability and Serum Levels of M-Ficolin". PLoS ONE 7 (11): e50585. doi:10.1371/journal.pone.0050585.
- ^ Sachidanandam, R.; Weissman, D.; Schmidt, S. C.; Kakol, J. M.; Stein, L. D.; Marth, G.; Sherry, S.; Mullikin, J. C.; Mortimore, B. J.; Willey, D. L.; Hunt, S. E.; Cole, C. G.; Coggill, P. C.; Rice, C. M.; Ning, Z.; Rogers, J.; Bentley, D. R.; Kwok, P. Y.; Mardis, E. R.; Yeh, R. T.; Schultz, B.; Cook, L.; Davenport, R.; Dante, M.; Fulton, L.; Hillier, L.; Waterston, R. H.; McPherson, J. D.; Gilman, B.; Schaffner, S. (2001). "A map of human genome sequence variation containing 1.42 million single nucleotide polymorphisms". Nature 409 (6822): 928–933. doi:10.1038/35057149. PMID 11237013. edit
- ^ J.T. Den Dunnen (2008-02-20). "Recommendations for the description of sequence variants". Human Genome Variation Society. Retrieved 2008-09-05.
- ^ den Dunnen, Johan T.; Antonarakis, Stylianos E. (2000). "Mutation nomenclature extensions and suggestions to describe complex mutations: A discussion". Human Mutation 15 (1): 7–12. doi:10.1002/(SICI)1098-1004(200001)15:1<7::AID-HUMU4>3.0.CO;2-N. PMID 10612815.
- ^ 23. Ogino, Shuji; Gulley, Margaret L.; Den Dunnen, Johan T.; Wilson, Robert B.; Association for Molecular Pathology Training and Education Committee (2007). "Standard Mutation Nomenclature in Molecular DiagnosticsPractical and Educational Challenges". The Journal of Molecular Diagnostics 9 (1): 1–6.doi:10.2353/jmoldx.2007.060081. PMC 1867422. PMID 17251329.
- ^ Altshuler, D; Pollara, V J; Cowles, C R; Van Etten, W J; Baldwin, J; Linton, L; Lander, E S. An SNP map of the human genome generated by reduced representation shotgun sequencing. Nature. 2000, 407 (6803): 513–6. PMID 11029002. doi:10.1038/35035083.
- ^ Drabovich, A.P.; Krylov, S.N. Identification of base pairs in single-nucleotide polymorphisms by MutS protein-mediated capillary electrophoresis. Analytical chemistry. 2006, 78 (6): 2035–8. PMID 16536443. doi:10.1021/ac0520386.
- ^ Griffin, T J; Smith, L M. Genetic identification by mass spectrometric analysis of single-nucleotide polymorphisms: ternary encoding of genotypes. Analytical chemistry. 2000, 72 (14): 3298–302. PMID 10939403. doi:10.1021/ac991390e.
- ^ Bush, William S.; Moore, Jason H.; Lewitter, Fran; Kann, Maricel (27 December 2012). "Chapter 11: Genome-Wide Association Studies". PLoS Computational Biology 8 (12): e1002822. doi:10.1371/journal.pcbi.1002822.
- ^ Tagger. [1 May 2014]. (原始內容存檔於2016-08-23).
- ^ CLUSTAG. [9 March 2024]. (原始內容存檔於2020-10-17).
- ^ WCLUSTAG. [9 March 2024]. (原始內容存檔於2020-10-17).