蛋白質結構預測

維基百科,自由的百科全書
氨基酸組成可以被分析來預測二級,三級和四級蛋白質結構。

蛋白質結構預測(英語:Protein structure prediction)是指從蛋白質的氨基酸序列中預測蛋白質的三維結構。也就是說,從蛋白質的一級結構預測它的摺疊二級三級四級結構。結構預測與蛋白質設計英語Protein design的反問題有着根本的不同。蛋白質結構預測是生物信息學與理論化學所追求的最重要目標之一;它在醫學上(例如,在藥物設計)和在生物技術上(例如,新的的設計)都是非常重要的。每隔兩年,當前蛋白質結構預測技術的性能在蛋白質結構預測技術的關鍵測試(CASP)實驗中被評測。蛋白質結構預測的網絡伺服器連續的評測是由社區項目CAMEO3D英語CAMEO3D執行。

蛋白質結構和術語

蛋白質是由氨基酸鏈通過肽鍵連接在一起。與α碳原子相連的C-N鍵和C-C鍵相對旋轉,產生了蛋白質主鏈的多種構象,也正是這些構象變化造成了蛋白質三維結構上的差異。每一個氨基酸的主鏈都是極性的,即 碳氧雙鍵上的碳原子帶正電性、氧原子帶負電性(δ+ C=O δ-),氧原子可以作為氫鍵受體;氮氫單鍵有(δ- N-H δ+),氮原子可以作為氫鍵供體。這些基團在蛋白質結構中便可以相互作用。根據側鏈結構的不同可以分為20種常見氨基酸,各自在蛋白質中扮演着重要的角色。甘氨酸(Glycine)的角色往往很特殊,因為它的側鏈是最小的,只有一個氫原子,沒有側鏈的空間位阻就增加了主鏈的局部靈活性。半胱氨酸(Cysteine)可以與另一個半胱氨酸發生交聯反應形成二硫鍵,使蛋白質整體更加穩定。

蛋白質結構的形成以二級結構元素(Secondary Structure Elements, SSE)為基礎,二級結構中有α螺旋和β摺疊,它們共同構成了蛋白質鏈的三級結構。在這些常見的二級結構中,相鄰的氨基酸之間形成氫鍵,主鏈也有類似的Φ(或者φ,Phi)和Ψ(Psi)角。

ψ and Ψ 角的定義

這些結構的形成使每個氨基酸主鏈的極性得到了中和和穩定。在疏水環境裏,二級結構常常緊密地堆疊形成蛋白質核心。每個氨基酸側鏈的體積的限制,加之與鄰近側鏈可能產生的相互作用的限制,我們需要運用分子模擬與結構疊合的手段來預測蛋白質的細微結構[1]

α螺旋

一個α-螺旋帶氫鍵(黃色點)

α螺旋是在蛋白質二級結構中最豐富的類型。α螺旋的平均每個螺旋周期包含3.6個氨基酸,形成一個氫鍵,在每4個殘基中;平均長度為10個氨基酸(3個螺旋)或10埃(Å),但變化範圍5到40(Å)(1.5個至11個螺旋)。沿螺旋排列的氫鍵也構成了帶部分電荷的偶極矩,氮端帶部分正電。因為氮端有自由的氨基,可以與帶負電的基團,比如磷酸基團,進行反應。α螺旋常位於蛋白質核心區靠近表面的位置,有利于于水環境發生作用。面向蛋白內部的螺旋傾向於採用更多的疏水氨基酸,面向外部的多為親水氨基酸。因此,螺旋鏈上每四個氨基酸中位置處於的第三位的多為疏水,這也很特徵很容易被識別出。比如對亮氨酸拉鏈模體(Leucine zipper motif)有高度預測性的重複特徵是兩個相鄰的螺旋相對的面上均有亮氨酸的存在。螺旋輪圖可以顯示出這種重複性的特徵。其它的藏在蛋白質核心區或者細胞膜內的α螺旋會更經常分佈疏水氨基酸,這樣的結構也更能被預測。 暴露在螺旋表面的氨基酸中疏水氨基酸所佔的比例會更小。所以說氨基酸的類別組成可以用來預測α螺旋區域。那些有更多丙氨酸(Alanine,A)、穀氨酸(Glutamic acid,E)、亮氨酸(Leucine,L)、蛋氨酸(methionine,M),更少脯氨酸(Proline,P)、甘氨酸(Glycine,G)、酪氨酸(Tyrosine,Y)、絲氨酸 (Serine,S)的氨基酸容易形成α螺旋。脯氨酸通常破壞或者使α螺旋更不穩定,但是在更長可以存在因為它在α螺旋中形成一個彎折。

β摺疊

環肽鏈

捲曲

一個二級結構的區域不是一個α螺旋,一個β摺疊,或可識別的轉動,通常被稱為一個捲曲(Coils)[1]

蛋白質分類

蛋白質結構和序列分類術語

參考文獻

  1. ^ 1.0 1.1 Mount DM. Bioinformatics: Sequence and Genome Analysis 2. Cold Spring Harbor Laboratory Press. 2004. ISBN 0-87969-712-1. 

延伸閲讀

參閱

外部連結