admin管理员组

文章数量:1530269

蛋白质结构预测---蛋白质残基的基础知识---接触概念(三)

  • 一、接触(contact)的概念
  • 二、蛋白质的接触矩阵
  • 三、蛋白质的接触矩阵的意义
  • 四、小结

承接上文接下来我会用一条PDBID为1F88的蛋白质为例子,来解释什么叫蛋白质接触矩阵。

一、接触(contact)的概念

先通俗的说,什么叫接触。
比如你和我都走在马路上,你在马路对面走着,我在马路另一边走,我们俩之间的距离很远。我可能都不会注意到有你这么个人,我并不在乎你在干嘛,你是谁,你要去哪里,我对你根本没有反应,因为,我们之间距离很远

相反,如果你和我之间距离过近,都贴到我脸上来了,我肯定会对你有所反应,我会心想你这人干啥呢,离我这么近,你想干嘛,甚至下意识想推开你,说明我因为我们之间距离过近,让我对你产生了反应。

所以,蛋白质残基接触的定义就是空间中2个氨基酸集团的Ca原子(一般用Ca原子来计算接触)的空间距离小于8Å(Å是距离单位)的时候,我们认定这两个氨基酸是处于接触contact状态。

接下来,继续用1F88这条蛋白质来距离。

提问:1F88序列中,处在第一个位置的MET氨基酸和第二个位置的ASN氨基酸 他们是接触还是不接触的呢?

答案:我只需要将pdb坐标文件中2个氨基酸集团中的CA原子分别取出来,然后用空间距离计算公式,计算一下结果便可以得知结果。
Step1 MET_Ca的坐标为(x1,y1,z1)=44.718,-5.054,-26.911。ASN_Ca的坐标为(x2,y2,z2)=44.449,-4.763,-23.103。
Setp2 代入空间中两点距离公式求这俩坐标之间的距离d。
Step3计算得出距离d为70.417122Å。远远大于8Å的距离阈值要求。所以这俩氨基酸在空间中不接触。

二、蛋白质的接触矩阵

在知道什么是接触、接触如何计算之后,我们可以用矩阵的形式,来将一条蛋白质的接触信息展示出来。这个形式就是接触矩阵,或成接触图。

在接触矩阵M中,假设一条蛋白质序列的长度为L。那么这个接触矩阵的维度就是L*L,接触矩阵M是一个沿主对角线对称的矩阵。

矩阵中每一个元素的值要么是0要么是1。0表示不接触,1表示接触。我们可以用i和j来标识。

比如一条长度为10的蛋白质,他的接触矩阵M的维度就是10*10。
如那么第三行第六列为1。就表示该序列的第3个氨基酸与第6个氨基酸他们是接触的。

三、蛋白质的接触矩阵的意义

CASP是二年一次的蛋白质结构预测竞赛,在CASP竞赛中,有专门的的一项就是接触预测竞赛。那么接触的意义是什么? 通俗的说,接触就是一种约束,有了约束,会决定蛋白质在空间中的空间结构(为什么蛋白质的螺旋往左边倾斜,不往右边倾,就是有一种约束在其中作用),而空间结构决定了蛋白质的功能。有了功能能为药物开发等提供研究基础等。所以对接触进行研究是极具意义的。

四、小结

本节终于引出了接触矩阵的含义
Ending~

本文标签: 蛋白质基础知识概念结构