蛋白质复合物结构与亲和能数据库的整理与分析研究(2)

第二章蛋白质结构基本理论 2.1蛋白质结构预测 蛋白质的分子结构在现今的科技水平和人类的共识下可以分为一,二,三级结构。蛋白质的空间结构的预测


第二章蛋白质结构基本理论

2.1蛋白质结构预测

蛋白质的分子结构在现今的科技水平和人类的共识下可以分为一,二,三级结构。蛋白质的空间结构的预测可以以他的这三个结构层来进行分类。

结构类型的预测:由蛋白质当中氨基酸所形成的二级结构来进行分类。现今已知结构的蛋白质根据二级结构组成的不同可分为五种类型:α类蛋白质(主要是由α螺旋组成),β类蛋白质(主要是由β折叠组成),α/β类蛋白质(是由α螺旋与β折叠交替的排列组成),α+β类蛋白质(是由分开的α螺旋和β折叠组成,其中β折叠一般是平行结构)和没有规则的蛋白质。这种分类方式是十分科学和先进的。蛋白质和蛋白质之间的区别是人为规定的并不是因为它们本质上的差异。未知的结构蛋白质所属的类型是根据他的结构类型来进行区分的。因为它的结构未知,所以只是根据已知蛋白质来对他进行类比,只能知道它的大概空间结构型。

第二层空间结构预测:第二层空间结构的预测目的是根据一小段的蛋白质基因组来预判它的残基会出现在什么位置。这一步直接关系到整个蛋白质结构预测的准确与否。根据大数据和科学论来讲如果我们这一阶段的准确率达到80%的话,那么就可以基本准确地预测出一个蛋白质分子的空间结构。第二层的空间结构预测有着多种多样的方法。但这些方法还不是十分的成熟和完善,还有很大的进步空间。

第三层空间结构的预测:三维结构的预测是蛋白质结构预测中的终极目标,现今为止还没有一种预测法能候得到相对满意的结果。蛋白质三维结构预测的一个方向是利用二级结构预测的结论和蛋白质的结构类型与折叠类型预测的结果,将可信度比较高的二级结构进行更深层次的组装搭建后得到蛋白质的空间结构。这种方法虽然可以构建出一些蛋白质结构,但是因为它非常依赖之前预测结果,所以受到的限制有很多。而另一个方向是不利用二级结构预测的结果,直接进行三维结构预测的方法。相对成功的理论方法是同源模型法[3]。

2.2蛋白质结构预测方法

蛋白质的结构预测理论基础在现今的情况下是蛋白质的一级结构可决定高级结构。现今蛋白质结构预测的方法总体分为两类。第一种是依据理论来进行分析:当蛋白质的初始结构状态处在热力学中最稳定,能量最低的状态,考虑蛋白质分子中全部原子间的相互作用和蛋白质分子与溶剂间的相互作用,利用分子力学的能量极小化方法,计算蛋白质分子的天然空间结构。每种方法都有他的不足,这种方法存在在的不足是:一,通过理论基础理来计算蛋白质复杂的空间结构要求我们准确地了解蛋白质分子与溶剂相互作用力及对应的能量函数,但是我们目前所掌握的知识还不足以支撑我们对它进行研究;其次,我们在数学方面的研究也没能达到我们的研究需要,这也从侧面说明了一种科技的进步往往需要多方面科学的共同进步,决不能故步自封;最后一点,目前为止我们只是通过实验验证了蛋白质分子空间结构在一定的情况下所具备的生物学功能,但我们并不能肯定的说蛋白质分子自然状态下的空间结构是它整个生命活动中能量最小的时候[4]。

除了上述方法以外,还有另外一种方法:那就是把已经知道结构的蛋白质建立一个数据库,然后对它进行分析研究,通过对这个数据库当中蛋白质第一层结构的分析来预判第二层结构,再建立起可能的三维模型,根据已经总结出的空间结构与一级序列之间的规律,排除掉不合理的模型,再由能量最低原理得到修正的结构,这就是所谓得“基于已知事物的预测法”。第二种方法在蛋白质的空间结构预测方面有着较为广泛的应用,因为它是依据已知确定得数据来进行进一步的分析,有着较高的可信度。不同于第一类方法的是它的预测基础是一定准确的,不会在蛋白质空间结构预测之初就有所误差。