生命组学
蛋白质之间的互作可以有以下应用:
Eg:改变蛋白质基因,从而组改变结构,削弱蛋白质之间的相互作用。
Eg:数据模拟出蛋白质的靶点,即结合腔,将此数据存入结合化合物的dataset,用于制药
结构预测:
通用方法:首先将得到序列采用Fasta(全局序列比对)&blast(局部序列比对)在PDB中(此数据库中有实验数据和计算预测得到的数据)找模板modeling。找模板的方法可以基于sequence similarity。可以基于structure相似性,因为存在氨基酸序列不同但是最终组成相似结构的情况,此方法quality高。可以基于研究目的(ligands and cofactors)。对于alignment方面,最好采用全局比对,多模板序列比对可得到低相似度结果但比较准确,pair模板序列比对结果具有高相似度,可用于保守区验证。model building方法:1.满足钢铁模型直接把保守区域的copy到给未知序列。2.方法一对于序列要求很高,必有没能连上的部分,没连上部分fragment assembly,这样得到的结构与膜件相似度高3.通过空间限制条件,利用打分机制判断,结果准确同时与膜件相似度低。用于assembly的software有insight QUANTA和SYBYL COMPOSER,这两个软件是图形界面且收费。也可使用MODELLER编译。在线分析软件有SWISS_MODEL、WHAT IF、3D-JIGSAW、CPH-Model。
普通方法用于水环境,Membrane protein溶液环境。
实验测困难,所以采用bioinformation的方法预测结构,特殊之处在于modeling Membrane protein structure模板是GPCRs(有螺旋),主要预测蛋白质形态,所处位置和胞内胞外结构,再将三者组合成初始结构,然后进一步优化旋转方向。
功能预测基于已解析的功能信息,有以下五种原理:
1.可使用自动化脚本在数据库中找sequence similarity,利用experiment判据选择。
2.因为结构比序列更保守,所以可采用structure-based。利用结构相似性找对应序列,分解出序列特征,通过序列相似性找相似性功能SCOP。其中,不同层级准确性不同:class <fold <superfamily <family
3.可通过预测结合腔的大小、形状、理化性质,从而得到功能域信息,有功能域就有功能
4.以motif-based为基本单位预测,选择可用功能,之后做进化树判断选择近源功能。
5.从System level角度来说,在KEGG pathway找到通路中的功能。
蛋白质之间互作网络便是PPI网络,它有两种类型:1.几种蛋白质参与同一个生物学过程,这是间接互作。2.几种蛋白质组成同一个复合物,这是直接接触而互作(eg:蛋白质复合物;四级结构)共同作用结果是行使功能。
研究互作方法:
- Phylogenetic profile method:某些基因经常同时存在,则认为这些基因对应蛋白质互作。
- Gene neighborhood:基因相对位置保守,则认为这些蛋白质互作。
- 物种A中两个功能域在同一个蛋白上,物种B中转变为两个蛋白质,则认为这两个蛋白质互作。这是因为真核生物中的调控更复杂,需要更多原件,所以有些功能域分化出来,基因组变大。
- 基因共进化:因为基因组系统发育树相近所以有可能蛋白质拓扑关系一致(eg1:一个带正电一个带负电。Eg2:金属A与金属B互作,A变则B也变),可以用跨物种比对拓扑关系,比对可用打分矩阵,最后用相关系数来判断,若等于1则说明有互作。