蛋白质结构

基因组注释

≯℡__Kan透↙ 提交于 2020-02-16 01:46:21
基因组注释主要包括四个研究方向:重复序列的识别;非编码RNA的预测;基因结构预测和基因功能注释。我们将分别对这四个领域进行阐述。 1 重复序列的识别。 1.1 重复序列的研究背景和意义:重复序列可分为 串联重复序列 (Tendam repeat)和 散在重复序列 (Interpersed repeat)两大类。其中串联重复序列包括有微卫星序列,小卫星序列等等;散在重复序列又称转座子元件,包括以DNA-DNA方式转座的DNA转座子和反转录转座子(retrotransposon)。常见的反转录转座子类别有LTR,LINE和SINE等。 1.2 重复序列识别的发展现状:目前,识别重复序列和转座子的方法为 序列比对和从头预测 两类。序列比对方法一般采用Repeatmasker软件,识别与已知重复序列相似的序列,并对其进行分类。常用Repbase重复序列数据库。从头预测方法则是利用重复序列或转座子自身的序列或结构特征构建从头预测算法或软件对序列进行识别。从头预测方法的优点在于能够根据转座子元件自身的结构特征进行预测,不依赖于已有的转座子数据库,能够发现未知的转座子元件。常见的从头预测方法有Recon,Piler,Repeatscout,LTR-finder,ReAS等等。 1.3 重复序列识别的研究内容:获得组装好的基因组序列后,我们首先预测基因组中的重复序列和转座子元件。一方面

分子生物学基础知识

♀尐吖头ヾ 提交于 2019-12-04 10:35:57
基因数量远小于蛋白质数量 (1) 基因重排 ,在某些细胞中,可将一个基因从远离启动子的地方移到距它很近的位点从而启动转录,如抗体的合成(这里还涉及到抗体的结构); (2) 可变剪接 ,特异性保留内含子或缺失外显子的部分或全部,是基因转录后调控的重要方式; (3) 蛋白质多亚基 是这个问题的核心,以P型离子泵为例,在钠钾泵中,α亚基是主要的活性中心,而β亚基则是负责帮助α亚基折叠,本身无转运活性,多种P型离子泵的β亚基是共用的。也就是说,多数蛋白质是有多个亚基组合而成的,每一个位置都有好几种亚基,亚基之间的组合形成了多种蛋白质。 此外,在原核生物中,一个基因还可以编码多条肽链,这会更加丰富蛋白质的多样性。 基因、染色体、蛋白质、DNA,RNA 之间的关系 真核生物的染色体由DNA:组蛋白:非组蛋白:RNA=1:1:1:0.05组成, DNA序列及其甲基化位点 组成了细胞中最重要的遗传信息实体, 组蛋白 的作用在于帮助DNA形成特定结构、稳定DNA,同时 围绕着组蛋白的30多种修饰在基因表达的调控中起到重要作用 。 非组蛋白 主要指各种与 核苷酸和dNTP合成、复制、转录 相关的蛋白质,包括各种酶与蛋白质因子。 来源: https://my.oschina.net/u/3732258/blog/3129509

Journal of Proteome Research | Proteomic Profiling of Rhabdomyosarcoma-Derived Exosomes Yield Insights into Their Functional Role in Paracrine Signaling (解读人:孙国莹)

烂漫一生 提交于 2019-12-02 14:49:31
文献名: Proteomic Profiling of Rhabdomyosarcoma-Derived Exosomes Yield Insights into Their Functional Role in Paracrine Signaling(源于 横纹肌肉瘤的外泌体的蛋白质组学分析 用于深入了解其 在旁分泌信号转导中的作用 ) 期刊名: Journal of Proteome Research 发表时间: ( 2019 年 8 月) IF : 3.78 单位: 黎巴嫩大学,黎巴嫩 贝鲁特美国大学儿童和青少年医学系,黎巴嫩 德州理工大学化学与生物化学系,美国 物种: 儿童 横纹肌肉瘤 细胞系 技术: 外泌体提取、蛋白提取、免疫印迹、蛋白消化、 LC-MS/ MS 定量、 MRM 定量、 PANTHER 分析、 Pathway Studio 分析 一、 概述: (用精炼的语言描述文章的整体思路及结果) 本研究 利用质谱分析手段对儿童横纹肌肉瘤( RMS )细胞系中提取出的外泌体内所含蛋白进行比对研究,利用 PANTHER 和 Pathway Studio 软件分析外泌体蛋白参与的被扰乱生物过程及变化途径。结果显示,源于 RMS 的外泌体携带一种有助于多细胞系间保守的细胞信号网络构建,同时,对 RMS 外泌体的特异性蛋白需要进一步的评估,寻找作为该肿瘤的全新生物标志物的可能性

Ribosome profiling|N-terminomics|蛋白质基因组学

爱⌒轻易说出口 提交于 2019-12-01 14:17:32
生物医学大数据 - 蛋白质基因组学:质谱注释 蛋白质组与其他组学的关系便是互为印证:蛋白质基因组学原本用于基因组注释,后面扩展到蛋白质与转录组或可变剪接之间关系,同时,蛋白质组依赖于基因组注释作为验证。许多研究未标明蛋白质基因组学,而是归属于对应的组学。 蛋白质基因组学现存问题: 基因组注释方法: 1.Denovo 。 2. 与转录组相应证。 3. 与基因组数据库同源比对。 基因组注释问题: 对于特定结构: 起始位点定位信号难以确定 确定 promoter 调控结合位点,错误率高 终止位点不被注释 可变剪接预测和确认上需要更多基因组的训练数据,使用 denovo 可以全部预测出来,但是用内含子和外显子仅能预测 60% 。 对于基因组的常规部分: 因为二代 reads 短所以难拼接 以前是鉴定已经存在的基因组,现在是未知物种的 genome 同类数据不同处理有不同结果 人员水平不齐 对于蛋白质组大量质谱数据没被充分解析,可能的原因是 蛋白质多种修饰 搜索引擎差异 其它电荷没鉴定 数据库数据不足 没有充分解析造成许多没鉴定出来的数据,这些数据有可能是 噪音 实验污染,通过加入污染蛋白证实这部分是实验污染,当然鉴定出来之后也会舍弃这部分,对于该部分问题需要改进质控方法。 产生混合图谱(即多肽段在同一个图谱)或者融合肽段 在已知信息库中未收录的蛋白,即新蛋白 蛋白质基因组学的作用: 1.

Protein interaction|insight QUANTA|SYBYL COMPOSER|MODELLER|SWISS_MODEL|WHAT IF|3D-JIGSAW|CPH-ModelGPCRs|Membrane protein|

心不动则不痛 提交于 2019-11-30 12:07:46
生命组学 蛋白质之间的互作可以有以下应用: Eg :改变蛋白质基因,从而组改变结构,削弱蛋白质之间的相互作用。 Eg :数据模拟出蛋白质的靶点,即结合腔,将此数据存入结合化合物的 dataset ,用于制药 结构预测: 通用方法:首先将得到序列采用 Fasta (全局序列比对) &blast (局部序列比对)在 PDB 中(此数据库中有实验数据和计算预测得到的数据)找模板 modeling 。找模板的方法可以基于 sequence similarity 。可以基于 structure 相似性,因为存在氨基酸序列不同但是最终组成相似结构的情况,此方法 quality 高。可以基于研究目的( ligands and cofactors )。对于 alignment 方面,最好采用全局比对,多模板序列比对可得到低相似度结果但比较准确, pair 模板序列比对结果具有高相似度,可用于保守区验证。 model building 方法: 1. 满足钢铁模型直接把保守区域的 copy 到给未知序列。 2. 方法一对于序列要求很高,必有没能连上的部分,没连上部分 fragment assembly ,这样得到的结构与膜件相似度高 3. 通过空间限制条件,利用打分机制判断,结果准确同时与膜件相似度低。用于 assembly 的 software 有 insight QUANTA 和 SYBYL