生物信息学

生物信息学 之 序列比对

喜欢而已 提交于 2020-02-27 21:46:41
针对DNA、RNA以及蛋白质序列,我们需要对其进行序列相似性搜索,来研究分析不同序列在结构和功能上相同与差异 相似性【similarity】/一致性【identity】 <==> 双序列比对( Pairwise sequence Alignment ) 同源性【homology】 <==> 多序列比对 (Multiple Sequence Alignment) 旁系同源【paralogs】:同祖同种不同功 直系同源【orthologs】:同祖不同种同功 序列之间的相似性越高 => 序列为同源序列的可能性越高 但 同源序列不一定相似(趋异进化),相似序列不一定同源(趋同进化) 双序列比对: 全局比对 / 局部比对 局部比对:寻找最优匹配的 子序列 最佳比对查找方法:动态规划算法(Dynamic programming) Needleman-Wunsch Algorithm(for Global Alignment ) Smith-Waterman Algorithm(for Local Alignment) 常用工具: BLAST FASTA BLAST: Blastn:核酸检索核酸库 Blastp:蛋白质检索蛋白质库 Blastx:核酸(先翻译6ORFs)检索蛋白质库 tblastn:蛋白质检索核酸库(先翻译) tblastx:核酸(先翻译)检索核酸库(先翻译) PSI-BLAST

基因组学技术新进展与展望

末鹿安然 提交于 2019-11-30 19:37:12
基因组学技术新进展与展望 于军 任鲁风 王绪敏 (中国科学院北京基因组研究所) 近十年来,由“下一代测序(next generation sequencing; NGS)”技术引领的基因组科学与技术正在一个空前的高速度推动下迅猛发展。这个发展势头的加速度之高,其研究成果在生物医学以及其他各生物相关领域应用和推广的渗透力之强,其对科学总体发展和社会进步的影响之大,使我们不得不刮目相看,必须要阖目冥思。首先,就中国生命科学与技术的发展而言,在过去的40年里,我们既没有掌握以DNA测序为核心的基因组核心技术,也没在相关仪器、试剂与耗材的研发方面取得任何突破性进展,更没有建立具有权威性、实用性、永久性和用户友好的相关数据库和知识库体系,所以任何技术源头的控制、高技术含量的仪器禁运和数据传运光缆的故障等都会大面积地、深刻地影响到中国生命科学的发展进程,至少在科学源头创新和发展速度上一定如此。其次,尽管在过去的十年里中国科学家积极参与了数个国际化的基因组学研究计划(包括人类基因组计划、人类基因组单倍体型图计划、千人基因组计划等),但是我国基因组学研究整体仍处在“拿着别人造的枪,装着买来的弹,打着别人打剩下的鸟”的基本局面。尤其在仪器和设备研发上,还处在“一无所有”的初级阶段。尽管各中原由诸多,且十分错综,我们仍应实事求是,回顾历程,分析现状,为未来的发展找到务实性的道路。