1.ChIP-seq简介
染色质免疫共沉淀技术(Chromatin-immunoprecipitation)也称结合位点分析法,被用于蛋白质与DNA的交互作用。该技术将染色质免疫沉淀与大规模并行DNA测序相结合起来鉴定与DNA相关蛋白结合部位。其可被用于精确绘制任意目的蛋白在全基因组上的结合位点。
主要原理是基于RNA分子与RNA结合蛋白在紫外照射下发生藕联,以RNA结合蛋白的特异性抗体将RNA-蛋白质复合沉淀之后,回收其中的RNA片段,经过加接头、RT-PCR等步骤,对这些分子进行高通量测序。
2.一般生物信息分析流程为:
2.1 质量控制
2.2 比对
2.3 结合峰检测
结合峰(peak)是通过算法识别的富集区域,即识别的蛋白结合位点。将测序数据与参考基因组进行比对,
然后使用软件对匹配到基因组上的短序列进行富集区域的扫描。通常,扫描到的富集区即被认为是蛋
白质与DNA 相互结合的区域。用于结合峰检测的软件最常用的有MACS2和Piranha。
软件:Piranha,参考文献: Site identification in high-throughput rna–protein interaction data.
软件:MACS2,参考文献:Model-based analysis of ChIP-Seq (MACS).
软件比对参考文献: A practical comparison of methods for detecting transcription factor binding sites in chip-seq experiments
2.4 结合峰的注释
结合峰的注释是指将peak注释到所对应的基因信息。
软件:Homer,参考文献:Simple combinations of lineage-determining transcription factors primecis-regulatory elements required for macrophage and B cell identities
其他资料:http://www.mi.fu-berlin.de/wiki/pub/ABI/GenomicsLecture14Materials/chipseq.pdf
https://bioinformatics-core-shared-training.github.io/cruk-autumn-school-2017/ChIP/Materials/Lectures/Lecture5_Peak%20Calling_SS.pdf
来源:https://www.cnblogs.com/daimakun/p/9998673.html