kegg

clusterprofiler

匿名 (未验证) 提交于 2019-12-03 00:27:02
http://www.biotrainee.com/thread-632-1-1.html 接下来就是clusterprofiler的函数: library(clusterProfiler) ego=enrichGO(OrgDb="org.Hs.eg.db", gene = gene1,pvalueCutoff = 0.01,readable=TRUE)#一行代码完成GO富集,gene1就是上图的entrezID的list Pvalue可自己调节 接下来输出结果: write.csv(summary(ego),"G-enrich.csv",row.names =F) 同样的KEGG: write.csv(summary(ekk),"KEGG-enrich.csv",row.names =F); 那么这样我们就用4行代码完成了GO和kegg的富集分析。 后面我在bioconductor的Rscript里还发现这包还能玩GSEA富集.....(TM好强啊我去) 代码也是极其简单的: gmtfile <- system.file("extdata", "c5.cc.v5.0.entrez.gmt", package="clusterProfiler") c5 <- read.gmt(gmtfile)#前面俩行大概就是来选择GSEA的数据库用的,c5.cc.v5.0.entrez

GO/KEGG功能富集分析及气泡图

血红的双手。 提交于 2019-12-01 04:56:54
何为功能富集分析? 功能富集分析是将基因或者蛋白列表分成多个部分,即将一堆基因进行分类,而这里的分类标准往往是按照基因的功能来限定的。换句话说,就是把一个基因列表中,具有相似功能的基因放到一起,并和生物学表型关联起来。 何为GO和KEGG? 为了解决将基因按照功能进行分类的问题,科学家们开发了很多基因功能注释数据库,。这其中比较有名的一个就是Gene Ontology(基因本体论,GO)和Kyoto Encyclopedia of Genes and Genomes(京都基因与基因组百科全书,KEGG)。 其中,GO是基因本体论联合会建立的一个数据库,旨在建立一个适用于各种物种的、对基因和蛋白功能进行限定和描述的、并能够随着研究不断深入而更新的语义词汇标准。GO注释分为三大类:分子生物学功能(Molecular Function,MF)、生物学过程(Biological Process,BP)和细胞学组分(Cellular Components,CC),通过这三个功能大类,对一个基因的功能进行多方面的限定和描述。 而KEGG,大多数人会将其当做一个基因通路(Pathway)的数据库,其实KEGG的功能远不止于此。KEGG是一个整合了基因组、化学和系统功能信息的综合数据库。KEGG下属4个大类和17个子数据库,而其中有一个数据库叫做 KEGG Pathway

R包对植物进行GO,KEGG注释

£可爱£侵袭症+ 提交于 2019-11-29 19:27:32
1、安装,加载所用到到R包 用BiocManager安装,可同时加载依赖包 source("https://bioconductor.org/biocLite.R") BiocManager::install("clusterProfiler") library(clusterProfiler) ##富集分析 library(topGO) ###画GO图 library(AnnotationHub) ##获取数据库 library(BiocFileCache) ##依赖包 library(dbplyr) ##依赖包 library(pathview) ##看KEGG pathway 2、利用annotataionHub去抓取目标orgDb ah <- AnnotationHub() ##收索所有orgdb,到ah unique(ah$dataprovider) ##可查看数据注释来源 query(ah, "Apis cerana") ##查找目标物种 tar_org <- ah[["AH62635"]] ##下载目标物种到org数据 3、了解org数据库 主要有5个函数 columns(x): 显示当前对象有哪些数据 keytypes(x): 有哪些keytypes可以用作select或keys的keytypes参数 keys(x, keytype, ...)

ChIP-seq基本流程及工具

你说的曾经没有我的故事 提交于 2019-11-28 02:59:02
ChIP-seq数据分析整理 1.Alignment 2.Peak detection 3.Peak annotation 1. GO analysis 2. Pathway analysis 4.Differential analysis 5.Peak gene 6.Pathway analysis 7.Data visualization 1.Alignment base calling——Off-Line Basecaller software (OLB V1.8.0). Solexa CHASTITY quality filter【质量控制】 http://www.genomics.agilent.com/article.jsp?pageId=2213 BOWTIE software (V2.1.0) 2.Peak detection MACS v1.4 p-value 10^-5 3.Peak annotation UCSC RefSeq Peaks annotation TSS distribution heatmap Peak Distribution around TSS peak Distribution Pie Charts Peaks in promoter 1. GO analysis www.geneontology.org Biological