gwas

GWAS条件分析(conditional analysis)

喜欢而已 提交于 2020-03-05 01:45:53
一、为什么要做GWAS的条件分析(conditional analysis) 我们做GWAS的时候,经常扫出一堆显著的信号,假设rs121是我们扫出来与某表型最显著相关的位点(P=1.351e-36),rs124尾随其后(6.673e-22),也是与该表型显著相关,那么这个时候,我们就有问题了:这个rs124位点是真的与该表型显著相关,还是因为rs124与rs121高度连锁不平衡(linkage disequilibrium)。换句话说,rs124之所以出类拔萃,是因为它本身厉害,还是有rs121提拔,导致我们看到的结果是:rs124永远跟随者rs121水涨船高。为了解决这个问题,我们就需要做条件分析。 二、GWAS的条件分析(conditional analysis)步骤 如果你有全基因组关联分析的基础的话,条件分析的工作则很简单,只需要在原来的基础上加上“--condition”的参数,具体为: 如果表型为case/control的情况: ./plink --bfile ./data --condition rs121 --logistic --pheno ./pheno.txt --mpheno 1 --covar ./covar.txt --covar-number 1.2 --out ./gwas_condition    如果表型为连续性变量的情况: ./plink -

IUBS|CODATA|Open Data in a Big Data World|National Genomics Data Center

依然范特西╮ 提交于 2019-12-05 05:09:37
生命组学: National Genomics Data Center 中的 section : LncRNA 知识库 +non-code 加入 RNA central GWAS Atlas 基因组关联分析数据库 EWAS 表观组关联分析数据库,大部分是人。 Tissue/cell 单细胞测序 Idog Rice genome reannotation中研究的内容有 表达谱、可变剪接和重注释等 人群队列分析 BIG search 生物信息的国际组织: IUBS 、 CODATA 、 Open Data in a Big Data World 现在的国际三大生物信息学中心是中美欧 来源: https://www.cnblogs.com/yuanjingnan/p/11908590.html

全基因组关联分析学习资料(GWAS tutorial)

我的梦境 提交于 2019-12-03 16:50:47
前言 很多人问我有没有关于全基因组关联分析(GWAS)原理的书籍或者文章推荐。 其实我个人觉得,做这个分析,先从跑流程开始,再去看原理。 为什么这么说呢,因为对于初学者来说,跑流程就像一个大黑洞,学习原理就像一个小黑洞。 很多人花了好几个月的时间在看原理,一旦丢给他数据去分析,依旧束手无策。 不会跑流程,内心依旧会很恐慌。就像从来没有入门一样。 所以,我的建议是咱们先不去管原理,直接从分析入手。 等把数据跑出来了,整个流程的技能点满了,再去看看它的原理。 入门:学习GWAS的在线网站: 对于没有编程基础的人来说,建议先从一个在线的网站走一遍GWAS流程。 这样就能知道完成GWAS需要多少个步骤,心里大概有个底。 easygwas 网站提供了公共数据,可以直接开始分析GWAS。整个流程按照网站提示,很简单。 网址: https://easygwas.ethz.ch/ 进阶备选1:在linux下学习GWAS的实操数据 由于我们最终还是需要拿着自己的数据完成GWAS分析,不必避免的需要一定的编程基础。 在线网站只是一个提供理解GWAS流程的网站,因此,我们还是需要在linux系统下拿一些数据练练手。学会最基本的命令行。 在这里,我推荐一个提供linux下学习GWAS的教程: GWA_tutorial . 网址: https://github.com/MareesAT/GWA

SNP功能注释网站合集

拜拜、爱过 提交于 2019-12-02 19:42:27
这篇文章是对SNP位点功能注释在线网站的一个总结帖。 软件排名不分先后,优先顺序可以看推荐指数。 彩蛋在最后,请坚持看完 1、 GWAS4D , 推荐指数:**** 网址: http://mulinlab.tmu.edu.cn/gwas4d 支持输入格式 1) Variants Coordinates: Chr, Pos, [P-value] 支持输入格式 2) VCF-like Map: Chr, Pos, SNPID, Ref, Alt, [P-value] 支持输入格式 3) Single SNP ID: dbSNPID, [P-value] 支持输入格式 4) Plink-like Map: Chr, dbSNPID, Pos, [P-value] 分隔符为TAB 或者 comma 输出的结果有: SNP位点的优先排序 SNP位点在基因组区域的可视化 SNP功能预测和注释 1) SNP信息 2) Binding Affinity:SNP最可能影响的factors 3)功能预测、保守性得分 4) 相关的疾病,GWAS来源、临床相关来源 5) 外部链接 2、 SNPnexus ,推荐指数:*** 网址: https://www.snp-nexus.org/index.html 输入方式支持dbSNP rs#、基因组位置 支持GRCh38/hg38, GRCh37/hg19

GWAS Catalog数据库简介

蓝咒 提交于 2019-11-30 13:36:50
GWAS Catalog The NHGRI-EBI Catalog of published genome-wide association studies EBI负责维护的一个收集已发表的GWAS研究的数据库 Catalog stats Last data release on 2019-09-24 4220 publications 107486 SNPs 157336 associations Genome assembly GRCh38.p12 dbSNP Build 151 Ensembl Build 96 基本的搜索方法 搜索表型:如breast carcinoma,会得到相关的非常规范的表型信息,EFO,就像GO一样,是一套表型分类规则。然后还会得到表型相关的基因。 搜索SNP:如rs7329174,会得到变异的详细信息,和对应的基因。 搜索人名:Yao,会得到相关的文献 搜索染色体位置:如2q37.1,Cytogenetic region 搜索基因:如HBS1L 搜索区域:如6:16000000-25000000 说是数据库,其实就是一个table,从 这里 下载,不过100MB 表里面有这些数据: DATE ADDED TO CATALOG* +: Date a study is published in the catalog PUBMEDID* +:

查询、下载GWAS目录数据的R包(gwasrapidd)

穿精又带淫゛_ 提交于 2019-11-28 20:30:27
目前GWAS方向发了很多文献,但是并没有一个很完善的R包对这些文献的数据进行汇总。 接下来推荐的这个是最新发表的GWAS数据汇总R包​。看了一下功能齐全,但是数据不是收录的很齐全​。 下面具体讲一下。​ 在R上安装 install.packages("remotes") remotes::install_github("ramiromagno/gwasrapidd") 查询是否有发表关于自身免疫性疾病的文章 library(gwasrapidd) my_studies <- get_studies(efo_trait = 'autoimmune disease') 查询发表自身免疫性疾病文章的数量 n(my_studies) 获取发表自身免疫性疾病的文章ID my_studies@studies$study_id 查询发表自身免疫性疾病的文章标题 my_studies@publications$title 查看发表自身免疫性疾病文章在pubmed的界面信息 open_in_pubmed(my_studies@publications$pubmed_id) 获取发表身高文献的SNP关联信息 my_associations <- get_associations(study_id = my_studies@studies$study_id) 查询P值小于1e-6的位点 dplyr: