下载GATK中存储的snp vcf文件
写这篇文章的目的是为了以后不迷路,哈哈。我可是花了很长时间二次查找。
GATK是我们在找somatic snp时经常会用到的工具,它可以对可能存在小插入或者缺失的位点进行重新排列和校准!
GATK里存储了很多版本的vcf文件
以下载hg38版本为例
网址为ftp://ftp.broadinstitute.org/bundle/hg38/
我们可以在服务器上直接下载
wget -b -c ftp://gsapubftp-anonymous@ftp.broadinstitute.org/bundle/hg38/1000G_phase1.snps.high_confidence.hg38.vcf.gz
wget -b -c ftp://gsapubftp-anonymous@ftp.broadinstitute.org/bundle/hg38/dbsnp_138.hg38.vcf.gz
wget -b -c ftp://gsapubftp-anonymous@ftp.broadinstitute.org/bundle/hg38/Mills_and_1000G_gold_standard.indels.hg38.vcf.gz
wget -b -c表示后台断点式下载,这样就不用担心网断的问题了。
tail -f wget-log 可以查看下载进度
来源:oschina
链接:https://my.oschina.net/u/4408225/blog/4465608