genome

把人骑马变成人牵着马,这篇CVPR2020论文实现语义级别图像修改

时间秒杀一切 提交于 2020-07-28 09:01:13
  图像修改是图像生成领域的一个特殊任务,它要求生成对原图进行修改后得到的图片。例如常用的美颜、修图软件,可以得到原照调整后的美颜人像。目前,绝大多数的图片操纵和生成都是在像素级别进行的。随着技术的进步,基于语义的图像修改和生成成为可能。   一篇 CVPR2020 的论文 Semantic Image Manipulation Using Scene Graphs 就聚焦图片语义级别修改问题,实现针对场景图的修改图片生成问题。即给定一张图片,先生成一个表示图片中出现的对象及其关系的语义场景图,用户可以利用场景图方便地修改其中的节点(对象)和边(关系),模型再根据这些修改后的场景图和原图生成修改后的图片,如图一所示。   这需要模型对原图中的对象进行替换或者改变原图中对象之间的关系,但还要保持生成的图片和原图中语义关系以及风格一致。      图丨基于语义关系的图片修改。基于原图(source image),模型首先生成场景图,接下来用户对场景图进行修改,最后模型根据修改的场景图生成新的图片。图中用户将女孩和马的关系由 “骑” 变为“在旁边”(来源:Semantic Image Manipulation Using Scene Graphs)   高层级的图片修改是以语义为中心的,这项技术有广泛的应用场景。   编辑旅行风景照时,不需要再手动切割、删除其中多余的旅客

把人骑马变成人牵着马,这篇 CVPR2020 论文实现语义级别图像修改

一笑奈何 提交于 2020-07-27 22:02:40
  图像修改是图像生成领域的一个特殊任务,它要求生成对原图进行修改后得到的图片。例如常用的美颜、修图软件,可以得到原照调整后的美颜人像。目前,绝大多数的图片操纵和生成都是在像素级别进行的。随着技术的进步,基于语义的图像修改和生成成为可能。   一篇 CVPR2020 的论文 Semantic Image Manipulation Using Scene Graphs 就聚焦图片语义级别修改问题,实现针对场景图的修改图片生成问题。即给定一张图片,先生成一个表示图片中出现的对象及其关系的语义场景图,用户可以利用场景图方便地修改其中的节点(对象)和边(关系),模型再根据这些修改后的场景图和原图生成修改后的图片,如图一所示。   这需要模型对原图中的对象进行替换或者改变原图中对象之间的关系,但还要保持生成的图片和原图中语义关系以及风格一致。      图丨基于语义关系的图片修改。基于原图(source image),模型首先生成场景图,接下来用户对场景图进行修改,最后模型根据修改的场景图生成新的图片。图中用户将女孩和马的关系由 “骑” 变为“在旁边”(来源:Semantic Image Manipulation Using Scene Graphs)   高层级的图片修改是以语义为中心的,这项技术有广泛的应用场景。   编辑旅行风景照时,不需要再手动切割、删除其中多余的旅客

Visual Question Answering: Datasets, Algorithms, and Future Challenges文章翻译

寵の児 提交于 2020-05-09 10:34:45
Abstract 视觉问答(VQA)是计算机视觉和自然语言处理领域的一个新问题,引起了深度学习、计算机视觉和自然语言处理领域的极大兴趣。在VQA,一种算法需要回答基于文本的图像问题。自2014年第一个VQA数据集发布以来,已经发布了更多数据集,并提出了许多算法。在这篇综述中,我们从问题表述、现有数据集、评估指标和算法等方面批判性地考察了VQA的现状。特别是,我们讨论了当前数据集在正确训练和评估VQA算法方面的局限性。然后我们详尽地回顾现有的VQA算法。最后,我们讨论了VQA和图像理解研究未来可能的方向。 1 Introduction 计算机视觉和深度学习研究的最新进展使许多计算机视觉任务取得了巨大进展,如图像分类[1,2),物体检测[3,4],和活动识别[5,6,7]。给定足够的数据,深度卷积神经网络可以与人类进行图像分类的能力相媲美[2]。由于众包,带注释的数据集在规模上迅速增加,类似的结果也可以预期用于其他聚焦的计算机视觉问题。然而,这些问题范围狭窄,不需要对图像的整体理解。作为人类,我们可以识别图像中的物体,理解这些物体的空间位置,推断它们的属性和彼此的关系,并且在给定周围环境的情况下推断每个物体的用途。我们可以对图像随意提问,也可以交流从图像中收集的信息。 直到最近,开发一种能够回答关于图像的任意自然语言问题的计算机视觉系统一直被认为是一个雄心勃勃但棘手的目标。然而

20200503文献速递

人走茶凉 提交于 2020-05-04 10:09:57
一 文献题目: Genome-wide DNA methylation profiles of low- and high-grade adenoma reveals potential biomarkers for early detection of colorectal carcinoma 不想看英文题目: 全基因组DNA甲基化揭示了大肠癌早期检测的潜在生物标志物 杂志和影响因子: Clin Epigenetics (IF: 5.496) 样本量: 20个control样本(从腺瘤患者组织中提取的正常组织),18个低度腺瘤,22个高度腺瘤,以及从GEO 数据库挖掘的278个正常样本,51个腺瘤样本和504个癌症样本。 分析方法: 使用GenomeStudio处理甲基化原始数据,软件包pROC区分正常组织、LGA组织、HGA组织和CRC组织的高甲基化和低甲基化位点,使用R函数princomp进行PCA分析,使用KEGG和GO进行富集分析。 结论: 研究发现,在低度腺瘤和高度腺瘤患者中,分别有209和8692个CpG 位点呈超甲基化,通路分析表明早期腺瘤甲基化变化主要与神经系统相关,ADHFE1启动子区域的DNA甲基化最有可能成为大肠腺瘤和大肠癌的早期诊断生物标志物。 数据GEO登录号: GSE139404 文章链接: https://www.ncbi.nlm.nih.gov

【转录组入门】4:参考基因组和注释文件

浪子不回头ぞ 提交于 2020-05-02 19:34:11
作业要求: 在UCSC下载hg19参考基因组,我博客有详细说明,从gencode数据库下载基因注释文件,并且用IGV去查看你感兴趣的基因的结构,比如TP53,KRAS,EGFR等等。 作业,截图几个基因的IGV可视化结构!还可以下载ENSEMBL,NCBI的gtf,也导入IGV看看,截图基因结构。了解IGV常识。 参考基因组--下载 地址:UCSC https://genome.ucsc.edu/ (1) 、进入 UCSC--- 选择 Downloads---genomic data---human---GRCh37/hg19---Full data set ,下拉,找到 chromFa.tar.gz, 右击 chromFa.tar.gz ,选择 “ 复制链接地址 ” # 点击 Full data set 后,有各类文件的说明文档 (2) 、终端命令行操作 1 # 切换到要存放参考基因组的目录 2 $ cd data/GSE81916/reference/genome/ hg19 3 4 # 用axel或wget下载参考基因组 5 $ nohup wget http: // hgdownload.soe.ucsc.edu/goldenPath/hg19/bigZips/chromFa.tar.gz # wget后面跟的是参考基因组的下载地址 6 7 # 解压下载后的文件 8 $

GWAS+自然选择:62个样本的GWAS分析,没信号,如何巧妙的发文章

﹥>﹥吖頭↗ 提交于 2020-05-02 17:14:42
欢迎来到"bio生物信息"的世界 6天前,BMC Genomics 推了一篇文献“Population history and genetic adaptation of the Fulani nomads: inferences from genome-wide data and the lactase persistence trait”。 要不是这个标题起的太大,又是Population history,又是 genetic adaptation ,我可能都不会点开来看。 但是既然看了,还是要写点总结,毕竟,每一篇能发出来的文章,总是有那么一点值得我们借鉴的。 这篇文章很聪明的一点是,他避开了GWAS没信号这个问题,转而将重点放在:结合表型和人群历史以及遗传适应性来讲。 下面讲讲整篇文章的研究思路。 ###0. 研究背景 Fulani nomads是在非洲西部的一群游牧民族。 游牧民族最大的特点是什么。当然是(牛/羊)奶多。 所以乳糖耐性就是一个明显受到选择的表型。 这也是他们本次研究采用乳糖耐性作为表型的原因。 讲完背景,我们接下来看看他们做了什么工作。 ###1. 研究的人群的历史。 62个样本,讲人群历史当然很干巴巴。 那么,就需要增大样本量了。 增大样本量,首选就是千人基因组公共数据库了。 全世界各个群体的基因型数据都有,不嫖白不嫖。 这张图用的是EIGENSOFT

R包对植物进行GO,KEGG注释

◇◆丶佛笑我妖孽 提交于 2020-05-01 07:18:58
1、安装,加载所用到到R包 用BiocManager安装,可同时加载依赖包 source("https://bioconductor.org/biocLite.R") BiocManager::install("clusterProfiler") library(clusterProfiler) ##富集分析 library(topGO) ###画GO图 library(AnnotationHub) ##获取数据库 library(BiocFileCache) ##依赖包 library(dbplyr) ##依赖包 library(pathview) ##看KEGG pathway 2、利用annotataionHub去抓取目标orgDb ah <- AnnotationHub() ##收索所有orgdb,到ah unique(ah$dataprovider) ##可查看数据注释来源 query(ah, "Apis cerana") ##查找目标物种 tar_org <- ah[["AH62635"]] ##下载目标物种到org数据 3、了解org数据库 主要有5个函数 columns (x ): 显示当前对象有哪些数据 keytypes (x ): 有哪些keytypes可以用作 select或keys的keytypes参数 keys (x , keytype , ... )

古人以及其他灵长类动物基因组数据

我们两清 提交于 2020-04-27 04:20:29
丹尼索瓦人: http://cdna.eva.mpg.de/denisova/VCF/human/ 尼安德特人: http://cdna.eva.mpg.de/neandertal/altai/AltaiNeandertal/VCF/ 多个古人的数据集合: http://genetics.med.harvard.edu/reichlab/Reich_Lab/Datasets.html https://bioinf.eva.mpg.de/jbrowse/?loc=1%3A6093255..6093320&tracks=hg19_1000g%2CENSEMBL67&highlight= 西蒙斯基因组多样性计划(SGDP); https://reichdata.hms.harvard.edu/pub/datasets/sgdp/ ensembl的各大物种: http://ftp.ensembl.org/pub/ 黑猩猩等灵长类动物基因组: https://uswest.ensembl.org/Pan_troglodytes/Location/Variant/Table http://map4.nig.ac.jp/cgi-bin/gb2/gbrowse/chimpanzee/ http://biologiaevolutiva.org/greatape/data.html https:/

2015 年,我和华大基因立下一个小目标……

半世苍凉 提交于 2020-02-26 07:17:20
导读 :2015 年,阿里云和华大基因立下一个目标:到 2020 年,要在 24 小时完成个人全基因组测序。这在当时是一个几乎被认为不可能的挑战。 而在 2020 年刚开始的第 17 天,我们就实现了这个目标!并且把个人全基因组测序分析做到只需要 15 分钟,不到一顿饭的功夫。 云端实现大规模弹性调度计算 图 1 - WGS 分析过程示意图 基因计算所面临的挑战不同于常规计算,大数据生信分析平台需要具备 PB 级的数据处理能力:存储与压缩、清理及管理、低成本保存的能力;快速、安全的云端分发共享;基因数据的安全隐私保护、大规模数据挖掘;按需调度和弹性扩容等。 此次方案由华大 DNBSEQ 自主测序仪、BGI Online 混合云架构、阿里云容器服务 ACK/AGS 基因服务以及赛乐基因 GPU 加速算法的深度融合而成。其中,华大基因联合阿里云的整体技术架构为云原生容器混合云,实现云上云下资源一体,跨地域集群统一管理。凭借云端的自动伸缩特性,实现大规模弹性调度计算。 在使用上,该方案用户无需关心基因数据处理过程中的计算资源、处理逻辑、数据缓存等细节,只需将下机数据 (FASTQ文件) 上传至 OSS,以及授权 Bucket 给 AGS 服务,即可高效、快速完成整个数据分析流程,并将结果数据上传到用户期望的存储空间。 这套端到端解决方案,无缝衔接测序平台和基因云平台,全面支持包括

基因组变异汇总

帅比萌擦擦* 提交于 2019-12-30 15:26:28
【推荐】2019 Java 开发者跳槽指南.pdf(吐血整理) >>> 人类基因组上的结构性变异研究对于基因组进化,群体多态性分析以及疾病易感性等方面的研究有着重要的意义。第二代短reads高通量测序技术的发展在带来了测序成本降低的同时,这种短读长的测序方式也给人类的变异检测带来了很大的挑战。这里我主要对当前常用的变异检测方法、软件以及他们各自的有确定做一个简要的小结。 人类基因组上的变异主要分为三大类:1. 单核苷酸变异,(通常称为单核苷酸多态性,通俗的说法就是单个DNA 碱基 的不同,简称SNP);2. 小的Indel(Insertion 和 Deletion的简),指的是在基因组的某个位置上所发生的小片段序列的插入或者删除,其长度通常在50bp以下(这个长度范围的变异可以利用Smith-Waterman 的比对算法来获得1,2);3. 大的结构性变异,这种类型比较多,包括长度在50bp以上的长片段序列的插入或者删除、染色体倒位,染色体内部或染色体之间的序列易位,拷贝数变异,以及一些形式更为复杂的变异。为了和SNP变异作区分,第2和第3类变异通常也被称为基因组结构性变异(Structural variation,简称SV)。这里值得一提的是,研究人员对基因组的结构性变异发生兴趣,主要是由于这几年的研究发现:(1)虽然还未被广泛公认