motif

GWAS ATLAS:最全面的GWAS数据库

假装没事ソ 提交于 2021-01-13 22:10:24
欢迎关注”生信修炼手册”! GWAS ATLAS数据库收录了来自4756个人类不同表型的GWAS结果,并进行了不同表型间的遗传相关性分析,对应的文献发表在nature genetics上,链接如下 https://www.nature.com/articles/s41588-019-0481-0 数据库的网址如下 https://atlas.ctglab.nl/ 该数据库不仅仅是一个gwas结果存储的数据库,对于收录的原始gwas结果,进行了深入挖掘,提供了risk loci, LDSC, MAGMA基因集关联分析,多种表型间的遗传相关性分析等结果。 分成了以下3大模块 1. Browse GWAS 查看gwas分析结果,包含了以下几点内容 manhattan plot lead snp and risk loci gene-based association results SNP heritability and genetic correlations GWAS分析最经典的展示结果就是曼哈顿图和QQ图了,示意如下 基于gwas结果,分析了lead snp和risk loci, 结果示意如下 利用MAGMA软件进行了基因集的关联分析,结果示意如下 利用LDSC分析,评估了表型对应的SNP遗传力,结果示意如下 2. Multiple GWAS comparison

图中的谱聚类详解

こ雲淡風輕ζ 提交于 2020-10-19 08:47:15
在Neural network还未使用在graph里时, 图聚类就有着很大的需求, 比如在社交网络中的群体分类,如何在图中完成相应地工作,本文基于对cs224w 《Spectral Clustering》的学习笔记,尝试描述清楚,这方面经典的工作。 Graph Partitioning 何谓graph partitioning, 如下图,给定无向图 , 将这些节点分为两个组: 逻辑很简单,但是难点在于: 如何定义一个尺度,来保证图的切分是合理的: 组内成员连接尽可能多; 组与组之间连接尽可能少; 如何高效地识别这些分区; Criterion Cut(A,B): 如下图,图当中,两个点分别在两个分组的边的数量; Minimum-cut 最小化图分组间的连接(如果有权重,则考虑权重): 这样会存问题: 仅仅考虑图当中分组的外部连接; 未考虑图中分组的内部连接; 因此,在下面图中,会出现,假如是minimum cut不是optimal cut : Conductance 与Minimum-cut逻辑不一样, Conductance不仅仅考虑分组间的连接, 也考虑了分割组内的“体积块”, 保证分割后得到的块更均衡,Conductance指标如下: 其中 指分组块A内节点所有的权重度之和; 但是,得到最好的Conductance是一个np难题。 Spectral Graph

AirVis: Visual Analytics of Air Pollution Propagation

人盡茶涼 提交于 2020-10-06 07:36:47
论文传送门 视频 作者 浙江大学: Zikun Deng Di Weng Jiahui Chen Ren Liu Zhibin Wang Yingcai Wu 京东智慧城市研究院 Jie Bao Yu Zheng 摘要 空气污染已经成为世界上许多城市的一个严重的公共健康问题。为了找出空气污染的原因,必须在大的空间尺度上研究空气污染物的传播过程。然而,复杂和动态的风场导致污染物输送的高度不确定性。如果没有领域知识的整合,最先进的数据挖掘方法不能完全支持跨多个地区的这种不确定时空传播过程的广泛分析。这些自动化方法的局限性促使我们设计和开发 AirVis,这是一种新颖的可视分析系统,它可以帮助领域专家基于图形可视化有效地捕捉和解释空气污染的不确定传播模式。设计这样的系统提出了三个挑战:a)传播模式的提取;b)模式表示的可伸缩性;和 c)传播过程的分析。为了应对这些挑战,我们开发了一个新的模式挖掘框架来模拟污染物迁移,并从大规模大气数据中有效地提取频繁传播模式。此外,我们基于最小描述长度原则对提取的模式进行分层组织,并允许专家用户基于模式拓扑有效地探索和分析这些模式。我们通过使用真实数据集和领域专家的积极反馈进行的两个案例研究证明了我们方法的有效性。 Introduction 空气污染成为一个严重的公共问题 来源: Vehicle emission Incineration Factory

20200510文献速递

坚强是说给别人听的谎言 提交于 2020-08-20 03:39:48
一 文献题目: Single-cell RNA-seq analysis of the brainstem of mutant SOD1 mice reveals perturbed cell types and pathways of amyotrophic lateral sclerosis. 不想看英文题目: SOD1突变小鼠脑干的单细胞RNA序列分析揭示了肌萎缩性侧索硬化的细胞类型和途径。 背景: 肌萎缩性侧索硬化症(ALS)的发病机制涉及多种细胞类型(例如星形胶质细胞和小胶质细胞),为了确定哪一种细胞类型影响ALS,使用单细胞RNA测序(scRNA-seq)方法进行鉴定。 杂志和影响因子: Neurobiol Dis(IF: 5.16) 样本量: 两只SOD1(G93A) 突变的转基因小鼠,以及两只年龄匹配的野生型小鼠。分别从突变型和野生型小鼠中分离出3199 和1894个细胞。 分析方法: 通过查找细胞簇内突变细胞和野生型细胞之间的差异表达基因(DEG),鉴定单细胞中ALS相关的基因。使用KEGG,Reactome,BIOCARTA和Gene Ontology数据库对差异表达基因进行注释。最后将已发表肌萎缩性侧索硬化症的GWAS文献和单细胞测序鉴定出来的差异表达基因进行重合,进一步确认可能与肌萎缩性侧索硬化症相关的基因 结论:

工业数据分析技术与实战之数据分析的挑战——昆仑数据田春华培训听课记录

天大地大妈咪最大 提交于 2020-08-16 02:56:03
昆仑数据田春华老师在微信公众号的专栏培训:工业数据分析与实战。培训给出了一些实际的数据分析例子,包括“设备管理”、“运作优化”和“营销服务”三类;然后讲了数据分析的基本框架、方法和技术;最后给出了大数据时代,数据分析的认识误区和挑战。田老师发音不标准啊,好多词听好几遍,再关联上下文,连猜带蒙的才勉强能明白,不过有的也不一定对。记录以反复学习。 视频链接 过去我们经常提非结构化数据,其实结构化数据也是现在数据分析的一大方向。比如时序结构,工业上大量的传感器、物联网数据。再就是移动互联网的时空数据,一些观测数据。还有一些序列数据,它跟时序数据不一样,可能并不是连续的,比如一些交易数据,今天取钱,明天去哪儿消费,这些在一些欺诈识别里面非常重要,特别是网络入侵,你做一系列的事件,通常可能导致某个事件的发生,通过一些事件序列,通常可以发现行为异常等。另外一些是Networks网络数据,比如社交网络数据,还有一些合作数据,比如谁和谁通常一起发论文等等。结构化数据也是一个需要深入研究的领域。 以工业为例。工业有什么特点呢,首先是先验知识。工业里面,先验知识比较多,不像我们在互联网里面做推荐,做用户画像,我对用户的一些了解,包括人的认知都是非常宏观。工业里面的都非常微观,比如一些动态方程,一些运行机理,这些知识如果用统计学的联合概率分布等来刻画还是不够充分。而且工业系统通常是一个工控系统

如何在PC和手机上制作好看的长图片?

不打扰是莪最后的温柔 提交于 2020-08-15 08:35:37
https://zhuanlan.zhihu.com/p/26544575 如何在PC和手机上制作好看的长图片? PC端:长颈鹿 http://www.changweibo.com/ 基础功能:长颈鹿支持自行设置图片背景、插入图片等基础功能,但VIP会员还支持去除水印、自定义图片宽度大小等功能。 排版:如果非常注重排版的话,建议在其他的微信编辑器上进行排版,然后直接复制过来就OK了,长颈鹿支持的排版样式并不多。 图片画质:此款工具生成的长图片只能说是有点糙,画质不够精细,如果你对此非常严格的话,不建议使用。 手机端:锤子便签 米田 Motif(超级推荐) 来源: oschina 链接: https://my.oschina.net/u/4385799/blog/4277923

【cs224w】Lecture 5

我是研究僧i 提交于 2020-04-08 21:04:02
Spectral Clustering 前面的课程说到了 community detection 并介绍了两种算法。这次来说说另外一类做社区聚类的算法,谱聚类。这种算法一般分为三个步骤 pre-processing: 构建一个描述图结构的矩阵 decomposition: 通过特征值和特征向量分解矩阵 grouping: 基于分解后的矩阵以及点的 representation 进行聚类 在介绍具体操作前我们先了解几个概念 Graph Partitioning 图的划分就是将节点分到不同的组内,如果分为两个组就是二分。划分的目的其实就是找社区,那如何判断一个划分的质量呢?回顾之前说到的社区的特点,即社区内部连接丰富而社区间连接稀疏。因此我们希望我们的划分能最大化每个划分内的连接并最小化划分间的连接数。我们用割这个概念来描述不同划分间的连接数 \(cut(A,B)=\sum\limits_{i\in A,j\in B}w_{ij}\) 。对于无权图这里的 \(w\) 就是 \(\{0,1\}\) 。但这个定义并不完美,因为这样并不能保证划分均匀。例如,一个图中有一个节点的度为 \(1\) 那么只要把这个节点和其余节点分开就能保证 cut 为 \(1\) 。因此我们将划分后不同组内节点的度纳入考虑就能较为全面的评估一个划分的好坏了,即 Conductance,其中 \(vol\)

【cs224w】Lecture 5

谁都会走 提交于 2020-04-08 21:01:31
目录 Spectral Clustering Graph Partitioning $d$-Regular Graph Motif-Based Spectral Clustering 转自本人: https://blog.csdn.net/New2World/article/details/105372317 Spectral Clustering 前面的课程说到了 community detection 并介绍了两种算法。这次来说说另外一类做社区聚类的算法,谱聚类。这种算法一般分为三个步骤 pre-processing: 构建一个描述图结构的矩阵 decomposition: 通过特征值和特征向量分解矩阵 grouping: 基于分解后的矩阵以及点的 representation 进行聚类 在介绍具体操作前我们先了解几个概念 Graph Partitioning 图的划分就是将节点分到不同的组内,如果分为两个组就是二分。划分的目的其实就是找社区,那如何判断一个划分的质量呢?回顾之前说到的社区的特点,即社区内部连接丰富而社区间连接稀疏。因此我们希望我们的划分能最大化每个划分内的连接并最小化划分间的连接数。我们用割这个概念来描述不同划分间的连接数 \(cut(A,B)=\sum\limits_{i\in A,j\in B}w_{ij}\) 。对于无权图这里的 \(w\) 就是 \(\

【cs224w】Lecture 3

拜拜、爱过 提交于 2020-04-08 20:33:50
目录 Network Motifs Configuration Model Graphlets How to Find Motifs and Graphlets Structural Roles 转自本人: https://blog.csdn.net/New2World/article/details/105291956 大量真实网络都有一个规律,即这些网络都是由一些 building block 构成,类似 Kronecker 图有大量的重复结构。而我们需要一种度量方式来衡量某个结构在图中的显著性。因此需要引入 motif 和 graphlet 这两个概念。 这一部分我还有一些概念没完全理解,所以在最后记录了一些问题等待以后回来解决。也欢迎有理解了的朋友帮忙解惑。 Network Motifs 这里实在无法确定 motif 的准确翻译是什么,干脆不翻译了。但它是什么东西还是得搞清楚的:在图中大量重复的模式被称为 motif。这个定义包含了三个要点 大量,就是多,比随机图多 重复,还是多 模式,即规模小的导出图 [1] 我们为什么需要这个 motif ?首先,既然这个概念的定义表明它在网络中大量存在,说明这个 motif 揭示了这个网络的一些普遍规律,比如食物链中的互利共生关系或竞争关系。同时我们可以依据这个规律预测一些我们可能还没有发现的网络中隐含的关系。 知道了 motif

OpenGL SuperSampling Anti-Aliasing?

筅森魡賤 提交于 2019-12-22 06:58:13
问题 At office we're working with an old GLX/Motif software that uses OpenGL's AccumulationBuffer to implement anti-aliasing for saving images. Our problem is that Apple removed the AccumulationBuffer from all of its drivers (starting from OS X 10.7.5), and some Linux drivers like Intel HDxxxx don't support it neither. Then I would like to update the anti-aliasing code of the software for making it compatible with most actual OSs and GPUs, but keeping the generated images as beautiful as they were