genome | 易学教程

An Analysis of Visual Question Answering Algorithms翻译

阅读更多关于 An Analysis of Visual Question Answering Algorithms翻译

Abstract 在视觉问答(VQA)中，算法必须回答关于图像的基于文本的问题。尽管自2014年末以来，VQA已经创建了多个数据集，但它们在内容和算法评估方式上都存在缺陷。结果，评估分数被夸大了，而且主要是通过回答更简单的问题来决定的，这使得比较不同的方法变得很困难。在本文中，我们使用一个名为任务驱动图像理解挑战(TDIUC)的新数据集来分析现有的VQA算法，该数据集有超过160万个问题，分为12个不同的类别。我们还引入了对给定图像没有意义的问题，以迫使VQA系统对图像内容进行推理。我们提出新的评估方案，以弥补过度代表的问题类型，并使其更容易研究算法的优势和弱点。我们分析了基线和最先进的VQA模型的性能，包括多模态紧致双线性池(MCB)、神经模块网络和循环回答单元。我们的实验建立了注意力如何比其他类别更有助于某些类别，确定哪些模型比其他模型更有效，并解释了简单的模型(例如MLP)如何通过简单地学习回答大的、简单的问题类别来超越更复杂的模型(MCB)。 1. Introduction 在开放式视觉问题解答（VQA）中，算法必须对有关图像的任意基于文本的问题产生答案[21，3]。 VQA是一个令人兴奋的计算机视觉问题，它要求系统能够执行许多任务。真正解决VQA将是人工智能的一个里程碑，并将极大地促进人机交互。但是，VQA数据集必须测试广泛的能力，才能充分衡量进度。

抽一次血可筛50种癌症，NGS早筛巨头GRAIL申请纳斯达克上市

阅读更多关于抽一次血可筛50种癌症，NGS早筛巨头GRAIL申请纳斯达克上市

　　　　美东时间 9 月 9 日，液体活检初创公司 GRAIL 宣布已提交 IPO 申请，目前尚未确定要发行的股票数量和发行价格范围。此次发行的最高目标是 1 亿美元，净收益将用于旗下产品 Galleri 和 DAC 的开发和商业化、其它产品的开发，以及技术和实验室运营的扩展以及其它事务。　　自 2016 年以来，GRAIL 已经从包括亚马逊创始人 Jeff Bezos，生物制药巨头强生在内的投资者那里筹集了约 20 亿美元，甚至还有加拿大的养老计划。在完成 D 轮融资后，GRAIL 终于宣布将在纳斯达克上市，股票代码为 “GRAL”。　　2016年，GRAIL 获得第三方的投资，开始以独立公司的身份运营。到 2020 年 6 月 30 日，已从投资方和合作伙伴处筹集了超过 19 亿美元的资金。2017 年 6 月，收购总部位于香港的 Cirina Limited，为 GRAIL 提供了许多专利和与产品相关专利的独家许可。　　在成立之初，GRAIL 便募集了超过 1 亿美元的 A 轮融资。其目标是开发通过单次抽血就能检测大部分类型癌症的泛癌种检测技术。为了实现该目标， GRAIL 启动了迄今为止规模最大的临床项目一 “循环游离基因组图谱研究” （Circulating Cell-free Genome Atlas，CCGA）。在这项试验中，GRAIL

20200510文献速递

阅读更多关于 20200510文献速递

一文献题目： Single-cell RNA-seq analysis of the brainstem of mutant SOD1 mice reveals perturbed cell types and pathways of amyotrophic lateral sclerosis. 不想看英文题目： SOD1突变小鼠脑干的单细胞RNA序列分析揭示了肌萎缩性侧索硬化的细胞类型和途径。背景：肌萎缩性侧索硬化症（ALS）的发病机制涉及多种细胞类型（例如星形胶质细胞和小胶质细胞），为了确定哪一种细胞类型影响ALS，使用单细胞RNA测序（scRNA-seq）方法进行鉴定。杂志和影响因子： Neurobiol Dis（IF： 5.16）样本量：两只SOD1(G93A) 突变的转基因小鼠，以及两只年龄匹配的野生型小鼠。分别从突变型和野生型小鼠中分离出3199 和1894个细胞。分析方法：通过查找细胞簇内突变细胞和野生型细胞之间的差异表达基因（DEG），鉴定单细胞中ALS相关的基因。使用KEGG，Reactome，BIOCARTA和Gene Ontology数据库对差异表达基因进行注释。最后将已发表肌萎缩性侧索硬化症的GWAS文献和单细胞测序鉴定出来的差异表达基因进行重合，进一步确认可能与肌萎缩性侧索硬化症相关的基因结论：

抄袭Nature封面？加州大学付向东教授实名举报中科院明星学者杨辉学术抄袭

阅读更多关于抄袭Nature封面？加州大学付向东教授实名举报中科院明星学者杨辉学术抄袭

上周的 Nature 封面研究被 4 月登上《细胞》杂志的论文抄袭了？昨日，一条消息突然引爆学术界：美国加州大学圣地亚哥分校细胞与分子医学系付向东教授实名举报中科院上海神经所 80 后明星学者杨辉学术抄袭、造假。此次举报的直接原因是两篇关于通过敲降 PTBP1 治疗帕金森综合征的研究。其中，付向东教授的论文发表于今年 6 月 25 日的《自然》杂志，投稿时间为 2018 年 11 月 12 日。杨辉博士的论文发表于今年 4 月的《细胞》杂志。 6 月 25 日《自然》杂志的封面。论文链接： https://www. nature.com/articles/s41 586-020-2388-4 付向东等人在 Nature 发表的研究中，研究人员成功地将患帕金森综合症的小鼠恢复了正常，这可能会改变帕金森症治疗的现状，被认为意义重大。但很多人可能没有注意到在这篇论文中还有这样一句话：「在我们的工作接收同行评审时，概念相关的结果也出现在了其他地方。」在 Nature 文章中出现这样意有所指的话实属罕见。付向东等人提到的，就是杨辉等人发表在 Cell 上的论文《Glia-to-neuron conversion by CRISPR-CasRx alleviates symptoms of neurological disease in mice》论文链接： https://www

实名举报！加州大学付向东教授控诉80后明星教授杨辉学术抄袭、造假

阅读更多关于实名举报！加州大学付向东教授控诉80后明星教授杨辉学术抄袭、造假

　　　　作者 | 青暮　　编辑 | 丛末　　今日，一份实名举报的帖子登上了知乎热榜第一，具体事情是：美国加州大学圣地亚哥分校细胞与分子医学系付向东教授写举报信，实名举报中科院上海神经所80后明星教授杨辉学术抄袭、造假。　　　　根据举报信的title，这封信同时发给了中科院、科技部、基金委。　　举报的具体内容是：付向东受蒲慕明所长邀请，去中科院神经所做学术报告，报告内容是还未发表的研究成果。杨辉全程听了报告，并在晚饭期间询问了实验细节。　　随后，据付向东在信中所言，杨辉在全面了解付向东的研究思路和成功的实验结果后，换一种实验技术进行重复研究工作，从而写成论文投稿到Cell，并被此杂志接收，其论文发表时间先于付向东的Nature论文。　　另外，在信中，付向东呼吁国家科技管理高层，关注和重视当前国内学术界日益凸显和严重的科学诚信和学术道德问题，以维护中国科学界的声誉。　　 1 　　事件原委　　据网友爆料，这件事情具体时间细节是这样的：　　付向东2018年11月就向Nature投了论文，这项研究提出的技术有望改变帕金森氏症治疗现状。由于结论太重量级（诺奖级别），论文一直处于审核状态。2018年6月14日，中科院神经所的蒲慕明邀请付向东来国内做报告，付向东在报告中把论文细节全部说出，包括科学思路、全部实验设计和研究结果。　　中科院神经所研究员杨辉听了报告以后

因为Excel，科学家们修改了27种人类基因的名称

阅读更多关于因为Excel，科学家们修改了27种人类基因的名称

　　电子表格类软件，已经深度参与到我们日常工作的各个环节。　　而其中的翘楚无疑是微软的 Excel，不管是 WPS 或是 Numbers，都无法撼动这款已经拥有 35 年历史的软件。但最近它的某些功能却给一些科学家们带来了困扰。　　藏在基因名称中的“隐患” 　　人类基因组，有 23 对染色体，包含约 30 亿个 DNA 碱基对，部分碱基对组成了大约 20000 到 25000 个基因。在科学研究中，学者需要为每个基因起一个特定的名称以便快速定位，这些名称一般由字母加数字的形式组成。　　但是在最近一年左右的时间里，有约 27 种人类基因被重新命名，Excel 正是这一系列行为的“肇事者”，它会将这些基因名称误读为日期格式，并直接修改成了默认格式。　　这种事情并不新鲜，我们每个人或多或少都遇到过类似情况。　　但是，当 Excel 将一些关键数据误读，而科学家们恰好使用这些数据来分析，甚至临床试验的时候，就可能产生不可挽回的严重后果。　　当遇到类似情况时，科学家们必须手工设置单元格格式以还原数据，但难免也会产生遗漏的情况。据一项 2016 年的调查表明，这类 “Bug” 非常普遍，以至于在 3597 篇样本论文中，约五分之一都受到了影响。　　　　图 | 微软 Excel 将基因名称误读作日期　　“这真的非常非常烦人”，英国 Quadram 研究所的系统生物学家

后疫情时代，初创企业生存之策

阅读更多关于后疫情时代，初创企业生存之策

作者： Nutanix亚太及日本地区高级副总裁兼销售负责人 Matt Young 初创企业总是面临着救火、融资等“生存”挑战，尤其在当下的特殊环境中，效率、产能和增长的压力急剧增大，流动性受阻，融资更加困难和严格，使初创企业的生存变得格外艰难。根据市场调研公司Start-up Genome的研究报告，新冠肺炎疫情首先冲击了中国的创业生态系统，其后亚洲和全球其他地区也接连受创。在疫情爆发的前两个月里，中国初创企业融资额下降了50% 以上。大多数初创企业业务结构比较精简，因此任何来自个人或社会的切实冲击都会加重对企业生产和运营的负面影响。尤其是新冠肺炎疫情爆发后，员工受到出行限制、隔离或滞留都会进一步加剧这一影响。供应链中断是另一个需要担忧的层面。成熟企业在多年的发展中早已实现了供应链多样化，而初创企业则倾向选择较小的供应商群体，供应链更为集中。中国是基础组件的主要大宗供应市场，新冠肺炎疫情中工厂停工和员工出行限制导致的减产可能会在中短期内给企业订单执行和增长带来挑战。同样，在外包商无法维持正常业务运营时，呼叫中心和后台工作流程业务也会受到限制。生产力下降、订单无法完成将影响所有初创企业的生命线——现金流和流动性。好消息是，融资并不会完全消失。只是在目前的环境下，融资会更加困难，完成融资所需的周期会更长，投资者对企业也会更加挑剔。融资难题将加速供应链的多样化

解密阿里云高效病原体基因检测工具

阅读更多关于解密阿里云高效病原体基因检测工具

1.背景介绍病原体基因检测，为各种严重感染的诊断提供了基础。病原体检测流程分成五个步骤：（1）采集病人的样本，比方说静脉血，痰液，肺泡灌洗液，或者脑脊髓液等。（2）对样本进行培养，提取样本中的核酸组织。（3）通过高通量基因测序仪，对核酸序列进行测序。高通量测序为了保证精度，会将很长的核苷酸序列，切成小的分片，分别进行测序，在读取基因序列上，一般是50pb到200bp不等。（4）高通量测序之后，需要查询相关的病原体标准序列，找到匹配的基因序列。（5）通过将这些小的片段进行分析，得到全部基因片段的组成成分（即检测结果），从而为病人的疾病确诊以及精准治疗提供有力的支持。图1. 病原体基因检测流程对于生物分析检测来说，通常情况下，一次病原体检测，大约会生成5亿左右的75bp的基因片段。过滤掉一些人的基因组织序列之后，还需要查询1亿左右的基因片段。通常情况下，会使用nBlast [1]工具来进行基因匹配，这部分在整个病原体检测过程中，也是非常耗时的部分，大约需要2-3个小时。阿里云AnalyticDB向量版提供了一个高效的基因检索工具，大大提升了基因分析的性能，能够在几十分钟内完成整个病原体的查询检测过程。 2.基因检索应用 2.1 基因检索功能图1展示了病原体基因检索的界面。当前演示包含了12182个病毒的碱基序列，我们将病毒切分成150bp的小片段（总共1590804个片段）

Visual Question Answering: A Survey of Methods and Datasets

阅读更多关于 Visual Question Answering: A Survey of Methods and Datasets

Abstract 视觉问答（VQA）是一项具有挑战性的任务，已受到计算机视觉和自然语言处理社区的越来越多的关注。给定图像和自然语言的问题，就需要对图像的视觉元素和常识进行推理，以推断出正确的答案。在本调查的第一部分中，我们通过比较解决问题的现代方法来检查最新技术。我们通过它们将视觉和文本模态联系起来的机制对方法进行分类。特别是，我们研究了结合卷积神经网络和递归神经网络将图像和问题映射到公共特征空间的通用方法。我们还将讨论与结构化知识库交互的内存增强型和模块化体系结构。在本调查的第二部分，我们回顾了可用于培训和评估VQA系统的数据集。各种数据集包含不同复杂程度的问题，这些问题需要不同的推理能力和类型。我们深入研究了Visual Genome项目中的问题/答案对，并评估了带有结构图的图像与VQA场景图的注释的相关性。最后，我们讨论了该领域有希望的未来方向，特别是与结构化知识库的连接以及自然语言处理模型的使用。 1. Introduction 视觉问题解答是一项旨在将计算机视觉与自然语言处理（NLP）联系起来，促进研究并推动这两个领域界限的任务。一方面，计算机视觉研究了获取，处理和理解图像的方法。简而言之，其目的是教机器如何看。另一方面，NLP是涉及以自然语言实现计算机与人之间的交互的领域，即教学机器如何阅读以及其他任务。计算机视觉和NLP都属于人工智能领域

文献速递20200531

阅读更多关于文献速递20200531

本周最新文献速递一文献题目： Identification of ALK in Thinness 不想看英文题目： ALK基因：让人更瘦杂志和影响因子： Cell (IF: 36.216) 样本量：以BMI低于6%的881个个体作为case，BMI在30-50%的3173个个体作为control 分析方法：利用GWAS分析鉴定出与瘦子相关的候选位点和基因，随后在果蝇和小鼠体内敲除候选基因，观察果蝇和小鼠的代谢、组织、形态、行为发生的变化结论： GWAS发现ALK为瘦子的候选基因，敲除果蝇ALK基因后，果蝇的甘油三酯水平降低，突变小鼠的体重降低、脂肪含量变少。文章链接： https://www.sciencedirect.com/science/article/pii/S0092867420304979 二文献题目： Whole Genome Sequencing Identifies Novel Functional Loci Associated with Lung Function in Puerto Rican Youth 不想看英文题目：全基因组测序鉴定肺功能相关的位点杂志和影响因子： Am J Respir Crit Care Med (IF: 16.494) 样本量： 720名哮喘患者和116个健康个体分析方法：使用全基因组测序发现候选位点

订阅 genome