beam

conda update -n base -c defaults conda

狂风中的少年 提交于 2021-02-13 11:04:02
At the top of the electron microscope is the electron gun. As we've discussed it has a filament and then what's often called the Wehnelt cylinder. And then an accelerator stack to accelerate the electrons as they come out and head down the column. And this is called the electron gun. Next we have the first lens system, which is called the condenser lens system. Complete with a set of deflectors and lenses, usually there's two called C1 and C2, stigmators and an aperture. The purpose of the condenser lens is to take the electrons coming out of the gun and focus and direct them onto the sample.

Multi-modal Multi-label Emotion Detection with Modality and Label Dependence 阅读笔记

孤街醉人 提交于 2020-12-31 20:18:09
背景 这篇文章讲的是 多标签的情感分析 , 这篇文章是考虑多模态的情感分析, 因为是多标签 所以需要考虑不同标签的依赖性,以及每个标签对不同模态的依赖性 任务的具体例子是: 给定一个视频,包括三个模态信息 ( 视觉, 文本, 声音 )然后给出情感倾向(可以是多个) 文章指出 多标签分类比单标签分类要更加难 , 以主要挑战是如何去对标签之间的依赖性进行建模, 正如上图所说, 一个Sad 很有可能 和Disgust 是同时出现的, 但是有很小可能会出现 happy 和 sad。 论文内容 特征初步提取 Text : word embedding 用的是GLoVe, 没有句子的概念, 文本 表示为 单词数 ×单词维度 Visual : Facet 提取视觉特征, 包括 面部动作单元,面部标志,头部姿势,凝视追踪, 一共34维, 一个视频提取多个帧 Audio : COVAREP 提取声音特征 包括: 12 Mel-frequency cepstral coefficients (MFCCs), pitch, voiced/unvoiced segmenting features 问题描述 (好像EMNLP都有这个部分) 这里主要是介绍一下符号, 可以在后面模型结构中再进行解释, 但是有一点注意其优化目标 因为是一个多标签问题, 其优化目标就是, 找到一个最优 label序列 就是要最大化

语音专题第一讲,麦克风阵列的语音信号处理技术

痞子三分冷 提交于 2020-12-19 06:24:29
https://blog.csdn.net/ffmpeg4976/article/details/52397000 转载自地平线机器人大讲堂,主讲人徐荣强。 2011年11月毕业于英国爱丁堡大学通信与信号处理专业,曾任诺基亚,联想,微软高级音频工程师。现在Horizon-Robotics负责语音相关硬件系统设计,涉及远场高灵敏度麦克风阵列设计,高精度音频硬件编解码器评估验证,远场语音前处理算法的评估验证,涉及声源定位,波束形成,盲信号分离,回声抑制及平稳降噪等相关技术算法。 前言 随着人工智能与人们的生活越来越近,语音技术的发展也备受关注。传统的近场语音已经无法满足人们的需求,人们希望可以在更远的距离,更复杂的环境中语音控制智能设备。因此,阵列技术成为远场语音技术的核心。 阵列麦克风对人工智能的意义: 空间选择性:通过电扫阵列等空间定位技术可以获取声源的有效位置,智能设备在获取精准的声源位置信息,让我们的语音更加智能,通过算法获取高品质的语音信号质量。 麦克风阵列可以自动检测声源位置,跟踪说话人,同时可以获取多声源和跟踪移动声源的优势,无论你走到任何位置,智能设备都会对你的位置方向进行语音增强。 阵列麦克风增加了空域处理,对多信号空时频三维的处理弥补单信号在噪声抑制,回声抑制,混响抑制,声源定位,语音分离方面的不足,让我们的智能设备在复杂的环境中都可以获取高质量的语音信号

UC伯克利摘最佳论文、Hugging Face获最佳demo,EMNLP 2020奖项公布

拥有回忆 提交于 2020-11-20 08:15:09
刚刚,正在进行中的 EMNLP 2020 大会公布了一系列奖项,其中最佳论文奖由加州大学伯克利分校的研究者获得,爱丁堡大学华人博士生 Yanpeng Zhao 为一作的论文获得了最佳论文荣誉提名奖(共 4 篇论文获此奖项)。另外,本届大会的最佳 Demo 奖由大家非常熟悉的 Hugging Face 团队摘得。 机器之心报道,编辑:魔王、杜伟、小舟。 EMNLP 是国际语言学会(ACL)下属的 SIGDAT 小组主办的自然语言处理领域的顶级国际会议,每年举办一次。受疫情影响,今年的 EMNLP 会议以线上形式举行。 EMNLP 2020 共收到投稿 3677 篇,其中有效投稿为 3359 篇,接收论文数量为 752 篇,包括长论文 602 篇、短论文 150 篇。 从接收率看,EMNLP 2020 的论文接受率创下新低,为 22.4%。其中长论文接收率为 24.6%,短论文接收率为 16.6%。 根据大会公布信息,美国、中国、英国、德国、印度、加拿大、日本的论文投稿量最多,中美两国均有 1000 余篇论文投稿。而就各国论文接收率而言,英国、新加坡和丹麦的论文接收率名列前茅,中国的论文接收率仅有 13.2%,低于大会平均接收率。 另外,我们参考了 Aminer 平台对于 EMNLP 2020 会议的统计数据。从热门选题来看,EMNLP 2020 会议涉及了语言模型、神经机器翻译

TeaForN:让Teacher Forcing更有“远见”一些

淺唱寂寞╮ 提交于 2020-11-08 11:35:55
©PaperWeekly 原创 · 作者|苏剑林 单位|追一科技 研究方向|NLP、神经网络 Teacher Forcing 是 Seq2Seq 模型的经典训练方式,而 Exposure Bias则是 Teacher Forcing 的经典缺陷,这对于搞文本生成的同学来说应该是耳熟能详的事实了。笔者之前也曾写过文章 Seq2Seq中Exposure Bias现象的浅析与对策 ,初步地分析过 Exposure Bias 问题。 本文则介绍 Google 新提出的一种名为“ TeaForN ”的缓解 Exposure Bias 现象的方案,来自论文 TeaForN: Teacher-Forcing with N-grams ,它通过嵌套迭代的方式,让模型能提前预估到后 N 个 token(而不仅仅是当前要预测的 token),其处理思路上颇有可圈可点之处,值得我们学习。 论文标题: TeaForN: Teacher-Forcing with N-grams 论文链接: https://arxiv.org/abs/2010.03494 (注:为了尽量跟旧文章保持一致,本文的记号与原论文的记号有所不同,请大家以理解符号含义为主,不要强记符号形式。) Teacher Forcing 文章 Seq2Seq中Exposure Bias现象的浅析与对策 已经相对详细地介绍了 Teacher

内容推荐算法:异构行为序列建模探索

徘徊边缘 提交于 2020-10-24 06:27:19
很多秃头小可爱沉迷熬夜逛淘宝,以下是 来自宇宙洪荒之力的最新线报: 男生比女生多 天蝎座多 夜间小裙子搜索量位居第一 ...... 尤其,每晚有1700万人在淘宝只逛不买,他们到底在干什么? 看完视频和下方文章,你就知道为什么上头了。 前言 来洋淘, 更有young! 洋淘轻应用的内容均是手淘用户的真实购后分享, 在这里,你可以个性化地浏览他人的美好生活, 并鼓励自我表达与分享。 图1. 洋淘轻应用截图, 左) 为双列流, 右) 为详情页 在推荐任务上,同导购产品相比,洋淘场景有着自身的特性: 新用户冷启严峻,六成以上的用户无洋淘场景内的历史内容点击; 老 用户内容兴趣也稀少,历史内容点击数不超过10,反观商品点击数却高达数倍; 用户在电商与内容两个 domain 的兴趣差异较大。 统计日志发现,电商兴趣对洋淘场景下内容点击样本的覆盖度仅为 30% 。 于是,如何把跨域的异构行为用好,提升用户的浏览深度就显得弥足珍贵。我们从 召回 , ctr预估 两大关键环节均作了探索与创新, 大幅提升了推荐效果, 取得了显著的业务收益。 向量召回模型In_Match 前文提到内容兴趣不够用,我们首先基于i2i尝试了商品与内容的混合协同,取得了一定的收益。然后基于电商兴趣的标题作相关内容的严格相似召回,却收益为负,这说明跨域的兴趣不可生搬硬套,也与前文的兴趣差异统计相吻合。

这么多年,终于有人讲清楚Transformer了

故事扮演 提交于 2020-10-21 14:31:06
作者 | Jay Alammar 译者 | 香槟超新星,责编 | 夕颜 来源 | CSDN(ID:CSDNnews) 注意力机制是一种在现代深度学习模型中无处不在的方法,它有助于提高神经机器翻译应用程序性能的概念。在本文中,我们将介绍Transformer这种模型,它可以通过注意力机制来提高训练模型的速度。在特定任务中,Transformer的表现优于Google神经机器翻译模型。但是,最大的好处来自于Transformer如何适用于并行化。实际上,Google Cloud建议使用Transformer作为参考模型来使用其Cloud TPU产品。因此,我们试试将模型分解开吧,看看它是如何工作的。 Attention is All You Need一文中提出了Transformer。它的TensorFlow实现是Tensor2Tensor包的一部分。哈佛大学的NLP团队创建了一份指南,用PyTorch实现对这篇文章进行注释。在本文中,我们将试着尽可能地简化讲解,并逐一介绍概念,希望能让那些对这方面没有深入知识的人们更容易理解Transformer。 Transformer概览 首先,让我们先将模型视为一个黑盒。在机器翻译应用程序中,这个模型将拿一种语言中的一个句子,然后以另一种语言输出其翻译。 打开擎天柱的引擎盖(Optimus Prime,Transformer与变形金刚是同一个词

国内基因编辑疗法单笔最大金额融资!博雅辑因完成4.5亿元B轮融资

生来就可爱ヽ(ⅴ<●) 提交于 2020-10-15 19:48:23
  今日, 博雅辑因宣布完成 4.5 亿元 B 轮融资。 本轮融资由三正健康投资领投,红杉资本中国基金、雅惠投资、昆仑资本跟投,公司现有投资者 IDG 资本、礼来亚洲基金、华盖资本、松禾资本跟投。 博雅辑因称融资资金将用于推进研发管线临床转化并进一步扩充团队。   博雅辑因成立于 2015 年,总部位于北京,主要是以基因编辑技术为基础,针对多种疾病加速药物研究并开发创新疗法。目前该公司拥有以基因编辑技术为中心的四大平台, 包括造血干细胞平台、通用型 CAR-T 平台、RNA 碱基编辑平台、药物研发平台。 并建立了国内首个 GMP 级别基因编辑临床应用中心。   自成立以来, 博雅辑因已完成超 7 亿元融资,且 B 轮融资规模具备基因编辑疗法领域国际领军企业水准。 CRISPR Therapeutics(纳斯达克:CRSP)的 B 轮融资金额是 1.4 亿美元,并且是在 2015-2016 年多轮完成的;2015 年,Editas Medicine(纳斯达克:EDIT)完成了 1.2 亿美元 B 轮融资;2015 年,Intellia Therapeutics(纳斯达克:NTLA)完成了 7000 万美元的 B 轮融资;2019 年,Beam Therapeutics(纳斯达克:BEAM)完成了 1.35 亿美元的 B 轮融资。   (来源:生辉根据公开资料整理)   关于此次融资

专访博雅辑因丨我们希望做一家优秀的基因编辑转化公司,关键是治病救人

你说的曾经没有我的故事 提交于 2020-10-13 10:01:05
     从 2012 年新的 CRISPR 系统被发现,到如今进入癌症、眼科疾病等多领域疾病的研究,基因编辑技术取得了长足发展并已逐渐从实验室走向临床。基因编辑技术的下一步转化成为重要“课题”。   2018 年,美国生物技术公司 Sangamo 开启了基因疗法治疗镰状细胞病 (sickle cell disease, SCD) 临床试验,希望治疗这种遗传性血液疾病。CRISPR Therapeutics 和 Vertex Pharmaceuticals 也于 2018 年开展了治疗同类疾病的临床研究。去年 12 月,博雅辑因在美国血液学年会上发布其 β- 地中海贫血基因编辑治疗项目的规模化生产及临床前安全性和有效性试验数据;今年 5 月,博雅辑因与艺妙神州宣布合作研发治疗肿瘤的通用型 CAR-T 疗法,引来业界关注。   博雅辑因由基因编辑技术领军人物、北京大学生命科学学院教授魏文胜于 2015 年创立,致力于将前沿的基因组编辑技术转化为治疗遗传病和癌症的创新疗法,同时为药物研发提供解决方案。目前,博雅辑因已开发出针对造血干细胞和 T 细胞的体外细胞基因编辑治疗平台,基于 RNA 单碱基编辑技术的体内基因治疗平台和针对靶向药物研发的高通量基因组编辑筛选平台等四大平台。   2018 年,魏东博士加入博雅辑因并担任首席执行官。魏东博士拥有 20

DICOMRT:XXX Target Volume,各种目标体积浅析

独自空忆成欢 提交于 2020-10-07 04:41:54
题记: 记得某一堂课上,学数学的管理学老师讲过一句话,“科学就是分类”,通俗而易懂。此篇博文成文于三年前,当时作为初入该领域的调研资料,为了区分好诸多专业术语而整理而成。因为只有从基础概念入手理清楚了才能逐步深入。现如今发上来供大家讨论与批评指正。 一、背景介绍 肿瘤放射治疗是肿瘤治疗的三大手段之一,放射治疗(没有特殊说明,这里的放射治疗专指外照射,external beam radiotherapy)主要包括调强放疗(IMRT,Intensity Modulated Radiation Therapy)、图像引导放疗(IGRT,Image-Guided Radiation Therapy)、容积旋转调强放疗(VMAT,Volumetric Arc Therapy)等。三维适形放疗(3D Conformal Radiation Therapy)是一种将治疗过程中的射束形变以匹配肿瘤实体表面形状的技术(三维指的就是肿瘤体积的表面,适形指的就是每一个平面上都将射束调整到与该平面上肿瘤体积表面(这时候已经降维成了二维闭合曲线)最大程度吻合),确保癌变组织接受足够的剂量的同时,尽可能降低对周围正常组织的损伤。目标体积定义(Target Volume Definition)是三维适形治疗技术的先决条件,因此需要将肿瘤区域精确描述出来(包括勾画和定义)——这关乎到肿瘤治疗的精度和效果。