CTC

今日Paper|联合抽取;流式语音识别;差异学习;Skip-Thought向量等

烂漫一生 提交于 2020-04-17 20:02:41
   目录   在序列标注模型中使用位置注意力进行抽取实体与重叠关系的联合抽取   将混合CTC/Attention方法嵌入到Transformer结构中实现在线端到端的流式语音识别架构   基于人工反向修正数据的差异学习   利用一种基于多属性邻近度的方法从可比较的新闻语料库中挖掘事件   Skip-Thought向量    在序列标注模型中使用位置注意力进行抽取实体与重叠关系的联合抽取   论文名称:Joint extraction of entities and overlapping relations using position-attentive sequence labeling   作者:Dai Dai / Xinyan Xiao / Yajuan Lyu / Shan Dou / Qiaoqiao She / Haifeng Wang   发表时间:2019/7/17   论文链接:https://aaai.org/ojs/index.php/AAAI/article/view/4591   本文设计了一种基于位置信息和上下文信息的注意力机制,同时将一个关系抽取任务拆成了n(n为句子的长度)个序列标注子任务,一个阶段即可将实体、关系等信息抽取出来。   本文发表时在两个数据集上达到了SOTA,并且对于跨度长的关系、重叠关系表现尤其好。  

PaddlePaddle/DeepSpeech

别来无恙 提交于 2020-04-16 11:22:01
【推荐阅读】微服务还能火多久?>>> 语音识别: DeepSpeech2 English DeepSpeech2 是一个采用 PaddlePaddle 平台的端到端自动语音识别(ASR)引擎的开源项目,具体原理参考这篇论文 Baidu's Deep Speech 2 paper 。 我们的愿景是为语音识别在工业应用和学术研究上,提供易于使用、高效和可扩展的工具,包括训练,推理,测试模块,以及 demo 部署。同时,我们还将发布一些预训练好的英语和普通话模型。 目录 安装 开始 数据准备 训练模型 数据增强流水线 推断和评价 在 Docker 容器上运行 超参数调整 训练汉语语言 用自己的声音尝试现场演示 发布模型 试验和基准 问题和帮助 安装 为了避免环境配置问题,强烈建议在 Docker容器上运行 ,否则请按照下面的指南安装依赖项。 前提 只支持Python 2.7 PaddlePaddle 1.6.0 版本及以上(请参考 安装指南 ) 安装 请确保以下库或工具已安装完毕: pkg-config , flac , ogg , vorbis , boost 和 swig , 如可以通过 apt-get 安装: sudo apt-get install -y pkg-config libflac-dev libogg-dev libvorbis-dev libboost-dev

【AI in 美团】 深度学习在OCR中的应用

二次信任 提交于 2020-03-27 17:59:38
3 月,跳不动了?>>> 背景 计算机视觉是利用摄像机和电脑代替人眼,使得计算机拥有类似于人类的对目标进行检测、识别、理解、跟踪、判别决策的功能。以美团业务为例,在商家上单、团单展示、消费评价等多个环节都会涉及计算机视觉的应用,包括文字识别、图片分类、目标检测和图像质量评价等方向。本文将通过以OCR(光学字符识别)的场景来介绍深度学习在计算机视觉中的应用。 基于深度学习的OCR 文字是不可或缺的视觉信息来源。相对于图像/视频中的其他内容,文字往往包含更强的语义信息,因此对图像中的文字提取和识别具有重大意义。OCR在美团业务中主要起着两方面作用。一方面是辅助录入,比如在移动支付环节通过对银行卡卡号的拍照识别以实现自动绑卡,辅助运营录入菜单中菜品信息,在配送环节通过对商家小票的识别以实现调度核单,如图1所示。另一方面是审核校验,比如在商家资质审核环节对商家上传的身份证、营业执照和餐饮许可证等证件照片进行信息提取和核验以确保该商家的合法性,机器过滤商家上单和用户评价环节产生的包含违禁词的图片。 <center>图1 图像中的文字提取和识别流程</center> OCR技术发展历程 传统的OCR基于图像处理(二值化、连通域分析、投影分析等)和统计机器学习(Adaboost、SVM),过去20年间在印刷体和扫描文档上取得了不错的效果。传统的印刷体OCR解决方案整体流程如图2所示。

基于TPNN的儿童英语声学模型训练

本秂侑毒 提交于 2020-03-19 16:46:42
3 月,跳不动了?>>> 前言 TPNN作为学而思网校自主研发的深度学习平台,专门针对声学模型训练进行了架构优化,可以轻松帮助研发人员完成语音特征和解码器的无缝对接,同时在此框架下,我们也实现了主流的声学模型架构和高效的多卡训练技术,在TPNN的框架下,我们进行了大规模数据下儿童声学模型的技术研发。 通过大量实验,包括模型结构,特征维度,建模单元等,结合n-gram语言模型,融入了上万小时的儿童英语数据,最终实现了最适合中国儿童的英语识别的声学模型架构,我们的儿童声学模型可以达到92%以上的识别精度,拥有领先业界的性能。 同时考虑到业务的需要,我们也实现了儿童声学模型的离线识别方案,利用8bit量化,neon优化,混合精度运算等技术,我们可以在损失少量的性能的情况下,在移动端达到接近服务器的计算速度。 本文将从TPNN的“多卡训练技术” “声学模型训练” “移动端的模型优化”这几个方面为大家介绍学而思网校的儿童声学模型训练技术。 一、TPNN的多卡加速技术 基于深度学习的的声学模型在语音识别领域取得了巨大的成功,但这些模型的训练都必须建立在海量的数据训练上,面对海量的训练数据,模型的训练时间大大增加,识别会严重拖慢研究和开发进度。 因此高效的多卡训练方案对于一个深度学习框架是一个非常重要的环节。 TPNN拥有在NVidia的NCCL通信框架基础上,利用BMUF技术

Understanding CTC loss for speech recognition in Keras

删除回忆录丶 提交于 2020-01-23 02:01:12
问题 I am trying to understand how CTC loss is working for speech recognition and how it can be implemented in Keras. What i think i understood (please correct me if i'm wrong!) Grossly, the CTC loss is added on top of a classical network in order to decode a sequential information element by element (letter by letter for text or speech) rather than directly decoding an element block directly (a word for example). Let's say we're feeding utterances of some sentences as MFCCs. The goal in using CTC

Using Tensorflow's Connectionist Temporal Classification (CTC) implementation

拜拜、爱过 提交于 2019-12-20 08:50:44
问题 I'm trying to use the Tensorflow's CTC implementation under contrib package (tf.contrib.ctc.ctc_loss) without success. First of all, anyone know where can I read a good step-by-step tutorial? Tensorflow's documentation is very poor on this topic. Do I have to provide to ctc_loss the labels with the blank label interleaved or not? I could not be able to overfit my network even using a train dataset of length 1 over 200 epochs. :( How can I calculate the label error rate using tf.edit_distance?

RPA 有哪些应用案例

守給你的承諾、 提交于 2019-12-19 16:36:43
【推荐】2019 Java 开发者跳槽指南.pdf(吐血整理) >>> 案例 1 –网站爬取   RPA软件是针对特定规则将其实施的理想选择,获取已知信息或从网站上爬去的数据-例如,股票交易网站,期货交易网站,商品交易网站,新闻和媒体网站(基于关键字)。可以轻松地爬去这些网站以获取感兴趣的特定信息,对其进行汇总,然后可以将其呈现给所需的利益相关者,以要求下一步如何处理此信息。    借助 RPA 进行网络爬去的优势   ●更少的错误和成本   ●定制爬取   ●设置更快   ●收集社交媒体数据   ●自动执行批量下载任务   ●无需维护团队进行抓取   ●简单快捷的设置    案例 2 –客户订单处理   在实际工作中可能将放置在许多电子商务网站上的订单放置在实际存储库中以进行实际调度,并保持与面向客户的订单不同的库存记录。这样的数据输入过程可以移交给 RPA 解决方案,因为定单的整个过程将自始至终实现自动化。与由于误解可能导致的任何手动错误相比,可以更好地保持数据的准确性。    RPA 自动化处理客户订单的优势   ●改善客户体验   ●消除手动输入时间   ●改善数据控制   ●降低成本   ●高灵活性   ●改善投资报酬率    案例 3 –发送客户电子邮件查询处理   如果您是服务公司,需要答复收件箱中的数千封电子邮件以进行响应,那么您肯定难以搞定这种情况,此时 RPA

机器学习中的End-to-End到底是怎么回事?

廉价感情. 提交于 2019-12-18 16:51:34
【推荐】2019 Java 开发者跳槽指南.pdf(吐血整理) >>> 简单讲就是,Input--->系统(这里指神经网络)--->Output(直接给出输入,NN神经网络就给出结果,一气喝成!!!) 借用一段对话:(http://dy.163.com/v2/article/detail/C3J6F2NJ0511AQHO.html)   机器之心:那你现在最主要的兴趣是在视觉和在语言处理这方面的这个方向吗?   田渊栋:这些方向都会有涉及。但现在时代不同了,不应该把自己限制在视觉或者某个特定方向。   机器之心:不是一个专门的应用。   田渊栋:对,因为感觉上自然语言处理、图像、语音,这些基本上都是应用了。所以说如果必要的话,其实可以在这个中间进行切换,或者做一些交叉的方向。以前做这三个方向,可能需要大量的领域知识,特别是做自然语言处理,要学以前语言学的文献。要做分词,比如说每个词给一些词性。要做一些语法的分析、语素的分析,有很多很多的步骤。但现在的趋势是从头到尾都让机器学。   机器之心:就是他们说的 end-to-end。   田渊栋:是的,end-to-end 端对端的学习。比如说自然语言这一块,并没有比以前的效果好太多,但整个流程变得很简单方便,将来进步的速度可能就会变快。比如机器翻译里面,你把一个句子,直接通过神经网络翻译成另外一个语言的句子,这样就比以前快

Connectionist Temporal Classification (CTC) blank label

戏子无情 提交于 2019-12-13 12:34:39
问题 I am trying to use the CTC loss function in my network, but don't quite understand when to feed the 'blank' label as a label. I use it in gesture recognition as described byMolchanov, but what get's me confused that there is a 'no gesture' as well. In tensorflow docs, it is described that The inputs Tensor's innermost dimension size, num_classes, represents num_labels + 1 classes, where num_labels is the number of true labels, and the largest value (num_classes - 1) is reserved for the blank

Necroptosis|Apoptosis|CTC|

余生颓废 提交于 2019-12-12 01:37:20
大数据 - 外周血研究 Necroptosis 与 Apoptosis... 区别:肿瘤导致和自身凋亡。 CTC ,肿瘤细胞脱落进入外周血, CTC (循环肿瘤细胞, CirculatingTumorCell )是存在于外周血中的各类肿瘤细胞的统称 , 通过检测 CTC 来判断预后。可通过荧光检测 single CTC 和 CTC clusters 。 CTC 比 self free DNA 的研究价值更高。 Eg :用 7 个 self free DNA 预测早产 白细胞的类型: 白细胞 种类划分 血液中的 白细胞 有五种,按照体积从小到大是:淋巴细胞,嗜碱性粒细胞,中性粒细胞,嗜酸性粒细胞和单核细胞。 白细胞 是无色有核的血细胞,在血液中一般呈球形,根据形态差异可分为颗粒和无颗粒两大类。 Eg :判别感冒类型 Eg :预测胎龄 来源: https://www.cnblogs.com/yuanjingnan/p/12026775.html