网络模型

(KWS-DNN)Small-footprint keyword spotting using deep neural networks

半世苍凉 提交于 2020-02-19 11:47:31
会议:ICASSP 2014 论文: Small-footprint keyword spotting using deep neural networks 作者:Guoguo Chen ; Carolina Parada ; Georg Heigold Abstract 我们的应用程序需要具有内存占用量小,计算成本低和精度高的关键字查找系统。为了满足这些要求,我们提出了一种基于深度神经网络的简单方法。训练深度神经网络以直接预测关键词或关键词的子词单元,然后采用后处理方法产生最终的置信度得分。相对于基于竞争性的基于隐马尔可夫模型的系统,关键字识别结果实现了45%的相对改进,而在有杂音的情况下,性能则显示了39%的相对改进。 INTRODUCTION 由于智能手机和平板电脑的快速发展,使用语音与技术进行交互变得司空见惯。例如,Google提供了在Android设备上通过语音搜索[1]的功能,而Apple的iOS设备配备了名为Siri的会话助手。这些产品允许用户点击设备,然后说出查询或命令。 我们有兴趣通过开发一个系统来连续不断地收听特定的关键字来启动语音输入,从而使用户拥有完全的免提体验。这在开车等情况下尤其有用。所提出的系统必须高度准确,低延迟,占用空间小,并且必须在计算受限的环境(例如现代移动设备)中运行。在设备上运行系统避免了连接到服务器进行识别的延迟和功耗问题。 关键字搜寻

网络osi七层模型——传输层和应用层

和自甴很熟 提交于 2020-02-18 15:18:31
网络osi七层模型—传输层和应用层 传输层 TCP/IP是指一整套数据通信协议,传输层完成端到端的连接和传输 TCP/IP传输层包含以下两个协议: * 传输控制协议TCP(Transmission Control Protocol) * 用户数据报文协议UDP(User Dategram Protocol) UDP是一个简单的面向数据包的传输层协议 * UDP不提供可靠性 * 传输小数据文件中发挥了重要的作用 * QQ聊天就是使用了UDP的传输机制 应用层 应用层的功能:和应用程序协同工作,利用基础网络交换应用程序之间专用的数据。 常用的应用层协议: * http超文本传输协议 * 用于传输Internet浏览器使用的普通文本、超文本、音频和视频等数据 * 端口号为tcp的80端口 * https基于安全套接字层的http协议 * 基于http开发,提供加密,可以确保消息的私有性和完整性 * 端口号为443端口 * ftp文件传输协议 * 用于传输文件 * 端口为TCP的21和20端口 * dns域名系统 * 用来完成域名与IP地址之间的映射 * 端口号为TCP或UDP的53端口 * smtp邮件传输协议 * 用于发送和接收邮件 * 端口号为25 * pop3邮局协议 * 用于客户端接收邮件 * 端口号为110 * ssh安全外壳协议 * SSH 为建立在应用层基础上的安全协议

Docker三十分钟快速入门(下)

微笑、不失礼 提交于 2020-02-15 23:06:13
一、背景   上篇文章我们进行了Docker的快速入门,基本命令的讲解,以及简单的实战,那么本篇我们就来实战一个真实的项目,看看怎么在产线上来通过容器技术来运行我们的项目,来达到学会容器间通信以及docker-compose学习以及docker网络模型学习的目的。 二、项目描述 创建Todo应用,功能很简单,实现创建Task关联Task分类,以及更新Task的完成状态的功能。 项目运行后的主界面如下:      三、启动项目 因为是使用git管理的maven java项目,所以需要首先在服务器上安装java、maven、git 三大件     传送门: Centos7下Java开发基本环境搭建 Git入门教程传送门: 谈谈分布式版本管理工具Git 接着把github上的项目源码clone到本地 git clone https://github.com/hafizzhang/mysql-spring-boot-todo.git 进入到项目根目录 cd mysql-spring-boot-todo 使用maven命令进行打包项目并且使用docker命令进行build镜像 mvn clean package docker:build 用容器启动mysql 5.6版本 docker run --name mysql -e MYSQL_ROOT_PASSWORD=password -e

受限玻尔兹曼机和深度置信网络

爱⌒轻易说出口 提交于 2020-02-15 15:23:36
2016-07-20 11:21:33 1受限玻尔兹曼机 梯度下降法 (以及相关的L-BFGS算法等)在使用随机初始化权重的深度网络上效果不好的技术原因是:梯度会变得非常小。具体而言,当使用 反向传播方法 计算导数的时候,随着网络的深度的增加,反向传播的梯度(从输出层到网络的最初几层)的幅度值会急剧地减小。结果就造成了整体的损失函数相对于最初几层的权重的导数非常小。这样,当使用梯度下降法的时候,最初几层的权重变化非常缓慢,以至于它们不能够从样本中进行有效的学习。这种问题通常被称为“梯度的弥散”[4]。 与梯度弥散问题紧密相关的问题是:当神经网络中的最后几层含有足够数量神经元的时候,可能单独这几层就足以对有标签数据进行建模,而不用最初几层的帮助。因此,对所有层都使用随机初始化的方法训练得到的整个网络的性能将会与训练得到的浅层网络(仅由深度网络的最后几层组成的浅层网络)的性能相似。 梯度弥散一直是困扰着深度神经网络的发展,那么如何解决梯度弥散问题呢?多伦多大学的Geoff Hinton提出了设想:受限玻尔兹曼机(Restricted Boltzmann Machines, RBM)[1],即一类具有两层结构的、对称链接无自反馈的随机神经网络模型(一种特殊的马尔科夫随机场)。 如图1所示,一个RBM包含一个由随机的隐单元构成的 隐藏层 (一般是伯努利分布)和一个由随机的可见(观测

使用 异步多线程TCP Socket 实现进程间通信(VC 6.0 , BCB6.0调试通过)

为君一笑 提交于 2020-02-14 23:57:08
进程间通信有很多种方式,比如说 Pipe,共享内存,DDE,Socket等,关于进程通信方面的知识我在这里就不讨论了,大家可以看我博客里的另一些文章有讲...今天我们主要讨论怎么样使用Socket实现进程间通信。 本程序将使用Socket 的WSAEventSelect异步方式,使用多线程,建立一个服务器类,使用此类的时候只需要将处理数据的函数指针传给该类,进行数据处理,本例中,服务器将启动一个客户端进程,让客户端像服务器发送数据,然后服务端收到数据后将数据打印出来进!从而达到进程通信的目的,当然,如果想进行数据的特殊处理的话,只需要改写处理函就行了,因为,服务器类只是接收函数指针。 本类在C++ builder 6.0 和 VC 6.0调试通过....不过大家注意看程序注释,不同的编译器使用需要修改一点地方,程序注释说的很清楚,我就不在这里介绍了(注意BCB中包含的头文件位置,本类的头文件一定要放在最上面,因为winsock2.h的冲突问题,有关这个问题,有兴趣的朋友自己上网搜,因为时间有限,一篇文章不可能写太多的内容,请大家谅解) 下面我们先来了解一下 Socket 的异步方式 ! (程序源码示例请翻到文章尾下载) 首先,Wi ndows套接字在两种模式下执行I / O操作:锁定和非锁定。 在锁定模式下,在I / O操作完成前,执行操作的Wi nsock函数

【转载】AutoML研究分析

自作多情 提交于 2020-02-14 00:56:13
参考简书文章 AutoML研究分析 ,少有改动 文章目录 1. Auto Keras 2. 其它AutoML产品(工具包) 2.1 AutoWEKA 2.2 Auto-sklearn 2.3 H2O AutoML 2.4 Google Cloud AutoML 3. AutoML实现原理分析 3.1 NAS 3.1.1 搜索空间 3.1.2 搜索策略 3.1.3 性能评估策略 3.1.4 NAS未来的方向 3.1.5 NAS的演进 3.2 Hyper-parameter optimization 3.3 Meta-Learning 3.4 算法相关 3.4.1 强化学习 3.4.2 进化算法 3.4.3 贝叶斯优化 4. AutoML应用场景 参考材料 AutoML全称是automated machine learning,下面有一段AutoML不是什么的描述: AutoML is not automated data science. While there is undoubtedly overlap, machine learning is but one of many tools in the data science toolkit, and its use does not actually factor in to all data science tasks.

论文阅读 Tacotron2

蓝咒 提交于 2020-02-13 00:52:54
Tacotron2 摘要 引言 2 模型架构 2.1 内部特征表示 2.2 频谱图预测网络 2.3 WaveNet 声码器 3 实验结果 3.1 训练步骤 3.2 评估 摘要 这篇论文描述了Tacotron2,一个从文字直接转化为语音的神经网络。这个体系是由字符嵌入到梅尔频谱图的循环序列到序列神经网络组成的,然后是经过一个修改过后的WaveNet,该模型的作用是将频谱图合成波形图。这个模型取得了不错的效果MOS4.53。为了验证我们的设计选择,我们介绍了系统关键组件的简化测试以及评估了使用梅尔频谱图作为WaveNet的条件输入的影响(不是语言,持续时间和功能)。我们进一步展示了,使用这种紧凑的声学中间表示形式可以大幅度减小WaveNet体系结构的大小。 引言 TTS尽管进行了数十年的调查,但还是有一个大问题。随着时间的推移,不同的技术在这片领域中施展拳脚。单端选择的级联合成,将预先记录的波形拼在一起在之前好长时间都是比较先进的技术。统计参数语音合成,它直接生成语音特征的平滑轨迹是由声码器合成,随后解决了级联合成在声音边界不真实的问题。然而,与人类声音比起来,还是稍显不自然。 WaveNet,是一个时域生成模型,产生的声音可以跟人类媲美,现在好多TTS系统已经在用了。但是WaveNet的输入(语言特征,预测对数基本频率和音素持续时间),需要大量的专业领域知识才能产生

网络IO模型

喜夏-厌秋 提交于 2020-02-10 20:06:58
1、同步网络IO模型      网络IO模型分两段,一个write,一个read,write操作我们不需要考虑,这里我们看read操作。 接受线程会一直阻塞,当有数据到来的时候,操作系统会先把数据写入接收缓存,然后给接收数据的线程发一个通知, 线程收到通知后结束等待,开始读取数据。处理完这一批数据后,继续阻塞等待下一批数据到来,这样周而复始地处理收到的数据。   每个连接都需要阻塞一个线程来等待数据,当大量连接数时就会有大量线程被阻塞,造成CPU负载过高,系统的性能较慢 2、异步网络模型   同步IO导致线程阻塞会影响性能,同时也不能使用极少的线程来处理网络请求,所以我们想到异步网络模型。脑海中想到系统异步设计中,采用非阻塞的模式,当有数据来的时候创建一个线程 来接收数据,这样就可以用少量的线程来处理大量的连接。        1、使用Netty实现网络通信        // 创建一组线性 EventLoopGroup group = new NioEventLoopGroup(); try{ // 初始化Server ServerBootstrap serverBootstrap = new ServerBootstrap(); serverBootstrap.group(group); serverBootstrap.channel

DialogueGCN论文翻译

半城伤御伤魂 提交于 2020-02-09 20:10:58
对话GCN:对话中情感识别的图卷积神经网络 绪论 会话中的情感识别(ERC)最近受到了研究者的广泛关注,因为它在医疗,教育和人力资源等各个领域都有潜在的广泛应用。 在本文中,我们介绍了对话图卷积网络(DialogueGCN),这是一种基于图神经网络的ERC方法。 我们利用对话者的自我和说话者之间的依存关系来为情感识别建模会话上下文。 通过图网络,DialogueGCN解决了当前基于RNN的方法中存在的上下文传播问题。 我们凭经验表明,这种方法可以缓解此类问题,同时在许多基准情感分类数据集上的表现要优于当前水平。 1 引言 几十年来,情绪识别一直是一个活跃的研究主题(K. D’Mello等,2006; Busso等,2008; Strapparava和Mihalcea,2010)。 然而,最近在社交媒体平台(例如Facebook,Twitter,Youtube和Red dit)上开放式对话数据的激增引起了热烈的关注(Poria等人,2019b; Majumder等人,2019; Huang等人。 (2019年),从研究人员转向对话中的情感识别(ERC)。 不可否认,ERC在情感对话系统(如图1所示)中也很重要,在这种对话中,机器人可以理解用户的情绪并产生连贯和移情反应的情绪。 图1:情感对话的插图,其中情感取决于上下文。 健康助手了解用户的情感状态,以生成情感和移情反应

目标跟踪综述

情到浓时终转凉″ 提交于 2020-02-09 20:01:48
文章目录 目标跟踪 入门基础 介绍 研究 算法 现有目标跟踪方法简介 基于生成式模型的方法 基于判别式模型的方法 基于深度学习的方法 适用于目标跟踪的深度学习模型 深度判别式模型 深度生成式模型 其他深度学习模型 基于深度学习的目标跟踪方法 按网络结构分类 按网络功能分类 按照网络训练分类 其他深度目标跟踪算法 基于分类与回归相融合的深度目标跟踪方法 基于强化学习的深度目标跟踪方法 基于集成学习的深度目标跟踪方法 基于元学习的深度目标跟踪方法 数据库与评价标准 适用于深度学习目标跟踪的视频数据库 适用于深度学习目标跟踪的评价标准 应用实例介绍 目标跟踪 入门基础 介绍 目标跟踪是计算机视觉领域的一个重要分支,是模式识别,图像处理,计算机视觉,机器学习等学科的交叉研究,有着广泛的应用,如视频监控,虚拟现实,人机交互,图像理解,无人驾驶等 目前的目标跟踪的通常任务是 ,在视频的第一帧给定一个目标的矩形框,然后后续这个矩形框紧跟着要跟踪的物体。不过,目标跟踪与计算机视觉中的图像识别,分割,检测是分不开的,通常跟踪是这些分割检测的最后一步 研究 目标跟踪方向的论文可以关注计算机视觉的三大顶会 CVPR (Computer Vision and Pattern Recognition) ICCV (International Conference on Computer Vision)