基线

(KWS-DNN)Small-footprint keyword spotting using deep neural networks

半世苍凉 提交于 2020-02-19 11:47:31
会议:ICASSP 2014 论文: Small-footprint keyword spotting using deep neural networks 作者:Guoguo Chen ; Carolina Parada ; Georg Heigold Abstract 我们的应用程序需要具有内存占用量小,计算成本低和精度高的关键字查找系统。为了满足这些要求,我们提出了一种基于深度神经网络的简单方法。训练深度神经网络以直接预测关键词或关键词的子词单元,然后采用后处理方法产生最终的置信度得分。相对于基于竞争性的基于隐马尔可夫模型的系统,关键字识别结果实现了45%的相对改进,而在有杂音的情况下,性能则显示了39%的相对改进。 INTRODUCTION 由于智能手机和平板电脑的快速发展,使用语音与技术进行交互变得司空见惯。例如,Google提供了在Android设备上通过语音搜索[1]的功能,而Apple的iOS设备配备了名为Siri的会话助手。这些产品允许用户点击设备,然后说出查询或命令。 我们有兴趣通过开发一个系统来连续不断地收听特定的关键字来启动语音输入,从而使用户拥有完全的免提体验。这在开车等情况下尤其有用。所提出的系统必须高度准确,低延迟,占用空间小,并且必须在计算受限的环境(例如现代移动设备)中运行。在设备上运行系统避免了连接到服务器进行识别的延迟和功耗问题。 关键字搜寻

威胁分析

倖福魔咒の 提交于 2020-02-17 02:40:50
2020年1月17日 11:54 - 威胁分析 - 情报环模型 - 生成情报 - 建立调查 - 采集、处理数据 - 数据处理 - 富化信息 - 评估损害 - 生成情报 - 共享情报 - 反馈 威胁分析 威胁分析的目的是通过分析异常信息,生成可供事件响应模块使用的威胁情报。 安全分析在整个体系建设中的难点。原因在于不像安全基线和事件响应有明确的预期和肉眼可见的效果。威胁分析难以量化且是对使用者来说是个黑盒,使用者无法预料到威胁分析会有哪些产出物,以及对产出物没有衡量标准。 无论是采集到的网络行为、系统告警、未知md5,这些都是当前系统观测到的信息,这些信息或许能作为一个线头向下挖掘,但是实际挖掘过程中。入侵者可能已经建立了多个据点,也有可能只是误导防御方的佯攻。很有可能刚牵出线头线索就中断了。威胁分析模块基于这些蛛丝马迹的信息管中窥豹。所以大部分APT分析类的产品在演示时都展示得特别美好,而在使用后难有较好的效果。 威胁分析的算法和设计不是我擅长的。所以想讨论的内容还是威胁分析在安全自动化体系中的地位,和如何实现从数据->信息->情报->策略的工作流程。 一个情报从生成到被使用的全流程 数据 在建立安全基线的阶段,围绕资产生成了不少数据,包括资产的位置、资产的合规状态、资产的安全风险、资产已经配置的防护策略、资产的备份、恢复策略等,这些都是数据,在没有任何入侵活动发生的时候

自动工作负载库(Automatic Workload Repository,AWR)

蓝咒 提交于 2020-02-16 06:51:48
自动工作负载库(Automatic Workload Repository,AWR) AWR的由来: 10g之前的oracle:用户的连接将产生会话,当前会话记录保存在v$session中;处于等待状态的会话会被复制一份放在v$session_wait中。当该连接断开后,其原来的连接信息在v$session和v$session_wait中就会被删除;oracle10g及之后保留下了v$session_wait中的这些信息,并多了v$active_session_history(ASH)视图,记录每个活动session在v$session_wait中最近10次的等待事件。 ASH的采样数据是保存在内存中。而分配给ASH的内存空间是有限的,当所分配空间占满后,旧的记录就会被覆盖掉;而且数据库重启后,所有的这些ASH信息都会消失。这样,对于长期检测oracle的性能是不可能的。 在Oracle10g中,提供了永久保留ASH信息的方法,这就是AWR。 由于全部保存ASH中的信息是非常耗费时间和空间的, AWR采用的策略是:每小时对v$active_session_history进行采样一次,并将信息保存到磁盘中,并且保留7天,7天后旧的记录才会被覆盖。 这些采样信息被保存在视图wrh$_active_session_history中。而这个采样频率(1小时)和保留时间(7天

菜鸟笔记-DuReader阅读理解基线模型代码阅读笔记(二)—— 介绍及分词

南楼画角 提交于 2020-02-13 03:04:59
数据部分请见上一篇文章: 菜鸟笔记-DuReader阅读理解基线模型代码阅读笔记(一)—— 数据 官方基于了DuReader给了两个基线模型:( BiDAF 和 Match-LSTM ): Match-LSTM是广泛应用的MRC模型,Match-LSTM为了在文章中找到答案,依次遍历文章,动态地将注意力权重与文章的每个标记进行匹配。最后,使用一个应答指针层来查找文章中的答案跨度。 BiDAF既使用了语境对问题的注意,又使用了问题对上下文的注意,从而突出了问题和上下文中的重要部分。然后,利用注意流层融合所有有用的信息,从而得到每个位置的向量表示。 每个模型分别给出了在百度的深度学习架构 PaddlePaddle 和谷歌的深度学习架构 TensorFlow 中的实现,我主要阅读了其在TensorFlow中上的实现。 运行环境 我的运行环境如下表所示: 系统平台 CPU 内存 GPU CUDA cuDNN Python tensorflow Ubuntu18.04 4110 32G RTX 2080Ti 10.0 7.4 3 7.4 2.0 代码及数据集下载 代码的下载地址: github库主页 数据集下载地址: DuReader 代码下载后解压可以看到目录如下图所示: 数据集下载可以运行data/目录下的download.sh文件下载

菜鸟笔记-DuReader阅读理解基线模型代码阅读笔记(四)—— 段落抽取

对着背影说爱祢 提交于 2020-02-10 17:54:31
系列目录: 菜鸟笔记-DuReader阅读理解基线模型代码阅读笔记(一)—— 数据 菜鸟笔记-DuReader阅读理解基线模型代码阅读笔记(二)—— 介绍及分词 菜鸟笔记-DuReader阅读理解基线模型代码阅读笔记(三)—— 预处理 未完待续 … … 基线系统加入了新的段落抽取策略来提升模型表现。 段落抽取思路 基线系统使用了新的段落抽取策略提高模型效果,具体代码见DuReader代码库中 paddle/para_extraction.py 文件。相似的策略被用于2018年的Top-1系统 (Liu et al. 2018) at 2018 Machine Reading Challenge 。 DuReader (He et al. 2018)原来的基线使用了简单策略选择段落训练和测试模型。但是真正包含答案的段落可能并没有被包含进去。因此,使用更多的信息进行答案抽取。 段落抽取的新策略具体如下,将新的段落抽取策略用于每个文档。对于单个文档: 去除文档中的重复段落 如果段落短于预先设定的最大长度则使用预先定义的分隔符将标题与段落连接起来。 计算每个段落于问题的F1分数 将标题与top-K个F1分数的段落使用预先定义的分隔符连接起来,构造短于预定义最大长度的段落。 代码 主要分为两个函数compute_paragraph_score、paragraph_selection如下

css之inline-block元素对齐

微笑、不失礼 提交于 2020-02-09 20:07:24
   生命中最善良的时光 , 就像水一样明亮 , 记忆里总有人在坐在身旁 , 抚摸着我枯萎的肩膀 , 对我说红色不该遗忘。   不好意思,跑题了。   当同一行的多个元素的样式为 display:inline-block 时 , 由于内容的类型不一致,存在图片、文本、或空标签的情况下,可能出现元素无法对齐的情况   如下:         分析   对齐基于元素与对齐方式来进行分析   元素     内联元素 display:inline 从左至右一个挨着一个 , 内容包裹元素 , 无法设置宽高     块级元素 display:block 单独占用一行 , 可以设置宽高     行内块级元素 display: inline-block 兼容以上两者特性   对齐方式     CSS语法:vertical-align     语法:       baseline | sub | super | top | text-top | middle | bottom | text-bottom | <百分比> | <长度> | inherit     说明:       设置元素内容的垂直对齐方式。     参数:       baseline: 基线对齐; 取行高最高的作为基准       sub: 下标显示;       super: 上标显示;       top: 顶端对齐;   

浅谈软件测试之回归测试

泪湿孤枕 提交于 2020-01-25 18:56:37
回归测试的定义: 回归测试是指修改了旧代码后,重新进行测试以确认修改没有引入新的错误或导致其他代码产生错误。 1.回归测试是指重复以前的全部或部分的相同测试。 2.新加入测试的模组,可能对其他模组产生副作用,故须进行某些程度的回归测试。 3.回归测试的重心,以关键性模组为核心。 回归测试的好处: 自动回归测试将大幅降低系统测试、维护升级等阶段的成本。回归测试作为软件生命周期的一个组成部分,在整个软件测试过程中占有很大的工作量比重,软件开发的各个阶段都会进行多次回归测试。 回归测试的存在意义: 在渐进和快速迭代开发中,新版本的连续发布使回归测试进行的更加频繁,而在极端编程方法中,更是要求每天都进行若干次回归测试。因此,通过选择正确的回归测试策略来改进回归测试的效率和有效性是非常有意义的。 回归测试的需求: 对于一个软件开发项目来说,项目的测试组在实施测试的过程中会将所开发的测试用例保存到“测试用例库”中,并对其进行维护和管理。当得到一个软件的基线版本时,用于基线版本测试的所有测试用例就形成了基线测试用例库。在需要进行回归测试的时候,就可以根据所选择的回归测试策略,从基线测试用例库中提取合适的测试用例组成回归测试包,通过运行回归测试包来实现回归测试。保存在基线测试用例库中的测试用例可能是自动测试脚本,也有可能是测试用例的手工实现过程。 测试用例的选择: 对于一个软件开发项目来说

怎样去除img之间的间距

南楼画角 提交于 2020-01-25 14:47:48
解决方法:     <div style="font-size:0;" > <img/> </div> 原理分析:     块级元素包含内联元素如图片文字等时,内联元素默认是和父级元素的baseline(基线)对齐的,而baseline又和父级元素底边有一定的距离(这个距离和font有关,不一定是5px),所以以上代码的效果中不同div之间有间隙,这是因为图片与父元素的底边有距离。其 baseline 是vertical-align属性的默认值,vertical-align属性是设置元素的垂直排列的,用来定义行内元素的基线相对于该元素所在行的基线的垂直对齐,除了baseline对齐方式之外,还可以是sub | super | top | text-top | middle | bottom | text-bottom |inherit(任何的版本的Internet Explorer (包括 IE8)都不支持属性值 "inherit")。 来源: https://www.cnblogs.com/bykj/p/5631576.html

系统集成项目管理工程师备考资料(口袋应试第二版)19

无人久伴 提交于 2020-01-22 14:39:22
15.文档/配置管理 口袋应试:文档、配置管理一章中,因为每年出题的分数占比不高,所以出题点比较集中。文档管理中主要是:文档的种类、文档的质量等级;配置管理中出题点主要集中在15.2.1这一节,其中包括:配置项状态、配置项版本号(版本号要会看会区分)、配置库的概念和类型。其它内容大家根据个人时间和精力去复习即可。 15.1信息系统项目相关信息(文档)及其管理 15.1.1信息系统项目相关信息(文档) 2.信息系统项目相关信息(文档)种类 软件文档分为三类:开发文档、产品文档、管理文档。 (1) 开发文档描述开发过程本身,基本的开发文档是: ●可行性研究报告和项目任务书; ●需求规格说明 ●功能规格说明 ●设计规格说明,包括程序和数据规格说明; ●开发计划 ●软件集成和测试计划 ●质量保证计划; ●安全和测试信息。 (2) 产品文档描述开发过程的产物,基本的产品文档包括: ●培训手册; ●参考手册和用户指南 ●软件支持手册 ●产品手册和信息广告 (3) 管理文档记录项目管理的信息,例如: ●开发过程的每个阶段的进度和进度变更的记录 ●软件变更情况的记录 ●开发团队的职责定义。 第二版P491@15.1.1@15.1.1 出题概率:★★★★★ 140163、140363、160163、160361、180361 文档的4个质量等级 文档的质量可以分为四级: (1) 最低限度文档

深入理解行内元素的布局

我怕爱的太早我们不能终老 提交于 2020-01-16 13:36:29
前言 总括: 本文通过实例讲解CSS中最大的难点之一,行内元素的布局,主要是挖掘line-height和vertical-align两个属性在布局方面的使用。 原文博客地址: 深入理解行内元素的布局 知乎专栏&&简书专题: 前端进击者(知乎) && 前端进击者(简书) 博主博客地址: Damonare的个人博客 白茶清欢无别事,我在等风,也在等你。 ? 正文 讲道理line-height和vertical-align 这对基是十分低调的,日常开发中碰到的很多莫名其妙的bug很大一部分都是这俩货搞出来了的,但很少有人知道这对基的罪恶,因为可能花式改写一下CSS代码问题就解决了。实际上搞明白这俩东西才能让我们在布局工作中游刃有余。本文接下来就通过这对基的关系来了解内联元素具体的布局问题~we are刨根问底拦不住~? ​ 读这篇文章之前请确定您有以下知识基础: line-height的数字值是和font-size大小相关的; vertical-align的百分比值是和line-height值相关的; 引出vertical-align 首先来看一个?: <div class="test"> <img src="https://sfault-avatar.b0.upaiyun.com/344/542/3445428434-5631776c183b2_huge256" alt="">