高斯混合模型

[图像分割] OpenCV 的 GrabCut 函数使用和源码解读

大城市里の小女人 提交于 2020-08-09 18:10:38
转自 zouxy09 GrabCut 原理参考 这里 ,以下为 GrabCut 源码: ——看别人写的好的代码也很享受,干净利落,有些处理的细节也学习一下。 /*M/////////////////////////////////////////////////////////////////////////////////////// // // IMPORTANT: READ BEFORE DOWNLOADING, COPYING, INSTALLING OR USING. // // By downloading, copying, installing or using the software you agree to this license. // If you do not agree to this license, do not download, install, // copy or use the software. // // // Intel License Agreement // For Open Source Computer Vision Library // // Copyright (C) 2000, Intel Corporation, all rights reserved. // Third party copyrights are

基于点云的机器人抓取识别综述

左心房为你撑大大i 提交于 2020-08-08 08:45:29
点击上方“ 3D视觉工坊 ”,选择“星标” 干货第一时间送达 机器人作为面向未来的智能制造重点技术,其具有可控性强、灵活性高以及配置柔性等优势,被广泛的应用于零件加工、协同搬运、物体抓取与部件装配等领域,如图1-1所示。然而,传统机器人系统大多都是在结构化环境中,通过离线编程的方式进行单一重复作业,已经无法满足人们在生产与生活中日益提升的智能化需求。随着计算机技术与传感器技术的不断发展,我们期望构建出拥有更加灵敏的感知系统与更加智慧的决策能力的智能化机器人系统。 图1-1 机器人的应用领域 图1-2 机器人抓取的操作流程与步骤 机器人抓取与放置是智能化机器人系统的集中体现,也是生产与生活中十分重要的环节,近几年来在工业界与学术界得到了深入而广泛的研究。具体的机器人抓取可以分为视觉感知部分与机器人抓取操作部分。视觉感知部分又包含:模型与场景表征、目标识别与定位这两个步骤;而机器人抓取操作部分则包含:系统标定、运动控制与抓取规划等步骤,如图1-2所示。这其中,机器人通过视觉传感器感知环境并实现对目标物体的识别与定位,也就是视觉感知部分,是十分重要的环节,其直接决定了后续机器人的抓取精度。 图1-3 二维图像的部分缺陷 受益于计算机算力的不断提高以及传感器成像水平的高速发展,目前针对结构化环境或者半结构化环境中,基于二维图像的机器人平面单目标物体的抓取技术已经趋于成熟

语音识别——一份简短的技术综述

丶灬走出姿态 提交于 2020-08-06 16:36:28
转自: https://zhuanlan.zhihu.com/p/53264756 大家好!又到了每周一狗熊会的深度学习时间了。在上一讲中,小编给大家介绍了经典的 seq2seq,以及著名的注意力模型,并且小编在这些理论的基础上给出一个基于seq2seq和注意力模型的机器翻译实例。本讲小编将和大家继续将目光放宽,对广义的自然语言处理应用领域之一的语音识别进行一次简单而又相对完整技术综述。 1 概述 自动语音识别(Automatic Speech Recognition,ASR),也可以简称为语音识别。说新领域也有点夸张,因为语音识别可以作为一种广义的自然语言处理技术,是用于人与人、人与机器进行更顺畅的交流的技术。语音识别目前已使用在生活的各个方面:手机端的语音识别技术,比如苹果的 siri;智能音箱助手,比如阿里的天猫精灵,还有诸如科大讯飞一系列的智能语音产品等等。 为了能够更加清晰的定义语音识别的任务,我们先来看一下语音识别的输入和输出都是什么。大家都知道,声音从本质是一种波,也就是声波,这种波可以作为一种信号来进行处理,所以语音识别的输入实际上就是一段随时间播放的信号序列,而输出则是一段文本序列。 图1 语音识别的输入与输出 将语音片段输入转化为文本输出的过程就是语音识别。一个完整的语音识别系统通常包括信息处理和特征提取、声学模型、语言模型和解码搜索四个模块

如何三步搭建一套声纹系统

偶尔善良 提交于 2020-08-06 03:23:04
背景介绍 声纹检索,顾名思义就是说话人识别,通过声音来验证或者识别说话人的声音。声纹识别的关键步骤就是声音向量化,将说话人的声音将其转化成结构化的向量。阿里云AnalyticDB向量版,提供了一套声纹验证检索的解决方案。用户只需要使用简单的几条SQL命令,三步之内就可以搭建一套高精度的声纹检索验证服务。 声纹识别技术 1)声纹检索演示 图1展示了AnalyticDB向量数据库的声纹检索系统的演示界面。为了方便用户体验,我们将380个人的声音信息,转化成向量存储在系统中。当前演示系统分成两部分,第一部分是检索部分,用户输入录制好的声音文件或者用户现场进行录音上传声音文件,提交到声纹库进行声音的匹配检索。第二部分是注册部分,用户可以注册上传自己的声音到当前的声纹库里面,方便后期的查询验证。在接下来的章节中,我们分别介绍各个功能。 图1 . 声纹演示系统 图2上传一段S0004的测试音频“BAC009S0004W0486.wav”到声纹库里面进行检索,可以看到top1的结果S0004就会在最上面进行展示。 图2 . 查询声音 图3展示了声纹注册系统,用户可以注册自己的声音到后台声纹库里面,方便检索。比方说,用户Hanchao注册自己的声音(只有7s长度),到当前的系统里面来。当前系统支持无文本注册,用户可以说任何话来进行注册。 图3 . 注册声音 图4演示用户现场录制声音,上传到系统中

异常检测算法演变及学习笔记

我们两清 提交于 2020-08-05 07:46:21
【说在前面】本人博客新手一枚,象牙塔的老白,职业场的小白。以下内容仅为个人见解,欢迎批评指正,不喜勿喷![认真看图][认真看图] 【补充说明】异常检测,又称离群点检测,有着广泛应用。例如金融反欺诈、工业损毁检测、电网窃电行为等! 一、基于时间序列分析 关于时间序列分析的介绍,欢迎浏览我的另一篇博客: 时间序列分析中预测类问题下的建模方案 ,这里不再赘述。 1. 基于同比和环比 适合数据呈周期性规律的场景中。例如: 监控APP的DAU的环比和同比,及时发现DAU上涨或者下跌 监控实时广告点击、消耗的环比和同比,及时发现变化 当上述比值超过一定阈值,则判定出现异常。 2. 基于统计学模型预测 移动平均MA是一种分析时间序列的常用工具,它可过滤高频噪声和检测异常点。 根据计算方法的不同,常用的移动平均算法包括简单移动平均、加权移动平均、指数移动平均。 在序列取值随时间波动较小的场景中,上述移动均值与该时刻的真实值的差值超过一定阈值,则判定该时刻的值异常。 当然,还有ARMA、ARIMA、SARIMA等适用于时间序列分析的统计学模型,可以预测信号并指出其中的异常值。 3. 基于时间序列分解 STL是一种单维度时间指标异常检测算法。大致思路是: (1)先将指标做STL时序分解,得到seasonal、trend、residual成分。 (2)用ESD算法对trend

NLP 语义相似度计算 整理总结

☆樱花仙子☆ 提交于 2020-07-27 18:56:44
更新中 更新时间: 2019-12-03 18:29:52 写在前面: 本人是喜欢这个方向的学生一枚,写文的目的意在记录自己所学,梳理自己的思路,同时share给在这个方向上一起努力的同学。写得不够专业的地方望批评指正,欢迎感兴趣的同学一起交流进步。 (参考文献在第四部分, 侵删 ) 一、背景 二、基本概念 三、语义相似度计算方法 四、参考文献 一、背景 在很多NLP任务中,都涉及到语义相似度的计算,例如: 在搜索场景下(对话系统、问答系统、推理等),query和Doc的语义相似度; feeds场景下Doc和Doc的语义相似度; 在各种分类任务,翻译场景下,都会涉及到语义相似度语义相似度的计算。 所以在学习的过程中,希望能够更系统的梳理一下这方面的方法。 二、基本概念 1. TF Term frequency即关键词词频,是指一篇文章中关键词出现的频率,比如在一篇M个词的文章中有N个该关键词,则 为该关键词在这篇文章中的词频。 2. IDF Inverse document frequency指逆向文本频率,是用于衡量关键词权重的指数,由公式 计算而得,其中D为文章总数,Dw为关键词出现过的文章数。 3. 向量空间模型 向量空间模型简称 VSM,是 VectorSpace Model 的缩写。在此模型中,文本被看作是由一系列相互独立的词语组成的,若文档 D 中包含词语 t1,t2,

基于图嵌入的高斯混合变分自编码器的深度聚类(Deep Clustering by Gaussian Mixture Variational Autoencoders with Graph Emb...

别来无恙 提交于 2020-07-27 11:53:27
基于图嵌入的高斯混合变分自编码器的深度聚类 Deep Clustering by Gaussian Mixture Variational Autoencoders with Graph Embedding, DGG 作者:凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ 1. 引言 这篇博文主要是对论文“ Deep Clustering by Gaussian Mixture Variational Autoencoders with Graph Embedding ”的整理总结,这篇文章将图嵌入与概率深度高斯混合模型相结合,使网络学习到符合全局模型和局部结构约束的强大特征表示。将样本作为图上的节点,并最小化它们的后验分布之间的加权距离,在这里使用Jenson-Shannon散度作为距离度量。 阅读这篇博文的前提条件是:了解 高斯混合模型用于聚类的算法 ,了解 变分推断与变分自编码器 ,进一步了解 变分深度嵌入(VaDE)模型 。在知道高斯混合模型(GMM)与变分自编码器(VAE)之后,VaDE实际上是将这两者结合起来的一个产物。与VAE相比,VaDE在公式推导中多了一个变量c。与GMM相比,变量c就相当于是GMM中的隐变量z,而隐层得到的特征z相当于原来GMM中的数据x。而基于图嵌入的高斯混合变分自编码器的深度聚类(DGG

R语言代写基于模型的聚类和高斯混合模型

守給你的承諾、 提交于 2020-05-07 19:04:25
原文链接: http://tecdat.cn/?p=6105 介绍 聚类模型是一个概念,用于表示我们试图识别的聚类类型。四种最常见的聚类方法模型是层次聚类,k均值聚类,基于模型的聚类和基于密度的聚类 可以基于两个主要目标评估良好的聚类算法: 高级内相似性 低级间相似性 基于模型的聚类 是迭代方法,通过优化聚类中数据集的分布,将一组数据集拟合到聚类中。高斯分布只不过是正态分布。此方法分三步进行: 首先随机选择高斯参数并将其拟合到数据点集。 迭代地优化分布参数以适应尽可能多的点。 一旦收敛到局部最小值,您就可以将数据点分配到更接近该群集的分布。 有关高斯混合模型的详细信息 基于概率模型的聚类技术已被广泛使用,并且已经在许多应用中显示出有希望的结果,从图像分割,手写识别,文档聚类,主题建模到信息检索。基于模型的聚类方法尝试使用概率方法优化观察数据与某些数学模型之间的拟合。 生成模型通常使用 EM 方法求解, EM 方法是用于估计有限混合概率密度的参数的最广泛使用的方法。基于模型的聚类框架提供了处理此方法中的几个问题的主要方法,例如组件密度(或聚类)的数量,参数的初始值(EM算法需要初始参数值才能开始),以及分量密度的分布(例如,高斯分布)。 EM 以随机或启发式初始化开始,然后迭代地使用两个步骤来解决计算中的循环: E-Step 。使用当前模型参数确定将数据点分配给群集的预期概率。 M

Image Processing, Analysis & and Machine Vision

≯℡__Kan透↙ 提交于 2020-05-02 06:32:41
Contents目录 Chapter 0: Introduction to the companion book本辅导书简介 Chapter 1: Introduction 简介 Viewing an image: image_view_demo 查看一张图像:image_view_demo Chapter 2: The image, its representations and properties Displaying a coarse binary image: coarse_pixels_draw Distance transform, an example: dist_trans_demo Border of a region, an example: region_border_demo Chapter 3: The image, its mathematical and physical background Convolution, shift-multiply-add approach: conv_demo Discrete Fourier Transform: dft_edu Inverse DFT: idft_edu 1D Discrete Fourier Transform: dft1d_demo 2D Discrete Fourier Transform

机器学习中五种常用的聚类算法

我们两清 提交于 2020-04-09 14:21:17
聚类是机器学习中一种重要的无监督算法,它可以将数据点归结为一系列特定的组合。理论上归为一类的数据点具有相同的特性,而不同类别的数据点则具有各不相同的属性。在数据科学中聚类会从数据中发掘出很多分析和理解的视角,让我们更深入的把握数据资源的价值、并据此指导生产生活。以下是五种常用的聚类算法。 K均值聚类 这一最著名的聚类算法主要基于数据点之间的均值和与聚类中心的聚类迭代而成。它主要的优点是十分的高效,由于只需要计算数据点与剧类中心的距离,其计算复杂度只有O(n)。其工作原理主要分为以下四步: 1.首先我们需要预先给定聚类的数目同时随机初始化聚类中心。我们可以初略的观察数据并给出较为准确的聚类数目; 2.每一个数据点通过计算与聚类中心的距离了来分类到最邻近的一类中; 3.根据分类结果,利用分类后的数据点重新计算聚类中心; 4.重复步骤二三直到聚类中心不再变化。(可以随机初始化不同的聚类中心以选取最好的结果) 这种方法在理解和实现上都十分简单,但缺点却也十分明显,十分依赖于初始给定的聚类数目;同时随机初始化可能会生成不同的聚类效果,所以它缺乏重复性和连续性。 和K均值类似的K中值算法,在计算过程中利用中值来计算聚类中心,使得局外点对它的影响大大减弱;但每一次循环计算中值矢量带来了计算速度的大大下降。 均值漂移算法 这是一种基于滑动窗口的均值算法,用于寻找数据点中密度最大的区域