马尔科夫

Machine Learning系列--CRF条件随机场总结

对着背影说爱祢 提交于 2020-03-02 22:57:08
根据《统计学习方法》一书中的描述,条件随机场(conditional random field, CRF)是给定一组输入随机变量条件下另一组输出随机变量的条件概率分布模型,其特点是假设输出随机变量构成马尔科夫随机场。 条件随机场是一种判别式模型。 一、理解条件随机场 1.1 HMM简单介绍 HMM即 隐马尔可夫模型 ,它是处理序列问题的统计学模型,描述的过程为:由隐马尔科夫链随机生成 不可观测的状态随机序列 ,然后各个状态分别生成一个观测,从而产生观测随机序列。 在这个过程中,不可观测的序列称为状态序列(state sequence), 由此产生的序列称为观测序列(observation sequence)。 该过程可通过下图描述: 上图中, $X_1,X_2,…X_T$是隐含序列,而$O_1, O_2,..O_T$是观察序列。 隐马尔可夫模型由三个概率确定: 初始概率分布 ,即初始的隐含状态的概率分布,记为$\pi$; 状态转移概率分布 ,即隐含状态间的转移概率分布, 记为$A$; 观测概率分布 ,即由隐含状态生成观测状态的概率分布, 记为$B$。 以上的三个概率分布可以说就是隐马尔可夫模型的参数,而根据这三个概率,能够确定一个隐马尔可夫模型$\lambda = (A, B, \pi)$。 而隐马尔科夫链的三个基本问题为: 概率计算问题 。即给定模型$\lambda = (A,

语音识别系统结构

妖精的绣舞 提交于 2020-02-23 00:16:07
转载: 语音识别系统结构——鸟瞰 语音识别概述 语音识别是指将语音信号转换为文字的过程。现在通行的语音识别系统框架如图: 信号处理模块将根据人耳的听觉感知特点,抽取语音中最重要的特征,将语音信号转换为特征矢量序列。现行语音识别系统中常用的声学特征有线性预测编码(Linear Predictive Coding,LPC),梅尔频率倒谱系数(Mel-frequency Cepstrum Coefficients,MFCC),梅尔标度滤波器组(Mel-scale Filter Bank,FBank)等。 解码器(Decoder)根据声学模型和语言模型,将输入的语音特征矢量序列转化为字符序列。 声学模型是对声学、语音学、环境的变量,以及说话人性别、口音的差异等的知识表示。语言模型则是对一组字序列构成的知识表示。 模型的训练 现代的语音识别系统中声学模型和语言模型主要利用大量语料进行统计分析,进而建模得到。 声学模型 语音识别中的声学模型充分利用了声学、语音学、环境特性以及说话人性别口音等信息,对语音进行建模。目前的语音识别系统往往采用隐含马尔科夫模型(Hidden Markov Model,HMM)建模,表示某一语音特征矢量序列对某一状态序列的后验概率。隐含马尔科夫模型是一种概率图模型,可以用来表示序列之间的相关关系,常常被用来对时序数据建模。 隐含马尔科夫模型是一种带权有向图

猪猪的机器学习笔记(十七)隐马尔科夫模型HMM

老子叫甜甜 提交于 2020-01-20 04:43:54
隐马尔科夫模型 HMM 作者:樱花猪 摘要: 本文为七月算法( julyedu.com ) 12 月机器学习第十七次课在线笔记。 隐马尔可夫模型(Hidden Markov Model,HMM)是统计模型 ,它用来描述一个含有隐含未知参数的马尔科夫过程 。其难点是从可观察的参数中确定该过程的隐含参数,然后利用这些参数来作进一步的分析。在早些年HMM模型被非常广泛的应用,而现在随着机器学习的发展HMM模型的应用场景越来越小然而在图像识别等领域HMM依然起着重要的作用。 引言: 隐马尔科夫模型 是马尔科夫链 的一种,它的状态不能直接观察到,但能通过观测向量序列观察到,每个观测向量都是通过某些概率密度 分布表现为各种状态,每一个观测向量是由一个具有相应概率密度分布的状态序列产生。所以,隐马尔科夫模型 是一个双重随机过程----具有一定状态数的隐马尔科夫链 和显示随机函数集。自20世纪80年代以来,HMM被应用于语音识别 ,取得重大成功。到了90年代,HMM还被引入计算机文字识别和移动通信核心技术“多用户的检测”。HMM在生物信息科学、故障诊断等领域也开始得到应用。 本次课程以中文分子算法为实践背景基础来讲述隐马尔科夫模型。本次课程主要分享了隐马尔科夫模型的概率计算、参数估计和模拟预测等方法,结合课程上提到的实力,我们能够感受大HMM能够经久不衰的强大力量。

机器学习中的隐马尔科夫模型(HMM)详解

﹥>﹥吖頭↗ 提交于 2019-12-06 14:30:48
前导性推荐阅读资料: 从朴素贝叶斯分类器到贝叶斯网络(上) 从朴素贝叶斯分类器到贝叶斯网络(下) 欢迎关注白马负金羁的博客 http://blog.csdn.net/baimafujinji ,为保证公式、图表得以正确显示,强烈建议你从该地址上查看原版博文。本博客主要关注方向包括:数字图像处理、算法设计与分析、数据结构、机器学习、数据挖掘、统计分析方法、自然语言处理。 引言 在之前介绍贝叶斯网络的博文中,我们已经讨论过概率图模型(PGM)的概念了。Russell等在文献【1】中指出:“在统计学中,图模型这个术语指包含贝叶斯网络在内的比较宽泛的一类数据结构。” 维基百科中更准确地给出了PGM的定义:“A graphical model or probabilistic graphical model is a probabilistic model for which a graph expresses the conditional dependence structure between random variables. ” 如果你已经掌握了贝叶斯网络,那么你一定不会对PGM的概念感到陌生。本文将要向你介绍另外一种类型的PGM,即隐马尔可夫模型(HMM,Hidden Markov Model)。更准确地说,HMM是一种特殊的贝叶斯网络。 一些必备的数学知识 随机过程

隐马尔科夫模型一(概念理解)

…衆ロ難τιáo~ 提交于 2019-12-06 14:30:00
前言 由于前一段时间在看CTC论文,里面用到了HMM中的前向后向算法,推公式的时候·一脸懵逼,所以又来学习HMM的思想,所以写篇博客做个笔记。本部分博客分为两篇,第一篇主要介绍一些基本的概念和思想,第二篇介绍理论的推导。博客的内容主要是基于<<统计学习方法>>以及其他的一些博客 模型概念 隐马尔可夫模型 :隐马尔科夫模型是关于时序的概念模型,描述了由一个隐藏的马尔科夫链随机产生不可观测的状态随机序列,再由各个状态生成一个观测而产生的观测随机序列的过程。隐藏的马尔科夫链随机生成的状态序列成为 状态序列 :每个状态生成一个观测,而由此产生的观测的随机序列,称为 观测序列 。序列的每一个位置又可以看作一个时刻。 当第一次看到上述描述时估计大都数人都会和我一样一脸蒙逼,什么是状态序列,什么又是观测序列?还有隐马尔可夫链又是神马? 举个例子,假设你有一个住得很远的朋友,他每天跟你打电话告诉你他那天做了什么.你的朋友仅仅对三种活动感兴趣:公园散步,购物以及清理房间.他选择做什么事情只凭天气.你对于他所住的地方的天气情况并不了解,但是你知道总的趋势.在他告诉你每天所做的事情基础上,你想要猜测他所在地的天气情况。其实这个就是一个隐马尔科夫模型。每一天天气的变化就是一个隐马尔科夫链(即不同状态之间的转换),其有两个状态 “雨"和"晴”,但是你无法直接观察它们,也就是说,它们对于你是隐藏的.每天

隐马尔科夫HMM 算法

断了今生、忘了曾经 提交于 2019-12-06 14:29:11
要知道隐马尔科夫我们先来了解什么是马尔科夫模型 举一个天气的例子: 我们知道某些天气出现的概率和天气之间转换的概率 比如我知道了昨天的天气,想知道今天的天气最可能是什么,由上图可以知道,昨天的天气是什么,会对今天可能的天气是有影响的。 那么这个时候我们可以说,一个一阶的马尔科夫模型是什么样的 此时,我们可以知道今天是晴天的概率是多少 计算今天是晴天的概率就需要去计算昨天所有可能天气转到今天是晴天的概率之和,也就有了上面的公式 那下面我们就可以引申出什么是隐马尔科夫模型。 相比马尔科夫模型,多了个隐,也就是在隐马尔科夫模型中,多了一个隐藏状态 同样是天气举例子,但是现在多了一个情况,我们观察海藻的情况 在这个情况下,我们是不知道天气情况的,只能从海藻的情况,来知道天气的情况 那么这个时候海藻就是我们观察出来的观察状态,天气就是我们想要知道的隐藏状态 而在这里需要注意的是,观察状态和隐藏状态并不是一一对应的,也就是说,晴天->Dry 晴天->Dryish 晴天->Damp 等等 有一个多对多的关系,一个观测序列(多个观察状态 比如说7天的海藻情况)对应的隐藏序列其实是可以有多个的。 这个是需要我们注意的。我们要做的是把所有可能的情况都要考虑进去。 在隐马尔科夫模型HMM中 ,我们有一个设定,就是以上两个,上面z是隐藏状态, 生成的是下面x观察状态 那么 这是HMM的三要素 pi A B

HMM隐马尔科夫模型

旧时模样 提交于 2019-12-06 14:16:58
什么是熵(Entropy) 简单来说,熵是表示物质系统状态的一种度量,用它老表征系统的无序程度。熵越大,系统越无序,意味着系统结构和运动的不确定和无规则;反之,,熵越小,系统越有序,意味着具有确定和有规则的运动状态。熵的中文意思是热量被温度除的商。负熵是物质系统有序化,组织化,复杂化状态的一种度量。 熵最早来原于 物理学 . 德国物理学家鲁道夫·克劳修斯首次提出熵的概念,用来表示任何一种能量在空间中分布的均匀程度,能量分布得越均匀,熵就越大。 一滴墨水滴在清水中,部成了一杯淡蓝色溶液 热水晾在空气中,热量会传到空气中,最后使得温度一致 更多的一些生活中的例子: 熵力的一个例子是耳机线,我们将耳机线整理好放进口袋,下次再拿出来已经乱了。让耳机线乱掉的看不见的“力”就是熵力,耳机线喜欢变成更混乱。 熵力另一个具体的例子是弹性力。一根弹簧的力,就是熵力。 胡克定律其实也是一种熵力的表现。 万有引力也是熵力的一种(热烈讨论的话题)。 浑水澄清[1] 于是从微观看,熵就表现了这个系统所处状态的 不确定性程度 。香农,描述一个信息系统的时候就借用了熵的概念,这里熵表示的是这个信息系统的 平均信息量 ( 平均不确定程度 ) 。 最大熵模型 我们在投资时常常讲不要把所有的鸡蛋放在一个篮子里,这样可以降低风险。在信息处理中,这个原理同样适用。在数学上,这个原理称为最大熵原理(the maximum

隐马尔科夫模型学习笔记

荒凉一梦 提交于 2019-12-06 14:16:15
隐马尔科夫模型 Viviterbi算法 马尔科夫性质 马尔科夫链 马尔科夫链案例 HMM HMM(Hidden Markov Model)隐马尔科夫模型是一种统计模型,在语音识别、行为识别、NLP、故障诊断等领域具有高效的性能。 HMM是关于时序概率模型,描述一个含有未知参数的马尔科夫链所生成的不可观测的状态序列,再由各个状态生成观测随机序列的过程。HMM是一个双重随机过程--具有一定状态的隐马尔科夫链和随机的观测序列。 HMM随机生成的状态随机序列被称为状态序列;每一个状态生成的一个观测,由此产生的观察随机序列,被称为观测序列。 HMM由隐含状态S、可观测状态O、初始状态概率矩阵π、隐含状态转移概率矩阵A、可观测值转移矩阵B(又称为混淆矩阵,Confusion Matrix); π和A决定了状态序列,B决定了观测序列,因此HMM可以使用三元符号表示,称为HMM的三元素: HMM的两个性质 HMM案例 HMM的三个问题 概率计算的问题: 前向-后向算法 给定模型λ=(A,B,π)和观测序列Q={q1,q2,...,qT},计算模型λ下观测到序列Q出现的概率P(Q|λ) 学习问题: Baum-Welch(状态未知) 已知观测序列Q={q1,q2,...,qT},估计模型λ=(A,B,π)的参数,使得在该模型下观测序列P(Q|λ)最大。 预测问题: Viterbi算法 给定模型λ=(A

隐马尔科夫(HMM)模型

谁都会走 提交于 2019-12-06 14:15:07
隐马尔科夫(HMM)模型 隐马尔科夫(Hidden Markov model)模型是一类基于概率统计的模型,是一种结构最简单的动态贝叶斯网,是一种重要的有向图模型。自上世纪80年代发展起来,在时序数据建模,例如:语音识别、文字识别、自然语言处理等领域广泛应用。隐马尔科夫模型涉及的变量、参数众多,应用也很广泛,以至于很多人不明白模型到底在做什么,模型能够做什么。 HMM中hidden&Markov 首先需要明确的是什么是马尔科夫性质。假设随机过程中某一时刻的状态 s t s t //--> 的概率分布满足: p ( s t | s t − 1 , s t − 2 , . . . , s 0 ) = p ( s t | s t − 1 ) p ( s t | s t − 1 , s t − 2 , . . . , s 0 ) = p ( s t | s t − 1 ) //--> 通俗的说就是,随机过程中某一时刻的状态 s t s t //--> ,只与它前一时刻的状态 s t − 1 s t − 1 //--> 有关,以上就是马尔科夫性质。我们知道自然世界中的很多现象都不符合这一性质,但是我们可以假设其具有马尔科夫性质,这为原来很多无章可循的问题提供了一种解法。 如果某一随机过程满足马尔科夫性质,则称这一过程为马尔科夫过程,或称马尔科夫链。 在马尔科夫链中

隐马尔科夫模型(HMMs)之一:简介及生成模式

好久不见. 提交于 2019-12-06 14:14:53
介绍(introduction) 通常我们总是对寻找某一段时间上的模式感兴趣,这些模式可能出现在很多领域:一个人在使用电脑的时候使用的命令的序列模式;一句话中的单词的序列;口语中的音素序列。总之能产生一系列事件的地方都能产生有用的模式。 考虑一个最简单的情况:有人(柯南?)试图从一块海藻来推断天气的情况。一些民间的传说认为“soggy”的海藻意味着潮湿(wet)的天气,“dry”的海藻预示着晴朗(sun)。如果海藻处于中间状态“damp”,那就无法确定了。但是,天气的情况不可能严格的按照海藻的状态来变化,所以我们可以说在一定程度上可能是雨天或是晴天。另一个有价值的信息是之前某些天的天气情况,结合昨天的天气和可以观察到的海藻的状态,我们就可以为今天的天气做一个较好的预报。 这是在我们这个系列的介绍中一个非常典型的系统。 首先我们介绍一个可以随时间产生概率性模型的系统,例如天气在晴天或者雨天之间变动。 接下来我们试图去预言我们所不能观察到的"隐形"的系统状态,在上面的例子中,能被观察到的序列就是海藻的状态吗,隐形的系统就是天气情况 然后我们看一下关于我们这个模型的一些问题,在上面那个例子中,也许我们想知道 如果我们观察一个星期每一天的海藻的状态,我们是否能知相应的其天气情况 如果给出一个海藻状态的序列,我们是否能判断是冬天还是夏天?我们假设,如果海藻干(dry)了一段时间