隐马尔可夫

AI研习丨优秀博士学位论文:面向互联网金融微观对象的数据挖掘

别说谁变了你拦得住时间么 提交于 2020-04-09 04:28:18
   摘 要   近些年,互联网金融市场的蓬勃发展对传统金融行业造成了巨大冲击;与此同时,互联 网金融市场中积累的海量用户和交易数据为研究智能化、个性化、精准化的服务提供了 支持。本文通过大数据驱动的研究方法,分别针对互联网金融平台中的参与三方——用 户、金融产品和市场管理进行了系统性的研究。在真实互联网金融数据上的实验结果验 证了本研究中所提出方法的有效性。    关 键 字   互联网金融;微观对象;数据挖掘;行为分析;推荐系统    0引言   互联网金融是指传统金融机构或者互联网企 业利用互联网等信息技术实现资金融通、支付、 投资和信息中介等服务的新型金融业务模式。互 联网金融是目前金融科技(Fintech)领域的重要 形态和研究对象之一。相比于传统金融,互联网金融具有效率高、成本低、范围广、操作方便等 优势。但是,互联网金融模式也在一定程度上造 成了金融市场门槛降低、市场流动性增大,以及 监管困难等问题。   互联网金融市场的易变性和业务复杂性对传 统经济学、金融学的研究范式提出了挑战。与此 同时,互联网金融市场中积累的海量用户和交易数据,也为研究者深入探索互联网环境下金融市场的潜在价值,解决互联网金融市场中存在的问题,开发大数据驱动的智慧金融服务带来了全新的机遇。   基于以上背景,本文调研了互联网金融的现状,并采用数据驱动的研究方法对互联网金融市场的主要微观对象(用户

隐马尔可夫模型学习笔记(之一,概率计算问题)

自古美人都是妖i 提交于 2020-04-06 17:12:51
###隐马尔可夫模型的定义 隐马尔可夫模型是关于时序的概率模型,描述由一个隐藏的马尔可夫链随机生成不可观测的状态随机序列,再由各个状态生成一个观测而产生观测随机序列的过程。 隐马尔可夫链随机生成的状态的序列,称为状态序列(state sequence);每个状态生成一个观测,而由此产生的观测的随机序列,称为观测序列(observation sequence)。序列的每一个位置又可以看作是一个时刻。 设Q是所有可能的状态的集合,V是所有可能的观测的集合。 Q = { q 1 , q 2 , . . . q N } , V = { v 1 , v 2 , . . . v M } Q = \{q_1,q_2,...q_N\}, V = \{v_1,v_2,...v_M\} Q = { q 1 ​ , q 2 ​ , . . . q N ​ } , V = { v 1 ​ , v 2 ​ , . . . v M ​ } 其中, N N N 是可能的状态数, M M M 是可能的观测数。状态 q q q 是不可见的,观测 v v v 是可见的。应用到词性标注系统,词就是 v v v ,词性就是 q q q 。应用到语音识别系统,语音就是 v v v ,语素就是 q q q 。 I I I 是长度为 T T T 的状态序列, O O O 是对应的观测序列。 I = { i 1 , i 2 ,

HTK 3.5解码工具HVITE独立工程(Visual Studio Code实现)

无人久伴 提交于 2020-04-06 05:31:04
HTK3.5支持DNN HTK3.5支持DNN了,本来想做一个HMM+DNN的模型,作为HMM+GMM的对比。但是HTK不支持实时的HMM+DNN解码。原因有两个。 HTK不支持实时的计算MFCC_0_D_A_Z的特征,即无法实时计算出特征空间的均值。 HTK不支持实时的DNN或者HMM+DNN的解码。 所以只能做离线的演示。为了学习HVITE的细节,我决定将HVITE工具单独编译。 HTK的源文件结构 HTK的源文件分为lib和tool两个层次。lib文件之间可能有相互依赖(dependency),而tool文件之间相互独立。 HTK主要有HTK和HLM两大类工具,前者做语音识别而后者主要是语言模型。 这次只需要将HTKLib文件夹的所有文件和HTKTools中的HVITE文件提取出来即可。 Visual Studio Code 下面的内容有不详细的地方,可以参考这个链接。 https://code.visualstudio.com/docs/languages/cpp Visual studio code是一个轻量化,跨平台的调试工具。安装后,需要安装两个插件,分别是C/C++,C++ intellisense。 然后将源文件在workspace中打开 编译需要GCC工具,在编译之前需要配置tasks.json,相当于一个脚本。 1)打开 Command Palette

生成模型和判别模型(Generative model, Discriminative model)

只愿长相守 提交于 2020-04-05 15:15:51
生成模型和判别模型(Generative model, Discriminative model) 监督学习的任务是学习一个模型,对给定的输入预测相应的输出。这个模型一般形式为决策函数Y=f(X)或者条件概率分布P(Y|X)。有一种分类就把模型分为:Generative Modeling (生成模型)和Discriminative Modeling (判别模型)两种。生成模型是由训练数据学习联合概率分布P(X,Y),然后求出条件概率分布P(Y|X)作为预测的模型。常见的生成模型有PCA,Kmeans,Naive Bayesian和HMM。 判别模型是由训练数据直接学习决策函数f(X)或者条件概率分布P(Y|X)作为预测的模型,模型关心的是对给定的输入X,应该预测什么样的输出Y,与GM的不同在于不需要先学习出联合分布P(X,Y)。典型的判别模型有 KNN、Logistic Regression,Linear Regression、Decision Tree、SVM、AdaBoost和条件随机场等。 生成模型对数据集的分布有严格的假设,对于outliers会很敏感。而判别模型不关心数据集的分布,只需要学习得到分类的规则,对outliers相对不敏感。 模型 生成模型 判别模型 数据集大小 小 大 数据分布 有严格的要求 不关心 学习目标 估计概率 分类规则 对于判别式模型来说求得P(Y

苹果序列号查询知识汇总

烂漫一生 提交于 2020-03-25 07:51:25
3 月,跳不动了?>>> 丢锋网 整合苹果iphone相关知识大全系列一:苹果序列号查询知识汇总。在这里你可以找到关于苹果序列号查询的所有问题的答案。(如果小编一不小心又漏掉的,麻烦不要拍我!)从本月开始,大家从我们丢锋网上查看到的信息将不仅仅是关于 苹果手机找回方法 相关的内容,我们将从更广泛的维度去了解并且帮助广大苹果用户解决更多不同的需求问题。 问题一 : 苹果序列号是什么?什么是苹果序列号? 苹果序列号,苹果公司生产的产品(如iPhone,iPad,iPod等)设备的硬件序列号简称苹果序列号,每件产品的序列号都不相同,是辨别真伪的硬件标识。 这就好比大家的身份证一样,每个人的身份证都是唯一的。 苹果序列号一般由11位数字加字母组成,每一位都有一定的含义,会根据你的出厂批次,销售地,设备类型等因素进行排列!同时通过苹果序列号可以在 苹果官网 或第三方查询网站 ICCID 查询 上查找到设备的型号,生产日期,购买日期,销售地,保修日期等信息。有了这些信息做对比,可以很容易掌握苹果硬件设备的基本情况。通过这个数据可以鉴别出购买设备的真伪以及是否被翻新过。有的非苹果官方网站上通过苹果序列号查询的信息要比官方的信息更全面一些,这样通过苹果序列号查询到的信息数据完全可以鉴别出是否是翻新机以及设备的购买时间,激活时间和过保时间等。 问题二 : 苹果手机序列号有什么用?