特征提取

SIFT特征提取与检索

余生颓废 提交于 2020-03-07 11:18:46
文章目录 1、SIFT特征提取算法介绍 1.1 算法综述 1.2 算法特性 1.3 主要步骤 2、SIFT特征提取 2.1 实现代码 2.2 实现结果 2.3 实现小结 3、两图片SIFT特征匹配 3.1 实现代码 3.2 实现结果 3.3 实现小结 4、图库检索最高匹配 4.1 获取并保存图库中全部图片的特征数据 4.2 检索最高匹配 4.3 实验小结 5、实验遇到的问题及解决 6、实验总小结 1、SIFT特征提取算法介绍 1.1 算法综述 尺度不变特征转换(Scale-invariant feature transform或SIFT)是一种电脑视觉的算法用来侦测与描述影像中的 局部性特征 ,它在空间尺度中寻找极值点,并提取出其 位置、尺度、旋转不变量 。其应用范围包含物体辨识、机器人地图感知与导航、影像缝合、3D模型建立、手势辨识、影像追踪和动作比对。 1.2 算法特性 SIFT特征是图像的局部特征,其对旋转、尺度缩放、亮度变化保持不变性,对视角变化、仿射变换、噪声也保持一定程度的稳定性; 独特性好,信息量丰富,适用于在海量特征数据库中进行快速、准确的匹配; 多量性,即使少数的几个物体也可以产生大量的SIFT特征向量; 高速性,经优化的SIFT匹配算法甚至可以达到实时的要求; 可扩展性,可以很方便的与其他形式的特征向量进行联合。 1.3 主要步骤 建立尺度空间,即建立高斯差分

LBP特征提取原理及代码实现

北战南征 提交于 2020-03-06 15:37:25
老规矩,先上背景,算是表示对LBP算法提出者的一种尊敬(其实,是为了装...kkk,大家都懂ha)。 一、LBP背景:     LBP(Local Binary Pattern,局部二值模式)是一种用来描述图像 局部纹理特征 的算子;它具有旋转不变性和灰度不变性等显著的优点。它是首先由 T. Ojala, M.Pietikäinen, 和D. Harwood 在1994年提出,用于纹理特征提取。而且,提取的特征是图像的局部的纹理特征。至今,仍在图像识别和人脸识别部分,有很好的效果。 二、LBP特征的原理:      从94年T. Ojala, M.Pietikäinen, 和D. Harwood提出至今,LBP经历过多次的改进,以下根据时间顺序介绍: FirstBleed:    原始的LBP算子定义为在3*3的窗口内,以窗口内的中心点的像素值为标准,对比窗口内其余8个元素的像数值大小,大于中心点的位置用1表示,小于为0。如此,3*3领域内的8个点恰可产生8为二进制数字(通常转化为十进制表示成LBP值)即为中心点的LBP特征值。     上图: SecondBleed:    原始的LBP提出后,研究人员不断对其改进和优化,以下是改进点。   (一):圆形LBP算子:      原始LBP算子固定为某个区域,在图像尺寸和频率纹理发生改变时,会出现很大的偏差

卷积层自我理解

☆樱花仙子☆ 提交于 2020-03-05 20:01:33
卷积层相对全连接层的优势: 全连接层用于图片分类的用法是,假如有一张1000*1000的图片,通过神经元和激励函数产生非线性,假如说有10^6 方的神经元,那么便有10^12 方的权重即参数。 现在利用卷积层的生物特征,人眼是通过各种局部特征组合来做分类的,所以利用感受野的概念。 提出卷积核,用来感受局部特征。因此假设有10^6 方个神经元,此时只有10^8 个权重。 这10^8 个权重提取了10^6 个局部特征,但如果不需要这么多的局部特征,只需要几十,几百个,那么参数量就大大减少了。这样做的依据是同一个卷积核能被用来提取某一固定特征,所以某一固定特征的提取共享一个卷积核,称之为参数共享。但其实就是降低了隐藏层神经元的数量! 卷积层提取特征: 一般利用多层卷积层来提取图片特征,原理是,第一层通过几十个卷积核提取几十个局部特征,可能是线段、圆弧段这类的简单几何特征,然后将几十个局部特征分布在不同通道输入下一层卷积层。 下一层卷积层用与输入通道数一致的卷积核来卷积输入的局部特征进一步提取特征,此时的提取出什么和卷积核如何设计已经极为抽象,但是可以相信的是此时经过学习,可以提取更高级抽象的特征。 参考:https://www.zhihu.com/question/39022858第二个答案。 下一层继续上述操作,如此经过了多层之后,最后输出一张高级特征的特征图

cnn提取基本特征的例子

感情迁移 提交于 2020-03-05 18:14:10
<div class="text-title"> <h1> 原来CNN是这样提取图像特征的。。。 <span class="article-tag"> </span> </h1> <div class="article-info"> <span class="time" id="news-time" data-val="1542969000000">2018-11-23 18:30</span> <span data-role="original-link">来源:<a href="https://www.sohu.com/?spm=smpc.content.content.1.1583387992313onUFvkL" target="_blank" data-spm-data="1">计算机视觉life</a></span> </div> 原标题:原来CNN是这样提取图像特征的。。。 阅读本文8分钟就够了吧? 对于即将到来的人工智能时代,作为一个有理想有追求的程序员,不懂深度学习(Deep Learning)这个超热的领域,会不会感觉马上就out了?作为机器学习的一个分支,深度学习同样需要计算机获得强大的学习能力,那么问题来了,我们究竟要计算机学习什么东西?答案当然是图像特征了。将一张图像看做是一个个像素值组成的矩阵,那么对图像的分析就是对矩阵的数字进行分析,而图像的特征

06-01 DeepLearning-图像识别

房东的猫 提交于 2020-03-03 11:50:33
文章目录 深度学习-图像识别 人脸定位 手工提取特征的图像分类 识图认物 传统分类系统的特征提取 计算机眼中的图像 什么是图像特征? 卷积运算 利用卷积提取图像特征 基于神经网络的图像分类 传统图像分类系统和深度神经网络 深度神经网络的架构 卷积层 池化层 全连接层 归一化指数层 非线性激活层 Sigmoid函数 双曲正切函数 ReLU函数 深度神经网络的训练 反向传播算法 图像分类应用——人脸识别 人脸识别的流程 人脸识别应用场景 小结 深度学习-图像识别 人脸定位   相信你们外出游玩的时候,都不会带上你的牛逼plus诺基亚手机出门,而是带上你的智能手机给自己美美的拍上一张。当你用手机镜头对准人脸的时候,都会出现一个矩形框,如下图所示(前方高能),那么这个技术是怎么做到的呢?   相机中的人脸定位技术用的是二分类技术。该技术流程如下图所示。   如上图所示,相机首先会将照片分割成一块块的图像块,一张照片往往会有成千上万的图像块被切割出来。   然后每一个图像块都会经过人脸分类器去判别是否是人脸。人脸分类器是预先训练好的分类器,类似于我们之前讲的手写数字识别应用程序中的支持向量机分类器。如果人脸分类器预测该图像块为人脸,相机则会在这个图像块中显示出框的位置。   在人脸定位中,为了解决由于手机离人的距离不同,导致手机上显示的人脸大小不一致的问题。手机在切割图像的时候

深度学习简介

十年热恋 提交于 2020-03-01 02:55:07
传统机器学习算法的特征:输入-》人工特征提取-》权重学习-》预测结果 深度学习算法: 输入-》基础特征提取-》多层复杂特征提取-》权重学习-》预测结果 例如深度学习在图像中的应用: 输入-》基础特征提取(基础特征:图片像素)-》多层复杂特征提取(第一层(线条),第二层(简单形状)第三层(复杂形状))-》权重学习-》预测结果 机器学习领域三大方向:自然语言处理、计算机视觉和语音识别 来源: CSDN 作者: 繁华落叶草 链接: https://blog.csdn.net/wht18720080085/article/details/104581439

语音特征提取

我只是一个虾纸丫 提交于 2020-02-29 12:29:26
原英文博客地址: https://haythamfayek.com/2016/04/21/speech-processing-for-machine-learning.html 目录 Setup 预加重(Pre-Emphasis) 分帧(Framing) 加窗(Window) 傅里叶变换和功率谱(Fourier-Transform and Power Spectrum) Filter Banks 梅尔倒谱系数 Mel-frequency Cepstral Coefficients (MFCCs) 均值归一化 Mean Normalization Filter Banks vs MFCCs Conclusion 语音处理在自动语音识别(Automatic Speech Recognition ,简称ASR)或者说话人识别(speaker recognition)等系统中扮演了重要的角色。一直以来梅尔频率倒谱系数( Mel-Frequency Cepstral Coefficients ,简称MFCCs)在语音特征处理中很流行,最近则filter banks越来越流行了。在这边博客中讨论filter banks 和MFCCs,以及为什么filter bank会越来越受欢迎。 Filter banks和MFCCs的计算包含了一些相同的步骤,filter banks计算完成后

基于深度学习的近红外掌纹识别原型系统设计与实现

倾然丶 夕夏残阳落幕 提交于 2020-02-26 14:47:38
基于深度学习的近红外掌纹识别原型系统设计与实现 一、绪论 二、深度学习知识 三、Tensorflow 四、卷积神经网络 五、掌纹识别理论 掌纹图像采集 掌纹图像预处理 掌纹特征提取 掌纹特征匹配 掌纹识别 六、总结 在B站视频学习 深度学习之神经网络算法(CNN RNN GAN原理入门+实战) Tensorflow2.0入门到进阶 卷积神经网络—>卷积层 池化层 全连接层 掌纹识别系统 主要包括掌纹图像采集、 掌纹图像预处理、特征提取、特征匹配等几个部分 掌纹图像收集 掌纹图像预处理方法—>ROI区域 DA https://blog.csdn.net/cmen/article/details/7708477 预处理方法主要包括二值化、边界跟踪和关键点定位等步骤 掌纹特征提取方法AlexNet(5层卷积+3层全连接) 模型过拟合问题 https://blog.csdn.net/csdn_muxin/article/details/81289933 Dropout随机失活 https://blog.csdn.net/sinat_29957455/article/details/81023154 基于CNN的掌纹分类方法 掌纹分类识别方法Softmax 常用到的分类决策算法包括:最近邻分类算法(KNN, K-Nearest Neighbor)、支持向量机分类算法(SVM,Support

图像质量评估综述

佐手、 提交于 2020-02-24 11:52:07
本文部分内容摘自: https://zhuanlan.zhihu.com/p/32553977 1. 背景介绍 在过去的几十年里,由于质量评估(Quality Assessment,QA)在许多领域有其广泛的实用性,比如图像压缩、视频编解码、视频监控等,并且对高效、可靠质量评估的需求日益增加,所以QA成为一个感兴趣的研究领域,每年都涌现出大量的新的QA算法,有些是扩展已有的算法,也有一些是QA算法的应用。 质量评估可分为图像质量评估(Image Quality Assessment, IQA)和视频质量评估(Video Quality Assessment, VQA),本文主要讨论图像质量评估。IQA从方法上可分为主观评估和客观评估。主观评估就是从人的主观感知来评价图像的质量,首先给出原始参考图像和失真图像,让标注者给失真图像评分,一般采用平均主观得分(Mean Opinion Score, MOS)或平均主观得分差异(Differential Mean Opinion Score, DMOS)表示。客观评估使用数学模型给出量化值,可以使用图像处理技术生成一批失真图像,操作简单,已经成为IQA研究的重点。图像质量评估算法的目标是自动评估与人的主观质量判断相一致的客观图像质量。然而,主观评估费时费力,在实际应用中不可行,并且主观实验受观看距离、显示设备、照明条件、观测者的视觉能力

task05

帅比萌擦擦* 提交于 2020-02-20 03:17:14
LeNet: 在大的真实数据集上的表现并不尽如⼈意。 1.神经网络计算复杂。 2.还没有⼤量深⼊研究参数初始化和⾮凸优化算法等诸多领域。 机器学习的特征提取:手工定义的特征提取函数 神经网络的特征提取:通过学习得到数据的多级表征,并逐级表⽰越来越抽象的概念或模式。 神经网络发展的限制:数据、硬件 AlexNet 首次证明了学习到的特征可以超越⼿⼯设计的特征,从而⼀举打破计算机视觉研究的前状。 特征: 8层变换,其中有5层卷积和2层全连接隐藏层,以及1个全连接输出层。 将sigmoid激活函数改成了更加简单的ReLU激活函数。 用Dropout来控制全连接层的模型复杂度。 引入数据增强,如翻转、裁剪和颜色变化,从而进一步扩大数据集来缓解过拟合。 来源: CSDN 作者: 一只小团子 链接: https://blog.csdn.net/powu0193/article/details/104401246