图像识别

免费数据集下载

北城余情 提交于 2020-03-24 13:54:27
目前系统整理了一些网上开放的免费科研数据集,以下是分类列表以及下载地址,供高校和科研机构免费下载和使用。 金融 美国劳工部统计局官方发布数据 上证A股日线数据,1999.12.09 至 2016.06.08,前复权,1095支股票 深证A股日线数据,1999.12.09 至 2016.06.08,前复权,1766支股票 深证创业板日线数据,1999.12.09 至 2016.06.08,前复权,510支股票 MT4平台外汇交易历史数据 Forex平台外汇交易历史数据 几组外汇交易逐笔(Ticks)数据 美国股票新闻数据【 Kaggle数据 】 美国医疗保险市场数据【 Kaggle数据 】 美国金融客户投诉数据【Kaggle数据】 Lending Club 网贷违约数据 【Kaggle数据】 信用卡欺诈数据 【Kaggle 数据】 某个金融产品实时交易数据 【Kaggle数据】 美国股票数据XBRL 【Kaggle数据】 纽约股票交易所数据【Kaggle数据】 交通 2013年纽约出租车行驶数据 Udacity自动驾驶数据 纽约 Uber 接客数据 【Kaggle数据 】 英国车祸数据(2005-2015)【Kaagle数据】 芝加哥汽车超速数据 【Kaggle数据】 商业 Amazon 食品评论数据 【Kaggle数据】 Amazon 无锁手机评论数据 【Kaggle数据】

团队及项目介绍

可紊 提交于 2020-03-18 11:59:21
一.团队介绍 我们团队是由三个小伙伴组成的,虽然平时结队上课,吃饭,打水,游玩等等,但是结对开发,合作编写程序还是第一次,不免还是有点小紧张。大学三年时光让我们三只变得已经很熟悉,也有了相互适应,每一个人都有自己的性格和特长,希望我们可以充分发挥自己的特长,互相弥补,互相扶持,有一个更加精彩的团队合作。 团队成员: 张鹏宇,武于微,鲁鑫 成员介绍: 张鹏宇:有很活跃的逻辑性思维,编程能力很好,在结队开发中给团队项目带来很好的创造力和开发力,在团队中起领导作用 鲁鑫: 思维比较缜密,掌握并可灵活运用各种算法,在结对开发中对于团队项目有一个很好的规划设计,架构搭建,算法探讨运用 武于微:做事比较认真细心,对项目开发细节提出建设性意见和各模块代码的拼写,对软件的测试进行相关的检测和项目维护 博客园地址: 张鹏宇:http://home.cnblogs.com/u/fooreveryu/ 武于微:http://www.cnblogs.com/wuyw/ 鲁鑫:http://www.cnblogs.com/LUXIN123/ 二.团队项目 安卓手机人脸识别解锁 三.项目介绍 1.创意解决用户什么需求 人脸识别,是基于人的脸部特征信息进行身份识别的一种生物识别技术。用摄像机或摄像头采集含有人脸的图像或视频流,并自动在图像中检测和跟踪人脸,进而对检测到的人脸进行脸部的一系列相关技术

MobileFaceNets

牧云@^-^@ 提交于 2020-03-17 02:14:19
论文:MobileFaceNets: Efficient CNNs for Accurate RealTime Face Verification on Mobile Devices 0 摘要 作者简单分析了普通的移动式设备上部署的网络应用于人脸验证任务时的缺点,并克服这个缺点设计了高效、准确的人脸验证模型MobileFaceNets。在相同的实验条件下,MobileFaceNets和MobileNetV2识别准确率相当,但速度要快了两倍。使用arcface loss,基于MS-Celeb-1M数据集,大小仅为4MB的MobileFaceNets模型在LFW上取得了99.55%的人脸验证准确率,在MegaFace上FAR=1e-6时的TAR为92.59,这个准确率和大小为数百MB的大模型相当。最快的一个MobileNets在手机上的推理时间仅为18ms。综合来看,MobileFaceNets效率比之前的移动式模型有了很大的提升。 1 核心思想 1.1 传统的轻量化网络用于人脸验证任务时的弊端 轻量化网络,如MobileNetV1,ShuffleNet和MobileNetV2,都使用了全局平均池化层GAP。对于人脸验证和识别任务,有的论文提到使用了GAP之后识别准确率会降低,但这些论文都没有给出理论上的解释。这里,作者尝试从感受野的角度出发来解释下这个问题。

技术文档

岁酱吖の 提交于 2020-03-13 19:50:38
开发需求分析 功能:合理推荐学生找到合适的自习室,节省时间。 开发策略:通过后端处理数据,将之展现在前段搭建的平台上。 框架:   前端:html5   后端:OpenCV和C++ 基本架构   前段用于处理用户的输入以及需求信息,后端用于处理运算用户所需的结果 前端架构设计 一、功能 读入学生对于某教学楼的查询需求,并显示对应结果 二、页面构成 1.顶端是中国人民大学的logo,以及“教室资源管理系统”的字样。 2.中间是搜索框和搜索按钮 3. 下方左侧是选择指定教学楼的单选表单 ; 4. 下方右侧是显示搜索结果的表格 , 一列为教室编号 , 另一列为拥挤程度。 三、 页面设计 : 初步设计的页面如下图所示 , 之后会继续修改 : 后端架构设计: 后端人脸检测部分使用OpenCV和C++语言完成。它分为下面两个部分: (一)分类器的训练 建立一个含有大量图片的样本库,样本库中的图片分为包含人脸特征和不包含人脸特征两种。从样本库中将人脸和非人脸的haar-like特征提取出来,作为分类器训练过程的输入,然后使用Adaboost算法训练出一个级联的强分类器。该分类器就是一个对人脸和非人脸的判断器。 (二)人脸检测 若待检测的是视频或摄像头的录像,则从其中提取一帧进行图片预处理;若待检测的是图片,则直接进行图片预处理阶段。加载在上一步工作中训练得到的分类器,对截取的待识别图像进行检测

FaceNet

萝らか妹 提交于 2020-03-12 04:52:58
论文:FaceNet: A Unified Embedding for Face Recognition and Clustering 0 摘要 FaceNet,直接把输入图像变成欧式空间中的特征向量,两个特征向量间的欧式距离就可以用来衡量两者之间的相似度。可以用在人脸验证、识别和聚类任务中。 本文提出了三元组的概念,构建anchor - matching sample -unmatching sample进行模型的训练。 FaceNet在LFW和YTF数据集上取得了很好的效果,远超当时的其他算法。 1 简介 本文提出的思想是,直接通过CNN学习一副输入人脸图像的欧式空间特征,那么两幅图像特征向量间的欧式距离越小,表示两幅图像是同一个人的可能性越大。一旦有了这个人脸图像特征提取模型,那么人脸验证就变成了两幅图像相似度和指定阈值比较的问题;人脸识别就变成了特征向量集的KNN分类问题;人脸聚类就可以通过对人脸特征集进行kmeans聚类完成。 前面的算法都是用已知身份的人脸图像集训练一个分类模型,然后取中间某个层的输出作为人脸的特征表示。这种方法的弊端是:不够直接和效率低下。不够直接是指希望学习的指定层的特征可以很好的泛化到未知人脸上,效率低是指一般学习的特征维度很高(大于1000维)。有的方法对提取的特征进行PCA降维处理,但这只是一个线性变换,可以通过一个网络层很简单的实现出来。

图像识别

三世轮回 提交于 2020-03-11 09:43:07
题目描述: 在图像识别中,我们经常需要分析特定图像中的些特征,而其中很重要的一 点就是识别出图像的多个区域。在这个问题中,我们将给定- -幅N x M的图像,其 中每个1 x 1的点都用一个[0, 255]的值来表示他的RGB颜色。如果两个相邻的像素点颜色差值不超过D,我们就认为这两个像素点属于同一个区域。对于一一个像素点(x,y),以下这8个点(如果存在)是与它相邻的: (x一1,y一1),(x- 1,y),(x -1,y + 1),(x,y- 1),(x,y + 1),(x + 1,y一1),(x +1,y),(x+ 1,y+ 1)。 你的任务是写一一个程序,分辨出给定图像中一“共被 分为多少个区域。 输入格式: . 输入数据包含多组测试数据。 输入的第一-行是-一个整数T (T s 100),表示测试数据的组数。 每组测试数据的第一行是三个整数N,M,D(1≤N,M≤100, 0≤D≤255),意 义如上所述。 接下来N行,每行M个整数,表示给定图像的每个像素点颜色。 输出格式: 对于每组测试数据输出-一行,即图像甲的这域数量。 输入样例: 2 3 3 0 1 1 1 0 1 0 0 1 0 3 4 1 10 11 12 13 9 8 7 6 2 3 4 5 输出样例: 3 1 # include <bits/stdc++.h> using namespace std ;

揭秘“图像识别”的工作原理

时光怂恿深爱的人放手 提交于 2020-03-10 16:25:23
对人类来说,描述我们眼睛所看到的事物,即“视觉世界”,看起来太微不足道了,以至于我们根本没有意识到那正是我们时时刻刻在做的事情。在看到某件事物时,不管是汽车、大树,还是一个人,我们通常都不需要过多的思考就能立刻叫出名字。然而对于一台计算机来说,区分识别“人类对象”(比如:在小狗、椅子或是闹钟这些“非人类对象”中识别出奶奶这一“人类对象”)却是相当困难的。 能解决这一问题可以带来非常高的收益。“图像识别”技术,更宽泛地说是“计算机视觉”技术,是许多新兴技术的基础。从无人驾驶汽车和面部识别软件到那些看似简单但十分重要的发展成果——能够监测流水线缺陷和违规的“智能工厂”,以及保险公司用来处理和分类索赔照片的自动化软件。这些新兴科技是离不开“图像识别”的。 在接下来的内容里,我们将要探究“图像识别”所面临的问题和挑战,并分析科学家是如何用一种特殊的神经网络来解决这一挑战的。 学会“看”是一项高难度、高成本的任务 着手解决这个难题,我们可以首先将元数据应用于非结构化数据。在之前的文章里,我们曾描述过在元数据稀缺或元数据不存在的情况下,进行文本内容分类和搜索遇到的一些问题和挑战。让专人来对电影和音乐进行人工分类和标记,确实是一项艰巨的任务。但有些任务不仅艰巨,甚至是几乎不可能完成的。比如训练无人驾驶汽车里的导航系统,让其能够将其他车辆与正在过马路的行人区分开来

论文翻译--Deep Feature Flow for Video Recognition

给你一囗甜甜゛ 提交于 2020-03-10 12:11:23
Abstract 深度卷积神经网络在图像识别方面取得了很大的成功。然而,将最先进的图像识别网络转换成视频并非易事, 因为每帧的评估速度太慢,而且负担不起 。 提出了一种基于深度特征流的快速、准确的视频识别框架 。它只在稀疏关键帧上运行繁琐的卷积子网络, 并通过流场将它们的深度特征映射传播到其他帧 。由于流计算速度相对较快,因此实现了显著的加速。整个体系结构的端到端训练显著提高了识别精度。深度特征流具有灵活性和通用性。在两个视频数据集上进行了目标检测和语义分割的验证。它显著地推进了视频识别任务的实践。 Introduction 近些年来,深度卷及网络去得了巨大的成功。快速准确的视频识别对于高价值场景至关重要,例如,自动驾驶和视频监控。然而,将现有的图像识别网络应用于单个视频帧会带来难以负担的计算量大多数应用程序的成本。 我们普遍地意识到图像内容的变化缓慢,特别是高级别场景下。 这一观察结果已被用于特征学习的正则化方法,并将视频视为未使用的数据源[46,21]。然而,这样的数据冗余 并利用连续性来降低计算成本。然而,这方面很少受到注意用于文献中使用CNNs的视频识别。 现有的CNN架构有一个共同点,就是大多数层是卷基化并且占用了太多的计算量。中间卷及地形图具有与输入突袭那个相同的空间范围,通常分辨率较小,如16x16或者更小。他们之间保持了低层次的关系,层次语义概念看【48】

人脸识别 人脸认证

家住魔仙堡 提交于 2020-03-08 05:24:18
人脸识别,是基于人的脸部特征信息进行身份识别的一种生物识别技术。用摄像机或摄像头采集含有人脸的图像或视频流,并自动在图像中检测和跟踪人脸,进而对检测到的人脸进行脸部的一系列相关技术,通常也叫做人像识别、面部识别。 传统的 人脸识别技术 主要是基于可见光图像的人脸识别,这也是人们熟悉的识别方式,已有30多年的研发历史。但这种方式有着难以克服的缺陷,尤其在环境光照发生变化时,识别效果会急剧下降,无法满足实际系统的需要。解决光照问题的方案有三维图像人脸识别,和热成像人脸识别。但这两种技术还远不成熟,识别效果不尽人意。 迅速发展起来的一种解决方案是基于主动近红外图像的多光源人脸识别技术。它可以克服光线变化的影响,已经取得了卓越的识别性能,在 精度 、稳定性和速度方面的整体系统性能超过三维图像人脸识别。这项技术在近两三年发展迅速,使人脸识别技术逐渐走向实用化。 人脸与人体的其它生物特征(指纹、虹膜等)一样与生俱来,它的唯一性和不易被复制的良好特性为身份鉴别提供了必要的前提,与其它类型的生物识别比较人脸识别具有如下特点: 非强制性:用户不需要专门配合人脸采集设备,几乎可以在无意识的状态下就可获取人脸图像,这样的取样方式没有“强制性”; 非接触性:用户不需要和设备直接接触就能获取人脸图像;   并发性:在实际应用场景下可以进行多个人脸的分拣、判断及识别;   除此之外,还符合视觉特性:“以貌识人

人脸表情识别论文阅读笔记1:A Compact Deep Learning Model for Robust Facial Expression Recognition

情到浓时终转凉″ 提交于 2020-03-07 04:16:10
FER方法有两种,一是image-based方法;二是sequence-based方法,分别对应于静态图像数据集(eg:FER2013)和视频序列数据集(eg:CK+、Oulu-CASIA)。 论文概述 该论文来自2018年CVPR: 1.提出一种轻量型(compact)frame-based人脸表情识别模型,在性能不逊色state-of-the-art方法的同时参数量更少; 2.提出frame-to-sequence方法,通过门控循环单元(GRU)来使用时间信息; 3.收集三个不同场景的数据集,用来评估跨域性能; 4.提出光照增强方案以解决通过混合数据训练深度网络的过拟合问题,提高模型鲁棒性 模型介绍 frame-basedFER框架总体结构如下: 由此可见,整体框架分为两个部分:人脸预处理和CNN分类模型。其中,人脸预处理使用IntraFace检测出的人脸特征点裁剪人脸区域;CNN分类模型结构如下: 模型由两层卷积层(每层卷积层由两个卷积层构成)和两个全连接层构成,卷积核大小均为5X5,输入图片大小为96X96。 模型设计原因: 1.简单网络(plain model)能够在FRR任务中取得不错效果; 2.使用大卷积核(5X5)保证神经元拥有更大感受野;感受野相关内容参见: 我的博客 3.大幅减少全连接层神经元数量,使得网络参数量大幅减少( 实验结果证明只要合理设计感受野