分类数据

A Taxonomy of Deep Convolutional Neural Nets for Computer Vision

霸气de小男生 提交于 2020-01-14 20:01:03
A Taxonomy of Deep Convolutional Neural Nets for Computer Vision 基本信息 摘要 1. Introduction 2. Introduction to Convolutional Neural Networks 2.1. Building Blocks of CNNs 2.1.1. Why Convolutions? 2.1.2. Max-Pooling 2.1.3. Non-Linearity 2.2. Depth 2.3. Learning Algorithm 2.3.1. Gradient-Based Optimization 2.3.2. Dropout 2.4. Tricks to Increase Performance 2.5. Putting It All Together: AlexNet 2.6. Using Pre-Trained CNNs 2.6.1. Fine-Tuning 2.6.2. CNN Activations as Features 2.7. Improving AlexNet 3. CNN Flavors 3.1. Region-Based CNNs 3.2. Fully Convolutional Networks 3.3. Multi-Modal Networks 3.4.

Task3:逻辑回归

╄→гoц情女王★ 提交于 2020-01-13 17:29:54
逻辑回归 1.逻辑回归与线性回归的联系与区别 2.逻辑回归的原理 3.逻辑回归损失函数推导及优化 4.正则化与模型评估指标 5.逻辑回归的优缺点 6.样本不均匀问题解决办法 7.Sklean参数 8.代码实现 1.逻辑回归与线性回归的联系与区别 线性回归解决的是连续变量的问题,但离散性变量,在分类任务中使用线性回归,效果不理想。` 例子: 图显示了是否购买玩具和年龄之间的关系,可以用线性回归拟合成一条直线,将购买标注为1,不购买标注为0,拟合后取当0.5值为阈值来划分类别。 y ^ = { 1 , f ( x ) > 0.5 , 0 , f ( x ) < 0.5 \hat y =\begin{cases} 1, f(x)>0.5, \\\\0, f(x)<0.5\end{cases} y ^ ​ = ⎩ ⎪ ⎨ ⎪ ⎧ ​ 1 , f ( x ) > 0 . 5 , 0 , f ( x ) < 0 . 5 ​ 可以看到,在途中,年龄的区分点约为19岁。 但当数据点不平衡时,很容易影响到阈值,见以下图: 可以看到,0值样本的年龄段往高年龄端偏移后,真实的阈值依然是19岁左右,但拟合出来的曲线的阈值往后边偏移了。可以想想,负样本越多,年龄大的人越多,偏移越严重。 实际情况是60岁的老人和80岁的老人都不会购买玩具,增加几位80岁的老人,并不会影响20岁以下人群购买玩具的概率

数据库mysql_关系型数据库 & MySQL安装

允我心安 提交于 2020-01-13 15:29:46
文章目录 数据库mysql 一、 数据库简介 1.为什么需要数据库? 2.常见数据库有哪些? 3.数据库分类 (1)关系型数据库 (2)非关系型数据库 二、 关系型数据库 1.基本概念: (1)E-R模型 (2)范式理解 (3)范式判断 是否符合第一范式? 是否符合第二范式? 是否符合第三范式? 2.个人博客数据库设计 三、 MySQL简介与安装(linux) 1.MySQL常用存储引擎分析 2.MySQL安装 3.允许远程连接 四、 数据库操作 1.数据库操作 2.数据库表操作 查询操作* 查询的基本语法 消除重复行 条件 分组 对比where与having 排序 获取部分行 注意: 实际使用中,只是语句中某些部分的组合,而不是全部 五、 pymysql数据库编程 PyMySQL 是在 Python3.x 版本中用于连接 MySQL 服务器的一个库, 数据库mysql 一、 数据库简介 数据库管理系统(英语:Database Management System,简称DBMS)是为管理数据库而设计的电脑软件系统,一般具有存储、截取、安全保障、备份等基础功能。数据库管理系统可以依据它所支持的数据库模型来作分类,例如关系式、XML;或依据所支持的计算机类型来作分类,例如服务器群集、移动电话;或依据所用查询语言来作分类,例如SQL、XQuery;或依据性能冲量重点来作分类,例如最大规模

全网最详细yolov1-yolov3原理

喜夏-厌秋 提交于 2020-01-13 05:26:57
文章目录 YOLO发展概述 YOLO v1~v3的设计历程 Yolov1 1. 核心思想 2. **网络结构** 3. Loss函数 4. 训练过程 5 .总结 Yolov2 1. 核心思想 2. 网络结构 3. Loss函数 4. 训练过程 5. 数据增强 6. 总结 Yolov3 1. 核心思想 2. 网络结构 3. loss 函数 4. 训练过程 5. Darknet框架 # YOLOv3原理 YOLO发展概述 2015 年,R-CNN 横空出世,目标检测 DL 世代大幕拉开。 各路豪杰快速迭代,陆续有了 SPP,fast,faster 版本,至 R-FCN,速度与精度齐飞,区域推荐类网络大放异彩。 奈何,未达实时检测之,难获工业应用之青睐。 此时,凭速度之长,网格类检测异军突起,先有 YOLO,继而 SSD,更是摘实时检测之桂冠,与区域推荐类二分天下。然却时遭世人诟病。 遂有 JR 一鼓作气,并 coco,推 v2,增加输出类别,成就 9000。此后一年,作者隐遁江湖,逍遥 twitter。偶获灵感,终推 v3,横扫武林! YOLO不断吸收同化对手,进化自己,提升战斗力:YOLOv1 吸收了 SSD 的长处(加了 BN 层,扩大输入维度,使用了 Anchor,训练的时候数据增强),进化到了 YOLOv2; 吸收 DSSD 和 FPN 的长处,仿 ResNet 的

机器学习在高德用户反馈信息处理中的实践

早过忘川 提交于 2020-01-13 02:58:17
1.背景 作为国内领先的出行大数据公司,高德地图拥有众多的用户和合作厂商,这为高德带来了海量的出行数据,同时通过各个渠道,这些用户也在主动地为我们提供大量的反馈信息,这些信息是需要我们深入挖掘并作用于产品的,是高德地图不断进步和持续提升服务质量的重要手段。 本文将主要介绍针对用户反馈的文本情报,如何利用机器学习的方法来提高大量用户数据的处理效率、尽可能实现自动化的解题思路。 先来解释一下重点名词。 情报:是一种文本、图片或视频等信息,用来解决高德地图生产或者导航中的具体问题,本质上是指与道路或交通相关的知识或事实,通过一定空间和时间通知给特定用户。 用户反馈:是指用户借助一定的媒介,对所使用的软件等提供一些反馈信息,包括情报、建议和投诉等。 典型的用户反馈类型和选项如下图所示: 2.问题及解法 用户反馈的方式可以通过手机的Amap端、PC端等进行上报,上报时选择一些选择项以及文本描述来报告问题,以下是一个用户反馈的示例,其中问题来源、大类型、子类型和道路名称是选择项,用户描述是填写项,一般为比较短的文本。这些也是我们可以使用的主要特征。 每个用户在上报了问题之后,均希望在第一时间内问题能够得到解决并及时收到反馈。但是高德每天的用户反馈量级在几十万,要想达到及时反馈这个目标非常的不容易。 针对这些用户反馈信息,当前的整体流程是先采用规则进行分类

利用数据透视表处理某列分类,并显示分类项的折线图

ぐ巨炮叔叔 提交于 2020-01-12 01:16:14
需求背景 一般我们从数据库查询出来的数据如下所示,时间维度的一批数据,但列数据的值是有分类的,如下的分类列的值 我们的目标是于时间维度(图表的x轴),分类列中各分类(http、quic、oss)为显示的系列(三条趋势线),图表的y轴是成功率。即如下图所示 解决方案 先用通过透视表,把第三列的分类项展开 央展开后的新表格上插入折线图 使用透视表 日期拖到列,分类拖到行,成功率拖到值,分类的类型就被展开了!!注意成功率的值类型需要改动求和项 出来的透视表如下所示 插入折线图 把透视表的内容,copy一份,成率的数据改为自己想要的格式,然后选中内容,点工具栏的插入》表格》折线图,done 参考文档 数据透视表+折线图绘制案例教程 画出与众不同的折线图(曲线图) 来源: CSDN 作者: 罗兄 链接: https://blog.csdn.net/SCHOLAR_II/article/details/103788282

图形分类

不羁的心 提交于 2020-01-12 00:37:04
1、棒棒糖图(LollipopChart) 棒棒糖图传达了跟柱形图或者条形图相同的信息, 只是将矩形转变成线条,这样可减少展示空间,重点放过在数据点上,从而看起来更加简洁与美观。相对于柱形图与条形图,棒棒糖图更加适合数据量比较多的情况 。图(a)为横向棒棒糖图,对应条形图;而如果是纵向棒棒糖图则对于柱形图。 2、 克利夫兰点图( Cleveland'sDot Plots) 也就是我们常用的滑珠散点图,非常类似于棒棒糖图,只是没有连接的线条,重点强调数据的排序展示以及互相之间的差距。如图 (b) 所示。克利夫兰点图一般都是横向展示,所以 Y 轴变量一般为类别型变量。 3、 哑铃图( DumbbellPlot ) 可以看成多数据系列的克利夫兰点图,只是使用直线连接了两个数据系列的数据点。哑铃图可以主要用于: 1. 展示在同一时间段两个数据点的相对位置(增加或者减少), 2. 比较两个类别之间的数据值差别。如图 (c) 所示,就是展示了男性( male )和女性( Female )两个类别的数值差别,以女性( Female )数据系列的数值排序显示。 引自:https://ask.hellobi.com/blog/EasyCharts/10672 来源: https://www.cnblogs.com/djx571/p/12181597.html

搜索过滤

柔情痞子 提交于 2020-01-11 02:43:43
0.学习目标 了解过滤功能的基本思路 独立实现分类和品牌展示 了解规格参数展示 实现过滤条件筛选 1.过滤功能分析 1.1.功能模块 首先看下页面要实现的效果: [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-FrJeCLwI-1578404532507)(assets/1526725119663.png)] 整个过滤部分有3块: 顶部的导航,已经选择的过滤条件展示: 商品分类面包屑,根据用户选择的商品分类变化 其它已选择过滤参数 过滤条件展示,又包含3部分 商品分类展示 品牌展示 其它规格参数 展开或收起的过滤条件的按钮 顶部导航要展示的内容跟用户选择的过滤条件有关。 比如用户选择了某个商品分类,则面包屑中才会展示具体的分类 比如用户选择了某个品牌,列表中才会有品牌信息。 所以,这部分需要依赖第二部分:过滤条件的展示和选择。因此我们先不着急去做。 展开或收起的按钮是否显示,取决于过滤条件现在有多少,如果有很多,那么就没必要展示。所以也是跟第二部分的过滤条件有关。 这样分析来看,我们必须先做第二部分:过滤条件展示。 1.2.问题分析 过滤条件包括:分类过滤、品牌过滤、规格过滤项等。我们必须弄清楚几个问题: 什么时候查询这些过滤项? 这些过滤项的数据从何而来? 我们先以分类和品牌来讨论一下: 问题1,什么时候查询这些过滤项? 现在,页面加载后就会调用

数据分类/组处理

假如想象 提交于 2020-01-09 23:20:04
数据分类/组处理 groupby() 分组函数 分组之后必聚合,只对数字的列聚合 单列进行分组 data.groupby(“attack_range”).mean()[“hp_max”] 使用列表进行多条件分组 data.groupby([“attack_range”,“role_main”]).mean()[“hp_max”] 对不同列求不同的聚合指标 gp = data.groupby([“attack_range”]) gp.agg({“hp_max”:“mean”,“mp_max”:“min”}) 数据聚合是数据处理的最后一步,通常是要使每一个数组生成一个单一的数值/ 数据分类处理: 分组:先把数据分为几组 用函数处理:为不同组的数据应用不同的函数以转换数据 合并:把不同的组得到的结果合并起来 数据处理的核心: groupby()函数 groups属性查看分组情况 练习: data = DataFrame ( data = { "item" : np . random . randint ( 0 , 100 , size = ( 100 ) ) , "color" : np . random . randint ( 1 , 4 , size = ( 100 ) ) , "weight" : np . random . random ( size = 100 ) * 100

Python KNN算法

僤鯓⒐⒋嵵緔 提交于 2020-01-09 05:00:11
  机器学习新手,接触的是《机器学习实战》这本书,感觉书中描述简单易懂,但对于python语言不熟悉的我,也有很大的空间。今天学习的是k-近邻算法。    1. 简述机器学习   在日常生活中,人们很难直接从原始数据本身获得所需信息。 而机器学习就是把生活中无序的数据转换成有用的信息。 例如,对于垃圾邮件的检测,侦测一个单词是否存在并没有多大的作用,然而当某几个特定单词同时出现时,再辅以考虑邮件的长度及其他因素,人们就可以更准确地判定该邮件是否为垃圾邮件。   机器学习分为 监督学习 和 无监督学习 ,其中:   (1) 监督学习: 包含分类和回归。分类,是将实例数据划分到合适的分类中。回归,主要用于预测数值形数据。因为这类算法必须知道预测什么,即目标变量的分类信息,所以称为监督学习。   (2) 无监督学习 :此时数据没有类别信息,不能给定目标值。在无监督学习中,将数据集合分成由类似的对象组成的多个类的过程称为 聚类 ,将寻找描述数据统计值的过程称为 密度估计 ,此外,无监督学习还可以减少数据特征的维度,以便我们可以使用二维或三维图形更加直观地展示数据信息。   以下是机器学习的主要算法:   监督学习: k-近邻算法(KNN) ,朴素贝叶斯算法,支持向量机(SVM),决策树        线性回归,局部加权线性回归,Ridge回归,Lasso最小回归系数估计   无监督学习:K