机器学习

python机器学习基本概念快速入门

浪子不回头ぞ 提交于 2021-02-17 09:10:50
//2019.08.01 机器学习基础入门1-2 1、 半监督学习的数据特征在于其数据集一部分带有一定的"标记"和或者"答案",而另一部分数据没有特定的标记 ,而更常见的半监督学习数据集产生的原因是各种原因引起的数据缺失。 2、半监督学习的数据集处理方式大多采用: 先用无监督学习算法对数据进行相关的处理,再利用监督学习算法对其进行模型的训练和预测。 3、增强学习: 它是指根据周围的环境进行相应的行动,然后根据采取行动的结果,学习行动的方式 ,其算法得到整体闭环原理图如下图所示: 图1 4、机器学习算法的其他分类方式: (1)在线学习(online learning)和批量学习(离线学习)(batch learning) (2)参数学习(parametric learning)与非参数学习(nonparametric learning) 5、批量学习算法的整体流程如下图所示: 图2 它的优点在于比较简单,它适应环境变化的方式是:进行定时重新批量学习,不过这种方式也有比较大的缺点就是:每次重新批量学习,其运算量巨大;另外在某些环境变化非常迅速的情况下,其实现是基本不可能的。 6、在线学习:它是指在批量学习的基础上将新的产生的数据集输入到机器学习算法的学习资料中进行实时的训练和迭代优化,从而及时地适应环境的变化,其具体原理图如下: 图3 它的优点在于能够及时地反映新的环境的变化

【机器学习】Python3入门机器学习 经典算法与应用

白昼怎懂夜的黑 提交于 2021-02-17 08:58:34
分享一份很珍贵的慕课网机器学习的视频教程。 【目录】 【获取方式】 关注公众号并在后台回复关键字: py002 有需要的朋友欢迎下载! 猜你喜欢 【干货分享】《C语言精彩编程百例》 【干货分享】C语言电子书 【干货分享】C语言视频教程 【干货分享】编程小白入门C语言的第一本书籍 【干货分享】一款小巧的的C语言编译器 【干货分享】《C语言程序设计_现代方法》配套代码 【干货分享】编程小白的第一本python入门书 本文分享自微信公众号 - 嵌入式大杂烩(zhengnian-2018)。 如有侵权,请联系 support@oschina.cn 删除。 本文参与“ OSC源创计划 ”,欢迎正在阅读的你也加入,一起分享。 来源: oschina 链接: https://my.oschina.net/u/2821634/blog/4570835

机器学习:如何通过Python入门机器学习

邮差的信 提交于 2021-02-17 08:44:13
我们都知道机器学习是一门综合性极强的研究课题,对数学知识要求很高。因此,对于非学术研究专业的程序员,如果希望能入门机器学习,最好的方向还是从实践触发。 我了解到 Python 的生态对入门机器学习很有帮助。因此希望以此作为突破口入门机器学习。 我将会记录一个系列的学习与实践记录。记录内容主要参考 Youtube 中 sentdex 发布的视频,有兴趣的读者可以自己翻墙到油管看一下。 下面介绍一下我将如何通过 Python 入门机器学习。 学习Python基本语法 首先我在 Python 官网找到入门教程,快速过了一遍 Python 的基本语法。相信对于稍微有点编程基础的人来说这都不是事儿。 作为实践,接着我用 Python 实现了一个基于命令行翻译脚本。到此 Python 算入门了。 这里啰嗦一下 Mac 下的 Python 环境的搭建过程。我在 这篇文章 中介绍如何处理系统自带和自己安装的 Python 版本。 Python机器学习相关库 Python 有好多涉及机器学习的库,如 Theano 、 TensorFlow 、 PyTorch 、 scikit-learn 等。考虑到 scikit-learn (以后将简写为 sklearn )对机器学习进行了高度封装与抽象,能够让初学者跳出数学的梦魇进行机器学习实践,我选择它作为入门的跳板。 除此之外还需要学习下面几个 Python

如何才能入门机器学习?

守給你的承諾、 提交于 2021-02-17 08:43:52
一个好的学习步骤 好的方法事半功倍,差的方法事倍功半。当然,本质上来说方法没有好坏,只有适合不适合。而我下面所总结的用于入门机器学习的方法也只是我一家之言,或者是很适合我自己的方法,当然也是值得借鉴的。 在知乎隔不了多久就会看到有人提问如何才能入门机器学习。想想自己刚刚开始接触机器学习的时候又何尝不是这样,总觉得自己一直是在门外徘徊,就是不得其中之道。幸运的是经过漫长的时间摸索,也总结出了适合自己的一条路线。接下来就来与大家一同分享。 1 怎么学? 笔者第一次系统的开始学习机器学习所接触到的资料就是吴恩达老师的机器学习视频,入门内容也确实浅显易懂,并且说得也很详细。对于初学者来说,上课内容绝对是慢慢的干活,但是对于笔者自己来说却有点不那么适合。但是当时也没有更好的办法了,只有硬着头皮接着往下看。直到第二次拿着李航老师的统计机器学习课本继续学习时,才总结出了一套适合初学者的学习路线。路线也很简单,总结起来就是一句话: 先抓主干,后抓枝节 。 学习一个算法就好比遍历一棵大树上的所有枝节,算法越是复杂枝叶也就越多,且一般来说有两种方式:深度优先遍历和主干优先遍历(不怎么恰当)。对于有的人来说可能适合第一种:从底部的根开始,每到一个枝干就深入遍历下去,然后再回到主干继续遍历第二个枝干,直到遍历结束;而对于有的人来说可能更适合第二种:从底部的根开始,沿着主干爬到树顶先对大树的整体结构有个概念

如何入门机器学习

試著忘記壹切 提交于 2021-02-17 08:16:14
本篇文章,我将从过来的人角度介绍下机器学习如何从入门到精通,这里我们谈经验,谈工具,更谈方法论。 1.入门 作为初入机器学习的小白,你可能除了一颗好奇的心和一番热血外什么都不没有,当然最好还是希望你能有线性代数、微积分和概率论的基础。你可能会心存顾虑:学过但忘了。不用担心,这种东西不用就会忘,但只要用到,学一学便会;或者说你可能真的没学过,这个也不用担心,只要你真的想学现在也来得及。 好了废话不多说,我们进入入门阶段的正题。入门阶段主要有三个任务: 快速看完周志华的《西瓜书》 ; 看吴恩达 Coursera 上的《机器学习》 ; 调包跑算法 。 看完这个后可能大家会有很多不解或者很多疑惑。不着急,我们一个一个解答。 1.1 快速看完《西瓜书》 问题一:为什么要选《机器学习》? 因为这本书真的很不错,作为入门书籍非常合适。同样有名的《统计学习方法》虽然也很不错,但是其对小白来说相对较难。虽然《西瓜书》上面也有公式,但我们在初学的时候太复杂的完全可以先跳过去,并且书中还配有西瓜的例子,可以很好的帮助同学们理解算法的工作过程。 问题二:为什么要快速看完? 我这里强调快速,是因为快速真的很重要。因为如果战线拉得太长,如果一开始看的太细又读哪儿哪不懂,人是很容易有排斥心理的。最简单的一个例子,你想想你背英语单词的时候,多少次是从“abandon”开始背起的。每次快要期末考试了,或者四六级

IJCAI2020 图相关论文集

◇◆丶佛笑我妖孽 提交于 2021-02-17 07:57:31
↑公众号关注 “Graph-AI” 专注于 图机器学习 IJCAI2020 图相关论文集 “ IJCAI(International Joint Conference on Artificial Intelligence,国际人工智能联合会议),是人工智能领域中最主要的学术会议之一,是CCF A类会议。 “ 本文将该会议与图相关的文章进行了整理,IJCAI接受的论文分为主赛道和特别赛道,都进行了大致的分类:计算机视觉、数据挖掘等。但因为本文是关注图方面的,所以按照图的种类来进行筛选。 “ 全部收录论文地址:http://static.ijcai.org/2020-accepted_papers.html Main track 图卷积网络 MR-GCN: Multi-Relational Graph Convolutional Networks based on Generalized Tensor Product LSGCN: Long Short-Term Traffic Prediction with Graph Convolutional Networks Multi-Class Imbalanced Graph Convolutional Network Learning Multi-View Attribute Graph Convolution Networks for

sklearn svm基本使用

拟墨画扇 提交于 2021-02-17 07:55:48
SVM基本使用     SVM在解决分类问题具有良好的效果,出名的软件包有 libsvm (支持多种核函数), liblinear 。此外python机器学习库scikit-learn也有svm相关算法, sklearn.svm. SVC 和 sklearn.svm.LinearSVC 分别由libsvm和liblinear发展而来。   推荐使用SVM的步骤为: 将原始数据转化为SVM算法软件或包所能识别的数据格式; 将数据标准化;(防止样本中不同特征数值大小相差较大影响分类器性能) 不知使用什么核函数,考虑使用RBF; 利用交叉验证网格搜索寻找最优参数(C, γ);(交叉验证防止过拟合,网格搜索在指定范围内寻找最优参数) 使用最优参数来训练模型; 测试。 下面利用scikit-learn说明上述步骤: 1 import numpy as np 2 from sklearn.svm import SVC 3 from sklearn.preprocessing import StandardScaler 4 from sklearn.model_selection import GridSearchCV, train_test_split 5 6 def load_data(filename) 7 ''' 8 假设这是鸢尾花数据,csv数据格式为: 9 0,5.1,3.5,1.4

机器学习|支持向量机参数求解

孤人 提交于 2021-02-17 06:30:12
01 — 支持向量机 支持向量机的简称为SVM,能在已知样本点很少情况下,获得很好的分类效果。 02 — SVM分类两个点 已知两个样本点,如果用SVM模型,决策边界就是线g,它的斜率为已知两个样本点斜率的垂直方向,并经过两个点的中点。 这条线g就是SVM认为的分类两个样本点的最好边界线。 03 — SVM分类多个点 添加更多的样本点,但是有意识地让它们符合上面的分布,此时的最佳决策边界发生变化了吗?没有。 样本点虽然多了,但是SVM认为起到支持作用的还是那两个点,support vector就是它们,名字得来了,当然因此决策边界也未变。 以上这些都是直接观察出来的,计算机是如何做这个事的? 04 — 启发 03节还启发我们,SVM建立决策边界时,只关心距离决策边界最近的那两个样本点,然后取距离它们都最远的决策边g ,认为g就是最佳决策边界。 05 — 趁热打铁:SVM目标函数 有了以上基础,SVM目标函数的结构差不多就知道了:max ( min() ),SVM添加了一个约束,得到的好处是目标函数更精简了: arg max 1/||w|| s.t., y*f(x)>=1 注意,这个更精简的目标函数,必须满足上面的约束,它们是共生关系,缺一不可。 06 — 最大值转化为求最小值 机器学习中,遇到目标函数求最大值的,都会转化为求最小值,常规套路,SVM也不例外。 它也很简单,分母最小

保姆教程 | YOLOv5在建筑工地中安全帽佩戴检测的应用

孤街浪徒 提交于 2021-02-17 04:31:21
点击上方 “ 机器学习与生成对抗网络 ”,关注"星标" 获取有趣、好玩的前沿干货! 教程来自: https://github.com/PeterH0323/Smart_Construction 编辑:AI深度前沿视线 一、YOLO v5训练自己数据集教程 1.1 创建自己的数据集配置文件 1.2 创建每个图片对应的标签文件 1.3 文件放置规范 1.4 聚类得出先验框(可选) 1.5 选择一个你需要的模型 1.6 开始训练 1.7 看训练之后的结果 二、侦测 三、检测危险区域内是否有人 3.1 危险区域标注方式 3.2 执行侦测 3.3 效果:在危险区域里面的人体会被 红色框 选出来 四、生成 ONNX 五、增加数据集的分类 该项目是使用 YOLOv5 v2.x 来训练在智能工地安全领域中头盔目标检测的应用,先来一波演示! 指标 yolov5s 为基础训练, epoch = 50 分类 P R mAP0.5 总体 0.884 0.899 0.888 人体 0.846 0.893 0.877 头 0.889 0.883 0.871 安全帽 0.917 0.921 0.917 对应的 权重文件 :https://pan.baidu.com/share/init?surl=ELPhtW-Q4G8UqEr4YrV_5A,提取码: b981 yolov5m 为基础训练, epoch =

总结:被MySQL UTF8编码坑的惨痛教训...

旧城冷巷雨未停 提交于 2021-02-17 04:30:30
最近遇到几个项目被MySQL的utf8编码坑,想起之前编码问题被坑的惨痛教训,记录一下,警示自己。 曾几何时,每次建库都选utf8,觉得自己比那些用乱七八糟编码的人不知道酷到哪里去了。直到好多年前的某次课程设计做项目的时候,愉快的建了个用户表: CREATE TABLE `test_user` ( `id` int ( 11 ) unsigned NOT NULL AUTO_INCREMENT, `name` varchar ( 32 ) DEFAULT NULL , PRIMARY KEY ( `id` ) ) ENGINE = InnoDB DEFAULT CHARSET =utf8; 然后愉快的新增用户:INSERT INTO test_user(name) VALUES("我是😁"),接着愉快的反思人生: Incorrect string value : '\xF0\x9F\x98\x81' for column 'name' at row 1 我是谁?我来自哪里?我在干嘛?难道是我代码里面的字符集用错了?不对啊我所有地方都用的utf8啊…… # MySQL 的UTF8编码是什么? 首先来看官方文档: The character set named utf8 uses a maximum of three bytes per character and contains