python机器学习

机器学习实战笔记-1-机器学习基础

Deadly 提交于 2020-01-04 09:08:22
# 机器学习基础 监督学习简介 监督学习的两个任务: 分类 和 回归分析 (预测数值型数据)。 分类思路 分类方法思路: 这个表至关重要,叫做特征向量表 特征1 特征2 … 目的变量(类别) 实例1 … … … … 实例2 … … … … … … … … … 如上表,分类思路如下: 找到输入采样集中的特征(属性)-用你的大脑 给各特征一个值,并确定该值的类型(十进制,二值型,枚举型) 根据特征值进行分类: 算法训练(如何分类): 用大量的已分类数据(其目标变量的值已给出)组成的训练集进行训练,该训练集由若干个训练样本构成,每个训练样本是一个实例 测试样本(不提供目标变量) 比较目标变量的预测值和实际样本的目标变量值,计算得到算法的精确度。 监督学习的另一个任务是回归分析。 无监督学习简介 无目标变量(无类别信息),其主要任务有: 聚类:将数据集合分成由类似的对象组成的多个类的过程; 密度估计:寻找描述数据统计值的过程 减少数据特征的维度,方便用2/3维图形直观展示数据信息 机器学习算法的主要用途总结 监督学习的用途 k-近邻算法 朴素贝叶斯算法 支持向量机 决策树 线性回归 局部加权线性回归 Ridge回归 Lasso最小回归系数估计 其中深橙色表示分类算法,浅蓝色表示回归分析算法。 无监督学习的用途 k-均值 最大期望算法 DBSCAN Parzen窗设计

学习笔记之机器学习实战 (Machine Learning in Action)

空扰寡人 提交于 2020-01-04 09:08:00
机器学习实战 (豆瓣) https://book.douban.com/subject/24703171/ 机器学习是人工智能研究领域中一个极其重要的研究方向,在现今的大数据时代背景下,捕获数据并从中萃取有价值的信息或模式,成为各行业求生存、谋发展的决定性手段,这使得这一过去为分析师和数学家所专属的研究领域越来越为人们所瞩目。 本书第一部分主要介绍机器学习基础,以及如何利用算法进行分类,并逐步介绍了多种经典的监督学习算法,如k近邻算法、朴素贝叶斯算法、Logistic回归算法、支持向量机、AdaBoost集成方法、基于树的回归算法和分类回归树(CART)算法等。第三部分则重点介绍无监督学习及其一些主要算法:k均值聚类算法、Apriori算法、FP-Growth算法。第四部分介绍了机器学习算法的一些附属工具。 全书通过精心编排的实例,切入日常工作任务,摒弃学术化语言,利用高效的可复用Python代码来阐释如何处理统计数据,进行数据分析及可视化。通过各种实例,读者可从中学会机器学习的核心算法,并能将其运用于一些策略性任务中,如分类、预测、推荐。另外,还可用它们来实现一些更高级的功能,如汇总和简化等。 Machine Learning in Action https://www.safaribooksonline.com/library/view/machine-learning-in

跟着彭亮一起学人工智能之深度学习--零基础学人工智能

*爱你&永不变心* 提交于 2020-01-04 08:46:47
写在前面:   最近,跟着彭亮在麦子学院学习人工智能相关的课程,课程讲的很好,所以打算一边学,一边记。这个系列就当是一个学习笔记。希望可以帮助到更多的人。   注明:此系列课程适用人员为有一定编程基础,最好有Python的编程基础的从业人员,或相关行业的从业人员,另外所有的人工智能相关的课程,无论是深度学习,还是机器学习。或多或少的都需要一定的数学基础。关于数学,我的看法是,有最好,没有问题也不大。除非你要做底层的基础理论研究。   另外这个课程,在记笔记的过程中,我可能会发表一些自己的想法和建议。或许不够专业。希望各位谅解!有想法的同学可以一起学习,一起讨论! 下面就正式开始彭亮人工智能之机器学习理论基础的第一课:   第一课主要的内容是对机器学习相关的概念,术语,以及应用场景的一个简单介绍。这里需要特别说明的一点是人工智能(AI),机器学习(ML),深度学习(deep Learning)这三者之间的关系。   首先人工智能是一个大的范畴,是一个很宽泛的定义。这个是百度百科给出的一个定义: https://baike.baidu.com/item/%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD/9180?fr=aladdin   而机器学习,是隶属于人工智能的子集,我的理解就是通过机器学习的方式来实现人工智能的目的。当然通往罗马的路肯定不是一条。  

机器学习:Python实现聚类算法(三)之总结

核能气质少年 提交于 2020-01-02 18:21:57
考虑到学习知识的顺序及效率问题,所以后续的几种聚类方法不再详细讲解原理,也不再写python实现的源代码,只介绍下算法的基本思路,使大家对每种算法有个直观的印象,从而可以更好的理解函数中参数的意义及作用,而重点是放在如何使用及使用的场景。 (题外话: 今天看到一篇博文: 刚接触机器学习这一个月我都做了什么? 里面对机器学习阶段的划分很不错,就目前而言我们只要做到前两阶段即可) 因为前两篇博客已经介绍了两种算法,所以这里的算法编号从3开始。 3.Mean-shift 1)概述 Mean-shift(即:均值迁移)的基本思想:在数据集中选定一个点,然后以这个点为圆心,r为半径,画一个圆(二维下是圆),求出这个点到所有点的向量的平均值,而圆心与向量均值的和为新的圆心,然后迭代此过程,直到满足一点的条件结束。(Fukunage在1975年提出) 后来Yizong Cheng 在此基础上加入了 核函数 和 权重系数 ,使得Mean-shift 算法开始流行起来。目前它在聚类、图像平滑、分割、跟踪等方面有着广泛的应用。 2)图解过程 为了方便大家理解,借用下几张图来说明Mean-shift的基本过程。 由上图可以很容易看到,Mean-shift 算法的核心思想就是不断的寻找新的圆心坐标,直到密度最大的区域。 3)Mean-shift 算法函数 a)核心函数:sklearn.cluster

从零开始的人工智能和机器学习,该从哪里入手呢?

五迷三道 提交于 2019-12-30 10:13:00
全文共 4039 字,预计学习时长 12 分钟 图源:Unsplash 问:零基础,如何让人工智能和机器学习更简单,更容易上手呢? 秘诀就是找一家咖啡厅,要有美味的咖啡和充足的自然光。这样学习就变得简单啦。 小芯的朋友曾在Apple Store工作,但他想换一种生活,于是开始学习自己平时提供服务的这项技术——机器学习和人工智能。 但初学者有太多事情要做了,太多太多。 每周,Google或Facebook似乎都会推出一种新的人工智能服务以更好地提升用户体验。 他这里就不再说无人驾驶汽车了。它固然很好,不过他不喜欢开车,另一个觉得在路上也不安全。 尽管人工智能行业已经发展得热火朝天,但目前人们对于它的定义仍没有达成一致。 有人认为可以将深度学习视为人工智能,也有人认为,除非它通过图灵测试,否则就不能算是人工智能。 这在一开始就阻碍了他的学习,因为要学会有多种不同定义的东西真的很难。 真是受够了这么多定义。 如何入手? 图源:Unsplash 小芯的朋友准备一起创建一家网络公司,不过后来因怀疑其意义而中途放弃了。但在此过程中,他开始听到越来越多有关机器学习和人工智能的消息。 “电脑在为你学习?”真不敢相信。 偶然得知了Udacity的深度学习微学位。一个名叫Siraj Raval的角色出现在宣传视频中,这个人物形象十分有趣,宣传也极富有感染力。因此,尽管没有达到基本要求

我的书单(2019)

隐身守侯 提交于 2019-12-30 05:12:22
分类 书名 概要 读后感 推荐指数 效率 极简思考 提出 结构化思维 概念,帮助提高方案通过率。 对于设计方案具有一定的参考价值,可以借鉴。 *** 深度思考 微服务 微服务设计 从微服务的各个角度阐述如何设计微服务。 微服务理论教材,入手微服务入门。 *** 生产微服务 从生产的角度讲述如何构建一个标准化的微服务体系。 讲述了微服务的一套标准化,企业应用微服务借鉴。 ***** 机器学习 工程数学线性代数 线性代数基础教材 机器学习基础的一部分。 *** 概率论与数理统计 概率、统计相关知识的基础教材 机器学习基础的一部分,与机器学习贴合较为紧密。 **** 机器学习-周志华 机器学习理论教材,介绍了各种模型和算法。 比较好的机器学习入门教材。 ***** 统计学习方法-李航 机器学习理论教材,介绍了各种模型和算法。 与【机器学习-周志华】讲述内容差不多,没有周讲的全面。 *** Python机器学习 机器学习实战 Python自然语言处理实战:核心技术与算法 知识图谱完整项目实战 知识图谱实战案例完全剖析 知识图谱导论 《知识图谱》 神经网络与深度学习 业务  全面实施预算绩效管理专业基础 来源: https://www.cnblogs.com/havery/p/10894587.html

人工智能和机器学习的前世今生

折月煮酒 提交于 2019-12-30 03:27:02
https://www.jianshu.com/p/8506cd0dd90f 摘要: 阅读本文以了解更多关于人工智能、机器学习和深度学习方面的知识,以及它们对商业化意味着什么。 如果正确的利用模式识别进行商业预测和决策,那么会为企业带来巨大的利益。机器学习(ML)研究这些模式,并将人类决策过程编码成算法。这些算法可以被应用到几个实例以得出有意义的结论。在这篇文章中,我们将了解一些机器学习的基础、工作原理及特点。 举例来了解机器学习 经研究预测,截至到2020年,企业采用机器学习、人工智能和深度学习、物联网(IOT)以及大数据将从他们那些不太知情的同行那里带走超过1兆2000亿美元。 数据是机器学习的关键。算法从一定数量的数据中学习,然后应用这种学习来做出明智的决策。Netflix有一个很好的关于下一个你想看的节目的想法,Facebook可以在照片中识别你和你的朋友,这要感谢机器学习.。 机器学习是关于自动执行任务的,它的应用跨越了广泛的行业领域。数据安全公司可以使用机器学习来追踪恶意软件,而金融公司可以使用它来增强其盈利能力这里有个例子,让我们考虑一个手电筒,无论什么时候,当“黑暗”一词出现在一个短语中的时候,它就会被程序打开。我们将使用的几个短语作为关于手电筒的机器学习算法的输入数据。 用程序语言来表达机器学习 为了解决业务的复杂性,并带来机器学习的技术创新

无监督机器学习 K-Means算法python测试

微笑、不失礼 提交于 2019-12-28 18:54:34
无监督机器学习 K-Means算法python测试 最近在自学吴恩达老师的机器学习视频,学到无监督机器学习K-means算法,自己用python写一些代码加深对此算法的理解 最近在自学吴恩达老师的机器学习视频,学到无监督机器学习K-means算法,自己用python写一些代码加深对此算法的理解 import numpy as np import matplotlib . pyplot as plt #生成随机的的点坐标 array = np . random . randn ( 2 , 100 ) x = array [ 0 ] y = array [ 1 ] #初始化3个聚类质点 3类 x0 = np . random . randn ( ) y0 = np . random . randn ( ) x1 = np . random . randn ( ) y1 = np . random . randn ( ) x2 = np . random . randn ( ) y2 = np . random . randn ( ) while True : #用于存放每次标记后的点坐标 class0x = [ ] class0y = [ ] class1x = [ ] class1y = [ ] class2x = [ ] class2y = [ ] #用于记录3个聚类质点的数据

C#开源跨平台机器学习框架ML.NET----介绍与环境搭建

泄露秘密 提交于 2019-12-28 06:36:55
ML.NET教程和API: https://docs.microsoft.com/zh-cn/dotnet/machine-learning/ 现在学习机器学习这块时,基本上都是要先学习Python,还要自己去学习更多的样本数据教程,这样对于使用C#学习机器学习的基础并不容易,于是微软推出了ML.NET的开源跨平台机器学习框架。 什么是ML.NET? ML.NET 使你能够在联机或脱机场景中将机器学习添加到 .NET 应用程序中。借助此功能,可以使用应用程序的可用数据进行自动预测,而无需连接到网络。 通过ML.NET进行的预测类型的包括: 分类/类别划分 自动将客户反馈划分为正面和负面类别 回归/预测连续值 根据大小和位置预测房屋价格 异常情况检测 检测欺诈性银行交易 建议 根据在线购物者之前的购买情况向其建议可能想要购买的产品 ML.NET的代码工作流 以下关系图表示应用程序代码结构,以及模型开发的迭代过程: 将训练数据收集并加载到 IDataView 对象中 指定操作的管道,以提取特征并应用机器学习算法 通过在管道上调用 Fit() 来训练模型 评估模型并通过迭代进行改进 将模型保存为二进制格式,以便在应用程序中使用 将模型加载回 ITransformer 对象 通过调用 CreatePredictionEngine.Predict() 进行预测 机器学习模型 ML.NET

入门人工智能

情到浓时终转凉″ 提交于 2019-12-27 20:53:14
【推荐】2019 Java 开发者跳槽指南.pdf(吐血整理) >>> 一、引言 1、什么是人工智能? 如果你是一个新技术的爱好者或者从事工科学习的学生,你一定听说过人工智能(AI),对于什么是人工智能,百度是这样子给出的定义: 人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。 人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能从诞生以来,理论和技术日益成熟,应用领域也不断扩大,可以设想,未来人工智能带来的科技产品,将会是人类智慧的“容器”。人工智能可以对人的意识、思维的信息过程的模拟。人工智能不是人的智能,但能像人那样思考、也可能超过人的智能。 人工智能是一门极富挑战性的科学,从事这项工作的人必须懂得计算机知识,心理学和哲学。人工智能是包括十分广泛的科学,它由不同的领域组成,如机器学习,计算机视觉等等,总的说来,人工智能研究的一个主要目标是使机器能够胜任一些通常需要人类智能才能完成的复杂工作。但不同的时代、不同的人对这种“复杂工作”的理解是不同的。 2017年12月,人工智能入选“2017年度中国媒体十大流行语”。 ---