周志华

机器学习周志华——机器学习重要会议及期刊

╄→尐↘猪︶ㄣ 提交于 2020-03-15 19:10:40
机器学习重要国际会议: 国际机器学习会议(ICML) 国际神经信息处理系统会议(NIPS) 国际学习理论会议(COLT) 机器学习重要区域会议: 欧洲机器学习会议(ECML) 亚洲机器学习会议(ACML) 机器学习重要国际期刊: Journal of Machine Learning Research Machine Learning 人工智能领域重要会议: IJCAI AAAI 人工智能重要期刊: Artificial Intelligence Journal of Artificial Intelligence Research 数据挖掘领域重要会议: KDD、ICDM 数据挖掘重要期刊: ACM Transactions on Knowledge Discovery from Data Data Mining and Knowledge Discovery 计算机视觉与模式识别重要会议: CVPR 计算机视觉与模式识别重要期刊: Neural Computation IEEE Transactions on Neural Networks and Learning Systems. 统计学重要期刊: Annals of Statistics 国内: 国内有两年一次的中国机器学习大会(CCML) 每年举行的机器学习及其应用研讨会(MLA) 很多学术刊物也经常刊登机器学习相关论文

周志华西瓜书3.5python代码

痴心易碎 提交于 2020-02-21 05:53:38
# -*- coding: utf-8 -*- """ Created on Thu Feb 20 15:49:38 2020 @author: 29033 """ #参考代码https://blog.csdn.net/A993852/article/details/80099258 import numpy as np import matplotlib . pyplot as plt import pandas as pd df = pd . read_excel ( 'E:/01machineLearning/周志华/西瓜数据集3a.xlsx' ) X0 = df . iloc [ : 8 , 1 : 3 ] X1 = df . iloc [ 8 : , 1 : 3 ] X0 = X0 . values X1 = X1 . values #求正反例均值 miu0 = np . mean ( X0 , axis = 0 ) . reshape ( ( - 1 , 1 ) ) miu1 = np . mean ( X1 , axis = 0 ) . reshape ( ( - 1 , 1 ) ) #求协方差 cov0 = np . cov ( X0 , rowvar = False ) cov1 = np . cov ( X1 , rowvar = False ) #求出w S

年中回望与感想

天涯浪子 提交于 2020-01-30 09:00:12
2018年在学习的道路上走走停停,停停走走,始终没有坚持下来。非常惭愧。 通过自己发给自己微信小号的聊天记录,大概归纳一下2018年学习了些什么东西 3月 主要看了一些大学的MOOC课程 吉林大学人工智能公开课看到了第9讲左右,后来发现它和中国大学MOOC上北大王敏文的《 人工智能原理 》课程比较相似,于是放弃了吉大公开课,继续看北大版的 网易公开课上的麻省理工学院的Patrick教授的 人工智能 基础课在本月看到了第16集 腾讯课堂上找了一门人工智能(机器学习)实践课看了大概3集左右,最后一集是朴素贝叶斯之垃圾邮件过滤实战 3.26大概是去哪面试了失败了(写着今日铩羽而归),晚上重拾selenium的学习,搞到了27号凌晨1:45 3.29却到新到单位上班了,还用微信记录了从单位到家的公交上下车时间,那前面的铩羽而归又是什么意思? 本月有记录的学习日:16、17、18、20、21、23、26、27 共8天 4月 4月主要在看北大版的人工智能MOOC与MIT的人工智能课 8号晚上刷了很久的抖音 本月可能已经看完MIT的课程了,最后的记录是第18集已看完 本月有记录的学习日:5、7、15、18、30 共5天 5月 5月主要在学的课程是北大版的人工智能原理,另外看了一些《意志力》这本书中的内容 本月有记录的学习日:5、8、13、20、23、25、27、28、(24、29两天在读《意志力

机器学习笔记(周志华西瓜书) 绪论

徘徊边缘 提交于 2020-01-17 06:06:57
基本术语 数据集:由数据组成的集合 示例/样本:对于每条数据记录,关于一个事件或对象的描述 属性/特征:反应事件或者对象在某方面的表现或性质的事项,例如“色泽”“根蒂”“敲声” 属性值:属性上的取值,例如“青绿”“乌黑” 属性空间/样本空间/输入空间:属性张成的空间,例如把“色泽”“根蒂”“敲声”作为三个坐标轴,则它们张成一个用于描述西瓜的三维空间,每个西瓜都可在这个空间中找到自己的坐标位置 特征向量:属性空间中每个点所对应的坐标向量 一般地,令 表示包含m个示例的数据集,每个实例由d个属性描述,则每个实例 是d维样本空间 中的一个向量, ,其中 是 在第j个属性上的取值,d称为样本 的“维数” 学习/训练:从数据中学得模型的过程 训练数据:训练过程中使用的数据,其中每个样本称为一个“训练样本” 训练集:训练样本组成的集合 假设:关于数据的某种潜在的规律的学得模型 真相/真实:潜在规律本身 有时将模型称为“学习器”,可看做学习算法在给定数据和参数空间上的实例化 标记:关于实例结果的信息 样例:拥有了标记信息的实例 一般用 表示第i个样例 来源: CSDN 作者: free迷茫 链接: https://blog.csdn.net/qq_42966160/article/details/103771941

机器学习周志华――学习器性能度量

匿名 (未验证) 提交于 2019-12-02 23:43:01
衡量模型泛化能力的评价标准,就是性能度量(performance measure)。 (1)错误率与精度 (2)查准率、查全率与F1 基于样例真实类别,可将学习器预测类别的组合划分为真正例(true positive)、假正例(false positive)、真反例(true negative)、假反例(false negative), TP 、 FP 、 TN 、 FN 分别表示其对应的样例数,则有 TP+FP+TN+FN =样例总数。 查准率 P 与查全率 R 分别定义为: P = TP /( TP+FP )=>正例结果中真正例数/正例结果总数 R = TP /( TP+FN )=>正例结果中真正例数/结果中所有真正例数 查准率高时,查全率往往偏低,查全率高时,查准率往往偏低(例如选西瓜例子,希望查全率高则应尽可能将所有瓜都选上,但这样查准率必然更低,若希望查准率高则应尽可能挑最有把握的瓜,但这样必然会漏掉一些好瓜,使查全率低)。通常只有在一些简单任务中,才可能使查全率和查准率都很高。 通常按学习器预测结果为正例可能的大小对样例排序,即排在前面的是学习器认变“最可能”是正例的样本,排在最后的则是学习器认为“最不可能”的正例样本。从上到下逐个把样本作为正例进行预测,每次均计算出当前的查全率、查准率,以查准率为纵轴、查全率为横轴作图,得到查准率-查全率曲线P-R曲线,简称P-R图。

机器学习周志华――机器学习的发展

匿名 (未验证) 提交于 2019-12-02 23:43:01
(1 )向机器学习的过渡 20世纪50-70年代,人工智能处于“推理期”,赋予机器逻辑推理能力,代表工作:A.Newell和H.Simon的“逻辑理论家”(Logic Theorist)程序以及此后的“通用问题求解”(General Problem Solving)程序等,A.Newell和H.Simon获图灵奖。 20世纪50-70年代中期开始,在E.A.Feigenbaum等的倡导下,人工智能研究进入了“知识期”,大量专家系统问世。E.A.Feigenbaum等作为“知识工程”之父获图录奖。 知识工程遇到瓶颈(总结知识再教给计算机相当困难)=>设法让机器自己能够学习知识。 (2 )机器学习发展 图灵在1950年图灵测试文章中,提到机器学习的可能性; 20世纪50年代已有机器学习研究,如A.Samuel的跳棋程序; 20世纪50年代中后期,基于神经网络的“连接主义”学习 ,代表作F.Rosenblatt的 感知机 (Perceptron)、B.Widrow的Adaline等。 20世纪60-70年代,基于逻辑表示的“符号主义”学习技术蓬勃发展 ,代表作P.Winston的“结构学习系统”、R.S.Michalski等的“基于逻辑的归纳学习系统”、E.B.Hunt等人的“概念学习系统”等; 以决策理论为基础的学习技术以及强化学习技术等也得到发展,代表作N.JNison的“学习机器

周志华机器学习笔记(一)

匿名 (未验证) 提交于 2019-12-02 23:36:01
机器学习笔记(一)绪论 什么是机器学习呢? 假设 P:计算机程序在某任务类T上的性能 T:计算机程序希望实现的任务类 E:表示经验,即历史的数据集 若该计算机程序通过利用经验E在任务T上获得了性能P的改善,则该程序对E进行了学习。 即机器学习是致力于研究如何通过计算手段,利用经验来改善系统自身性能的学科,研究的主要内容是关于在计算机上从数据中产生“模型”的算法,即学习算法。 机器学习中的基本术语 数据集:所有 数据的集合。 每条记录是关于一个事件或对象的描述,称为一个“示例”或“样本”。 反映事件或对象在某方面的表现或性质的事项,称为“属性”或“特征”。 属性上的取值称为“属性值”。 属性张成的空间称为“属性空间”、“样本空间”、或“输入空间”。 对于每一条记录,如果在坐标轴上表示,都可以用坐标中的一个点表示,空间中的每个点对应一个坐标向量,因此也将一个示例(样本)称为一个特征向量。 一个样本的特征数为“维数”。 在计算机程序学习经验数据生成算法模型的过程中,每一条记录称为一个“训练样本”同时在训练好模型后,用来测试模型效果的新的样本称为“测试样本”。 所有训练样本的集合称为训练集**【特殊】** 所有测试样本的集合称为测试集**【一般】** 机器学习出来的模型适用于新样本的能力为:泛化能力,即从特殊到一般。 若所要预测的是离散值,此类学习任务是“分类”, 若所要预测的是连续值