TPR

机器学习中的AUC-ROC曲线

走远了吗. 提交于 2020-08-07 08:28:12
作者|ANIRUDDHA BHANDARI 编译|VK 来源|Analytics Vidhya AUC-ROC曲线 你已经建立了你的机器学习模型-那么接下来呢?你需要对它进行评估,并验证它有多好(或有多坏),这样你就可以决定是否实现它。这时就可以引入AUC-ROC曲线了。 这个名字可能有点夸张,但它只是说我们正在计算“Receiver Characteristic Operator”(ROC)的“Area Under the Curve”(AUC)。 别担心,我们会详细了解这些术语的含义,一切都将是小菜一碟! 现在,只需知道AUC-ROC曲线可以帮助我们可视化机器学习分类器的性能。虽然它只适用于二值分类问题,但我们将在最后看到如何扩展它来评估多类分类问题。 我们还将讨论敏感性(sensitivity )和特异性(specificity )等主题,因为这些是AUC-ROC曲线背后的关键主题。 目录 什么是敏感性和特异性? 预测概率 AUC-ROC曲线是什么? AUC-ROC曲线是如何工作的? Python中的AUC-ROC 用于多类分类的AUC-ROC 什么是敏感性和特异性? 混淆矩阵: 从混淆矩阵中,我们可以得到一些在前面的文章中没有讨论过的重要度量。让我们在这里谈谈他们。 敏感度/真正例率/召回率 敏感度告诉我们什么比例的正例得到了正确的分类。

机器学习理解概念系列——ROC曲线

一曲冷凌霜 提交于 2020-08-04 10:04:06
案例描述: 在一个传染病数据集中,有80000个标签为不是传染病的记为负例(negtive),150个标签为是传染病的记为正例(positive),实际上我们的目标就是第一,在测试集测试的时候让这些正样本能够尽可能多得预测出来(TP)。第二,我们不希望模型把一个正常样本预测为有传染病(FP)(那不得把人吓死)。在目标第一点第二点中都提到了正例,说明影响模型可靠性的也是这些正例,我们的关注点也正是这些正例。而ROC曲线正好能够反应出来,尤其是在样本不均衡时。 1.ROC曲线相关知识 横轴 :负正类率(false postive rate FPR)特异度,划分实例中所有负例占所有负例的比例;(1-Specificity) 纵轴 :真正类率(true postive rate TPR)灵敏度,Sensitivity(正类覆盖率) 在一个二分类问题中,将实例分成正类(postive)或者负类(negative)。但是实际中分类时,会出现四种情况. (1)若一个实例是正类并且被预测为正类,即为真正类(True Postive TP) (2)若一个实例是正类,但是被预测成为负类,即为假负类(False Negative FN) (3)若一个实例是负类,但是被预测成为正类,即为假正类(False Postive FP) (4)若一个实例是负类并且被预测成为负类,即为真负类(True

机器学习中的AUC-ROC曲线

懵懂的女人 提交于 2020-07-28 20:59:57
作者|ANIRUDDHA BHANDARI 编译|VK 来源|Analytics Vidhya AUC-ROC曲线 你已经建立了你的机器学习模型-那么接下来呢?你需要对它进行评估,并验证它有多好(或有多坏),这样你就可以决定是否实现它。这时就可以引入AUC-ROC曲线了。 这个名字可能有点夸张,但它只是说我们正在计算“Receiver Characteristic Operator”(ROC)的“Area Under the Curve”(AUC)。 别担心,我们会详细了解这些术语的含义,一切都将是小菜一碟! 现在,只需知道AUC-ROC曲线可以帮助我们可视化机器学习分类器的性能。虽然它只适用于二值分类问题,但我们将在最后看到如何扩展它来评估多类分类问题。 我们还将讨论敏感性(sensitivity )和特异性(specificity )等主题,因为这些是AUC-ROC曲线背后的关键主题。 目录 什么是敏感性和特异性? 预测概率 AUC-ROC曲线是什么? AUC-ROC曲线是如何工作的? Python中的AUC-ROC 用于多类分类的AUC-ROC 什么是敏感性和特异性? 混淆矩阵: 从混淆矩阵中,我们可以得到一些在前面的文章中没有讨论过的重要度量。让我们在这里谈谈他们。 敏感度/真正例率/召回率 敏感度告诉我们什么比例的正例得到了正确的分类。

AUC

牧云@^-^@ 提交于 2020-07-26 15:29:13
AUC: Area Under Curve, 默认为ROC( receiver operating characteristic curve ) Curve, 也可以指定PR(Precision Recall) curve。 由于ROC曲线的X轴为False Positive Rate,Y轴为True Positive Rate,AUC是可以指 随机给定一个正样本和一个负样本,分类器输出该正样本为正的 比 输出该负样本为正 要大的概率 ,即 AUC = P(P_tpr > P_fpr). AUC的计算方法: 在有M个正样本,N个负样本的数据集里。一共可构成 M N 个样本对(一对样本即,一个正样本与一个负样本)。统计这M N对样本里,正样本的预测概率大于负样本的预测概率的个数。 A U C = ∑ i ∈ positiveclass rank ⁡ i − M ( 1 + M ) 2 M × N A U C=\frac{\sum_{i \in \text { positiveclass }} \operatorname{rank}_{i}-\frac{M(1+M)}{2}}{M \times N} A U C = M × N ∑ i ∈ positiveclass ​ r a n k i ​ − 2 M ( 1 + M ) ​ ​ def AUC ( label , pre ) :

的软肋使不少实体书店难

三世轮回 提交于 2020-05-03 19:22:39
sdfsdf 服务网格作为一个改善服务到服务通信的专用基础设施层,是云原生范畴中最热门的话题。随着容器愈加流行,服务拓扑也频繁变动,这就需要更好的网络性能。服务网格能够通过服务发现、路由、负载均衡、心跳检测和支持可观测性,帮助我们管理网络流量。服务网格试图为无规则的复杂的容器问题提供规范化的解决方案 将供应链搬出中国,似乎成了过去两三个月新冠肺炎疫情衍生出的热门话题。 年初新冠肺炎疫情爆发,让中国供应链的生产活动几乎完全停顿,影响席卷全球:苹果的新 5G 有可能因疫情而延期推出,特斯拉新款芯片无法及时交付、陷入“芯片门”纠纷。其余像三星、小米、索尼等著名跨国企业,均受到供应链停摆的影响。 因此,qdaqanz.answers.yahoo.com/question/index?qid=20200427235710AAGf1t1?RP5=51pzd=99p answers.yahoo.com/question/index?qid=20200427235730AAYucIS?PZ3=97ptr=39l in.answers.yahoo.com/question/index?qid=20200427235730AAYucIS?HT9=19tjd=55t malaysia.answers.yahoo.com/question/index?qid=20200427235730AAYucIS

东篱古意偶客秣陵得墨菊

拟墨画扇 提交于 2020-05-03 15:35:25
sdfsdf 服务网格作为一个改善服务到服务通信的专用基础设施层,是云原生范畴中最热门的话题。随着容器愈加流行,服务拓扑也频繁变动,这就需要更好的网络性能。服务网格能够通过服务发现、路由、负载均衡、心跳检测和支持可观测性,帮助我们管理网络流量。服务网格试图为无规则的复杂的容器问题提供规范化的解决方案 将供应链搬出中国,似乎成了过去两三个月新冠肺炎疫情衍生出的热门话题。 年初新冠肺炎疫情爆发,让中国供应链的生产活动几乎完全停顿,影响席卷全球:苹果的新 5G 有可能因疫情而延期推出,特斯拉新款芯片无法及时交付、陷入“芯片门”纠纷。其余像三星、小米、索尼等著名跨国企业,均受到供应链停摆的影响。 因此,asqcxhk.answers.yahoo.com/question/index?qid=20200426194047AArwX5O?LZ5=91fnd=57b answers.yahoo.com/question/index?qid=20200426194047AArwX5O?PP1=95xdv=53l nz.answers.yahoo.com/question/index?qid=20200426194047AArwX5O?ZV5=55bzd=37p in.answers.yahoo.com/question/index?qid=20200426194106AAp8cLJ?FH5

是能引起内心的共鸣哪怕

丶灬走出姿态 提交于 2020-05-03 15:11:10
sdfsdf 服务网格作为一个改善服务到服务通信的专用基础设施层,是云原生范畴中最热门的话题。随着容器愈加流行,服务拓扑也频繁变动,这就需要更好的网络性能。服务网格能够通过服务发现、路由、负载均衡、心跳检测和支持可观测性,帮助我们管理网络流量。服务网格试图为无规则的复杂的容器问题提供规范化的解决方案 将供应链搬出中国,似乎成了过去两三个月新冠肺炎疫情衍生出的热门话题。 年初新冠肺炎疫情爆发,让中国供应链的生产活动几乎完全停顿,影响席卷全球:苹果的新 5G 有可能因疫情而延期推出,特斯拉新款芯片无法及时交付、陷入“芯片门”纠纷。其余像三星、小米、索尼等著名跨国企业,均受到供应链停摆的影响。 因此,ravopnz.answers.yahoo.com/question/index?qid=20200426195737AAw3p83?PX7=53zrx=19d in.answers.yahoo.com/question/index?qid=20200426195804AA8LDLt?NP1=35rfh=17z malaysia.answers.yahoo.com/question/index?qid=20200426195804AA8LDLt?XF7=73xzr=39h sg.answers.yahoo.com/question/index?qid

统计学中相关性与机器学习中的评价指标

≯℡__Kan透↙ 提交于 2020-05-02 11:00:03
统计学习中的相关性 皮尔逊相关系数( Pearson correlation coefficient): 度量两个变量X和Y之间的 相关(线性相关) 斯皮尔曼相关性系数(spearman correlation coefficient): 先将样本转化为 等级变量 ,如90分为等级1,然后使用上面相关系数公式对等级进行相关性计算。 肯德尔和谐系数(kendall correlation coefficient): 表示 多列等级变量 相关程度的一种方法,检测多个评价者对一群候选者的 评价标准是否一致 。 其中k表示评价者数量,n表示被评价者数量。Ri表示第i个被评价者的总等级。 其中mi表示第i个评价者的结果中有多少种是重复等级,t_ij表示第i个评价者的第j个重复等级的数量。 马修斯相关系数(Matthews correlation coefficient): 机器学习中,用以测量二分类的分类性能的指标。该指标考虑了真阳性、真阴性和假阳性和假阴性,通常认为该指标是一个比较均衡的指标,即使是在两类别的样本含量差别很大时,也可以应用它。MCC本质上是一个描述实际分类与预测分类之间的相关系数,它的取值范围为[-1,1],取值为1时表示对受试对象的完美预测,取值为0时表示预测的结果还不如随机预测的结果,-1是指预测分类和实际分类完全不一致。 机器学习中的评价指标 回归评估: MAE

你不得不了解的人工智能基础知识

心不动则不痛 提交于 2020-05-02 08:03:11
你不得不了解的人工智能基础知识 1.什么是人工智能? 首先我们利用传统的软件和人工智能进行比较,就容易使大家更容易理解。 (1) 传统软件 VS 人工智能 传统软件是[基于规则]的,需要人为的设定条件,并且告诉计算机符合这个条件后该做什么。 人工智能则是机器从[特定]大量数据中总结规律,归纳出某些[特定知识],然后将这种知识应用到特定的场景中去解决实际问题。 然而,当前的人工智能知其然,但不知所以然。 也正是因为归纳逻辑,所以需要依赖大量的数据。数据越多,归纳出来的经验越具有普适性。 而我们在探寻AI的边界时,我们可以简单粗暴的把AI分成3个级别: 2.图灵测试 图灵测试的提出是因为图灵在思考一个问题: 机器能否思考? 并且图像相信是可以制作出会思考的机器,于是就在想第二个问题: 如何判断机器能否思考? 于是就有了图灵测试。 那么什么是图灵测试呢? 让一个人坐在电脑前,跟另一边用键盘进行对话,如果这个人分不清跟自己对话的是一个人还是一个机器,那么这个对话机器就通过了图灵测试并具备人工智能。 3.什么是算法? 算法简单来说,就是 解决问题的手段,并且是批量化解决问题的手段。 比如你想要木头桌子,那么制造桌子的工厂就是“一套算法”。提供(输入)木头,就会得到(输出)桌子。 关于算法,有3点需要注意: 1.没有某种算法是万能的。 2.算法没有高级和低级之分。 3

Linux查看CPU和内存情况

断了今生、忘了曾经 提交于 2020-05-01 04:41:32
  本文简单介绍在Linux上查看CPU和内存情况和一款系统资源查看工具htop。 查看CPU情况   以下是个人工作会经常使用到的服务器的信息。 查看所有CPU信息   可以通过如下命令查看所有CPU信息: # cat /proc/cpuinfo [starnight@344eeb24-3fac-11e9-b49d-0014101d20c6 ~]$ cat /proc/cpuinfo processor : 0 vendor_id : GenuineIntel cpu family : 6 model : 94 model name : Intel(R) Core(TM) i7-6700 CPU @ 3.40GHz stepping : 3 microcode : 0x7c cpu MHz : 3699.890 cache size : 8192 KB physical id : 0 siblings : 8 core id : 0 cpu cores : 4 apicid : 0 initial apicid : 0 fpu : yes fpu_exception : yes cpuid level : 22 wp : yes flags : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat