上一篇文章我们说了KS曲线和ROC曲线的理论知识,这篇文章我们来实际操作一下。
import pandas as pd
from sklearn.metrics import roc_curve
import matplotlib.pyplot as plt
### 构造数据
data = [[1,1,0,1,0,0],[0.9,0.8,0.5,0.6,0.2,0.6]]
### 转化喂dataframe,其实这步是多余的。
df = pd.DataFrame(columns =['type','prob'])
### 数据标签
df['type'] = data[0]
### 数据标签为1的概率
df['prob'] = data[1]
### 使用roc_curve函数获取fpr,tpr和threshold列
fpr, tpr, thresh = roc_curve(df.type, df.prob)
### 画tpr曲线
plt.plot(tpr, label='TPR')
### 画fpr曲线
plt.plot(fpr, label='FPR')
### 画ks曲线
plt.plot(tpr-fpr, label='KS')
plt.xlabel('thresholds')
plt.legend()
plt.show()
### 画roc曲线
plt.plot(fpr,tpr)
plt.xlabel('FPR')
plt.ylabel('TPR')
来源:CSDN
作者:会飞的猩猩。
链接:https://blog.csdn.net/zx1245773445/article/details/103694258