已知:
新冠测试的准确率:
新冠患者被测出positive的概率是0.9
非新冠患者被测试出negative的概率是0.9
整个人群的新冠患者比例是0.1
如果一个人被测试出positive,那他是新冠的概率更接近以下哪个:
0.4
0.5
0.6
0.7
0.8
0.9
1
如果不知道如何下手,可以参考贝叶斯定理。
来一起算一算:
是不是有点surprise。对于发病率较低的疾病,比如说0.01,一样的准确度,测试出是阳性的结果,实际上是阳性的概率只有0.083.
Plot一个图给大家看看。x轴为发病率,y轴为测试出阳性的人的得病概率。
为什么会有这种直觉误差呢。这就是统计学上最经典的样本分布不均匀的问题。如果实际发病率达到了0.5(样本分布均匀),那么:
P(TestPositive/Positive)=P(Positive/TestPositive)=0.9
那直觉就对了。
还记得模型评分里提到的那个例子吗?对于疾病的预测,如果预测全部false,准确率可以达到(1-发病率), 也就是发病率为0.01的疾病,模型什么都不做,就可以达到准确度99%。
另外提醒,瑞典的参与新冠测试的人,基本上都症状差不多match了,所以测试出是positive,就基本上是positive了。而本文的例子是大街上随便抓一个去测试的案例。
本文分享自微信公众号 - 一起learn大数据和机器学习(hundendagis)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。
来源:oschina
链接:https://my.oschina.net/u/4631447/blog/4552636