测测你的数学直觉

依然范特西╮ 提交于 2020-11-25 19:08:11

已知:

新冠测试的准确率:

新冠患者被测出positive的概率是0.9

非新冠患者被测试出negative的概率是0.9

整个人群的新冠患者比例是0.1


如果一个人被测试出positive,那他是新冠的概率更接近以下哪个:

0.4

0.5

0.6

0.7

0.8

0.9

1


如果不知道如何下手,可以参考贝叶斯定理。

来一起算一算:



是不是有点surprise。对于发病率较低的疾病,比如说0.01,一样的准确度,测试出是阳性的结果,实际上是阳性的概率只有0.083.


Plot一个图给大家看看。x轴为发病率,y轴为测试出阳性的人的得病概率。

为什么会有这种直觉误差呢。这就是统计学上最经典的样本分布不均匀的问题。如果实际发病率达到了0.5(样本分布均匀),那么:

P(TestPositive/Positive)=P(Positive/TestPositive)=0.9

那直觉就对了。


还记得模型评分里提到的那个例子吗?对于疾病的预测,如果预测全部false,准确率可以达到(1-发病率), 也就是发病率为0.01的疾病,模型什么都不做,就可以达到准确度99%。


另外提醒,瑞典的参与新冠测试的人,基本上都症状差不多match了,所以测试出是positive,就基本上是positive了。而本文的例子是大街上随便抓一个去测试的案例。


本文分享自微信公众号 - 一起learn大数据和机器学习(hundendagis)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!