1. 概述
广告CTR预估过程中,正负样本比例差距较大,需要采样,但是采用后模型训练的结果是有偏的。
2. 校准方式
用逻辑回归作为激活函数
其中是未进行负采样时正样本的比例,是进行负采样后的正样本的比例。
3. 参考博客
https://zhuanlan.zhihu.com/p/35580375
http://vividfree.github.io/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0/2015/12/15/model-calibration-for-logistic-regression-in-rare-events-data