1.CTR
CTR预估是对每次广告的点击情况做出预测,预测用户是点击还是不点击。
CTR预估和很多因素相关,比如历史点击率、广告位置、时间、用户等。
CTR预估模型就是综合考虑各种因素、特征,在大量历史数据上训练得到的模型。
CTR预估的训练样本一般从历史log、离线特征库获得。
样本标签相对容易,用户点击标记为1,没有点击标记为0。特征则会考虑很多,例如用户的人口学特征、广告自身特征、广告展示特征等。这些特征中会用到很多类别特征,例如用户所属职业、广告展示的IP地址等。一般对于类别特征会采样One-Hot编码,例如职业有三种:学生、白领、工人,那么会会用一个长度为3的向量分别表示他们:[1, 0, 0]、[0, 1, 0]、[0, 0, 1],可是这样会使得特征维度扩展很大,同时特征会非常稀疏。
https://www.cnblogs.com/xianbin7/p/10661572.html
3.FM