判断一个商品的是否进行推荐需要根据CTR预估的点击率来进行。
在进行CTR预估时,除了单特征外,往往要对特征进行组合。对于特征组合来说,通用的做法主要有两大类:FM系列与Tree系列。
今天,我们就来讲讲FM算法。FM(Factorization Machine)主要是为了解决数据稀疏的情况下,特征怎样组合的问题。
country,day,ad_type则是对应的特征。对于这种categorical特征,一般都是进行one-hot编码处理。one-hot编码带来的另一个问题是特征空间变大