Hulu视频如何提升推荐多样性?

▼魔方 西西 提交于 2019-11-28 22:54:04

640?wx_fmt=png

作者 | 余沾

整理 | 深度传送门(ID: deep_deliver)

导读:本文主要介绍Hulu在NIPS 2018上发表的《Fast Greedy MAP Inference for Determinantal Point Process to Improve Recommendation Diversity》中,提出的DPP算法解决视频推荐中的多样性问题。

640?wx_fmt=png

引言

随着机器学习技术日益成熟,机器学习的应用领域也越来越广。其中,推荐领域是机器学习一个比较常见且成功的应用场景。推荐多样性和相关性是衡量推荐算法常用的标准,最近项目团队针对搜索多样性做了大量的研究工作。Hulu陈拉明的推荐算法研究团队在NIPS 2018会议上提出的基于DPP的推荐多样性算法,能较好地提高推荐的多样性和相关性,并且执行效率也十分可观。我们团队也复现了该算法,具有不错的上线效果。

DPP 的构造

行列式点过程(Determinantal Point Process, DPP)是一种性能较高的概率模型。DPP将复杂的概率计算转换成简单的行列式计算,并通过核矩阵的行列式计算每一个子集的概率。DPP不仅减少了计算量,而且提高了运行效率,在图片分割、文本摘要和商品推荐系统中均具有较成功的应用。

DPP通过最大后验概率估计,找到商品集中相关性和多样性最大的子集,从而作为推荐给用户的商品集。

行列式点过程 P 刻画的是一个离散集合 640?wx_fmt=png 每一个子集出现的概率当 P 给定空集合出现的概率时,存在一个由集合 Z 的元素构成的半正定矩阵640?wx_fmt=png,对于每一个集合 Z 的子集 Y,使得子集 Y 出现的概率640?wx_fmt=png ,其中,L表示由行和列的下标属于 Y 构成的矩阵 L 的子矩阵。

为了更好地理解行列式点过程的定义,下面给出陈拉明在某次讲座中陈述的例子。

640?wx_fmt=png

由于矩阵 L 是半正定的,因此存在矩阵 B ,使得 640?wx_fmt=png ,并且640?wx_fmt=png这是因为行列式为方阵中的各个列向量张成的平行多面体体积的平方。

为了将DPP模型应用于推荐场景中,考虑将每个列向量 Bi 分解为640?wx_fmt=png,其中:

  • r_i 为 item i 与 user 之间的相关性,且 640?wx_fmt=png
  • 640?wx_fmt=png为item i 与 item j 之间的相似度度量,且 640?wx_fmt=png;那么,
640?wx_fmt=png

从矩阵 L 的构造可知,商品与用户之间相关性越大,且商品之间多样性越丰富,则矩阵 L 的行列式越大。因此,我们可以建立如下最优化问题:
640?wx_fmt=png

但是,直接求解该优化问题是 NP 难的,陈拉明团队则利用贪婪算法,提出了一种能加速行列式点过程推理过程的方法。

首先,DPP取Log后的函数是满足次模函数的:640?wx_fmt=png次模函数是一个集合函数,随着输入集合中元素的增加,增加单个元素到输入集合导致的函数增量的差异减小。即对于任意640?wx_fmt=png,都有:

640?wx_fmt=png

直观解释为,小集合和大集合增加同样一个元素,小集合带来的收益大于大集合的收益因此,可以将上述优化问题转化为贪婪的形式:
640?wx_fmt=png
即:每次选择收益最大的 item,直到满足条件为止。

DPP模型求解

求解该优化问题时,每次迭代的计算复杂度来源于行列式的计算,而求行列式的计算复杂度与该行列式长度的三次方成正比,即 640?wx_fmt=png,这一结果显然不适用于实际线上实时性较高的场景。下面,叙述论文中所做的改进:

首先对子矩阵 640?wx_fmt=png 做Cholesky分解,使得 640?wx_fmt=png其中,V  是一个下三角矩阵。对于任意 640?wx_fmt=png ,对子集 Y 添加一个元素 i 之后的子矩阵做 Cholesky 分解,使得:
640?wx_fmt=png

其中,有以下等式成立:640?wx_fmt=jpeg两边取行列式后再取log,可得:640?wx_fmt=png,应用Cholesky分解后,每次迭代只需要计算 640?wx_fmt=png即可。而为了得到 640?wx_fmt=png,先需要求解线性方程组:640?wx_fmt=png

求解得到 640?wx_fmt=png 后,再带入 640?wx_fmt=png 得到 640?wx_fmt=png。此过程的计算复杂度来源于求解线性方程组,虽然求解线性方程组的计算复杂度也是三次方,但是系数矩阵V是下三角矩阵,因此,每次迭代的计算复杂度可降到二次方

即使计算复杂度降到了二次方,但是相比于目前主流的算法,可能依然没有优势。因此,作者又考虑每次迭代也用增量的方式更新 640?wx_fmt=png 和 640?wx_fmt=png,从而避免了求解线性方程组带来的计算复杂度。具体过程如下:

对于任意 640?wx_fmt=png,将 640?wx_fmt=jpeg带入上式中,推导可得:
640?wx_fmt=png
因此,每次迭代的计算复杂度进一步降低至一次方。
640?wx_fmt=png

滑动窗口式多样性

在一些场景中,商品集是以一个长序列的形式展示的,每次仅展示其中一部分。其实,这和搜索展示十分类似。此时,多样性仅需要在当前的滑动窗口满足即可。

定义 w 是窗口的大小,对应的优化模型为:
640?wx_fmt=png
其中,640?wx_fmt=png 包含最近添加的 w - 1 个商品。
640?wx_fmt=png

实验

下图是各算法在性能耗时上的对比。

640?wx_fmt=png

如下图所示对比了在相关性与多样性之间的trade-off效果。横坐标代表相关性,纵坐标代表多样性,在Netflix Prize数据上DPP算法优于其他三个算法,而 Cover 的性能是表现最好的;但在Million Song数据上Cover的表现是最差的。

640?wx_fmt=png

与此同时,线上的A/B test实验也证实了我们DPP算法的有效性。

640?wx_fmt=png

总结

基于行列式点过程的推荐多样性提升算法使用贪婪算法推理最优的行列式点过程,并利用Cholesky加速行列式点过程的推理。该算法在推荐领域具有较好的应用,在丰富推荐多样性和相关性的同时,大大提升了计算速度。

来源:
https://blog.csdn.net/yz930618/article/details/84862751

(*本文为AI科技大本营转载文章,转载联系原作者


精彩推荐



2019 中国大数据技术大会(BDTC)再度来袭!豪华主席阵容及百位技术专家齐聚,15 场精选专题技术和行业论坛,超强干货+技术剖析+行业实践立体解读,深入解析热门技术在行业中的实践落地。6.6 折票限时特惠(立减1400元),学生票仅 599 元!

640?wx_fmt=png

推荐阅读

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!