Learning to Rank之Ranking SVM 简介
排序一直是信息检索的核心问题之一,Learning to Rank(简称LTR)用机器学习的思想来解决排序问题(关于Learning to Rank的简介请见我的博文 Learning to Rank简介 )。LTR有三种主要的方法:PointWise,PairWise,ListWise。Ranking SVM算法是PointWise方法的一种,由R. Herbrich等人在2000提出, T. Joachims介绍了一种基于用户Clickthrough数据使用Ranking SVM来进行排序的方法(SIGKDD, 2002)。 1. Ranking SVM的主要思想 Ranking SVM是一种Pointwise的排序算法, 给定查询q, 文档d 1 >d 2 >d 3 (亦即文档d 1 比文档d 2 相关, 文档d 2 比文档d 3 相关, x 1 , x 2 , x 3 分别是d 1 , d 2 , d 3 的特征)。为了使用机器学习的方法进行排序,我们将排序转化为一个分类问题。我们定义新的训练样本, 令x 1 -x 2 , x 1 -x 3 , x 2 -x 3 为正样本,令x 2 -x 1 , x 3 -x 1 , x 3 -x 2 为负样本, 然后训练一个二分类器(支持向量机)来对这些新的训练样本进行分类,如下图所示: 左图中每个椭圆代表一个查询,