BM25算法是一种常见用来做相关度打分的公式
- 思路比较简单,主要就是计算一个query里面所有词和文档的相关度,
- 然后在把分数做累加操作
- 而每个词的相关度分数主要还是受到tf/idf的影响
其实就是套用一个数学公式
- 详见:https://my.oschina.net/u/3847203/blog/2996346
- 直接套用叫二值独立模型
- 单词加权叫 BM25 模型
- 考虑不同区域的权重差异 叫BM25F模型
- 不同区域,比如标题、摘要
来源:oschina
链接:https://my.oschina.net/u/3847203/blog/3159976