BIE

ElasticSearch fuzziness 模糊查询

若如初见. 提交于 2020-03-01 04:01:32
[[模糊]] === 模糊 模糊匹配 视两个单词 ``模糊'' 相似,正好像它们是同一个词. ((("typoes and misspellings", "fuzziness, defining"))) 首先, 我们需要通过 fuzziness 来定义什么是((("fuzziness"))). 用来度量把一个单词转换为另一个单词需要的单字符编辑次数 ((("Levenshtein distance"))). 他提出了3种单字符编辑: 替换 一个字符到另一个字符: _f_ox -> _b_ox 插入 一个新字符: sic -> sic k 删除 一个字符:: b_l_ack -> back 稍后扩展了这些操作并包含了1个新的 ((("Damerau, Frederick J."))): 换位 调整字符: _st_ar -> _ts_ar 例如,把 bieber 转换为 beaver 需要以下几步: 用 v 替换掉 b: bie_b_er -> bie_v_er 用 a 替换掉 i: b_i_ever -> b_a_ever 换位 a 和 e : b_ae_ver -> b_ea_ver 以上的3步代表了3个 http://bit.ly/1ymgZPB[Damerau-Levenshtein edit distance(Damerau-Levenshtein编辑距离)]. 显然,