借助哈希算法实现高效字符串匹配算法

不羁岁月 提交于 2020-01-28 17:35:11

BF 算法,暴力匹配算法,每次往后移一位

RK 算法,通过哈希算法对主串中的 n-m+1 个子串分别求哈希值,然后逐个与模式串的哈希值比较大小。如果某个子串的哈希值与模式串相等,那就说明对应的子串和模式串匹配了(这里先不考虑哈希冲突的问题)。因为哈希值是一个数字,数字之间比较是否相等是非常快速的。

但是需要遍历子串中的每个字符,算法整体的效率并没有提高

提高哈希算法
二十六进制来表示一个字符串:把 a~z 这 26 个字符映射到 0~25 这 26 个数字,a 就表示 0,b 就表示 1;
在这里插入图片描述
相邻两个子串的哈希值的计算公式有一定关系,可以使用 s[i-1]的哈希值很快的计算出 s[i]的哈希值
在这里插入图片描述
26^(m-1) 这部分的计算,我们可以通过查表的方法来提高效率。我们事先计算好 260、261、262……26(m-1),并且存储在一个长度为 m 的数组中,公式中的“次方”就对应数组的下标。当我们需要计算 26 的 x 次方的时候,就可以从数组的下标为 x 的位置取值,直接使用,省去了计算的时间。

只需要扫描一遍主串O(n),模式串哈希值与每个子串哈希值之间的比较的时间复杂度是 O(1),总共需要比较 n-m+1 个子串的哈希值,整体的时间复杂度就是 O(n)。

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!