没想到今天是1024程序员节日,先祝大家节日快乐 希望有幸看到这篇文章的大佬们学的多不秃头(-。-)
串匹配-BF和KMP算法
串模式匹配即子串查找。设s和p是给定的两个字符串,在主串s中查找子串p的过程,成为模式匹配。如果在s中找到等于p的字串,则称匹配成功,函数返回p在s中首次出现的位置或序号,否则匹配失败,返回-1,p也称为模式串。
BF算法
解决这个问题,有两种算法,相对简单一种的叫做BF算法也叫简单匹配算法
BF算法的总体思路就是首先将s0与p0比较,若不相同,就将s1与p0比较,依次下去,直到si与p0相同,然后再比较之后的字符,就是将s(i+1)与p1比较,依次下去,若p比较到末尾,则匹配成功,若其中有一个字符不相等,则s回到本趟开始的一个字符位置,即s(i-j+1),继续下一趟的比较。
时间复杂度最好是O(n+m),最差为O(n*m)
代码如下:
public static int KM(char[] s, char[] p){
int i = 0;
int j = 0;
while(i < s.length && j < p.length){
if (s[i] == p[j]){
i++;
j++;
} else {
i = i-j+1;
j = 0;
}
if (j > p.length-1) {
return i-p.length;
}
}
return -1;
}
KMP算法
BF算法相对简单但效率较低,KMP算法对BF算法做了一些改进
在每一趟匹配中,当匹配失败,s串都要回到本串开始字符的下一个字符,模式串p要回到第一个字符,这会造成许多不必要的回溯,而KMP算法通过next数组改进了这个问题。
KMP算法的时间复杂度为O(n+m)
代码如下:
public static int KMP(char[] s, char[] p, int[] next){
int i = 0;
int j = 0;
while(i < s.length && j < p.length){
if(j == -1 || s[i] == p[j]){
i++;
j++;
}
else{
j = next[j];
}
if(j > p.length-1)
return i-p.length;
}
return -1;
}
求next的算法
KMP算法的一个难点就是求next数组的算法
next函数值取决于模式串本身而与主串无关。首先,我们可以知道**p1p2…pj-1与si…s(i+j-1)**相对应的位置是相等的
假设P1…p(j-1)中,**p1…p(k-1)与p(j-k)…p(j-1)**是一一对应相等的
那么就可以推出,**p1…p(k-1)与si…s(i+j-1)**是一一对应的。
KMP算法就是将模式串根据next右移,而主串不动。
就是说每个next值都决定了该移动多少位。
目前我看了半天也只是明白了个大概,如果有兴趣深究的,可以看看这位大佬的博客,写的是真的详细且精辟
地址链接:通俗易懂的字符串匹配KMP算法及求next值算法
膜拜大佬ing…
代码如下
public static int[] getNext(char[] p){
int[] next = new int[p.length];
next[0] = -1;
int i = 0;
int j = -1;
while(i < p.length-1){
if(j == -1 || p[i] == p[j]){
i++;
j++;
next[i] = j;
}
else {
j = next[j];
}
}
return next;
}
j = next[j];
}
}
return next;
}
来源:https://blog.csdn.net/s1547156325/article/details/102719190