KMP字符串
给定一个模式串S,以及一个模板串P,所有字符串中只包含大小写英文字母以及阿拉伯数字。
模板串P在模式串S中多次作为子串出现。
求出模板串P在模式串S中所有出现的位置的起始下标。
输入格式
第一行输入整数N,表示字符串P的长度。
第二行输入字符串P。
第三行输入整数M,表示字符串S的长度。
第四行输入字符串S。
输出格式
共一行,输出所有出现位置的起始下标(下标从0开始计数),整数之间用空格隔开。
数据范围
1 ≤ N ≤ 104
1 ≤ M ≤ 105
输入样例:
3
aba
5
ababa
输出样例:
0 2
#include <iostream>
using namespace std;
const int N = 10010, M = 100010; //定义两个常量
int main(){
int n ,m; //分别是 p, s串的长度
char p[N], s[M]; //定义两个字符数组 p是模板串(短),s是模式串(长)
int next[N]; //该数组考虑的是当前字符最大相同前缀后缀
cin >> n >> p + 1 >> m >> s + 1; //输入整数和字符串
//求next数组
next[1] = 0; //这里的next数组下标从 1开始
for(int i = 2, j = 0; i <= n; i++){
while(j && p[i] != p[j + 1])
j = next[j];
if(p[i] == p[j + 1])
j ++;
next[i] = j;
}
// for(int i = 1; i <= n; i++)
// printf("%d", next[i]); 检测 next数组是否正确
//匹配过程
for(int i = 1, j = 0;i <= m; i++){ //i代表模式串的移动
while(j && s[i] != p[j + 1])
j = next[j];
if(s[i] == p[j + 1])
j++;
if(j == n){
printf("%d ",i-n);
j = next[j];
}
}
return 0;
}
注意:
- next数组下标从1开始
- 假设子串为 ABCDABD
则next数组为0000120 - next数组表示的是当前字符最大相同的前缀后缀
- 只需要遍历一次长串,不需要回溯
- 将两个串放入到了两个字符数组中
- 遍历是从1开始(当然也可以从0开始,最后返回的值是从0开始的)
- 访问子串时也是从1开始
- 学算法时找一道题并学会以后可以再看别的关于该算法的别的方法,否则容易浑
来源:CSDN
作者:violet_pang
链接:https://blog.csdn.net/weixin_45897672/article/details/104039258