kmp算法---简单易懂

匆匆过客 提交于 2020-01-30 01:51:46

KMP字符串

给定一个模式串S,以及一个模板串P,所有字符串中只包含大小写英文字母以及阿拉伯数字。

模板串P在模式串S中多次作为子串出现。

求出模板串P在模式串S中所有出现的位置的起始下标。

输入格式

第一行输入整数N,表示字符串P的长度。
第二行输入字符串P。
第三行输入整数M,表示字符串S的长度。
第四行输入字符串S。

输出格式

共一行,输出所有出现位置的起始下标(下标从0开始计数),整数之间用空格隔开。

数据范围

1 ≤ N ≤ 104
1 ≤ M ≤ 105

输入样例:

3
aba
5
ababa

输出样例:

0 2

#include <iostream>
using namespace std;
const int N = 10010, M = 100010;  //定义两个常量 
	
int main(){
	int n ,m;  //分别是 p, s串的长度 
	char p[N], s[M];  //定义两个字符数组 p是模板串(短),s是模式串(长) 
	int next[N];  //该数组考虑的是当前字符最大相同前缀后缀 
	cin >> n >> p + 1 >> m >> s + 1;  //输入整数和字符串 
	
	//求next数组
	next[1] = 0; //这里的next数组下标从 1开始 
	for(int i = 2, j = 0; i <= n; i++){   
		while(j && p[i] != p[j + 1])  
			j = next[j];
		if(p[i] == p[j + 1])
			j ++;
		next[i] = j;	
	} 
//	for(int i = 1; i <= n; i++)
//		printf("%d", next[i]);  检测 next数组是否正确 

	//匹配过程
	for(int i = 1, j = 0;i <= m; i++){ //i代表模式串的移动 
		while(j && s[i] != p[j + 1])
			j = next[j];
		if(s[i] == p[j + 1])
			j++;
		if(j == n){
			printf("%d ",i-n);
			j = next[j];
		}
	} 
	return 0;	 
}

注意:

  • next数组下标从1开始
  • 假设子串为 ABCDABD
    则next数组为0000120
  • next数组表示的是当前字符最大相同的前缀后缀
  • 只需要遍历一次长串,不需要回溯
  • 将两个串放入到了两个字符数组中
  • 遍历是从1开始(当然也可以从0开始,最后返回的值是从0开始的)
  • 访问子串时也是从1开始
  • 学算法时找一道题并学会以后可以再看别的关于该算法的别的方法,否则容易浑
标签
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!