子串的定位运算通常称为串的模式匹配或串匹配。串的模式匹配设有两个字符串S和T,设S为主串,也称正文串;设T为子串,也称为模式。在主串S中查找与模式T相匹配的子串,如果匹配成功,确定相匹配的子串中的第一个字符在主串S中出现的位置。
著名的模式匹配算法有BF算法和KMP算法,先介绍BF算法。
BF算法是最简单直观的模式匹配算法,模式匹配不一定从主串的第一个位置开始,可以指定主串中查找的起始位置 pos,如果用顺序存储结构,可以写出不依赖于其他串操作的模式匹配算法。
【算法步骤】
- 用指针i,j指示主串S和模式T中当前正待比较的字符位置,i初值为pos,j初值为1.
- 如果两个串均未比较到串尾,即i,j均别小于S和T的长度,循环执行以下操作:
- S.ch[i]和T.ch[j]比较,若相等,则i和j分别指示串中下个位置,继续比较后续字符;
- 若不等,指针后退重新开始匹配,从主串的下一个字符( i= i - j + 2)起再重新和模式的第一个字符(j = 1) 比较
- 如果 j > T.length,说明模式T中的每个字符依次和主串S中的一个连续的字符序列相等,匹配成功,返回和模式T中第一个字符相等的字符在主串S中的序号(i - T.length);否则称匹配不成功,返回0.
【算法描述】
int index_BF(SString S,SString T,int pos)
{//返回模式T在主串S中第pos个字符开始第一次出现的位置,若不存在,则返回值为0
//其中,T非空,1<=pos<=S.length
i = pos; j = 1;//初始化
while(i <= S.length && j <= T.length)//两个串均未比较到串尾
{
if(S.ch[i] == T.ch[j])
i++, j++;//继续比较后续字符
else
{
i = i - j + 2; j = 1;//指针后退重新开始匹配、
}
if(j > T.length)
return i - T.length;//匹配成功
else
return 0;//匹配失败
}
}
【复杂度分析】
- 最好情况下,每趟不成功的匹配都发生在模式串的第一个字符与主串中的相应字符的比较。例如:
S = “aaaaaaaaaaba”
T = “ba”
复杂度为O(n + m); - 最坏情况下,每趟不成功的匹配都发生在模式串的第一个字符与主串中相应字符的比较,例如:
S = “aaaaaaaaaaaaab”
T = “aab”;
复杂度为O( n x m);
【代码实现】
#include<iostream>
#include<string>
using namespace std;
int index_BF(string S,string T,int pos)
{//返回模式T在主串S中第pos个字符开始第一次出现的位置,若不存在,则返回值为0
//其中,T非空,1<=pos<=S.length
int i = pos;
int j = 1;//初始化
while(i <= S.size() && j <= T.size())//两个串均未比较到串尾
{
if(S[i] == T[j])
i++, j++;//继续比较后续字符
else
{
i = i - j + 2; j = 1;//指针后退重新开始匹配、
}
}
if(j > T.size())
return (i - T.size());//匹配成功
else
return 0;//匹配失败
}
int main()
{
string S, T;
cout<<"输出主串:";
cin>>S;
cout<<"输入模式串:";
cin>>T;
int pos = index_BF(S,T,1);
cout<<pos<<endl;
return 0;
}
来源:CSDN
作者:ker.
链接:https://blog.csdn.net/weixin_45895026/article/details/104225115