数据结构- 串的模式匹配算法：BF和 KMP算法

博主： cto.wang
发布时间：2015 年 05 月 09 日
400次浏览
暂无评论
14179字数
分类： Web类

Brute-Force算法的思想
<h2 class="headline-1 bk-sidecatalog-title">1．BF(Brute-Force)算法 &nbsp;</h2>
Brute-Force算法的基本思想是：
1) 从目标串s 的第一个字符起和模式串t的第一个字符进行比较，若相等，则继续逐个比较后续字符，否则从串s 的第二个字符起再重新和串t进行比较。
2) 依此类推，直至串t 中的每个字符依次和串s的一个连续的字符序列相等，则称模式匹配成功，此时串t的第一个字符在串s 中的位置就是t 在s中的位置，否则模式匹配不成功。
Brute-Force算法的实现 &nbsp;&nbsp;
<img src="//cto.wang/usr/uploads/2016/07/20160703163623-32.jpg" title="1428372674344426.jpg" alt="1.jpg" />
c语言实现：

<pre class="brush:python;toolbar:false">//&nbsp;Test.cpp&nbsp;:&nbsp;Defines&nbsp;the&nbsp;entry&nbsp;point&nbsp;for&nbsp;the&nbsp;console&nbsp;application.&nbsp;&nbsp;&nbsp;&nbsp;
//&nbsp;&nbsp;&nbsp;&nbsp;
#include&nbsp;&quot;stdafx.h&quot;&nbsp;&nbsp;&nbsp;&nbsp;
#include&nbsp;&lt;stdio.h&gt;&nbsp;&nbsp;&nbsp;&nbsp;
#include&nbsp;&quot;stdlib.h&quot;&nbsp;&nbsp;
#include&nbsp;&lt;iostream&gt;&nbsp;&nbsp;
using&nbsp;namespace&nbsp;std;&nbsp;&nbsp;
&nbsp;&nbsp;
//宏定义&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
#define&nbsp;TRUE&nbsp;&nbsp;&nbsp;1&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
#define&nbsp;FALSE&nbsp;&nbsp;&nbsp;0&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
#define&nbsp;OK&nbsp;&nbsp;&nbsp;&nbsp;1&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
#define&nbsp;ERROR&nbsp;&nbsp;&nbsp;0&nbsp;&nbsp;&nbsp;&nbsp;
&nbsp;&nbsp;
#define&nbsp;&nbsp;MAXSTRLEN&nbsp;100&nbsp;&nbsp;
&nbsp;&nbsp;
typedef&nbsp;char&nbsp;&nbsp;&nbsp;&nbsp;SString[MAXSTRLEN&nbsp;+&nbsp;1];&nbsp;&nbsp;
/************************************************************************/&nbsp;&nbsp;
/*&nbsp;&nbsp;
&nbsp;返回子串T在主串S中第pos位置之后的位置，若不存在，返回0&nbsp;
*/&nbsp;&nbsp;
/************************************************************************/&nbsp;&nbsp;
int&nbsp;BFindex(SString&nbsp;S,&nbsp;SString&nbsp;T,&nbsp;int&nbsp;pos)&nbsp;&nbsp;
{&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;if&nbsp;(pos&nbsp;&lt;1&nbsp;||&nbsp;&nbsp;pos&nbsp;&gt;&nbsp;S[0]&nbsp;)&nbsp;exit(ERROR);&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;int&nbsp;i&nbsp;=&nbsp;pos,&nbsp;j&nbsp;=1;&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;while&nbsp;(i&lt;=&nbsp;S[0]&nbsp;&amp;&amp;&nbsp;j&nbsp;&lt;=&nbsp;T[0])&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;{&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;if&nbsp;(S[i]&nbsp;==&nbsp;T[j])&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;{&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;++i;&nbsp;++j;&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;}&nbsp;else&nbsp;{&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;i&nbsp;=&nbsp;i-&nbsp;j+&nbsp;2;&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;j&nbsp;=&nbsp;1;&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;}&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;}&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;if(j&nbsp;&gt;&nbsp;T[0])&nbsp;return&nbsp;i&nbsp;-&nbsp;T[0];&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;return&nbsp;ERROR;&nbsp;&nbsp;
}&nbsp;&nbsp;
&nbsp;&nbsp;
&nbsp;&nbsp;
&nbsp;&nbsp;
void&nbsp;main(){&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;SString&nbsp;S&nbsp;=&nbsp;{13,&#039;a&#039;,&#039;b&#039;,&#039;a&#039;,&#039;b&#039;,&#039;c&#039;,&#039;a&#039;,&#039;b&#039;,&#039;c&#039;,&#039;a&#039;,&#039;c&#039;,&#039;b&#039;,&#039;a&#039;,&#039;b&#039;};&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;SString&nbsp;T&nbsp;=&nbsp;{5,&#039;a&#039;,&#039;b&#039;,&#039;c&#039;,&#039;a&#039;,&#039;c&#039;};&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;int&nbsp;pos;&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;pos&nbsp;=&nbsp;BFindex(&nbsp;S,&nbsp;&nbsp;T,&nbsp;1);&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;cout&lt;&lt;&quot;Pos:&quot;&lt;&lt;pos;&nbsp;&nbsp;
}</pre>
<h2 class="headline-1 bk-sidecatalog-title">2．KMP算法</h2>
2.1 算法思想：
每当一趟匹配过程中出现字符比较不等时，不需要回溯I指针，而是利用已经的带的“部分匹配”的结果将模式向右滑动尽可能远的一段距离后，继续进行比较。
即尽量利用已经部分匹配的结果信息，尽量让i不要回溯，加快模式串的滑动速度。
<img src="//cto.wang/usr/uploads/2016/07/20160703163623-36.jpg" title="1428372716923686.jpg" alt="2.jpg" />
需要讨论两个问题： ①如何由当前部分匹配结果确定模式向右滑动的新比较起点k？ ② 模式应该向右滑多远才是高效率的?
现在讨论一般情况:
假设 主串：s: ‘s(1)&nbsp; s(2)&nbsp;s(3) ……s(n)’ ; &nbsp;模式串 ：p: ‘p(1)&nbsp; p(2)&nbsp;p(3)…..p(m)’
现在我们假设 主串第i个字符与模式串的第j(j&lt;=m)个字符‘失配’后，主串第i个字符与模式串的第k(k&lt;j)个字符继续比较。
此时，s(i)≠p(j)： 
<img src="//cto.wang/usr/uploads/2016/07/20160703163623-12.jpg" title="1428372732136361.jpg" alt="3.jpg" />

由此，我们得到关系式：即得到到1 到&nbsp;&nbsp;j -1&nbsp;的&quot;部分匹配&quot;结果:
&nbsp;‘P(1)&nbsp; P(2)&nbsp;P(3)…..P(j-1)’&nbsp;&nbsp; =&nbsp;&nbsp;&nbsp; ’ S(i-j+1)……S(i-1)’
&nbsp;从而推导出k 到 j- 1位的“部分匹配”：即P的j-1～j-k＝S前i-1～i- (k -1))位&nbsp;&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;&nbsp;
&nbsp;&nbsp;‘P(j &#8211; k + 1) …..P(j-1)’ &nbsp;=&nbsp;&nbsp;’S(i-k+1)S(i-k+2)……S(i-1)’ 
由于s(i)≠p(j)，接下来s(i)将与p(k)继续比较，则模式串中的前(k-1)个字符的子串必须满足下列关系式，并且不可能存在&nbsp; k’&gt;k&nbsp; 满足下列关系式：(k&lt;j) 
<img src="//cto.wang/usr/uploads/2016/07/20160703163623-70.jpg" title="1428372748178903.jpg" alt="4.jpg" />
有关系式：&nbsp;即(P的前k- 1 ~ 1位＝ S前i-1～i-(k-1) )位 )&nbsp;,：
‘P(1)&nbsp;P(2)&nbsp; P(3)…..P(k-1)’&nbsp;= ’S(i-k+1)S(i-k+2)……S(i-1)’

现在我们把前面总结的关系综合一下,有：
<img src="//cto.wang/usr/uploads/2016/07/20160703163623-24.jpg" title="1428372774122757.jpg" alt="5.jpg" />
由上，我们得到关系： 
‘p(1)&nbsp; p(2)&nbsp; p(3)…..p(k-1)’ &nbsp;= &nbsp;&nbsp;‘p(j &#8211; k + 1) …..p(j-1)’&nbsp; 
&nbsp; &nbsp; &nbsp; 反之，若模式串中满足该等式的两个子串，则当匹配过程中，主串中的第i 个字符与模式中的第j个字符等时，仅需要将模式向右滑动至模式中的第k个字符和主串中的第i个字符对齐。此时，模式中头k-1个字符的子串‘p(1)&nbsp; p(2)&nbsp; p(3)…..p(k-1)’&nbsp;&nbsp;必定与主串中的第i 个字符之前长度为k-1 的子串&nbsp; ’s(j-k+1)s(j-k+2)……s(j-1)’相等，由此，匹配仅需要从模式中的第 k 个字符与主串中的第 i 个字符比较起 继续进行。&nbsp; &nbsp; &nbsp; 若令 next[j] = k ,则next[j] 表明当模式中第j个字符与主串中相应字符“失配”时，在模式中需要重新和主串中该字符进行的比较的位置。由此可引出模式串的next函数：

根据模式串P的规律：&nbsp;&nbsp;‘p(1)&nbsp; p(2)&nbsp; p(3)…..p(k-1)’ &nbsp;= &nbsp;&nbsp;‘p(j &#8211; k + 1) …..p(j-1)’&nbsp;
由当前失配位置j(已知) ，可以归纳计算新起点k的表达式。
<img src="//cto.wang/usr/uploads/2016/07/20160703163623-3.jpg" title="1428372820555795.jpg" alt="1.jpg" />
由此定义可推出下列模式串next函数值：
<img src="//cto.wang/usr/uploads/2016/07/20160703163623-90.jpg" title="1428372837120322.jpg" alt="7.jpg" />
模式匹配过程:
<img src="//cto.wang/usr/uploads/2016/07/20160703163623-34.jpg" title="1428372870233820.jpg" alt="1.jpg" />
KMP算法的实现: 
第一步，先把模式T所有可能的失配点j所对应的next[j]计算出来；
第二步：执行定位函数Index_kmp（与BF算法模块非常相似）
<ol start="1" class=" list-paddingleft-2">
<li>

</li>
<li>
<pre class="brush:python;toolbar:false">int&nbsp;KMPindex(SString&nbsp;S,&nbsp;SString&nbsp;T,&nbsp;int&nbsp;pos)&nbsp;&nbsp;
{&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;if&nbsp;(pos&nbsp;&lt;1&nbsp;||&nbsp;&nbsp;pos&nbsp;&gt;&nbsp;S[0]&nbsp;)&nbsp;exit(ERROR);&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;int&nbsp;i&nbsp;=&nbsp;pos,&nbsp;j&nbsp;=1;&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;while&nbsp;(i&lt;=&nbsp;S[0]&nbsp;&amp;&amp;&nbsp;j&nbsp;&lt;=&nbsp;T[0])&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;{&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;if&nbsp;(S[i]&nbsp;==&nbsp;T[j])&nbsp;{&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;++i;&nbsp;++j;&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;}&nbsp;else&nbsp;{&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;j&nbsp;=&nbsp;next[j+1];&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;}&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;}&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;if(j&nbsp;&gt;&nbsp;T[0])&nbsp;return&nbsp;i&nbsp;-&nbsp;T[0];&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;return&nbsp;ERROR;&nbsp;&nbsp;
}</pre>
</li>
</ol>
完整实现代码：
<pre class="brush:python;toolbar:false">//&nbsp;Test.cpp&nbsp;:&nbsp;Defines&nbsp;the&nbsp;entry&nbsp;point&nbsp;for&nbsp;the&nbsp;console&nbsp;application.&nbsp;&nbsp;&nbsp;&nbsp;
//&nbsp;&nbsp;&nbsp;&nbsp;
#include&nbsp;&quot;stdafx.h&quot;&nbsp;&nbsp;&nbsp;&nbsp;
#include&nbsp;&lt;stdio.h&gt;&nbsp;&nbsp;&nbsp;&nbsp;
#include&nbsp;&quot;stdlib.h&quot;&nbsp;&nbsp;
#include&nbsp;&lt;iostream&gt;&nbsp;&nbsp;
using&nbsp;namespace&nbsp;std;&nbsp;&nbsp;
&nbsp;&nbsp;
//宏定义&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
#define&nbsp;TRUE&nbsp;&nbsp;&nbsp;1&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
#define&nbsp;FALSE&nbsp;&nbsp;&nbsp;0&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
#define&nbsp;OK&nbsp;&nbsp;&nbsp;&nbsp;1&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
#define&nbsp;ERROR&nbsp;&nbsp;&nbsp;0&nbsp;&nbsp;&nbsp;&nbsp;
&nbsp;&nbsp;
#define&nbsp;&nbsp;MAXSTRLEN&nbsp;100&nbsp;&nbsp;
&nbsp;&nbsp;
typedef&nbsp;char&nbsp;&nbsp;&nbsp;&nbsp;SString[MAXSTRLEN&nbsp;+&nbsp;1];&nbsp;&nbsp;
&nbsp;&nbsp;
void&nbsp;GetNext(SString&nbsp;T,&nbsp;int&nbsp;next[]);&nbsp;&nbsp;
int&nbsp;KMPindex(SString&nbsp;S,&nbsp;SString&nbsp;T,&nbsp;int&nbsp;pos);&nbsp;&nbsp;
/************************************************************************/&nbsp;&nbsp;
/*&nbsp;&nbsp;
&nbsp;返回子串T在主串S中第pos位置之后的位置，若不存在，返回0&nbsp;
*/&nbsp;&nbsp;
/************************************************************************/&nbsp;&nbsp;
int&nbsp;KMPindex(SString&nbsp;S,&nbsp;SString&nbsp;T,&nbsp;int&nbsp;pos)&nbsp;&nbsp;
{&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;if&nbsp;(pos&nbsp;&lt;1&nbsp;||&nbsp;&nbsp;pos&nbsp;&gt;&nbsp;S[0]&nbsp;)&nbsp;exit(ERROR);&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;int&nbsp;i&nbsp;=&nbsp;pos,&nbsp;j&nbsp;=1;&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;int&nbsp;next[MAXSTRLEN];&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;GetNext(&nbsp;T,&nbsp;next);&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;while&nbsp;(i&lt;=&nbsp;S[0]&nbsp;&amp;&amp;&nbsp;j&nbsp;&lt;=&nbsp;T[0])&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;{&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;if&nbsp;(S[i]&nbsp;==&nbsp;T[j])&nbsp;{&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;++i;&nbsp;++j;&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;}&nbsp;else&nbsp;{&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;j&nbsp;=&nbsp;next[j];&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;}&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;}&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;if(j&nbsp;&gt;&nbsp;T[0])&nbsp;return&nbsp;i&nbsp;-&nbsp;T[0];&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;return&nbsp;ERROR;&nbsp;&nbsp;
}&nbsp;&nbsp;
&nbsp;&nbsp;
/************************************************************************/&nbsp;&nbsp;
/*&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;求子串next[i]值的算法&nbsp;
*/&nbsp;&nbsp;
/************************************************************************/&nbsp;&nbsp;
void&nbsp;GetNext(SString&nbsp;T,&nbsp;int&nbsp;next[])&nbsp;&nbsp;
{&nbsp;&nbsp;&nbsp;int&nbsp;j&nbsp;=&nbsp;1,&nbsp;k&nbsp;=&nbsp;0;&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;next[1]&nbsp;=&nbsp;0;&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;while(j&nbsp;&lt;&nbsp;T[0]){&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;if(k&nbsp;==&nbsp;0&nbsp;||&nbsp;T[j]==T[k])&nbsp;{&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;++j;&nbsp;&nbsp;++k;&nbsp;&nbsp;&nbsp;next[j]&nbsp;=&nbsp;k;&nbsp;&nbsp;&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;}&nbsp;else&nbsp;{&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;k&nbsp;=&nbsp;next[k];&nbsp;&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;}&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;}&nbsp;&nbsp;
}&nbsp;&nbsp;
&nbsp;&nbsp;
void&nbsp;main(){&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;SString&nbsp;S&nbsp;=&nbsp;{13,&#039;a&#039;,&#039;b&#039;,&#039;a&#039;,&#039;b&#039;,&#039;c&#039;,&#039;a&#039;,&#039;b&#039;,&#039;c&#039;,&#039;a&#039;,&#039;c&#039;,&#039;b&#039;,&#039;a&#039;,&#039;b&#039;};&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;SString&nbsp;T&nbsp;=&nbsp;{5,&#039;a&#039;,&#039;b&#039;,&#039;c&#039;,&#039;a&#039;,&#039;c&#039;};&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;int&nbsp;pos;&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;pos&nbsp;=&nbsp;KMPindex(&nbsp;S,&nbsp;&nbsp;T,&nbsp;1);&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;cout&lt;&lt;&quot;Pos:&quot;&lt;&lt;pos;&nbsp;&nbsp;
}</pre>
k值仅取决于模式串本身而与相匹配的主串无关。
我们使用递推到方式求next函数： 1）由定义可知： &nbsp; &nbsp; &nbsp;next[1] = 0; 2) &nbsp;设&nbsp;next[j] = k&nbsp;,这个表面在模式串中存在下列关系： &nbsp; &nbsp;&nbsp;‘P(1) &nbsp;….. P(k-1)’ &nbsp;= &nbsp;&nbsp;‘P(j &#8211; k + 1) ….. P(j-1)’&nbsp; &nbsp; &nbsp; 其中k为满足1&lt; k &lt;j的某个值，并且不可能存在k` &gt; 满足: &nbsp; &nbsp;&nbsp;‘P(1) &nbsp;….. P(k`-1)’ &nbsp;= &nbsp;&nbsp;‘P(j &#8211; k` + 1) ….. P(j-1)’&nbsp; &nbsp; &nbsp; 此时next[j+1] = ?可能有两种情况： &nbsp; &nbsp;（1） 若Pk = Pj，则表明在模式串中：
&nbsp;&nbsp;‘P(1) ….. P(k)’ &nbsp;= &nbsp;&nbsp;‘P(j &#8211; k + 1) ….. P(j)’&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; 并且不可能存在k` &gt; 满足：&nbsp;&nbsp;‘P(1) ….. P(k`)’ &nbsp;= &nbsp;&nbsp;‘P(j &#8211; k` + 1) ….. P(j)’&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; 即next[j+1] = k + 1&nbsp;推到=》：
&nbsp; &nbsp; &nbsp; &nbsp; &nbsp;next[j+1] = next[j] + 1;
&nbsp; &nbsp;&nbsp;&nbsp;&nbsp;(2) &nbsp;若Pk<img src="//cto.wang/usr/uploads/2016/07/20160703163623-2.jpg" alt="" style="border: none" />Pj&nbsp;则表明在模式串中：
&nbsp; &nbsp; &nbsp; &nbsp; &nbsp;&nbsp;‘P(1) ….. P(k)’ &nbsp;<img src="//cto.wang/usr/uploads/2016/07/20160703163623-2.jpg" alt="" style="border: none" />&nbsp;&nbsp;&nbsp;‘P(j &#8211; k + 1) ….. P(j)’&nbsp; &nbsp; &nbsp; &nbsp;此时可把next函数值的问题看成是一个模式匹配的问题，整个模式串即是主串又是模式串， &nbsp; &nbsp; &nbsp;而当前匹配的过程中，已有：
&nbsp; &nbsp; &nbsp; Pj-k+1 = P1， Pj-k+2 = P2，&#8230; Pj-1 = Pk-1. &nbsp; &nbsp; &nbsp;则当Pk<img src="//cto.wang/usr/uploads/2016/07/20160703163623-2.jpg" alt="" style="border: none" />Pj时应将模式向右滑动至以模式中的第next[k]个字符和主串中的第&nbsp;j&nbsp;个字符相比较。 &nbsp; &nbsp; &nbsp;若next[k] = k`,且Pj= Pk`, 则说明在主串中的第j+1 个字符之前存在一个长度为k` (即next[k])的最长子串，和模式串 &nbsp; &nbsp; &nbsp;从首字符其长度为看k`的子串箱等。即 &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;‘P(1) ….. P(k`)’ &nbsp;=&nbsp;&nbsp;‘P(j &#8211; k` + 1) ….. P(j)’&nbsp; &nbsp; &nbsp; &nbsp;也就是说next[j+1] = k` +1&nbsp;即 &nbsp; &nbsp;&nbsp;&nbsp;next[j+1] = next[k] + 1 &nbsp; &nbsp; &nbsp;同理，若Pj&nbsp;<img src="//cto.wang/usr/uploads/2016/07/20160703163623-2.jpg" alt="" style="border: none" />Pk`&nbsp;,则将模式继续向右滑动直至将模式串中的第next[k`]个字符和Pj对齐， &nbsp; &nbsp; &nbsp;&#8230; ,一次类推，直至Pj和模式中某个字符匹配成功或者不存在k`(1&lt; k` &lt; j)满足，则: &nbsp; &nbsp; &nbsp;next[j+1] =1;
&nbsp; &nbsp;&nbsp;<img src="//cto.wang/usr/uploads/2016/07/20160703163623-99.jpg" title="1428372964745609.jpg" alt="1.jpg" />
 

<ol start="1" class=" list-paddingleft-2">
<li>

</li>
<li>
<pre class="brush:python;toolbar:false">/************************************************************************/&nbsp;&nbsp;
/*&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;求子串next[i]值的算法&nbsp;
*/&nbsp;&nbsp;
/************************************************************************/&nbsp;&nbsp;
void&nbsp;GetNext(SString&nbsp;T,&nbsp;int&nbsp;next[])&nbsp;&nbsp;
{&nbsp;&nbsp;&nbsp;int&nbsp;j&nbsp;=&nbsp;1,&nbsp;k&nbsp;=&nbsp;0;&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;next[1]&nbsp;=&nbsp;0;&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;while(j&nbsp;&lt;&nbsp;T[0]){&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;if(k&nbsp;==&nbsp;0&nbsp;||&nbsp;T[j]==T[k])&nbsp;{&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;++j;&nbsp;&nbsp;++k;&nbsp;&nbsp;&nbsp;next[j]&nbsp;=&nbsp;k;&nbsp;&nbsp;&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;}&nbsp;else&nbsp;{&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;k&nbsp;=&nbsp;next[k];&nbsp;&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;}&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;}&nbsp;&nbsp;
}</pre>
</li>
</ol>
next&nbsp;函数值究竟是什么含义，前面说过一些，这里总结。设在字符串S中查找模式串T，若S[m]!=T[n],那么，取T[n]的模式函数值next[n],1.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;next[n] = 0&nbsp;表示S[m]和T[1]间接比较过了，不相等，下一次比较&nbsp;S[m+1]&nbsp;和T[1]2.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;next[n] =1&nbsp;表示比较过程中产生了不相等，下一次比较&nbsp;S[m]&nbsp;和T[1]。3.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;next[n] = k &gt;1&nbsp;但k&lt;n,&nbsp;表示,S[m]的前k个字符与T中的开始k个字符已经间接比较相等了，下一次比较S[m]和T[k]相等吗？4.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;其他值，不可能。
注意：
（1）k值仅取决于模式串本身而与相匹配的主串无关。
（2）k值为模式串从头向后及从j向前的两部分的最大相同子串的长度。
（3）这里的两部分子串可以有部分重叠的字符，但不可以全部重叠。
next[j]函数表征着模式P中最大相同前缀子串和后缀子串（真子串）的长度。
可见，模式中相似部分越多，则next[j]函数越大，它既表示模式T字符之间的相关度越高，也表示j位置以前与主串部分匹配的字符数越多。
即：next[j]越大，模式串向右滑动得越远，与主串进行比较的次数越少，时间复杂度就越低（时间效率）。

最后修改：2021 年 12 月 10 日 10 : 53 AM

如果觉得我的文章对你有用，请随意赞赏