Manacher 算法
今天思考一道题的时候,学习了一些思路,其中 Manacher 算法很有必要记录下来。
这道题的内容是:
给定字符串,找到它的最长回文子串
最简单的思路莫过于找到给定字符串的所有子字符串,然后一个个的判断他们是否是回文字符串,在判断的时候用一个变量把最长的回文字符串记录下来就可以了;
判断是不是回文字符串很容易
function isPalindrome(str) {
var newStr = str.split("").reverse().join("");
return newStr === str ? true : false;
}
获得所有子串也很容易
function getSubstring(str){
var len = str.length;
for(var i=0; i<len; i++){
for(var j=i; j<len;j++){
console.log(str.substring(i,j+1));
}
}
}
这种简单粗暴的算法带来的后果就是:查找子串时间复杂度O(n^2),判断回文时间复杂度O(n),太费时间;浪费时间的主要原因是没有充分地利用获得的信息。
————————————————————分界线————————————————————————
Manacher算法非常巧妙,使用了一些辅助技巧使得整个算法的时间复杂度变为线性。
我们先明确两件事:
- 一个字符串是回文字符串,其中间位置为m。若他的子串S[i,i+x]为回文串,则相对于m对称的另一端子串S[2m-i, 2m-(i+x)]必然是回文串。
- 回文串必定是中心对称的,也就是:S[i] == S[2m-i]。
首先,Manacher算法使用了如下的一个技巧让我们不用考虑字符串的奇偶性问题:
每一个字符两边都加上一个特殊字符,比如以字符串"abba"为例,转换后变成"#a#b#b#a#"。这样一来字符串无论本来是奇数还是偶数,都会变成奇数。
function getNewString(str){
var newStr = '#';
for(i = 0;i<len;i++){
newStr += str[i]+'#';
}
}
然后设置了一个概念:创建一个新数组P, P[i]项表示以第i个字符为中心的回文字串的半径。比如
S # a # b # b # a #
P 1 2 1 2 5 2 1 2 1
通过表格可以发现,P[i]-1就是实际回文字串的长度(对应的是符号还是数字都没关系)。
所以我们的任务转化为了求解数组 P;
求解数组 P 是本算法核心,根据我的理解,将其概括为如下:
设置两个辅助参数:id 和 max;id表示当前边界最大的回文字符串的中心位置,max此回文字符串的边界值也就是id+p[i]
;
初始化一边数组P:
for(i = 0;i<newLen;i++){
p[i] = 0;
}
接下来开始讨论:
记 i 对应于中心点 id 的对应位置为j,即j = 2*id - i
;
如果当前已记载的最大边境max > i(即i位置是已知回文字符串内的一个位置),那么:
p[i] = Math.min(p[j], mx-i);
取比较小的值;i在id左边时,p[j]始终为0,是较小的值, i在id右边时则不一定。
目前确定的P[i]是回文半径范围能能确定的值,对于半径外的字符,因为不知能能否和已知回文串继续构成更大回文串,所以也要进行判断。
while ((newStr[i + p[i]] == newStr[i - p[i]]) && newStr[i + p[i]]){
p[i]++;
}
最后一步,当有更大的回文串出现时,更新max 和 id 的值
if (i + p[i] > mx) {
id = i;
mx = id + p[i];
}
整体代码
function getArrayP(str){
var p = [],
mx = 0,
id = 0;
var i;
var newStr = '#'; // 将字符串转化为奇数长度获取到新的字符串
var len = str.length;
for(i = 0;i<len;i++){
newStr += str[i]+'#';
}
var newLen = newStr.length;
for(i = 0;i<newLen;i++){
p[i] = 0;
}
// 获取到所有的子回文的长度值组成的数组
for (i = 0;i < newLen; i++) {
p[i] = mx > i ? Math.min(p[2*id-i], mx-i) : 1;
while ((newStr[i + p[i]] == newStr[i - p[i]]) && newStr[i + p[i]]){ // 超出其半径的位置再做额外判断
p[i]++;
}
// 当有更大的回文串出现时,更新中心位置和最大边界值
if (i + p[i] > mx) {
id = i;
mx = id + p[i];
}
}
return p;
}
获得数组 p 之后,我们就获取到P的最大值,上面的例子中,最大值是 p[4] = 5;因为回文半径算了自己在内,所以要减去1,所以回文字符串应该是从newStr[4-4]起,到newStr[4+4]为止。用newStr.subString(0,8)
方法获得字符串后,再去掉『#』符号就可以了;
newstr.subString(0, 8).split('#').join("");