Manacher 算法

今天思考一道题的时候,学习了一些思路,其中 Manacher 算法很有必要记录下来。
这道题的内容是:

给定字符串,找到它的最长回文子串

最简单的思路莫过于找到给定字符串的所有子字符串,然后一个个的判断他们是否是回文字符串,在判断的时候用一个变量把最长的回文字符串记录下来就可以了;
判断是不是回文字符串很容易

function isPalindrome(str) {
var newStr = str.split("").reverse().join("");
return newStr === str ? true : false;
}

获得所有子串也很容易

function getSubstring(str){
    var len = str.length;
    for(var i=0; i<len; i++){
        for(var j=i; j<len;j++){
            console.log(str.substring(i,j+1));
        }
    }
}    

这种简单粗暴的算法带来的后果就是:查找子串时间复杂度O(n^2),判断回文时间复杂度O(n),太费时间;浪费时间的主要原因是没有充分地利用获得的信息。

————————————————————分界线————————————————————————

Manacher算法非常巧妙,使用了一些辅助技巧使得整个算法的时间复杂度变为线性。
我们先明确两件事:

  • 一个字符串是回文字符串,其中间位置为m。若他的子串S[i,i+x]为回文串,则相对于m对称的另一端子串S[2m-i, 2m-(i+x)]必然是回文串。
  • 回文串必定是中心对称的,也就是:S[i] == S[2m-i]。

首先,Manacher算法使用了如下的一个技巧让我们不用考虑字符串的奇偶性问题:
每一个字符两边都加上一个特殊字符,比如以字符串"abba"为例,转换后变成"#a#b#b#a#"。这样一来字符串无论本来是奇数还是偶数,都会变成奇数。

function getNewString(str){
    var newStr = '#';   
    for(i = 0;i<len;i++){  
        newStr += str[i]+'#';  
    }  
}

然后设置了一个概念:创建一个新数组P, P[i]项表示以第i个字符为中心的回文字串的半径。比如

S  #  a  #  b  #  b  #  a  #  
P  1  2  1  2  5  2  1  2  1

通过表格可以发现,P[i]-1就是实际回文字串的长度(对应的是符号还是数字都没关系)。
所以我们的任务转化为了求解数组 P;
求解数组 P 是本算法核心,根据我的理解,将其概括为如下:
设置两个辅助参数:id 和 max;id表示当前边界最大的回文字符串的中心位置,max此回文字符串的边界值也就是id+p[i]
初始化一边数组P:

 for(i = 0;i<newLen;i++){  
        p[i] = 0;  
    }

接下来开始讨论:
记 i 对应于中心点 id 的对应位置为j,即j = 2*id - i;
如果当前已记载的最大边境max > i(即i位置是已知回文字符串内的一个位置),那么:

p[i] = Math.min(p[j], mx-i);

取比较小的值;i在id左边时,p[j]始终为0,是较小的值, i在id右边时则不一定。
目前确定的P[i]是回文半径范围能能确定的值,对于半径外的字符,因为不知能能否和已知回文串继续构成更大回文串,所以也要进行判断。

while ((newStr[i + p[i]] == newStr[i - p[i]]) && newStr[i + p[i]]){  
            p[i]++;  
        }  

最后一步,当有更大的回文串出现时,更新max 和 id 的值

if (i + p[i] > mx) {  
            id = i;  
            mx = id + p[i];  
        }  

整体代码

function getArrayP(str){  
    var p = [],   
        mx = 0,  
        id = 0;  
    var i;  
     
    var newStr = '#';       // 将字符串转化为奇数长度获取到新的字符串 
    var len = str.length;  
    for(i = 0;i<len;i++){  
        newStr += str[i]+'#';  
    }  
    
    var newLen = newStr.length;  
    for(i = 0;i<newLen;i++){  
        p[i] = 0;  
    }  
    
    // 获取到所有的子回文的长度值组成的数组  
    for (i = 0;i < newLen; i++) {  
        
        p[i] = mx > i ? Math.min(p[2*id-i], mx-i) : 1;   
        
        while ((newStr[i + p[i]] == newStr[i - p[i]]) && newStr[i + p[i]]){           // 超出其半径的位置再做额外判断  

            p[i]++;  
        }  
        
        // 当有更大的回文串出现时,更新中心位置和最大边界值
        if (i + p[i] > mx) {  
            id = i;  
            mx = id + p[i];  
        }  
    }  
    return p;  
}  

获得数组 p 之后,我们就获取到P的最大值,上面的例子中,最大值是 p[4] = 5;因为回文半径算了自己在内,所以要减去1,所以回文字符串应该是从newStr[4-4]起,到newStr[4+4]为止。用newStr.subString(0,8)方法获得字符串后,再去掉『#』符号就可以了;

newstr.subString(0, 8).split('#').join("");
Comments
Write a Comment