久久精品国产亚洲AV麻豆网站,亚洲国产精品专区在线观看,亚洲欧洲AV无码专区

[轉(zhuǎn)]LCS

Posted on 2008-06-16 14:47 xan 閱讀(206) 評論(0) 編輯收藏所屬分類: Algorithms

最長公共子序列問題LCS

參考解答

動態(tài)規(guī)劃算法可有效地解此問題。下面我們按照動態(tài)規(guī)劃算法設(shè)計的各個步驟來設(shè)計一個解此問題的有效算法。

1.最長公共子序列的結(jié)構(gòu)

解最長公共子序列問題時最容易想到的算法是窮舉搜索法，即對X的每一個子序列，檢查它是否也是Y的子序列，從而確定它是否為X和Y的公共子序列，并且在檢查過程中選出最長的公共子序列。X的所有子序列都檢查過后即可求出X和Y的最長公共子序列。X的一個子序列相應(yīng)于下標序列{1, 2, …, m}的一個子序列，因此，X共有2^m個不同子序列，從而窮舉搜索法需要指數(shù)時間。

事實上，最長公共子序列問題也有最優(yōu)子結(jié)構(gòu)性質(zhì)，因為我們有如下定理：

定理: LCS的最優(yōu)子結(jié)構(gòu)性質(zhì)

設(shè)序列X=<x₁, x₂, …, x_m>和Y=<y₁, y₂, …, y_n>的一個最長公共子序列Z=<z₁, z₂, …, z_k>，則：

若x_m=y_n，則z_k=x_m=y_n且Z_k-1是X_m-1和Y_n-1的最長公共子序列；

若x_m≠y_n且z_k≠x_{m ，}則Z是X_m-1和Y的最長公共子序列；

若x_m≠y_n且z_k≠y_n ，則Z是X和Y_n-1的最長公共子序列。

其中X_m-1=<x₁, x₂, …, x_m-1>，Y_n-1=<y₁, y₂, …, y_n-1>，Z_k-1=<z₁, z₂, …, z_k-1>。

證明

用反證法。若z_k≠x_m，則<z₁, z₂, …, z_k,x_m>是X和Y的長度為k十1的公共子序列。這與Z是X和Y的一個最長公共子序列矛盾。因此，必有z_k=x_m=y_n。由此可知Z_k-1是X_m-1和Y_n-1的一個長度為k-1的公共子序列。若X_m-1和Y_n-1有一個長度大于k-1的公共子序列W，則將x_m加在其尾部將產(chǎn)生X和Y的一個長度大于k的公共子序列。此為矛盾。故Z_k-1是X_m-1和Y_n-1的一個最長公共子序列。
由于z_k≠x_m，Z是X_m-1和Y的一個公共子序列。若X_m-1和Y有一個長度大于k的公共子序列W，則W也是X和Y的一個長度大于k的公共子序列。這與Z是X和Y的一個最長公共子序列矛盾。由此即知Z是X_m-1和Y的一個最長公共子序列。
與 2.類似。

這個定理告訴我們，兩個序列的最長公共子序列包含了這兩個序列的前綴的最長公共子序列。因此，最長公共子序列問題具有最優(yōu)子結(jié)構(gòu)性質(zhì)。

2.子問題的遞歸結(jié)構(gòu)

由最長公共子序列問題的最優(yōu)子結(jié)構(gòu)性質(zhì)可知，要找出X=<x₁, x₂, …, x_m>和Y=<y₁, y₂, …, y_n>的最長公共子序列，可按以下方式遞歸地進行：當x_m=y_n時，找出X_m-1和Y_n-1的最長公共子序列，然后在其尾部加上x_m(=y_n)即可得X和Y的一個最長公共子序列。當x_m≠y_n時，必須解兩個子問題，即找出X_m-1和Y的一個最長公共子序列及X和Y_n-1的一個最長公共子序列。這兩個公共子序列中較長者即為X和Y的一個最長公共子序列。

由此遞歸結(jié)構(gòu)容易看到最長公共子序列問題具有子問題重疊性質(zhì)。例如，在計算X和Y的最長公共子序列時，可能要計算出X和Y_n-1及X_m-1和Y的最長公共子序列。而這兩個子問題都包含一個公共子問題，即計算X_m-1和Y_n-1的最長公共子序列。

與矩陣連乘積最優(yōu)計算次序問題類似，我們來建立子問題的最優(yōu)值的遞歸關(guān)系。用c[i,j]記錄序列X_i和Y_j的最長公共子序列的長度。其中X_i=<x₁, x₂, …, x_i>，Y_j=<y₁, y₂, …, y_j>。當i=0或j=0時，空序列是X_i和Y_j的最長公共子序列，故c[i,j]=0。其他情況下，由定理可建立遞歸關(guān)系如下：

3.計算最優(yōu)值

直接利用(2.2)式容易寫出一個計算c[i,j]的遞歸算法，但其計算時間是隨輸入長度指數(shù)增長的。由于在所考慮的子問題空間中，總共只有θ(m*n)個不同的子問題，因此，用動態(tài)規(guī)劃算法自底向上地計算最優(yōu)值能提高算法的效率。

計算最長公共子序列長度的動態(tài)規(guī)劃算法LCS_LENGTH(X,Y)以序列X=<x₁, x₂, …, x_m>和Y=<y₁, y₂, …, y_n>作為輸入。輸出兩個數(shù)組c[0..m ,0..n]和b[1..m ,1..n]。其中c[i,j]存儲X_i與Y_j的最長公共子序列的長度，b[i,j]記錄指示c[i,j]的值是由哪一個子問題的解達到的，這在構(gòu)造最長公共子序列時要用到。最后，X和Y的最長公共子序列的長度記錄于c[m,n]中。

Procedure LCS_LENGTH(X,Y);

begin

m:=length[X];

n:=length[Y];

for i:=1 to m do c[i,j]:=0;

for j:=1 to n do c[0,j]:=0;

for i:=1 to m do

for j:=1 to n do

if x[i]=y[j] then

begin

c[i,j]:=c[i-1,j-1]+1;

b[i,j]:="↖";

end

else if c[i-1,j]≥c[i,j-1] then

begin

c[i,j]:=c[i-1,j];

b[i,j]:="↑";

end

else

begin

c[i,j]:=c[i,j-1];

b[i,j]:="←"

end;

return(c,b);

end;

由于每個數(shù)組單元的計算耗費Ο(1)時間，算法LCS_LENGTH耗時Ο(mn)。

4.構(gòu)造最長公共子序列

由算法LCS_LENGTH計算得到的數(shù)組b可用于快速構(gòu)造序列X=<x₁, x₂, …, x_m>和Y=<y₁, y₂, …, y_n>的最長公共子序列。首先從b[m,n]開始，沿著其中的箭頭所指的方向在數(shù)組b中搜索。當b[i,j]中遇到"↖"時，表示X_i與Y_j的最長公共子序列是由X_i-1與Y_j-1的最長公共子序列在尾部加上x_i得到的子序列；當b[i,j]中遇到"↑"時，表示X_i與Y_j的最長公共子序列和X_i-1與Y_j的最長公共子序列相同；當b[i,j]中遇到"←"時，表示X_i與Y_j的最長公共子序列和X_i與Y_j-1的最長公共子序列相同。

下面的算法LCS(b,X,i,j)實現(xiàn)根據(jù)b的內(nèi)容打印出X_i與Y_j的最長公共子序列。通過算法的調(diào)用LCS(b,X,length[X],length[Y])，便可打印出序列X和Y的最長公共子序列。

Procedure LCS(b,X,i,j);

begin

if i=0 or j=0 then return;

if b[i,j]="↖" then

begin

LCS(b,X,i-1,j-1);

print(x[i]); {打印x[i]}

end

else if b[i,j]="↑" then LCS(b,X,i-1,j) 

else LCS(b,X,i,j-1);

end;

在算法LCS中，每一次的遞歸調(diào)用使i或j減1，因此算法的計算時間為O(m+n)。

例如，設(shè)所給的兩個序列為X=<A，B，C，B，D，A，B>和Y=<B，D，C，A，B，A>。由算法LCS_LENGTH和LCS計算出的結(jié)果如圖2所示。

y_j

┌

─

┐

x_i

│

↑

↖

│

←

│

↖

↑

↖

│

←

│

↑

↖

↑

│

←

│

↖

↑

↖

│

←

│

↑

↖

↑

│

↑

↖

↑

↖

│

↖

↑

↖

↑

│

└

─

┘

圖2 算法LCS的計算結(jié)果

5.算法的改進

對于一個具體問題，按照一般的算法設(shè)計策略設(shè)計出的算法，往往在算法的時間和空間需求上還可以改進。這種改進，通常是利用具體問題的一些特殊性。

例如，在算法LCS_LENGTH和LCS中，可進一步將數(shù)組b省去。事實上，數(shù)組元素c[i,j]的值僅由c[i-1,j-1]，c[i-1, j]和c[i,j-1]三個值之一確定，而數(shù)組元素b[i,j]也只是用來指示c[i,j]究竟由哪個值確定。因此，在算法LCS中，我們可以不借助于數(shù) 組b而借助于數(shù)組c本身臨時判斷c[i,j]的值是由c[i-1,j-1]，c[i-1,j]和c[i,j-1]中哪一個數(shù)值元素所確定，代價是Ο(1)時間。既然b對于算法LCS不是必要的，那么算法LCS_LENGTH便不必保存它。這一來，可節(jié)省θ(mn)的空間，而LCS_LENGTH和LCS所需要的時間分別仍然是Ο(mn)和Ο(m+n)。不過，由于數(shù)組c仍需要Ο(mn)的空間，因此這里所作的改進，只是在空間復(fù)雜性的常數(shù)因子上的改進。

另外，如果只需要計算最長公共子序列的長度，則算法的空間需求還可大大減少。事實上，在計算c[i,j]時，只用到數(shù)組c的第i行和第i-1行。因此，只要用2行的數(shù)組空間就可以計算出最長公共子序列的長度。更進一步的分析還可將空間需求減至min(m, n)。

新用戶注冊刷新評論列表


只有注冊用戶登錄后才能發(fā)表評論。




網(wǎng)站導(dǎo)航: 博客園 IT新聞 Chat2DB C++博客博問管理
相關(guān)文章: N! 的位數(shù) 快速排序 [zz]中國剩余公理+擴展歐幾里德算法 [轉(zhuǎn)]LCS

xan walking & thinking

學(xué)習(xí) 思考實踐

隨筆分類(34)

收藏夾(43)

隨筆檔案(35)

最新隨筆

最新評論

[轉(zhuǎn)]LCS

最長公共子序列問題LCS

參考解答

1.最長公共子序列的結(jié)構(gòu)

2.子問題的遞歸結(jié)構(gòu)

3.計算最優(yōu)值

4.構(gòu)造最長公共子序列

5.算法的改進

常用鏈接

tech

評論排行榜

閱讀排行榜

xan walking & thinking

學(xué)習(xí) 思考 實踐

隨筆分類(34)

收藏夾(43)

隨筆檔案(35)

最新隨筆

最新評論

[轉(zhuǎn)]LCS

最長公共子序列問題LCS

參考解答

1.最長公共子序列的結(jié)構(gòu)

2.子問題的遞歸結(jié)構(gòu)

3.計算最優(yōu)值

4.構(gòu)造最長公共子序列

5.算法的改進

常用鏈接

tech

評論排行榜

閱讀排行榜

學(xué)習(xí) 思考實踐