Сравнение исходных текстов программ путем выравнивания последовательностей токенов - page 5

Сравнение исходных текстов программ путем выравнивания…

крайний левый столбец таблицы и новых сходных подпоследователь-

ностей не может быть найдено. В случае если

-й символ не входит в

подпоследовательность последовательности

, которой соответствует

похожая на нее подпоследовательность в последовательности

, пер-

вое в столбце (при просмотре ячеек сверху вниз) максимальное значе-

ние будет найдено в ячейке с индексом

= 0. В этом случае поиск

нижнего правого конца непрерывной диагонали продолжается в

столбце с индексом

− 1.

После нахождения правого нижнего конца диагонали осуществля-

ется

поиск входящих в диагональ ячеек

, который продолжается до тех

пор, пока не будет встречено нулевое значение в ячейке с индексами

> 0 и

> 0. При этом правый нижний конец диагонали включается в

последовательность пар символов, входящих в похожие последователь-

ности

. В противном случае осуществляется поиск новой диагона-

ли. Поиск завершается по достижении крайнего левого столбца табли-

цы, где

(

) принимает значение ( ) (пустая последовательность).

Такой поиск может быть описан следующей рекурсивной формулой:

 





 

( ),

(

)( 1),

( , )

(

)( 1),

( , ) , ( 1, 1) ,

p p i

p i j

p p i

T i j

i j p i

T i j









 

 



 





   







(7)

где

(

) — функция вычисления очередной пары в выравнива-

нии, следующей за парой (

) в общей последовательности





( , ) , ( 1, 1)

i j p i

 

(показана в виде вложенных пар, в программе реа-

лизована в виде списка), соответствующей парам символов

, вхо-

дящих в состав сходных подпоследовательностей последовательно-

стей

Как было отмечено, поиск диагоналей в таблице осуществляется

справа налево. Поскольку первая диагональ может быть найдена по

формулам (5) и (6), то последовательность всех пар символов, входя-

щих в непересекающиеся наиболее похожие подпоследовательности,

двух последовательностей может быть задана формулой



  

P p p w





(8)

где

— последовательность пар индексов (

), которая и является ис-

комым выравниванием.

Таким образом удается найти непрерывные непересекающиеся

сходные подпоследовательности в двух последовательностях.

SEO Version

Warning.

You are currently viewing the SEO version of !text.
It has a number of design and functionality limitations.

We recommend viewing the Flash version or the basic HTML version of this publication.

1,2,3,4 6,7,8,9,10,11,12,13