136
ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. “Приборостроение”. 2012
Комплексный метод.
С учетом изложенного выше, можно сде-
лать вывод о том, что описанные методы имеют свои достоинства и
недостатки, которые смогут в значительной степени компенсировать
друг друга. Поэтому в статье предложен комплексный метод, обоб-
щающий достоинства перечисленных методов. Алгоритм работы
комплексного метода представлен на рис. 3.
Суть алгоритма — последовательный поиск словоформы в слова-
рях Зализняка и ПроЛинг. Если в этих словарях словоформа отсут-
ствует, то к ней применяется аналитический метод выделения основы
с помощью алгоритма Snowball:
1)
Выделяется основа словоформы алгоритмом Snowball.
2)
Происходит поиск данной основы в словаре Шарова [3]. Если
основа найдена в словаре Шарова, то возвращается лексема, которой
соответствует данная основа. Если основа не была найдена, то шаг 1
Начало
Ввод
словоформы
Поиск
словоформы
по словарю
Зализняка А.А.
Определено?
Поиск
словоформы
по словарю
Про-Линг
Возврат
лексемы
Считаем
словоформу
лексемой
Конец
нет
нет
нет
да
i=0:1
Определение
основы по
Snowball
Поиск полученной
основы по
словарю Шарова
нет
да
Омонимия?
да
Выбор лексемы с
большей частотой
употребления по
словарю Шарова
да
нет
Определено?
Определено?
Рис. 3. Алгоритм работы комплексного метода