138
ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. “Приборостроение”. 2012
Результат работы алгоритма комплексного метода представлен в
табл. 6, соответствия словоформ, встреченных в тексте, лексемам,
определенных на шаге 3 работы алгоритма, т. е. найденных аналити-
чески — в табл. 7.
Таблица 6
Результат работы алгоритма комплексного метода
Слово
Частота
употребления
Слово
Частота
употреблений
Говорить
5
Он
11
Обед
4
Пирожок
3
Обедать
1
Попробовать
2
Обыкновение
1
Рыжик
3
Обыкновенный
3
Что
6
Таблица 7
Результат работы алгоритма комплексного метода на шаге 3
Слово
Лексема
Слово
Лексема
Напившись
Напиться
Говаривал
Говаривать
Говорил
Говорить
Подставляя Подставлять
Расспрашивал
Расспрашивать Приносила Приносить
Сообщал
Сообщать
Говорила
Говорить
Приблизившись Приблизиться Принимая
Принимать
Заедал
Заедать
Для сравнения в табл. 8 приведен результат работы алгоритма на
шаге 3 с использованием словарей Зализняка и ПроЛинг вместо сло-
варя Шарова.
Таблица 8
Результат работы комплексного алгоритма на шаге 3
с использованием словарей Зализняка и ПроЛинг
При детальном рассмотрении результатов, представленных в
табл. 7 и 8, можно сделать вывод, что использование словаря Шарова
является наиболее целесообразным для минимизации ошибок иден-
тификации лексем аналитическим методом.
Слово
Лексема, определенная по словарю
Зализняка
ПроЛинг
Напившись
Напаять
Напавший
Говорил
Говор
Говор
Приблизившись
Приблизительность Приблизивший
Приносила
Принос
Принос
Говорила
Говор
Говор