ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. “Приборостроение”. 2012
49
рактерные для телефонных каналов связи. В ЦРТ разработан алго-
ритм детектирования музыкальных фрагментов на основании дина-
мики спектральных максимумов [2]. Экспериментальные исследова-
ния представительной базы показали, что этот алгоритм имеет бóль-
шую эффективность, чем существующие аналоги. Малое значение
ошибки (11 %), а также простота данного алгоритма удовлетворяют
требованиям реальных приложений.
Рис. 1. Схема предварительной обработки речевого сигнала (выделение
на речевом сигнале участков, содержащих речь дикторов)
Важным компонентом является детектор речевой активности (Voice
Activity Detector, VAD). Основное внимание при разработке VAD-
алгоритма уделяется выделению шумоустойчивых признаков и выбору
правил классификации речь – не речь. Как правило, используются алго-
ритмы на основе анализа энергии сигнала, обнаружения основного тона,
спектрального и кепстрального анализа, измерений числа переходов
сигнала через нуль [3, 4]. Несмотря на значительное количество реали-
заций VAD-алгоритма и многочисленные исследования, существующие
решения не полностью отвечают требованиям, продиктованным осо-
бенностями задачи идентификации личности по голосу.