К вопросу о векторизации графических спектрограмм - page 3

К вопросу о векторизации графических спектрограмм
3
щие трекам локальных максимумов изменения спектра в частотно-
временной области. Каждый из выделенных контуров является неза-
мкнутой линией, содержащей информацию об изменении мгновен-
ной частоты и амплитуды компонента речевого сигнала (речевого
вокализма). При этом учитываются следующие особенности речевого
сигнала: средняя скорость изменения частоты основного тона, мини-
мальное расстояние между отдельными гармониками, взаимная кор-
реляция уровня сигнала для соседних следов фонообъектов. Это поз-
воляет повысить точность выделения контуров по спектрограмме
даже при высоком уровне шумов (отношение сигнал/шум –5 дБ в по-
лосе частот 0,3...3,4 кГц).
Информативными параметрами, описывающими речевой сигнал,
являются величина изменения амплитуды и частоты в пределах одно-
го контура, средняя длительность контура, максимальная скорость
изменения амплитуды и частоты, коэффициент корреляции между
соседними контурами и др.
Выделение контуров представляет собой задачу векторизации
изображения. Некоторые особенности решения этой задачи при об-
работке спектрограмм показаны на рис. 2.
Рис. 2.
Особенности формирования контуров по графической спектрограмме
Жирными линиями на рис. 2 отмечены выделенные контуры,
описывающие изменение частоты форманты по времени и амплиту-
де. Кружками обведены характерные ситуации, влияющие на форми-
рование контурного массива. В ситуации 1 на следующем спектраль-
ном срезе присутствуют два локальных максимума. В этом случае
1,2 4,5,6
Powered by FlippingBook