Метод идентификации человека по голосу - page 6

К.Л. Тассов, Р.А. Дятлов
6
Перевод из шкалы герц в шкалу мелов и обратно происходит по
следующим формулам:
( )
1127, 01048ln 1
700
hz
mel
hz
f
F f
=
+⎜
;
(5)
(
)
(
)
/1127,01048
700
1
mel
f
hz mel
F f
e
=
.
(6)
МЧКК — это значения кепстра, распределенные по мел-шкале с
использованием банка фильтров.
Существует алгоритм нахождения МЧКК.
1. Прошедший предварительную обработку сигнал
s
[
t
] разбивает-
ся на
K
кадров по
N
отсчетов, пересекающихся на половину длины:
[ ]
[ ]
,
1,...,
n
s t
S t n
K
→ =
.
2. В каждом кадре проводится получение комплексного пред-
ставления сигнала по частотам.
3. Находится спектральная плотность мощности получившегося
сигнала:
[ ]
[ ]
2
n
n
P k A k
=
;
(7)
[ ]
[ ]
[ ]
2
2
Re
Im
n
n
n
A k
X k
X k
=
+
.
(8)
4. Применение банка фильтров (рис. 8):
а) задается количество фильтров, а также начальная
f
1
и конечная
f
h
частоты (
f
h
не должна превосходить половины частоты дискретиза-
ции);
б) далее они переводятся в мелы:
( )
( )
,
;
m
l
mel
l
m
h
mel
h
f
F f
f
F f
=
=
в) на мел-шкале отрезок
,
m m
l
h
f f
разбивается на
P
+ 1 равных
непересекающихся подотрезков
1
,
m m
j
j
f
f
+
, 1 ≤ 1 ≤
P
+ 1 длины
1
m m
h
l
f
f
len
P
=
+
;
(9)
г) находятся их центры:
[ ]
, 1
m
m
l
C i
f
i len i P
= + ⋅
≤ ≤
;
(10)
и, переводя в шкалу Гц,
1,2,3,4,5 7,8,9,10
Powered by FlippingBook