Использование информации о динамике изменений человеческого лица для решения задач распознавания и классификации - page 9

Использование информации о динамике изменений человеческого лица
9
Результатом применения оператора ко всему изображению ана-
логично по формуле (4) является гистограмма, которая впоследствии
может быть подана на вход классификатору для дальнейшей обра-
ботки.
Описание эксперимента.
Размеченная база данных с тестовыми видеоизображениями.
При составлении тестовой базы данных были установлены следующие
признаки, которые необходимо учитывать при разработке метода:
количество людей в сцене;
ракурс, в котором человек движется в сцене;
динамичный или статичный фон;
проблемы, связанные с качеством изображений, разрешением,
наличием шума.
Основными же признаками, по которым составляется база дан-
ных, являются:
пол человека;
возраст человека.
Требования, которыми руководствовались авторы для составле-
ния базы данных:
разные сцены;
разные положения людей (разные признаки).
При составлении базы каждой записи ставится в соответствие
вектор признаков, который описывает экспертную оценку видеопо-
тока по описанным признакам.
Оценка результатов.
В качестве меры оценки точности работы
методов используется так называемая частота распознавания, которая
рассчитывается по формуле:
P
N
E
N
=
,
(8)
где
N
P
— количество верно распознанных фрагментов,
N
— количе-
ство распознаваемых фрагментов.
Исходные данные и постановка задач.
Для сравнения описан-
ных подходов используются тестовые данные, которые предоставля-
ются организациями, ведущими научные исследования в сфере ком-
пьютерного зрения. В зависимости от решаемых задач используются
наборы данных:
CRIM состоит из 591 видеофрагмента, размер кадров 130
×
150
пикселей [18];
VidTIMIT включает в себя 720 видеоизображений, размер кад-
ров 320
×
240 пикселей [19].
В качестве параметров алгоритма ЛБШ выбираются следующие:
1,2,3,4,5,6,7,8 10,11,12,13,14,15
Powered by FlippingBook