Алгоритм параллельной агрегации данных для визуализации данных о вербальном и невербальном поведении человека - page 1

1
УДК 004.9
Алгоритм параллельной агрегации данных
для визуализации данных о вербальном и невербальном
поведении человека
© Б.А. Князев
МГТУ им. Н.Э. Баумана, Москва, 105005, Россия
Рассмотрен метод визуализации поведения человека вербальной и невербальной
форм, представляющих собой данные большого объема. Приведены модель и алго-
ритм визуализации этих данных с использованием метода параллельной агрегации.
Предложена агрегирующая функция, выполняющая поиск экстремумов блоков
данных с помощью модернизированного алгоритма «reduction tree», что позволяет
приблизить сложность алгоритма к минимальной. Оптимизация осуществлена за
счет отображения данных в глобальную память видеопроцессора, большей
нагрузки каждого потока и использования меньшего количества потоков в одном
блоке. Представлены результаты сравнительного анализа пропускной способно-
сти центрального процессора и двух типов графического процессора, выполняю-
щих предложенный алгоритм.
Ключевые слова:
визуализация данных, биометрические данные, данные большой
размерности, графический процессор, снижение размерности.
Введение.
Вербальное и невербальное поведения могут рассмат-
риваться как процессы, изменяющиеся во времени. Для решения та-
ких задач, как безопасность, медицинская и психологическая диагно-
стика, робототехника и др., необходима объективная оценка
параметров данных процессов [1]. Оценка может осуществляться с
помощью интерпретации этих параметров в виде временных и ча-
стотных графиков. При этом частота движений частей тела и элементов
лица не превышает 10…12 Гц (≤ 12 Гц для пальцев рук [2, 3], ≤ 10 Гц
для жестов рук и движений тела в целом [3, 4] и ≤ 4 Гц для изменения
мимики лица [5]); около 90 % энергетической составляющей речевого
сигнала находится в диапазоне 100…5000 Гц [6]. Таким образом, из
теоремы Котельникова следует, что для исключения значительных по-
терь исходного сигнала частота дискретизации исследуемых в данной
работе невербальных и вербальных сигналов должна быть ≥ 25 кадров/с
и ≥ 10 КГц соответственно.
Длительность исследований, записанных на видео-и/или аудионо-
сители, может достигать нескольких часов. Следовательно, количество
отсчетов данных для визуализации
N
равно объему данных
:
N
N
= 3600
F L
точек,
(1)
где
L
— длительность исследования, ч;
F
— частота отсчетов, с.
/
1 2,3,4,5,6,7,8,9,10,11,...14
Powered by FlippingBook