Алгоритм параллельной агрегации данных для визуализации данных о вербальном и невербальном поведении человека

1

УДК 004.9

Алгоритм параллельной агрегации данных

для визуализации данных о вербальном и невербальном

поведении человека

МГТУ им. Н.Э. Баумана, Москва, 105005, Россия

Рассмотрен метод визуализации поведения человека вербальной и невербальной

форм, представляющих собой данные большого объема. Приведены модель и алго-

ритм визуализации этих данных с использованием метода параллельной агрегации.

Предложена агрегирующая функция, выполняющая поиск экстремумов блоков

данных с помощью модернизированного алгоритма «reduction tree», что позволяет

приблизить сложность алгоритма к минимальной. Оптимизация осуществлена за

счет отображения данных в глобальную память видеопроцессора, большей

нагрузки каждого потока и использования меньшего количества потоков в одном

блоке. Представлены результаты сравнительного анализа пропускной способно-

сти центрального процессора и двух типов графического процессора, выполняю-

щих предложенный алгоритм.

Ключевые слова:

визуализация данных, биометрические данные, данные большой

размерности, графический процессор, снижение размерности.

Введение.

Вербальное и невербальное поведения могут рассмат-

риваться как процессы, изменяющиеся во времени. Для решения та-

ких задач, как безопасность, медицинская и психологическая диагно-

стика, робототехника и др., необходима объективная оценка

параметров данных процессов [1]. Оценка может осуществляться с

помощью интерпретации этих параметров в виде временных и ча-

стотных графиков. При этом частота движений частей тела и элементов

лица не превышает 10…12 Гц (≤ 12 Гц для пальцев рук [2, 3], ≤ 10 Гц

для жестов рук и движений тела в целом [3, 4] и ≤ 4 Гц для изменения

мимики лица [5]); около 90 % энергетической составляющей речевого

сигнала находится в диапазоне 100…5000 Гц [6]. Таким образом, из

теоремы Котельникова следует, что для исключения значительных по-

терь исходного сигнала частота дискретизации исследуемых в данной

работе невербальных и вербальных сигналов должна быть ≥ 25 кадров/с

и ≥ 10 КГц соответственно.

Длительность исследований, записанных на видео-и/или аудионо-

сители, может достигать нескольких часов. Следовательно, количество

отсчетов данных для визуализации

N



равно объему данных

:

N

= 3600

F L

точек,

(1)

где

L

— длительность исследования, ч;

F

— частота отсчетов, с.

/

Алгоритм параллельной агрегации данных для визуализации данных о вербальном и невербальном поведении человека - page 1

Warning.