Формирование индекса для поиска похожих изображений транспортных средств - page 11

Формирование индекса для поиска похожих изображений транспортных средств
11
нейронную сеть, основанную на двух сетях Кохонена, кластеризую-
щую входные данные. Обучающее множество состоит из входных
векторов. На вход сети поступает множество многомерных векторов
H
i
= [
h
1
,
h
2
, …,
h
L
].
Первый слой состоит из 20 нейронов. Количество выходных
классов будет соответствовать степени схожести хеш-векторов, а
значит, схожести ТС. Второй слой представляет собой совокупность
нейронных сетей Кохонена, динамически формируемых в результате
обучения первого слоя. Количество нейронов в выходном слое равно
M
= 65536 (2 Байт). Каждое число представляет собой группу схожих
изображений
 
,
1,
m
C m M
, т. е. определяются ядра классов
 
,
1,
m
C m M
в пространстве классов
C
так, чтобы меры близости
d
(
H
i
,
c
m
) были минимальны:
 
,
min
m i
i
p
d H c
, где
m
(
i
) — функ-
ция, которая определяет номер класса по индексу
p
множества хеш-
векторов {
H
i
}, задает разбиение на классы и является решением зада-
чи кластеризации. Ядра
c
m
являются весовыми коэффициентами
нейронов. Каждый нейрон сети Кохонена запоминает один класс,
т. е. величина выхода тем выше, чем ближе вектор к данному классу.
На выходном слое определяется наиболее схожий нейрон, у ко-
торого скалярное произведение весов и поданного на вход вектора
максимально. Вычисленный нейрон объявляется победителем (англ.
winner или best match unit, BMU), и происходит изменение направле-
ния вектора к максимально подходящему кластеру.
При обучении сеть подстраивается под закономерности входных
данных. Обучение начинается с инициализации весовых коэффици-
ентов значениями, равными
1/
L
, где
L
— длина хеш-вектора.
Таким образом, индекс строится средствами СУБД по числу дли-
ны 4 Байт (тип
int
на примере СУБД
Microsoft SQL Server 2012
), при-
чем в последнем числе будут использованы только младшие 2 Байт
(старшие 2 Байт оставить зарезервированными).
Перед подачей хеш-вектора в сеть происходит предобработка
данных:
• определение по каждой компоненте хеш-вектора среднего зна-
чения;
• смещение начала координат в среднюю точку;
• нормализация полученных векторов.
Результаты проведения экспериментов.
Для оценки работы ал-
горитма выбраны
N
= 10000 фотографий различных ТС, зафиксиро-
ванных фронтальной стороной к камере видеорегистрации, получен-
ных в формате JPEG, 384
272. Выбраны модели четырех марок ТС (по
2500 изображений в группе): Форд, Ауди, Митсубиси, Мерседес-Бенц.
1...,2,3,4,5,6,7,8,9,10 12,13,14
Powered by FlippingBook