Анализ времени выполнения запроса в параллельном колоночном хранилище данных - page 2

Ю.А. Григорьев, Е.Ю. Ермаков
2
Однако проектирование систем на основе колоночных систем
управления БД ведется на интуитивном уровне, а кроме того, не су-
ществует математических методов, позволяющих учитывать специ-
фику сложных запросов к хранилищу данных, которые используются
в процессе принятия решений. Поэтому разработка теоретических
методов, дающих возможность на этапе проектирования прогнозиро-
вать время работы параллельного колоночного хранилища данных
(ПКХД) с учетом специфики предметной области, является в насто-
ящее время актуальной.
В исследовательской работе, проводимой в МГТУ им.
Н.Э. Баумана, указанная задача решается путем разработки моделей
оценки времени выполнения запроса к ПКХД, учитывающих
особенности колоночного хранения данных, состав и параметры
выполнения запросов, структуру и наполнение хранилища, механизм
распределения таблиц по процессорам системы, параллелизм
выполнения запросов в узлах, режимы работы системы, структуру
сложного многопроцессорного аппаратно-программного комплекса.
В статье рассмотрено специфическое для параллельных колоноч-
ных хранилищ данных скрытое соединение и получена оценка вре-
мени выполнения запроса к хранилищу на основе математических
методов, предложенных авторами в статьях [11–14] с учетом особен-
ностей выполнения запросов к колоночным БД.
Организация работы колоночной системы БД.
Под строчным
хранением данных обычно понимают физическое хранение кортежа
любого отношения в виде одной записи, в котором значения атрибута
идут последовательно одно за другим, а за последним атрибутом
кортежа в общем случае следует новый кортеж отношения.
Таким образом, на физическом носителе отношение
R
представлено
в следующем виде:
 
11 21
1 12 22
2
1
2
,
, ,
,
, ,
n
n
a a a a a a
 
 
13 23
3 3
...
,
, ,
n
a a a
 
1 2
[
,
,
, ,
]
m m nm m
a a
a
 
 
где
ij
a
— значение атрибута
i
a
. в
j
-м кортеже
отношения
R
;
1 2
,
, ,
j
j
nj j
a a a
  
 
j
-й кортеж отношения
R
;
n
— ко-
личество атрибутов отношения
R
;
m
=
( )
T R
— количество кортежей
отношения
R
.
В колоночных системах управления БД (СУБД) значения одного
атрибута хранятся последовательно друг за другом [10], т.е. на физи-
ческом носителе отношение
R
примет следующий вид:
2
11 12 13
1
21 22 2
1
1
2
3
2 3
,
,
, ,
,
,
, ,
,
,
, ,
,
m
n n n
nm n
m
a a a a a a a a
a a a a
 
  
  
  
где
ij
a
— значение атрибута
i
a
в
j
-м кортеже отношения
R
;
1 2 3
,
, , ,
i
i
i
im i
a a a a
  
i
-й столбец (атрибут) отношения
R
.
1 3,4,5,6,7,8,9,10,11,12,...18
Powered by FlippingBook