Анализ времени выполнения запроса в параллельном колоночном хранилище данных - page 14

Ю.А. Григорьев, Е.Ю. Ермаков
14
где
/2
0
( 1)
m
m
j
j
i
m i m j
j
C
 
   
(20)
— разность m-го порядка (при четном
m i
— целое, при нечетном —
полуцелое);
0
( ) (
)
i
i
x
x ih
     
(21)
соответствующие значения функции;
h
— шаг таблицы разностей.
Сравнение производительности соединения методом NLJ и
скрытого соединения в ПКХД.
Ниже приведено сравнение времени
выполнения запроса к хранилищу данных для скрытого соединения и
соединения методом NLJ [14]. Характеристики ресурсов (интенсив-
ности обработки) были получены с помощью программы синтетиче-
ских тестов AIDA64 [21]. Расчеты были выполнены при следующих
значениях характеристик ресурсов.
1. Процессор Intel Core i7-920 2.79GHz. Для выбранного процес-
сора измеренное значение числа процессорных циклов, выполняемых
в секунду, μ
P
= 2,79
10
9
(1/с).
2. Внешняя память
N
D
=250, диск 3,5'' Seagate Cheetah 15K.6
ST3146356FC; размер блока чередования (stripe size) (БЧ) Q
БЧ
= 64
Kб; среднее время поиска и чтения блока чередования с диска
t
БЧ
=
t
подвода
+
t
вращения
/2 +
Q
БЧ
/
v
чтения
= 4 + 4/2 + 64/200 = 6.3 мс. По-
этому интенсивность чтения блоков с диска μ
DB
= 1000/6,3= 160
(1/с),
p
D
=0,9.
3. Оперативная память DDR3-1600 PC3 — 12 800. Интенсивность
чтения одного байта информации из ОП μ
M
= 9586
1024
1024 (1/с).
В качестве примера был выбран аналитический запрос
Q
3 теста
TPC-H [22]. Схема базы данных тестовой среды приведена на рис. 6.
Коэффициент
sf
теста определяет объем обрабатываемых данных:
select
l_orderkey,
sum(l_extendedprice*(1-l_discount)) as revenue,
o_orderdate,
o_shippriority
from
customer,
orders,
lineitem
where
c_mktsegment = '[SEGMENT]'
and
c_custkey = o_custkey
and
l_orderkey = o_orderkey
and
o_orderdate < date '[DATE]'
and
l_shipdate > date '[DATE]'
1...,4,5,6,7,8,9,10,11,12,13 15,16,17,18
Powered by FlippingBook