Анализ времени выполнения запроса в параллельном колоночном хранилище данных - page 1

1
УДК 004.657
Анализ времени выполнения запроса в параллельном
колоночном хранилище данных
© Ю.А. Григорьев, Е.Ю. Ермаков
МГТУ им. Н.Э. Баумана, Москва, 105005, Россия
Проанализирован специфичный для параллельных колоночных хранилищ данных
план запроса со скрытым соединением. Приведено преобразование Лапласа —
Стилтьеса времени обработки запроса с подобным планом в параллельном коло-
ночном хранилище данных. Выполнено сравнение среднего времени выполнения за-
проса со скрытым соединением и пересечением NLJ.
Ключевые слова
: колоночное хранилище данных, колоночные базы данных, парал-
лельные базы данных, преобразование Лапласа — Стилтьеса, скрытое соединение.
Введение.
Являясь одними из наиболее значимых элементов ИТ-
инфраструктуры предприятия, базы данных (БД) консолидируют ин-
формацию, необходимую для создания достоверных аналитических и
управленческих отчетов. Они являются одними из крупнейших ис-
точников информации для современных аналитиков и, по оценке
Gartner [1], в ближайшей перспективе останутся ключевым компо-
нентом ИТ-инфраструктуры предприятий.
При оценке характеристик производительности на этапе проек-
тирования БД необходимо учитывать особенности предметной обла-
сти. Результаты исследований [2] показывают, что при расчете вре-
мени реакции информационной системы надо учитывать параметры
приложений: алгоритмы, запросы к БД и т.д. Время обработки этих
запросов достаточно велико, его доля в общем времени выполнения
прикладных программ превышает 90 %.
Методы анализа временны´х характеристик для параллельных строч-
ных БД (Oracle, MS SQL Server и т. д.), учитывающих специфику за-
просов к базе данных, уже разработаны и представлены в работах [2–
6]. Но в настоящее время внедряются новые системы управления БД
с иной организацией хранения данных, получившие название парал-
лельных колоночных БД (ПКБД) [7–9]. Они впервые были внедрены
при разработке больших БД, используемых при поддержке принятия
решения, в частности, в аналитических расчетах, и сразу же дали хо-
рошие результаты: почти 200-кратное сокращение объема ввода-
вывода по сравнению с аналогичными строчными БД и значительное
уменьшение времени выполнения запросов [8]. Это достигается за
счет того, что из БД читаются только атрибуты (столбцы), участву-
ющие в запросе, а также применяются эффективные методы сжатия
столбцов [10].
1 2,3,4,5,6,7,8,9,10,11,...18
Powered by FlippingBook