Использование графовых баз данных в целях оптимизации анализа биллинговой информации - page 2

М.В. Бартенев, И.Э. Вишняков
2
основная модель данных в них — классический математический
граф. Проекты в области графовых БД начали появляться с конца
1980-х годов, однако в большей степени носили академический ха-
рактер [2, 3]. В последнее время наблюдается бурный рост интереса к
графовым БД в связи с тем, что такая система представления данных
оказалась естественной и востребованной в современном мире раз-
личных социальных связей (Интернет, социальные сети и т. д.).
К достоинствам графовых моделей БД по сравнению с традиционной
реляционной моделью исследователи относят не только возможность
естественной реализации графовых операций (поиска путей, выделе-
ния сообществ и т. п.), но и гибкую схему данных, позволяющую
унифицировать хранение разнородных объектов [1, 4].
Биллинг оператора сотовой связи представляет собой информа-
цию обо всех звонках за определенный период внутри сотовой сети.
Эти данные естественным образом представляются в виде графа, где
вершина — абонент, а ребро — звонок между абонентами. За по-
следние годы наблюдается существенный рост активности абонентов
сотовой связи и, соответственно, кратное увеличение объемов бил-
линговой информации. Следовательно, все более и более долгой и
трудоемкой становится обработка с помощью реляционных храни-
лищ. Вариантом оптимизации такой обработки могут стать аналити-
ческие задачи, решаемые с помощью графовых БД.
В данной статье будет рассмотрено три различных реализации
нереляционных графовых БД, ядро каждой из которых написано на
разных языках программирования: Sones (C#) [5], Neo4J (Java) [6] и
DEX (C++) [7]. Цель рассмотрения этих хранилищ — оценка их воз-
можностей по легкой и быстрой работе с графовыми данными и уве-
личению скорости обработки биллинговой информации. Для реше-
ния поставленной задачи будет проведена оценка производительно-
сти операций импорта данных и двух наиболее востребованных задач
анализа биллинга. Кроме того, для сравнения будут предложены ре-
зультаты этих же задач, реализованных с помощью реляционной ба-
зы данных Microsoft SQL Server 2012 [8].
Задачи анализа биллинговой информации.
Будем называть
графом упорядоченную пару
G
:=
(
V
,
E
), в которой
V
— непустое
множество вершин, а
Е
— множество пар вершин, представляющих
ребра. В случае ориентированного графа пары в
E
упорядочены.
Рассмотрим операции, с помощью которых тестировались графо-
вые БД. Первая задача, которую необходимо реализовать, — импорт
графа из файла определенной структуры в БД. Данные хранятся в
текстовых файлах, где каждая строка описывает ребро графа и имеет
следующий вид:
{link_id; source_node; destination_node}
.
1 3,4,5,6,7,8
Powered by FlippingBook