Использование графовых баз данных в целях оптимизации анализа биллинговой информации - page 6

М.В. Бартенев, И.Э. Вишняков
6
рацию: Intel Core i5 3.1 GHz, 8 Gb DDR3, 1 Tb 7200 rpm hard drive,
Windows Server 2008 x64. В БД DEX и Neo4J значение размера кэша
устанавливалось равным 4 Gb. При работе с Neo4J Java Virtual
Machine запускалась со следующими параметрами: -d64 -server —
Xmx4096m -XX:+UseConcMarkSweepGC.
Для тестирования было предложено четыре набора данных, со-
держащих различное количество вершин и ребер, структура графа
при этом соответствовала типичной структуре биллинговой инфор-
мации. В самом маленьком количество объектов приблизительно
равно 1 млн, а в самом большом — 100 млн. Результаты тестирова-
ния представлены в табл. 1–4.
Таблица 1
16 000 вершин и 600 000 ребер
Тестовая
БД
Время, с
Размер
БД, Мб
импорта
данных
поиска соседей вер-
шины до максималь-
ного уровня
поиска пересечения
множеств соседей
для двух вершин
Neo4J
6
3
9
21
DEX
11
0,3
0,5
30
SQL Server
9
4
8
45
Таблица 2
100 000 вершин и 1 200 000 ребер
Тестовая
БД
Время, с
Размер Бб,
МБ
импор-
та дан-
ных
поиска соседей
вершины до макси-
мального уровня
поиска пересечения
множеств соседей
для двух вершин
Sones
78
23
50
1510 (RAM)
Neo4J
13
10
31
1308
DEX
20
0,4
0,7
1809
SQL Server
19
16
42
2835
Таблица 3
4 000 000 вершин и 38 000 000 ребер
Тестовая БД
Время, с
Размер Бб,
МБ
импорта
данных
поиска соседей
вершины до макси-
мального уровня
поиска пересечения
множеств соседей
для двух вершин
Sones
4150
301
622
5792 (RAM)
Neo4J
2430
Н/д
*
Н/д
*
5197
DEX
770
23
72
7238
SQL Server 2115
215
506
10 586
*
Нет данных.
1,2,3,4,5 7,8
Powered by FlippingBook