148
ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. “Приборостроение”. 2012
УДК 004.052.42
В.И. К у з о в л е в , А.О. О р л о в
ВЕРОЯТНОСТНЫЙ ПОДХОД
К ОЦЕНКЕ ПОКАЗАТЕЛЯ ДОСТОВЕРНОСТИ
ЭЛЕМЕНТОВ РЕЗУЛЬТАТОВ ПРОФИЛИРОВАНИЯ
Рассмотрены показатели достоверности информационных элемен-
тов как результатов процесса профилирования данных. Описаны
методы оценки показателей достоверности и их недостатки. Пред-
ложены оператор Tr, упорядочивающий элементы внутри отдельно
взятого класса профилирования, а также формула для расчета зна-
чения оператора.
E-mail:
Ключевые слова
:
профилирование, классы профилирования, показатели
достоверности, стратегии повышения качества данных.
Введение.
Для анализа и контроля достоверности данных разра-
ботаны средства и методы, позволяющие оценить базовые показатели
достоверности на основе принятых в этих методах моделей. Сред-
ствами контроля качества данных являются репозитории метадан-
ных, средства профилирования информации, системы управления
базами данных и др. Также разработаны методы, основанные как на
анализе самих данных, так и процессов их формирования и преобра-
зования в процессе функционирования систем.
В работе [1] для оценки показателей достоверности используется
набор графов: граф ошибок
ε
(
π
);
индикаторный граф
J
(
π
);
информа-
ционный граф
I
(
π
).
Информационный граф
I
(
π
)
определяет общую
технологию обработки данных. На его основе строится индикатор-
ный граф
J
(
π
),
который отображает события возникновения ошибок в
обрабатываемых информационных элементах. Граф ошибок
ε
(
π
)
фор-
мируется на базе индикаторного графа, его вершинами также явля-
ются индикаторы переменных логических функций, а дуги отобра-
жают причинно-следственные связи между индикаторами событий
ошибки.
Схема технологии возникновения и распространения искажений,
основными элементами которой являются процессы формирования
информационных элементов и связывающие их потоки искажений,
предложена в работе [2]. Схема делится на два уровня: уровень
обобщения потоков и уровень детализации процессов. Первый уро-
вень содержит информацию о процессах формирования информаци-
онных элементов и потоках искажений, связывающих эти процессы.
Выделяются первичные и целевые процессы, учитывается степень
детализации проведения исследования, определяются общие особен-
ности технологии возникновения и распространения искажений в ав-