Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Учебное пособие 700350.doc
Скачиваний:
16
Добавлен:
01.05.2022
Размер:
3.39 Mб
Скачать

2.5 Математическая модель оценки рисков систем, построенная на основе множественного регрессионного анализа

Реальные явления, как правило, определяются большим числом одновременно и совокупно действующих факторов.

Рассмотрим часто встречающуюся на практике задачу оценки риска успешного завершения злоумышленниками DOS-атаки на компьютерные системы и попробуем оценить величину риска получения ущерба от проникновения в систему.

Исследуем зависимость величины Y – риска получения ущерба от реализации одной угрозы, приводящей к отказам и сбоям – от нескольких переменных X1, X2, . . . , Xn, влияющих на величину риска.

Пусть yi i-е наблюдение зависимой переменной Y, а xi1, xi2, . . . , xip – i-е наблюдения независимых переменных X1, X2, . . . , Xn.

Предположим (выдвинем гипотезу), что экспериментальные точки

(yi, xi1, xi2, . . . , xi p) располагаются вдоль кривой [75]

.

Рассмотрим нелинейную модель множественной регрессии вида:

, (2.39)

где вектор возмущений удовлетворяют следующим условиям:

а) Математические ожидания возмущения равны нулю:

;

б) Дисперсия возмущения постоянна для любого i:

;

в) Возмущения и не коррелированны:

.

Прологарифмируем по основанию е каждое из уравнений (2.39):

;

;

, (2.40)

где

, .

Запишем выражение (2.40) в матричной форме:

, (2.41)

где – столбец параметров,

– вектор возмущений (случайных ошибок),

– вектор значений зависимой переменой размера n.

Матрица значений независимых переменных размера имеет следующий вид

Запишем регрессионное соотношение, которое является оценкой (3):

. (2.42)

где параметр и вектор возмущений определяются следующим образом:

и являются соответственно статистическими оценками и .

Параметры могут быть определены методом наименьших квадратов. В результате получим уравнение

.

Откуда можно найти b, если предположить, что матрица является неособенной.

Если рассмотреть частный случай , то матрица будет иметь следующий вид:

.

Для вектора получим следующее выражение:

,

где – число измерений. В предположении, что матрица является неособенной, получим выражение для нахождения коэффициентов , :

, (2.43)

Значимость коэффициентов регрессии можно оценить, воспользовавшись тем фактом, что статистика имеет t-распределение Стьюдента с степенями свободы; – несмещенная оценка для коэффициентов .

На практике часто бывает необходимо сравнение влияния на зависимую переменную Z = ln Y различных независимых переменных

X1, X2, . . . , Xn в случае, когда эти переменные выражаются разными единицами измерения. Тогда используются так называемые стандартизованные коэффициенты и коэффициенты эластичности :

; ;

,

где – несмещенная оценка для переменных Xj ;

– несмещенная оценка для зависимой переменной Z = ln Y;

, - выборочные средние соответственно для переменных Xj и зависимой переменной Z.

Стандартизованный коэффициент регрессии показывает, на сколько величин изменится в среднем зависимая переменная Z при изменении только j-ой независимой переменной на величину .

Коэффициент эластичности показывает на сколько процентов (от средней) изменится в среднем Z при изменении только Xj на 1%.

Рассмотрим вектор оценок (2.43), и преобразуем это выражение, заменив в нем на , воспользовавшись соотношением (2.43). В результате получим

.

Таким образом, оценки параметров (2.43), найденные по выборке, будут содержать случайные ошибки.

Так как

,

(в силу предположения о том, что математическое ожидание возмущения равно нулю), то вектор есть несмещенная оценка параметра .

После построения модели оценим значимость уравнения регрессии, т.е. установим, соответствует ли полученная математическая модель экспериментальным данным, а так же проверим, достаточно ли включенных в уравнение объясняющих переменных для описания зависимой переменной [76, 77, 78].

Согласно основной идеи дисперсионного анализа имеем:

=

,

где

– общая вариация – сумма квадратов отклонений зависимой переменной от средней;

– сумма квадратов отклонений, обусловленная регрессией;

– остаточная сумма квадратов отклонений, характеризующая влияние неучтенных факторов, так как

.

Получим формулы для сумм квадратов отклонений , и .

;

,

так как

;

.

Выдвинем гипотезу

(при ).

Тогда гипотеза о равенстве нулю параметров регрессионной модели отвергается, если выполняется условие

,

где – табличное значение -критерия Фишера.

Одной из наиболее эффективных оценок адекватности регрессионной модели, мерой качества уравнения регрессии (т.е. мерой подгонки регрессионной модели к наблюденным значениям), характеристикой прогностической силы анализируемой регрессионной модели является коэффициент множественной детерминации , который вычисляется по формуле

или

.

Из последнего равенства получаем:

,

где , , -мерные векторы;

,

.

Так как , то .

Величина показывает, какая часть вариации зависимой переменной обусловлена вариацией объясняющих переменных.

Чем ближе к единице, тем лучше регрессия аппроксимирует эмпирические данные, тем точнее описывает зависимость между объясняющими переменными и зависимой переменной.

Если известен коэффициент детерминации , то критерий значимости параметров регрессионной модели может быть записан в виде:

,

где ; , так как в уравнении множественной регрессии оцениваются параметров.

Ранжировка объясняющих переменных, согласно величинам частных коэффициентов корреляции, позволяет определить относительный вес каждой из них, что дает возможность выдать рекомендации по определению наиболее рациональных направлений совершенствования систем в направлении уменьшения рисков.

Выводы по второй главе:

1. На основе анализа структурной специфики ЛВС и динамики информационных процессов, предложено использовать положения теории чувствительности для оценки защищенности.

2. Получена математическая модель оценки рисков ЛВС с использованием функций чувствительности.

3. Влияние отдельных взаимосвязанных между собой подсистем или частных показателей риска на показатель рисков всей ЛВС определено методами теории чувствительности с помощью математического аппарата корреляционно-регрессионного анализа.

4. Обоснована целесообразность использования аппарата множественной нелинейной регрессии и построена математическая модель оценки рисков от атак на локальную вычислительную сеть.

4. Применение модели дает возможность ранжировки объясняющих переменных, согласно величинам частных коэффициентов корреляции, позволяет определить относительный вес каждой из них, что дает возможность выдать рекомендации по определению наиболее рациональных направлений совершенствования систем в направлении уменьшения рисков.

5. Создано программное обеспечение, позволяющее проводить расчеты по построенным математическим моделям.