Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

511_SHerstneva_O._G._Modelirovanie_funktsionirovanija_ehlementov__

.pdf
Скачиваний:
4
Добавлен:
12.11.2022
Размер:
1.48 Mб
Скачать

Федеральное государственное образовательное бюджетное учреждение высшего профессионального образования

«Сибирский государственный университет телекоммуникаций и информатики» (ФГОБУ ВПО «СибГУТИ»)

О.Г. Шерстнева

МОДЕЛИРОВАНИЕ ФУНКЦИОНИРОВАНИЯ ЭЛЕМЕНТОВ ТЕЛЕКОММУНИКАЦИОННЫХ СЕТЕЙ И РАЗРАБОТКА МЕТОДА РАСЧЕТА ПОКАЗАТЕЛЕЙ НАДЕЖНОСТИ

Учебное пособие

Новосибирск 2012

1

УДК625.395.7:51

Шерстнева О.Г.

Моделирование функционирования элементов телекоммуникационных сетей и разработка метода расчета показателей надежности: Учебное пособие. О.Г. Шерстнева. – Новосибирск: ГОУ ВПО «СибГУТИ», 2012. – 65с.

Учебное пособие имеет научно-исследовательскую направленность и предназначено для подготовки магистров, аспирантов по специальности 210406 «Сети связи и системы коммутации» по направлению 21000 «Телекоммуникации». Также может быть использовано при изучении соответствующих дисциплин близких по тематике направлений в других высших учебных заведениях.

Приведены особенности работы пунктов сетевого управления, методы оценки соответствия требованиям по надежности сетевых элементов, составлены математические модели и разработан метод расчета показателей надежности по данным системы управления и мониторинга сетью.

Рекомендовано ГОУ ВПО «СибГУТИ» в качестве учебного пособия для магистрантов и аспирантов вышеперечисленных направлений и специальностей.

Кафедра автоматической электросвязи

©ГОУ ВПО «СибГУТИ», 2012

©Шерстнева О.Г., 2012

2

Новосибирск 2012

Содержание

Введение……………………………………………………………………………..

4

Раздел 1. Анализ методов обеспечения надежности в телекоммуникацион-

 

ных сетях……………………………… ……………………………

5

1.1.Особенности работы центральных пунктов сетевого управле-

ния……………………………………………………………………. 5

1.2.Методы оценки соответствия элементов сети требованиям по на-

дежности…………………………………………………………….. 10

1.3. Виды контроля технического состояния сетевого элемента……. 15 Раздел 2. Разработка математической модели функционирования сетевых

элементов с учетом особенностей системы контроля и управле-

ния……………………………………………………………………. 19

2.1.Разработка математической модели функционирования сетевого элемента при достоверной комбинированной системе контроля и управления…………………………………………………………… 20

2.2.Исследование влияния ошибок системы контроля и управления на показатели надежности контролируемых объектов.. …………. 25

Раздел 3. Разработка метода расчета показателей надежности сетевого элемента на основе данных системы контроля и управле-

ния……………………………………………………………………. 30

3.1.Разработка модели технического обслуживания сетевого элемен-

та……………………………………………………………………… 31

3.2.Разработка метода расчета показателей надежности с учетом данных сетевого мониторинга……………………............................ 34

3.3.Пример использования разработанного метода расчета показате-

лей надежности……………………………………………………… 43

Раздел 4. Методика сбора и обработки статистических данных системы контроля и управления……………………………………………… 52

4.1.Постановка задачи сбора и обработки статистических дан-

ных……………………………………………………………………. 52

4.2.Оценка средней наработки на отказ………………………………... 53

4.3. Оценка среднего времени восстановления………………………… 55

4.4.Оценка вероятностей состояний……………………………………. 56

4.5.Оценка показателей надежности …………………………………... 57

4.6.Оценка интенсивности событий для случая полностью и неполностью определенной выборки……………………………………... 60

Раздел 5. Рекомендации по сбору и обработке статистических дан-

ных……………………………………………………………………. 64 Заключе- ………………………………………………………………………… 76

ние Приложе-

ние А ………………………………………………………………………… 77

Список литературы ………………………………………………………………………… 79

3

Введение.

В настоящее время исследователи и разработчики современных систем управления решают задачи, связанные, прежде всего, с управлением трафиком, оперативным перестроением сети и обеспечением достоверности передачи информации. Однако заслуживает внимание и тот факт, что для эффективного решения необходимо использовать информацию, получаемую от систем управления и контроля, а также учитывать надежность работы отдельных сетевых элементов. При эксплуатации телекоммуникационных сетей возникает множество нештатных ситуаций, обусловленных нестационарностью входящей нагрузки и конечной надежностью не только сетевых элементов, но и элементов самой системы контроля и диагностики. Каждая такая задача порождает специфическую прикладную задачу, при решении которой определяется вид соответствующего управляющего воздействия. Модели сетей связи с учетом управления разработаны, как правило, с использованием предположений об идеальной надежности сетевых элементов. Однако, исследования в этой области показывают, что уменьшение коэффициента готовности на 0,01 и 0,025 приводит к увеличению вероятности потерь на 8% и 20% соответственно [14]. Таким образом, учет параметров надежности в моделях сетей – вопрос актуальный. Как показывает опыт эксплуатации, существующие методы сетевого мониторинга и диагностики сами по себе не гарантируют достоверное обнаружение и локализацию отказов и не могут оперативно предотвратить перегрузку маршрутов и вносить изменения в протоколы маршрутизации. Это объясняется несовершенством существующих методов анализа и обработки статистических данных, что определяет необходимость проведения дальнейших работ в этом направлении.

4

1.Анализ методов обеспечения надежности в телекоммуникационных сетях.

1.1. Особенности работы центральных пунктов сетевого управле-

ния.

В связи с интенсивным внедрением новых технологий, позволяющих операторам телекоммуникационных сетей предоставлять пользователям широкий спектр современных услуг связи, произошло значительное усовершенствование самих сетей связи. При этом возрастают и требования, предъявляемые к пропускной способности сети. Удовлетворение этих требований в основном происходит за счет использования большого числа протоколов и механизмов для контроля и управления сетевыми ресурсами. На первый взгляд внедрение на сеть множества разнородных подсистем, дополняющих друг друга и существенно улучшающих характеристики сети в целом, привело к созданию высоконадежных систем и сетей связи. Возможность постоянного наблюдения за состоянием сети, контроль за работоспособностью отдельных сетевых элементов, оперативное вмешательство в работу подсистем управления в случае обнаружения перегрузки на сети или сбоя при обслуживании группы вызовов обеспечивает достаточно высокие показатели надежности ее эксплуатации. Однако, при анализе эффективности функционирования сложных систем, к которым, безусловно, относится и современная сеть связи, исследователями этой области были выявлены недостатки, которые заслуживают отдельного рассмотрения. Например, передача служебных сигналов различными телекоммуникационными протоколами, используемыми для управления элементами сети на разных уровнях функционирования, согласно модели взаимодействия открытых систем, занимает до 20% всей пропускной способности. Также, при обнаружении неисправности в одном элементе сети, не предусматривается автоматическая инициализация, в результате чего обнаруживается значительная задержка информации. Если добавить к этому, что внутренняя система контроля сетевого элемента охватывает только определенный перечень отказов и неисправностей и не учитывает нарушения нормальной работы, произошедшие по вине обслуживающего персонала или вызванные воздействием внешних факторов, то вопрос какие статистические данные необходимо обрабатывать для определения достоверных показателей надежности сетей связи остается актуальным. Разработка определенной методики сбора и обработки данных сетевого мониторинга так же представляет интерес. Применение статистических методов оценки технологических процессов в телекоммуникационных сетях определило задачу выявления круга статистических данных (эксплуатационных показателей надежности) с помощью которых впоследствии можно определить расчетные качественные показатели работоспособности всей сети с учетом ее конфигурации, технической оснащенности и т.п. Предъявляемые требования к увеличению объѐмов передаваемого трафика, повышению показателей качества, надѐжности и ус-

5

тойчивости функционирования сетей связи, совершенствованию процедур работы с пользователями также подтверждают сделанный вывод.

Анализируя работу системы оперативного контроля и диагностики на реальных сетях можно говорить о том, что в настоящее время развитие цифровых телекоммуникационных сетей требует разработки автоматизированной системы управления на новом уровне с целью обеспечения комплексного автоматизированного управления первичной и вторичными цифровыми сетями для повышения эффективности использования сетевых ресурсов [31].

В Рекомендациях МСЭ-Т по TMN (Рекомендации М и Q , в частности М3010, М3200, М3400) задачи всякой системы управления сетями связи определены как функциональные области управления, к которым относятся управление конфигурацией сети, управление устранением последствий отказов, управление качеством, управление взаиморасчетами, управление защитой информации (безопасность).

При управлении конфигурацией решаются следующие задачи:

-формирования и развития сети;

-реконфигурации сети;

-планирования работ при масштабировании сети и услуг связи;

-создания и ведения банка данных.

При управлении устранением последствий отказов должны решаться задачи:

-организации контроля за состоянием сети и ее элементов в реальном масштабе времени;

-обнаружения и локализации неисправностей;

-восстановления связей;

-оперативного перестроения сети;

-устранения неисправностей;

-оповещение пользователей о проводимых работах.

При управлении качеством должны быть решены задачи:

-сбора и анализа статистических данных по функционированию сетей и их элементов;

-регулирования трафика;

-разработки рекомендаций по улучшению эксплуатационных характеристик телекоммуникационных сетей, улучшению и расширению диапазона предоставления услуг связи;

-анализа функционирования систем управления и контроля с целью усовершенствования методов управления сетями связи.

При управлении расчетами должны решаться задачи:

-сбора данных по предоставляемым (арендуемым) средствам и услугам

связи;

-разработки тарифов за предоставляемые средства связи и услуги;

-проведение взаиморасчетов межу участниками предоставления услуг. При управлении защитой информации должны решаться задачи:

6

-разработки мер по обеспечению закрытости информации, контроль за их осуществлением;

-защиты баз данных от несанкционированного доступа;

-соблюдения конфиденциальности при предоставлении данных;

-классификации уровня безопасности сети связи.

Все перечисленные задачи тесно взаимосвязаны между собой. Невозможно решить задачу реконфигурации сети, оперативного перестроения сети, регулирования трафика без сбора и анализа статистических данных о функционировании отдельных элементов сети к которым относятся не только телекоммуникационное оборудование, но и системы передачи, линии связи.

Для того, чтобы обеспечить решение комплекса оперативных задач каждое подразделение оперативно-технического управления должно хранить массивы статической конфигурационной информации с целью описания сетевых узлов и станций, зоновых сетей, всех пунктов управления, а также иметь в своем распоряжении данные, влияющие на функционирование всех составляющих телекоммуникационной сети.

Вобщем виде база данных – это набор однородной, как правило, упорядоченной по некоторому критерию информации. База данных может быть представлена в «бумажном» или электронном виде.

Врезультате исследования работы узловых пунктов управления выяснено, что при ведении некоторой оперативно-технической документации по учету, анализу и отчетности о качестве работы сетевых узлов, линий передачи, сооружений, оборудования, аппаратуры и т.д. данные обрабатываются вручную. При таком способе обработки, во-первых, затрачивается довольно много времени, и, во-вторых, возникает вероятность получения неточности результатов. В настоящее время результаты анализа работы сети связи представляются в виде диаграмм, учитывающих долю обслуженных вызовов и отказов в обслуживании. Причины, по которым был отказ, в основном классифицируются по таким признакам, как неправильно набран номер или неполный набор, фиксирование состояние абонента (заблокирован, занят), отсутствие линейных сигналов. Однако такой важный параметр, как перегрузка на линии, также фиксируемый, не указывает действительной причины перегрузки. Это могут быть как ошибки сигнализации, так и несовместимость серверов. Действительное отсутствие соединительных путей или одновременное занятие нескольких линейных комплектов (каналов) при использовании двунаправленной линии связи.

Таким образом, для получения реальных показателей надежности необходима программа обработки статистических данных для каждого информа- ционно-исполнительного пункта и решение вопроса какие именно статистические данные подлежат сбору и в каких объемах.

Сэтой целью, в работе все исходные параметры надежности функционирования телекоммуникационной сети в системах управления с точки зрения их статистической оценки разбиты на две группы. В первую группу входят

7

такие показатели как интенсивности событий, являющиеся параметрами экспоненциального распределения, к ним относятся. Ко второй группе относятся вероятности событий, вычисляемые как соотношения чисел соответствующих событий, т.е. ошибки контроля I, II, III рода.

Интенсивности событий, являются параметрами экспоненциального распределения. К этим параметрам относятся:

- параметр потока отказов; -интенсивность восстановления участка или элемента сети;

-интенсивность проведения периодического контроля за работоспособностью;

-интенсивность повторной передачи информации.

Вероятности событий, вычисляются как соотношение чисел соответствующих событий, т.е. ошибки контроля I, II, III рода.

Под ошибкой контроля I рода понимают ложный отказ, когда работоспособный сетевой элемент признается как неработоспособный.

Под ошибкой контроля II рода понимают необнаруженный отказ, когда неработоспособный сетевой элемент признается как работоспособный.

Под ошибкой контроля III рода понимают ситуацию, когда неправильные действия оператора приводят к тому, что сетевой элемент оказывается в неработоспособном состоянии или не может выполнять заданных функций [3, 4].

При оценке интенсивности событий выборка может быть следующей:

-полностью определенной объема n, т.е. такая выборка, в которой все значения случайной величины определены;

-неполностью определенной объема n, т.е. такая выборка, в которой известны только m значений случайной величины, а про остальные (n-m) значений известно только то, что они больше некоторого числа.

Полностью определенной выборкой характеризуются интенсивности восстановления, завершения проверки функционирования сети или ее элемента, например цифровой системы коммутации, а также интенсивность проведения периодического контроля за работоспособностью сети.

Неполностью определенной выборкой характеризуется интенсивность отказов сетевого оборудования или системы сигнализации. При этом можно принять, что интенсивности, характеризующиеся неполной выборкой, оцениваются по результатам плана испытаний, согласно которому испытанию подвергаются отдельные участки сети. При таком методе испытаний нижняя и верхняя границы интенсивностей при односторонней доверительной вероятности для полностью определенной выборки вычисляются по формулам, определенным в [3, 4] и в Рекомендациях серии М.2100 ITU-T.

Все события, происходящие на сети, регистрируются, как правило, системой мониторинга или системой контроля и диагностики, а также обслуживающим персоналом (оператором сети) при прямых наблюдениях. Для определения текущей оценки среднего времени восстановления и средней наработке на отказ можно выделить два типа событий.

8

Первый тип событий состоит в исключении сетевого элемента из рабочей конфигурации после обнаружения отказа аппаратным или программным способом. После чего только запускается тест поиска неисправности, локализации неисправности. В этом случае необходимо фиксировать момент времени исключения элемента из рабочей конфигурации.

Второй тип событий состоит во включении элемента сети в рабочую конфигурацию. Этому типу событий предшествует, как правило, или замена отказавшего функционального блока сетевого элемента или блокировка канала. Но в том и другом случае необходим послеремонтный контроль технического состояния восстановленного функционального блока, сетевого элемента или канала (линии) с обязательной фиксацией времени включения элемента в рабочую конфигурацию.

Если принять, что первое событие является началом восстановления, а второе - его завершением, то воспользовавшись Рекомендациями ITU-T, например Рек.G.821., можно произвести оценку средней наработки на отказ и среднего времени восстановления для одной и той же совокупности однотипных функциональных блоков или сетевых элементов.

Для оценки вероятности событий необходимо фиксировать число событий, соответствующих каждому состоянию функционального блока или сетевого элемента. Эта задача легко выполнима при современных возможностях системы мониторинга сети. Таким образом, регистрации подлежит следующая информация:

- число групп однотипных функциональных блоков или сетевых элемен-

тов;

-суммарное время наблюдения;

-суммарное число проведенных периодических проверок;

-число функциональных блоков, сетевых элементов, попавших на восстановление с отказами, обнаруживаемыми разными видами контроля (непрерывным, периодическим, в результате плановых проверок и т.д.);

-число устройств, попавших на восстановление в работоспособном состоянии, например из-за ошибки системы контроля или сбоя программного обеспечения;

-момент времени обнаружения отказавшего сетевого элемента и момент включения его в рабочую конфигурацию.

Полученную информацию можно использовать для вычисления реальных показателей эксплуатации сети и ее элементов.

Теме определения, например, требуемой полосы пропускания мультимедийного трафика, или оценки характеристик пропускной способности в пакетных сетях, надежности функционирования современных телекоммуникационных сетей связи посвящено достаточное количество работ, опубликованных в научно-технических изданиях. В статьях, посвященных этой теме, составлены математические модели, позволяющие вывести аналитические выражения для определения требуемых показателей к которым прежде всего

9

относятся коэффициенты готовности и простоя, среднее время необнаруженного отказа, среднее время восстановления и многие другие.

Аналитические модели ненадежных распределенных сетей можно получить, применяя методы работ [15, 22]. Однако точность математических расчетов зависит, прежде всего, от достоверности параметров, используемых в формулах расчета. Достоверность параметров может быть обеспечена только при прямых наблюдениях за функционированием сети в реальном времени с использованием результатов системы мониторинга, тестирования, контроля и диагностики, а также оперативной обработке этой информации.

В работе предлагается разработанный расчетно-экспериментальный метод определения достоверных показателей надежности, основанный на данных систем мониторинга и позволяющий получать аналитические зависимости, связывающие расчетные, эксплуатационные и наблюдаемые параметры надежности функциональной зависимостью. Также, к рассмотрению предлагается разработанная обобщенная методика анализа, сбора и обработки статистических данных системы управления сетевого мониторинга, учитывающая интенсивности и вероятности наблюдаемых событий, классификацию событий, исходные вероятностные характеристики, суммарное время наблюдений. Разработанная методика позволяет анализировать множество статистических данных сетевого мониторинга при оценке реальных показателей надежности, оперативно обрабатывать полученную информацию.

1.2. Методы оценки соответствия элементов сети требованиям по надежности.

Надежность объекта [3] – свойство объекта сохранять во времени и установленных пределах значения всех параметров, характеризующих качество передачи информации в заданных режимах и условиях применения, технического обслуживания, ремонтов, хранения и транспортирования.

Основными показателями надежности являются:

- коэффициент готовности К Г - определяет вероятность работоспособности объекта в произвольный момент времени;

- коэффициент простоя К П - определяет вероятность того, что объект окажется в неработоспособном состоянии в произвольный момент времени.

К основным показателям качества обслуживания сети относятся такие показатели как, доступность, бесперебойность, качество передачи, надежность, качество обслуживания. Доступность включает расчет следующих параметров:

-суммарные потери в пределах сети;

-суммарные потери при выходе на сеть общего пользования;

-доля состоявшихся разговоров (эффективные попытки);

-среднее время установления соединения;

-обобщающие оценки доступности к сетевым ресурсам по результатам опроса потребителей услуг.

10