Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Синавина В.С. Оценка качества функционирования АСУ. (Исследование достоверности обработки информации)

.pdf
Скачиваний:
2
Добавлен:
23.10.2023
Размер:
7.84 Mб
Скачать

Блок-схема 2. Блок-схема алгоритма расчета на ЭВМ данных по

исходные данные по материалам выборочного обследо­ вания отдельных ВЦ.

По каждому документу этих трех массивов осущест­ влялась подготовка данных для обработки на ЭВМ, состоящая из операций: визуального и логического конт­ роля исходных данных; исправления обнаруженных оши­ бок в исходных данных; шифрования текстовой инфор­

мации,

содержащейся в

форме

1; переноса данных

с формы № 1 на перфоленту

в

алфавитно-цифровом

коде 2

МТК; контроля

перфорации и исправления об-

учету ошибок в информации, обрабатываемой на ВЦ (по форме № 1)

г наруженных на перфоленте ошибок, записи исходной ин-

I

формации на магнитную ленту.

t

Решение задачи на ЭВМ сводилось к тому, чтобы на

і

основе записанной на магнитной ленте исходной инфор-

j

мации и с помощью разработанной программы получить

I

заданные группировочные таблицы в последовательно-

сти, указанной на блок-схеме 1. Алгоритм расчета при­ веден в блок-схеме 2 .

Вобщем виде программа решения задачи на ЭВМ осуществляла выбор и группировку информации по

20

21

двум признакам — X (главный признак группировки) и Y (вторичный признак).

По признаку Y проводилась группировка информа­ ции внутри признака X (в некоторых случаях произво­ дилась группировка только по одному признаку).

На основе статистических данных по форме № 1, полученных от различных ВЦ, стало возможным прове­ сти исследование и анализ этих данных в нескольких направлениях, каждое из которых представляет опреде­ ленный интерес и имеет конкретное назначение. К ним относятся:

1) таблицы по каждому ВЦ в отдельности. Эти све­ дения дают возможность получить показатели уровня достоверности информации, обрабатываемой на каждом ВЦ, и ряд других характеристик.

Для каждого ВЦ они будут являться ценным анали­ тическим материалом, способствующим выявлению «уз­ ких мест» в работе ВЦ. Вместе с тем наличие однород­ ных данных по каждому ВЦ, рассчитанных по единой методике, позволяет сравнивать ВЦ по сопоставимым показателям и тем самым выявлять лучшие и отстаю­ щие ВЦ;

2)сводные таблицы по всем обследованным ВЦ си­ стемы ЦСУ СССР. Они позволяют обобщить данные по ВЦ, характеризуемым не столько единой ведомственной принадлежностью, сколько сравнительно однородным характером и условиями выполняемой работы.

Кроме того, при получении статистических данных от многих ВЦ системы ЦСУ и их суммировании могут быть определены показатели, характеризующие в извест­ ной мере состояние данной системы в целом, что позво­ лит сделать некоторые обобщающие выводы и вырабо­ тать рекомендации по улучшению работы системы;

3)сводные таблицы по всем обследованным ВЦ ми­ нистерств и ведомств. Эти сведения аналогичны преды­ дущим, однако при незначительном количестве обследо­ ванных ВЦ данной системы полученные результаты не могут характеризовать систему в целом, они использу­ ются как материалы выборочного обследования. Тем не менее такая обработка данных полезна, она дает воз­ можность сравнить показатели системы ВЦ ЦСУ СССР

сопытом работы вычислительных центров других мини­ стерств и ведомств;

22

4) сводные таблицы по всем обследованным ВЦ. Эти сведения являются главным итогом, представляющим суммарные данные по всем обследованным ВЦ. По­ скольку эти данные базируются на большом числе еди­ ничных наблюдений, они являются наиболее полными и могут послужить выявлением некоторых общих законо­ мерностей и зависимостей, присущих всей системе ВЦ.

Содержание группировочных таблиц, которые могут быть получены при обработке статистических данных, предопределено самой формой № 1.

Из алгоритма расчета (блок-схема 2) видно, что на основе единичных показателей формы № 1 (аі-=-аи) можно получить в результате выполнения вычислитель­ ных и контрольных операций 1, 1а, 2, и 3 и выдачи на печать 4 группировочные таблицы 1—10.

В этих таблицах содержатся следующие расчетные данные:

таблица 1 — частота ошибок в объемах обработан­ ной информации;

таблица 2 — частота ошибок по классам (видам) за­ дач;

таблица 3 — частота ошибок по этапам технологи­ ческого процесса обработки информации;

таблица 4 — частота ошибок в объемах обработан­ ной информации в зависимости от применяемых видов носителей;

таблица 5 — распределение обнаруженных ошибок по их видам и частоте;

таблица 6 — распределение обнаруженных ошибок по причинам их возникновения;

таблица 7 — частота ошибок в объемах обработан­ ной информации в зависимости от категории ВЦ;

таблица 8 — распределёние обнаруженных ошибок в зависимости от загрузки персонала ВЦ;

таблица 9 — данные об эффективности различных методов контроля;

таблица 10 — оценка эффективности различных ме­ тодов контроля в зависимости от уровня квалификации контролеров.

Уже сами названия вышеуказанных группировочных таблиц показывают их целенаправленность и значение при исследовании проблемы достоверности информации, обрабатываемой на ВЦ.

23

Группировочные, таблицы для четырех направлений обработки исходных данных (отдельный ВЦ, ВЦ систе­ мы ЦСУ СССР, ВЦ министерств и ведомств, все обсле­ дованные ВЦ) составляются по одинаковой форме для возможности сопоставления и суммирования соответст­ вующих данных.

Формы каждой из группировочных таблиц приво­ дятся вместе с результатами обработки исходных дан­ ных в главе II. Здесь необходимо лишь указать, что ос­ новной искомой величиной в расчете большинства груп­ пировочных таблиц является частота ошибки, определяе­ мой как отношение количества обнаруженных ошибок к объему обработанной информации и приведенной к ус­ ловному объему (ІО-4 знаков).

Последовательность расчета группировочных таблиц на ЭВМ несколько отличается от нумерации этих таб­ лиц. Это связано с рациональным построением машин­ ной программы.

Рассчитанные на ЭВМ группировочные таблицы вы­ даются на печать и записываются на магнитные ленты для использования в качестве исходной информации второго метода — регрессионного и корреляционного анализа данных проведенного статистического обследо­ вания ВЦ. Этот метод является органическим продолже­ нием и завершением метода группировок и средних статистических оценок.

Как уже отмечалось, ошибки, возникающие при об­ работке информации, по своей природе носят случайный, стохастический характер, что дает основание воспользо­ ваться при количественной оценке достоверности инфор­ мации теорией вероятности и статистическими метода­ ми расчета. Эти методы дают возможность уточнить средние статистические оценки, полученные с помощью первого метода группировок, так как они исключают случайные резко выделяющиеся величины единичных наблюдений и дают более правомерные количественные характеристики исследуемых явлений.

С другой стороны, как известно, корреляционный ме­ тод анализа позволяет оценить влияние и взаимосвязь двух или более величин, что особенно важно при иссле­ довании рассматриваемой проблемы достоверности для выявления существенных факторов, способствующих появлению ошибок в обрабатываемой информации,

24

Таблицы, полученные с помощью метода группиров­ ки статистических данных, записанные на магнитную ленту и, являющиеся исходной информацией для корре­ ляционного анализа, построены таким образом, что в

каждой из

десяти

таблиц

сгруппированы

данные по

двум показателям

(количеству обнаруженных ошибок

и объемам

обработанной информации). Показатели вы­

бираются

по какому-нибудь

одному из

исследуемых

факторов (например, по классу задач, носителям инфор­ мации, этапу технологического процесса и др.).

Таким образом, по каждой таблице может быть сде­ лана парная корреляция, анализирующая влияние рас­ сматриваемого фактора на величину ошибок. Такой анализ, однако, не является достаточно полным, по­ скольку на величину ошибок оказывает совокупное вли­ яние множество факторов. Более полным методом иссле­ дования является метод множественной корреляции, который основан на отборе наиболее значимых факто­ ров, определяемых по соответствующим коэффициентам, полученным при парной корреляции.

Следовательно, первым этапом при обработке полу­ ченных статистических данных по обследованным ВЦ является осуществление метода парной корреляции для последующего проведения на втором этапе — множест­ венной корреляции.

Мы рассмотрим только первый этап обработки полу­ ченных данных, поскольку расчеты уравнений и коэф­ фициентов множественной корреляции еще не заверше­ ны, что отнюдь не снижает интереса к результатам рас­ четов коэффициентов парной корреляции, которые дают наглядное представление и количественную оценку ис­ следуемых факторов.

Порядок расчета регрессионного и корреляционного анализа удобно рассмотреть по укрупненной блок-схе­ ме 3:

1. Получение эмпирического ряда из результатов всех наблюдений, записанных на магнитную ленту. Дан­ ные выбираются по признакам а,: 1) наименование и категория ВЦ, 2) наименование задачи, 3) шифр этапа технологического процесса, шифр носителя информации, 4) шифр метода контроля, 5) шифр вида ошибок, 6) шифр причины ошибок, 7) дата выполнения опера­ ции, 8 ) шифр метода контроля и причины ошибок,

25

Блок-схема 3. Блок-схема алгоритма расчета на ЭВМ статистических характеристик достоверности обработки информации

9) стаж работы контролера. В результате выборки по заданному признаку получаем ряд значений величины объема обработанной информации (Q) и соответствую­

26

щие им количества ошибок (б), расположенных в бес­ порядке:

Qi» 6„ і = 1,..., п. 1

2. Ранжирование (упорядочение) эмпирического ря­ да, выбранного по заданному признаку. Получаем ряд значений величины объема обработанной информации и соответствующих им значений количества ошибок, рас­ положенных в порядке возрастания величины Q.

Результаты-наблюдений по каждой группе от А\ до

.4„ в выбранных данных по заданному признаку имеют следующий вид:

Группа

Номер

Объем

 

Количество

данных

наблюдения

информации

 

ошибок

А

N,

 

Q I . I

бі . і

а 2

N2

Qi , 2

 

öl , 2

An

Nn

Ql ,п

 

Öl ,п

+1

Nn+i

2 +1

 

бг.л+і

Аг

 

 

Q ,n

 

•4л+2

 

2

2 +2

 

бг.л+г

и т. д.

Пп+ .

Q ,л

 

 

 

 

 

 

По условиям сортировки в каждой группе

 

Qi.i

< Qi,2;

Qi,2 <

Qi,3i •••» Qi,n—i< Q i,n

Q2, I < Q2,2»

Q2,2 <

Q2,3» • ■•» Q2, n1<Qi,n

3. Построение усредненного эмпирического ряда объ­ ема обработанной информации. Последовательно рас­ считываются следующие величины:

вариация ряда R = Qm^ — Qmin,

где Qmin и Qmax — соответственно минимальный и мак­ симальный обработанные объемы;

величина (высота) интервала

где L — целая часть числа 1+3,322А/' (N — количество наблюдений в ряду).

Границы расчетных интервалов и их середины опре­ деляются по следующим формулам:

27

начало интервала 1 ах = Qmin;

конец интервала

1 Ьг = оу

/г;

середина интервала

1 — s,- = оу -|— — ;

начало интервала 2 а2 — Ь{,

 

конец интервала 2 — Ь2 = о2 + /г =

 

середина интервала 2 — б3 = а2-|— — = Ьх+ —

 

2

2

и т. п.;

конец последнего интервала /,= Qmax.

Затем производится группировка количества ошибок в расчетных интервалах. При этом объемы информации (Q), лежащие в интервале, группируются в центр (Si). В качестве соответствующего количества ошибок (б)

берется

средняя арифметическая. Среднее

количество

ошибок (б) в расчетных интервалах

(Q)

определяется

по формуле

 

 

 

 

 

6j = -------------

при at <

Qi < bi,

 

bi

 

по всем

наблюдениям в ин-

где 2 о,- — сумма ошибок

і=а

тервале;

 

 

 

 

 

 

лежащих

в г-м

П{ — количество наблюдений,

ЭВМ

интервале.

значение

количества

ошибок

печатает среднее

в центре расчетных интервалов объемов обработанной информации Si, а также вероятность среднего значения ошибки (Р) в данном интервале объема информации Q

в итоге всех значений б и Q, т. е. Qu б, P(Qi, 6і).

Эти величины называются эмпирическими (выбороч­ ными) средними.

4. Построение эмпирической кривой, приблиоісен иммитирующей линию регрессии между объемом обра­ ботанной информации и количеством ошибок. При по­ строении графика по оси абсцисс откладываются середи­ ны расчетных интервалов объемов обработанной инфор­ мации, а по оси ординат — среднее количество ошибок

28

в интервале

объема информации:

б], 62,

б п р и ч е м

значения бі

о т н о с я т с я к середине

интервала 5,-. При

этом резко выделяющиеся на графике ординаты пере­ считываются.

Для определения аналитической, зависимости количе­ ства ошибок от объема обработанной информации тре­ буется найти параметры уравнения, чтобы сумма откло­ нений расчетных значений количества ошибок бь (Q) от наблюдаемых в действительности была минимальной:

А = 2 I W ) — 6((2)]2 = min-

Q

Это уравнение решается с помощью метода наимень­

ших квадратов. Вид зависимости б от Q выбирается, исходя из характера процесса, для которого устанавли­

вается зависимость.

 

 

статистические характеристики.

5.

Вычисляются

 

В простейшем случае, если зависимость бь от Q имеет

прямолинейный характер,

параметры уравнения б&=

= А - Q+ B, отвечающего

вышеприведенному условию,

вычисляются по формулам

 

 

 

J6

,

 

о.

 

А

Р- —

B = M b- p - ^ . M Q,

 

 

aQ

 

 

aQ

y j ( M Q- Q ) - ( M f l - 6 ) - p ( Q )

где рбiQ=

-----------

aQ---------------------стб

— коэффициент кор­

 

 

реляции;

cr<2 = 1/

2

(MQ — Q)2 p(Q) — среднее квадратичное от-

'

 

______________

клоиение величины Q;

os = I/

2

[Me — S(Q)]2 p(Q)

—среднее квадратичное

'

Q

отклонение величины б;

MQ = 2

QP(Q)— математическое ожидание величины

Q

Q;

 

M t = \

6(Q) p(Q) — математическое ожидание величи-

Q

 

иы б.

 

Кроме того, вычисляется корреляционное отношение: - 9

6/ Q

Y|6/Q

29

Величина коэффициента корреляции указывает на тесноту связи величин б, Q. При этом, чем меньше от­ личается р от + 1 или от —1, тем точнее и теснее груп­ пируются точки около линии регрессии, как это следует из формулы

Amin = ств ’

Р")-

Полученный коэффициент корреляции является эм­ пирической величиной. Исходя из предположения, что распределение величин (для большего числа наблюде­ ний) близко к нормальному, вычисляется среднее квад­ ратическое отклонение эмпирического значения по фор­ муле [34]

где п — число наблюдений.

Доверительный интервал (рнст) с уровнем значимо­ сти q % определяется следующим образом:

д

Р

о

1— ра .

. . о 1— р3

)

 

' - /— ^

Рнст<' Р “Ь

 

 

 

1' П

 

У П

 

6

определяется в зависимости от q %

— доверительной

вероятности [34].

 

 

 

 

Полученная

 

формула имеет тот смысл, что истинное

значение коэффициента корреляции лежит в указанных пределах с вероятностью q %. Для технических расче­ тов <7= 9 5 %. Аналогично вычисляется среднее квадрати­ ческое отклонение (б) и доверительный интервал для коэффициента регрессии (р);

бд

aQ

 

---

Уп

Р + ^

 

aQ

— Ра

—~

'

=— < Рнст <

0

'

описанному

 

 

77

 

 

Д

п

 

 

 

 

 

 

 

 

В результате

проведенных

расчетов по

 

выше методу были получены статистические характери­ стики по каждому из факторов, выделенных для иссле­ дования в десяти группировочных таблицах. Количест­ венные значения этих коэффициентов приводятся в со­ ответствующих параграфах следующей главы в виде сводных таблиц, которые не требуют повторного пояс­ нения, изложенного в настоящем параграфе.

Соседние файлы в папке книги из ГПНТБ