книги из ГПНТБ / Синавина В.С. Оценка качества функционирования АСУ. (Исследование достоверности обработки информации)
.pdfБлок-схема 2. Блок-схема алгоритма расчета на ЭВМ данных по
исходные данные по материалам выборочного обследо вания отдельных ВЦ.
По каждому документу этих трех массивов осущест влялась подготовка данных для обработки на ЭВМ, состоящая из операций: визуального и логического конт роля исходных данных; исправления обнаруженных оши бок в исходных данных; шифрования текстовой инфор
мации, |
содержащейся в |
форме |
№ |
1; переноса данных |
с формы № 1 на перфоленту |
в |
алфавитно-цифровом |
||
коде 2 |
МТК; контроля |
перфорации и исправления об- |
учету ошибок в информации, обрабатываемой на ВЦ (по форме № 1)
г наруженных на перфоленте ошибок, записи исходной ин-
I |
формации на магнитную ленту. |
t |
Решение задачи на ЭВМ сводилось к тому, чтобы на |
і |
основе записанной на магнитной ленте исходной инфор- |
j |
мации и с помощью разработанной программы получить |
I |
заданные группировочные таблицы в последовательно- |
‘сти, указанной на блок-схеме 1. Алгоритм расчета при веден в блок-схеме 2 .
Вобщем виде программа решения задачи на ЭВМ осуществляла выбор и группировку информации по
20 |
21 |
двум признакам — X (главный признак группировки) и Y (вторичный признак).
По признаку Y проводилась группировка информа ции внутри признака X (в некоторых случаях произво дилась группировка только по одному признаку).
На основе статистических данных по форме № 1, полученных от различных ВЦ, стало возможным прове сти исследование и анализ этих данных в нескольких направлениях, каждое из которых представляет опреде ленный интерес и имеет конкретное назначение. К ним относятся:
1) таблицы по каждому ВЦ в отдельности. Эти све дения дают возможность получить показатели уровня достоверности информации, обрабатываемой на каждом ВЦ, и ряд других характеристик.
Для каждого ВЦ они будут являться ценным анали тическим материалом, способствующим выявлению «уз ких мест» в работе ВЦ. Вместе с тем наличие однород ных данных по каждому ВЦ, рассчитанных по единой методике, позволяет сравнивать ВЦ по сопоставимым показателям и тем самым выявлять лучшие и отстаю щие ВЦ;
2)сводные таблицы по всем обследованным ВЦ си стемы ЦСУ СССР. Они позволяют обобщить данные по ВЦ, характеризуемым не столько единой ведомственной принадлежностью, сколько сравнительно однородным характером и условиями выполняемой работы.
Кроме того, при получении статистических данных от многих ВЦ системы ЦСУ и их суммировании могут быть определены показатели, характеризующие в извест ной мере состояние данной системы в целом, что позво лит сделать некоторые обобщающие выводы и вырабо тать рекомендации по улучшению работы системы;
3)сводные таблицы по всем обследованным ВЦ ми нистерств и ведомств. Эти сведения аналогичны преды дущим, однако при незначительном количестве обследо ванных ВЦ данной системы полученные результаты не могут характеризовать систему в целом, они использу ются как материалы выборочного обследования. Тем не менее такая обработка данных полезна, она дает воз можность сравнить показатели системы ВЦ ЦСУ СССР
сопытом работы вычислительных центров других мини стерств и ведомств;
22
4) сводные таблицы по всем обследованным ВЦ. Эти сведения являются главным итогом, представляющим суммарные данные по всем обследованным ВЦ. По скольку эти данные базируются на большом числе еди ничных наблюдений, они являются наиболее полными и могут послужить выявлением некоторых общих законо мерностей и зависимостей, присущих всей системе ВЦ.
Содержание группировочных таблиц, которые могут быть получены при обработке статистических данных, предопределено самой формой № 1.
Из алгоритма расчета (блок-схема 2) видно, что на основе единичных показателей формы № 1 (аі-=-аи) можно получить в результате выполнения вычислитель ных и контрольных операций 1, 1а, 2, 2а и 3 и выдачи на печать 4 группировочные таблицы 1—10.
В этих таблицах содержатся следующие расчетные данные:
таблица 1 — частота ошибок в объемах обработан ной информации;
таблица 2 — частота ошибок по классам (видам) за дач;
таблица 3 — частота ошибок по этапам технологи ческого процесса обработки информации;
таблица 4 — частота ошибок в объемах обработан ной информации в зависимости от применяемых видов носителей;
таблица 5 — распределение обнаруженных ошибок по их видам и частоте;
таблица 6 — распределение обнаруженных ошибок по причинам их возникновения;
таблица 7 — частота ошибок в объемах обработан ной информации в зависимости от категории ВЦ;
таблица 8 — распределёние обнаруженных ошибок в зависимости от загрузки персонала ВЦ;
таблица 9 — данные об эффективности различных методов контроля;
таблица 10 — оценка эффективности различных ме тодов контроля в зависимости от уровня квалификации контролеров.
Уже сами названия вышеуказанных группировочных таблиц показывают их целенаправленность и значение при исследовании проблемы достоверности информации, обрабатываемой на ВЦ.
23
Группировочные, таблицы для четырех направлений обработки исходных данных (отдельный ВЦ, ВЦ систе мы ЦСУ СССР, ВЦ министерств и ведомств, все обсле дованные ВЦ) составляются по одинаковой форме для возможности сопоставления и суммирования соответст вующих данных.
Формы каждой из группировочных таблиц приво дятся вместе с результатами обработки исходных дан ных в главе II. Здесь необходимо лишь указать, что ос новной искомой величиной в расчете большинства груп пировочных таблиц является частота ошибки, определяе мой как отношение количества обнаруженных ошибок к объему обработанной информации и приведенной к ус ловному объему (ІО-4 знаков).
Последовательность расчета группировочных таблиц на ЭВМ несколько отличается от нумерации этих таб лиц. Это связано с рациональным построением машин ной программы.
Рассчитанные на ЭВМ группировочные таблицы вы даются на печать и записываются на магнитные ленты для использования в качестве исходной информации второго метода — регрессионного и корреляционного анализа данных проведенного статистического обследо вания ВЦ. Этот метод является органическим продолже нием и завершением метода группировок и средних статистических оценок.
Как уже отмечалось, ошибки, возникающие при об работке информации, по своей природе носят случайный, стохастический характер, что дает основание воспользо ваться при количественной оценке достоверности инфор мации теорией вероятности и статистическими метода ми расчета. Эти методы дают возможность уточнить средние статистические оценки, полученные с помощью первого метода группировок, так как они исключают случайные резко выделяющиеся величины единичных наблюдений и дают более правомерные количественные характеристики исследуемых явлений.
С другой стороны, как известно, корреляционный ме тод анализа позволяет оценить влияние и взаимосвязь двух или более величин, что особенно важно при иссле довании рассматриваемой проблемы достоверности для выявления существенных факторов, способствующих появлению ошибок в обрабатываемой информации,
24
Таблицы, полученные с помощью метода группиров ки статистических данных, записанные на магнитную ленту и, являющиеся исходной информацией для корре ляционного анализа, построены таким образом, что в
каждой из |
десяти |
таблиц |
сгруппированы |
данные по |
двум показателям |
(количеству обнаруженных ошибок |
|||
и объемам |
обработанной информации). Показатели вы |
|||
бираются |
по какому-нибудь |
одному из |
исследуемых |
факторов (например, по классу задач, носителям инфор мации, этапу технологического процесса и др.).
Таким образом, по каждой таблице может быть сде лана парная корреляция, анализирующая влияние рас сматриваемого фактора на величину ошибок. Такой анализ, однако, не является достаточно полным, по скольку на величину ошибок оказывает совокупное вли яние множество факторов. Более полным методом иссле дования является метод множественной корреляции, который основан на отборе наиболее значимых факто ров, определяемых по соответствующим коэффициентам, полученным при парной корреляции.
Следовательно, первым этапом при обработке полу ченных статистических данных по обследованным ВЦ является осуществление метода парной корреляции для последующего проведения на втором этапе — множест венной корреляции.
Мы рассмотрим только первый этап обработки полу ченных данных, поскольку расчеты уравнений и коэф фициентов множественной корреляции еще не заверше ны, что отнюдь не снижает интереса к результатам рас четов коэффициентов парной корреляции, которые дают наглядное представление и количественную оценку ис следуемых факторов.
Порядок расчета регрессионного и корреляционного анализа удобно рассмотреть по укрупненной блок-схе ме 3:
1. Получение эмпирического ряда из результатов всех наблюдений, записанных на магнитную ленту. Дан ные выбираются по признакам а,: 1) наименование и категория ВЦ, 2) наименование задачи, 3) шифр этапа технологического процесса, шифр носителя информации, 4) шифр метода контроля, 5) шифр вида ошибок, 6) шифр причины ошибок, 7) дата выполнения опера ции, 8 ) шифр метода контроля и причины ошибок,
25
Блок-схема 3. Блок-схема алгоритма расчета на ЭВМ статистических характеристик достоверности обработки информации
9) стаж работы контролера. В результате выборки по заданному признаку получаем ряд значений величины объема обработанной информации (Q) и соответствую
26
щие им количества ошибок (б), расположенных в бес порядке:
Qi» 6„ і = 1,..., п. 1
2. Ранжирование (упорядочение) эмпирического ря да, выбранного по заданному признаку. Получаем ряд значений величины объема обработанной информации и соответствующих им значений количества ошибок, рас положенных в порядке возрастания величины Q.
Результаты-наблюдений по каждой группе от А\ до
.4„ в выбранных данных по заданному признаку имеют следующий вид:
Группа |
Номер |
Объем |
|
Количество |
|
данных |
наблюдения |
информации |
|
ошибок |
|
А |
N, |
|
Q I . I |
• |
бі . і |
а 2 |
N2 |
Qi , 2 |
|
öl , 2 |
|
An |
Nn |
Ql ,п |
|
Öl ,п |
|
+1 |
Nn+i |
2 +1 |
|
бг.л+і |
|
Аг |
|
|
Q ,n |
|
|
•4л+2 |
|
2 |
2 +2 |
|
бг.л+г |
и т. д. |
Пп+ . |
Q ,л |
|
||
|
|
|
|
|
|
По условиям сортировки в каждой группе |
|
||||
Qi.i |
< Qi,2; |
Qi,2 < |
Qi,3i •••» Qi,n—i< Q i,n |
||
Q2, I < Q2,2» |
Q2,2 < |
Q2,3» • ■•» Q2, n—1<Qi,n |
3. Построение усредненного эмпирического ряда объ ема обработанной информации. Последовательно рас считываются следующие величины:
вариация ряда R = Qm^ — Qmin,
где Qmin и Qmax — соответственно минимальный и мак симальный обработанные объемы;
величина (высота) интервала
где L — целая часть числа 1+3,322А/' (N — количество наблюдений в ряду).
Границы расчетных интервалов и их середины опре деляются по следующим формулам:
27
начало интервала 1 — ах = Qmin;
конец интервала |
1 — Ьг = оу |
/г; |
середина интервала |
1 — s,- = оу -|— — ; |
|
начало интервала 2 — а2 — Ь{, |
|
|
конец интервала 2 — Ь2 = о2 + /г = |
|
|
середина интервала 2 — б3 = а2-|— — = Ьх+ — |
||
|
2 |
2 |
и т. п.;
конец последнего интервала /,= Qmax.
Затем производится группировка количества ошибок в расчетных интервалах. При этом объемы информации (Q), лежащие в интервале, группируются в центр (Si). В качестве соответствующего количества ошибок (б)
берется |
средняя арифметическая. Среднее |
количество |
|||
ошибок (б) в расчетных интервалах |
(Q) |
определяется |
|||
по формуле |
|
|
|
|
|
|
6j = ------------- |
при at < |
Qi < bi, |
|
|
bi |
|
по всем |
наблюдениям в ин- |
||
где 2 о,- — сумма ошибок |
|||||
і=а |
тервале; |
|
|
|
|
|
|
лежащих |
в г-м |
||
П{ — количество наблюдений, |
|||||
ЭВМ |
интервале. |
значение |
количества |
ошибок |
|
печатает среднее |
в центре расчетных интервалов объемов обработанной информации Si, а также вероятность среднего значения ошибки (Р) в данном интервале объема информации Q
в итоге всех значений б и Q, т. е. Qu б, P(Qi, 6і).
Эти величины называются эмпирическими (выбороч ными) средними.
4. Построение эмпирической кривой, приблиоісен иммитирующей линию регрессии между объемом обра ботанной информации и количеством ошибок. При по строении графика по оси абсцисс откладываются середи ны расчетных интервалов объемов обработанной инфор мации, а по оси ординат — среднее количество ошибок
28
в интервале |
объема информации: |
б], 62, |
б п р и ч е м |
значения бі |
о т н о с я т с я к середине |
интервала 5,-. При |
этом резко выделяющиеся на графике ординаты пере считываются.
Для определения аналитической, зависимости количе ства ошибок от объема обработанной информации тре буется найти параметры уравнения, чтобы сумма откло нений расчетных значений количества ошибок бь (Q) от наблюдаемых в действительности была минимальной:
А = 2 I W ) — 6((2)]2 = min-
Q
Это уравнение решается с помощью метода наимень
ших квадратов. Вид зависимости б от Q выбирается, исходя из характера процесса, для которого устанавли
вается зависимость. |
|
|
статистические характеристики. |
||
5. |
Вычисляются |
|
|||
В простейшем случае, если зависимость бь от Q имеет |
|||||
прямолинейный характер, |
параметры уравнения б&= |
||||
= А - Q+ B, отвечающего |
вышеприведенному условию, |
||||
вычисляются по формулам |
|
||||
|
|
J6 |
, |
|
о. |
|
А |
Р- — |
B = M b- p - ^ . M Q, |
||
|
|
aQ |
|
|
aQ |
y j ( M Q- Q ) - ( M f l - 6 ) - p ( Q )
где рбiQ= |
—----------- |
aQ---------------------стб |
— коэффициент кор |
|
|
реляции; |
|
cr<2 = 1/ |
2 |
(MQ — Q)2 p(Q) — среднее квадратичное от- |
|
' |
|
______________ |
клоиение величины Q; |
os = I/ |
2 |
[Me — S(Q)]2 p(Q) |
—среднее квадратичное |
' |
Q |
отклонение величины б; |
|
MQ = 2 |
QP(Q)— математическое ожидание величины |
||
Q |
Q; |
|
|
M t = \ |
6(Q) p(Q) — математическое ожидание величи- |
||
Q |
|
иы б. |
|
Кроме того, вычисляется корреляционное отношение: - 9
6/ Q
Y|6/Q
29
Величина коэффициента корреляции указывает на тесноту связи величин б, Q. При этом, чем меньше от личается р от + 1 или от —1, тем точнее и теснее груп пируются точки около линии регрессии, как это следует из формулы
Amin = ств ’ |
Р")- |
Полученный коэффициент корреляции является эм пирической величиной. Исходя из предположения, что распределение величин (для большего числа наблюде ний) близко к нормальному, вычисляется среднее квад ратическое отклонение эмпирического значения по фор муле [34]
где п — число наблюдений.
Доверительный интервал (рнст) с уровнем значимо сти q % определяется следующим образом:
д |
Р |
о |
1— ра . |
. . о 1— р3 |
) |
|
|
' - /— ^ |
Рнст<' Р “Ь |
— |
|||
|
|
|
1' П |
|
У П |
|
6 |
определяется в зависимости от q % |
— доверительной |
||||
вероятности [34]. |
|
|
|
|||
|
Полученная |
|
формула имеет тот смысл, что истинное |
значение коэффициента корреляции лежит в указанных пределах с вероятностью q %. Для технических расче тов <7= 9 5 %. Аналогично вычисляется среднее квадрати ческое отклонение (б) и доверительный интервал для коэффициента регрессии (р);
бд |
aQ |
|
--- |
Уп |
Р + ^ |
|
aQ |
— Ра |
|
—~ |
' |
=— < Рнст < |
0 |
' |
описанному |
||||
|
|
77 |
|
|
Д |
п |
|||
|
|
|
|
|
|
|
|
||
В результате |
проведенных |
расчетов по |
|
выше методу были получены статистические характери стики по каждому из факторов, выделенных для иссле дования в десяти группировочных таблицах. Количест венные значения этих коэффициентов приводятся в со ответствующих параграфах следующей главы в виде сводных таблиц, которые не требуют повторного пояс нения, изложенного в настоящем параграфе.