Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Учебное пособие 800529

.pdf
Скачиваний:
3
Добавлен:
01.05.2022
Размер:
4.34 Mб
Скачать

Физически признак – результат измерения свойств объекта (фрагмента реальности), обобщенно выделенный из всего множества измерительных отсчетов свойств группы объектов, среди которых проводится (решается) определенная классификационная задача. Измерение значений выбранного признака для каждого объекта позволяет однозначно идентифицировать один объект от другого. Чтобы иметь такие идентифицирующие свойства, признак определяется обратным ходом: сначала все измеряется, а затем проверяются дискриминирующие способности каждого измеренного свойства объекта – претендента на его признак. В качестве признака при этом выбирается такое свойство объекта, которое обеспечивает надежную дискриминацию (распознавание) объектов. То есть такое знаковое замещение (отображение) должно быть гомоморфным (а не изоморфным) с определенным ядром - зоной прикрытия (эквивалентности).

Из-за этого описание признака имеет две составляющие: общее имя (название) признака, обобщенно фиксирующее все значения свойства всех объектов, прикрываемых (обозначаемых) данным признаком; значение признака, представляемое в виде множества, задаваемого не перечислением, а более компактно – указанием пределов изменения значений или закона их распределения. То есть признак как знак представляет собой компактный квант информации, обладающий зарядом обобщения и потенциалом получения дополнительных значений, нужных «по месту».

В этой ситуации важны два момента: размер ядра (зоны эквивалентности) и закономерность принадлежности к ядру (см. функцию принадлежности в нечетких множествах). Размер ядра определяет мощность многообразия объектов, прикрываемых (замещаемых) одним знаком (признаком), а закономерность принадлежности - сходством тех свойств, которые можно обозначить одним и тем же признаком. Так как такие факторы «не лежат на поверхности», то они должны чем-то определяться. Чем?

Основная физическая причина возможности компактирования описания пространства измерений с помощью признаков заключается в учете целенаправленности использования результатов измерения. То есть сплошной сканирующий съем (измерение) дан-

81

ных (с реальности) избирательно (по предметности) фокусируется содержанием той задачи, в которой сфокусированные данные (признаки) используются. Чаще всего такой задачей является задача классификации объектов измерения или задача их распознавания, имеющая диагностическое значение. В разуме субъекта такая задача решается генетически, то есть автоматически. Объективно возможность решения такой задачи с использованием частичного (признакового) описания определяется тем, что для осуществления распознавания не обязательно все знать об объекте. Об объекте нужно знать ровно столько, чтобы осуществлять его однозначную идентификацию среди множества сходных. Из-за этого распознавание возможно в усеченном (приведенном) пространстве. Кроме того, и это не менее важно, классификация в пространстве меньшей размерности осуществляется быстрее и проще, ибо человек (или его кибернетический помощник) не «путается» в деталях. При этом «… всякий вводимый, учитываемый признак (эпитет) ограничивает распространенность явления и допускает существование другого». Л.Леонов. Русский лес, с. 378.

Поэтому признак становится «представителем» многих объектов определенного класса, контекстуально скрытых в подразумеваемой общности содержания названия (имени) принятого признака. Чтобы соответствовать единому общему признаку, объекты класса должны «сбросить» некоторые индивидуальные частные свойства, не рассматриваемые в упомянутой выше задаче классификации. Тем самым реальный объект становится абстракцией, то есть мыслимой категорией (моделью), «усеченно» описанной для более удобного (но однозначного!) оперирования в рамках (только!) решаемой задачи классификации. При этом из описания исключается излишняя «всеохватность» и чрезмерная громоздкость. Однако, «усечѐнное» описание в виде абстракции локализует предметный фрагмент реальности, который в дальнейшем (при необходимости) можно детализировать, частично отбросив степень абстрактности. Образно такая сущность признака представлена на рис. 2.3.

Если содержание задачи меняется, то изменяются и учитываемые признаки объекта, а, следовательно, и их рассматриваемые

82

(измеряемые) свойства. Тем самым многомерная реальность по необходимости последовательно сканируется (рассматривается) «скользящим» окном, обеспечивая непрерывность ее представления с предметной стороны.

Так как содержание задачи классификации является решающим фактором при формировании признакового пространства, то есть настоятельная необходимость установить хотя бы еѐ типовое содержание.

При этом следует иметь в виду, что задача классификации – это не только генетическое свойство разума, но и фундаментальная проблема науки, затрагивающая все стороны человеческой деятельности. Поэтому к ней необходимо отнестись очень осторожно, не пытаясь «решить все». Из-за этого необходимо рассмотреть только минимум в части нас касающейся, а именно, в части преобразования данных (результатов измерения) в содержательную информацию (состоящую из признаков), выражаемую в записях. Это тоже архисложно, но мы обязаны с этим разобраться, хотя бы приближенно.

В связи с изложенным здесь возможны две типовые задачи: имеется совокупность свойств (данных их измерения), которая в себе содержит признаки неизвестного содержания; имеется совокупность свойств, которую необходимо распределить по совокупности заданных (известных) признаков. Естественно, что первая задача погружает и вторую, но торопиться брать ее за основу мы не будем.

Дело в том, что при решении первой задачи признаки, как правило, определяются формальными методами классификации – таксономии, факторного анализа и т.п., которые «ведут» (формально!) исследователя. Нас же, защитников информации, интересует случай, когда признаки определяются, исходя из физических соображений. Поэтому за основу мы возьмем смешанную задачу:

83

 

 

Группа

объектов N2, замещаемых

признаком N2

 

признака)

 

 

 

 

(штатное представление значений

 

 

 

Пределы изменения

значений признаков группы объектов

 

 

раздела групп объектов

 

 

 

 

граница

ак а н з и р пя и н еч а нЗ .I I

Замещение ―1 к многим‖

а

 

 

к

 

а

 

я

н

и

з

н и

е

р

ч

п

 

а

 

 

н

 

З

 

 

.

 

 

I

 

 

I

Группа объектов N1, замещаемых признаком N1 (условно показана в виде счетного множества)

 

 

Замещение 1:1

I. Имя: ―признак 2‖

I. Имя: ―признак 1‖

б) признаковое представление объектов

признакового замещения реальности

 

 

 

Имя и значение результата измерения свойства объекта

представление объекта

результатом измерения

Рис.2.3. Сущность

 

а)

 

 

84

имеется совокупность данных, признаки их классификации неизвестны и они назначаются исходя из физических соображений надсистемного характера; далее, имеющиеся данные необходимо «разнести» по этим признакам в интересах решения задач классификации. Они бывают двух типов: распознавание типа объекта как носителя информации (первый тип); распределение имеющихся данных по установленной совокупности признаков распознавания и по их синтетически укрупненным вариантам в интересах накапливания информации о свойствах объекта – носителя информации (второй тип). При этом признаки, по которым осуществляется распознавание типа объекта, являются слабым подмножеством их полного множества, то есть являются более малочисленными.

В этой задаче для нас важны два фактора: формулирование (зарождение) первичных признаков; синтетическое укрупнение первичных признаков, как средства углубления представления о свойствах объекта-носителя (содержателя!) информации.

Примерное «физическое» содержание механизма решения такой задачи показано на рис. 2.3.

Основным механизмом формулирования приведенного признакового пространства из исходного пространства данных является установление тесноты (близости) значений свойств (результатов измерения) исходного пространства и преобразование его в «сгустки» (по сходству) свойств исходя из физических соображений. После этого на «сгустках» устанавливается нужный (для целей задачи) порог эквивалентности и осуществляется разбиение исходного пространства на классы эквивалентности, число которых будет существенно меньше. Примечание. В топологии доказано, что преобразование пространства большей размерности в меньшую не может быть осуществлено без разрывов. Функцию разрыва выполняет вводимый порог эквивалентности, «поглощающий» частные отличия сходных (по выдвинутому критерию эквивалентности) объектов (смотри границу раздела на рис. 2.3).

Введение эквивалентности означает введение в первоначальное неструктуризованное описание пространства определенной закономерности, то есть определение связи между элементами. А установление или наличие любого соотношения связи элементов

85

дает возможность исключить лишние описывающие параметры. Поэтому наличие в разуме субъекта такого мощного «соотношения» как картина мира, то есть совокупности базисных функций, позволяет разуму представлять информацию наиболее экономно по меньшему числу более крупных (приближенных) признаков.

Формальный аппарат, выполняющий операцию установления тесноты результатов измерений, называется факторным анализом. Кроме него есть масса эвристических методов выявления признаков, ибо эта процедура существенно зависит от содержания задачи классификации. Поэтому в настоящее время задача выделения признаков является в большей степени искусством, а не математической наукой. Но для нас это вопрос профессии и мы обязаны.

Рассмотренный нами случай относится к формированию признаков – представителей (идентификаторов) объектов. По ним объект можно только идентифицировать (распознать). Но при защите информации рассматриваются и более крупные сведения, так называемые охраняемые, которые содержат свойства объекта. Поэтому нам необходимо рассмотреть процесс перехода от простейших (опознавательных) признаков объекта к более крупным (интегральным), описывающим более важные свойства объекта. Ввиду интеллектуальной сущности этой процедуры, мы ее рассмотрим приближенно, как гипотезу.

Основой перехода к более крупным признакам является замена бесструктурной совокупности (набора) признаков их образованием, обладающим определенной структурой. При этом структура должна соответствовать (определяться) содержанием того вывода (охраняемого сведения), которому должен соответствовать интеграл признаков. То есть формировать структуру признаков из их первичной совокупности «без оглядки на то, что нужно» нельзя. Это подтверждает тот факт, что интеллектуальные процессы развиваются как сочетание прямых и обратных ходов. Прямой ход при этом соответствует последовательности укрупнения (интегрирования) признаков, а обратный – проверке (сопоставлению) получившегося результата с тем, что нужно, то есть с содержанием требуемого интегрального вывода. Вариантов вывода может быть несколько, поэтому каждый раз решается и вопрос: «А на что это

86

больше похоже?». При этом «мягкая» ассоциация (смысловая связь) прямого хода превращается обратным ходом в «жесткую» (единственный вывод). Повторяем еще раз, что это только гипотеза.

Процедура последовательного перехода от бесструктурной совокупности признаков к интегральному (структурному) выводу, например об эффективности изделия (объекта) – источника информации включает три этапа:

этап завязки структуры вывода; этап наращивания и углубления структуры вывода;

принятие решения о со держании вывода.

Все три этапа основаны на композиции двух операций: группирования первичных признаков; вывод сущности сформулированных групп, дающих содержание более крупных вторичных признаков. Названные операции выполняются многократно.

Рассмотрим содержание этапов чуть подробнее.

Завязка структуры начинается с группирования признаков идентификации (распознавания) объектов – составных частей на основе их меры близости. Благодаря такой мере исходное бесструктурное пространство (множество) признаков превращается в начально структуризованное – в топологическое пространство. Открытость элементов такого пространства, то есть способность к расширению, составляет основу для дальнейшего углубления структуры. Выделение же исходных составных частей определяется содержанием того более крупного вывода, который готовится интеграцией признаков.

Углубление структуры осуществляется на основе вторичных признаков, формируемых путем рассмотрения другой (кроме морфологической) стороны любой совокупности – функциональной. Для этого в составе рассматриваемой группы объектов, как предметной основы укрупнения признаков, выявляются функциональные связи, то есть характеристики их совместного функционирования. На основе выявленных функциональных групп объектов и формулируются более крупные признаки.

Выше мы рассмотрели случай, когда результаты измерения являются скалярными данными (числами), освобожденными от

87

взаимных связей с соседними значениями. Но в реальности есть более сложные ситуации, когда измеряемый объект описывается структурно и между измеряемыми данными появляются отношения. Так как это есть более мощное средство для компактного представления реальности, то естественно желание использовать элементы структуры в качестве признаков. А практическая процедура их использования называется задачей структурного распознавания. Ее распространенность объясняется еще и тем, что в качестве формального аппарата представления структурных отношений используются не очень сложные синтаксические (языковые) модели, не требующие знания статистики признаков, основанные на закономерностях функционирования объектов.

Структурное представление объекта дает выход на более мощный (по сравнению с признаком) знак, называемый образом. Если признак является «анатомическим» знаком (представителем) объекта, пересекающимся с ним по свойствам и составляющим только в совокупности из нескольких признаков функциональное или структурное качество объекта, то образ является синтетическим знаком объекта в целом. Поэтому с точки зрения детальности представления образ более беден, чем признак и их совокупность, но с точки зрения мощности отображения объекта он более могуч, ибо он сходен по виду с объектом в целом.

Кроме того, он является представителем целого класса сходных объектов или явлений, а не средством вскрытия анатомии объекта, свойственным признаку. Приблизительную похожесть образа на объект можно охарактеризовать степенью изоморфизма, как количественной меры информации об объекте, содержащейся в его образе. При этом основным механизмом формирования образа объекта на фоне значения данных и признаков объекта является поиск структурных отношений разного уровня (мощности) между ними с последующим формированием единого наглядного образа (например, силуэт женской головки над входом в соответствующий салон красоты).

Образные знаки имеют различия. Различаются они по степени и характеру изоморфизма с отображаемой реальностью.

88

Сначала в функции знака вступают сами физические объекты (например, коллекция ножей, орденов и т.п.), они имеют стопроцентный изоморфизм с отображаемым. Затем появляются образы, где изоморфизм ограничивается внешними сходствами - образы иконы, а в интегрированных средах программирования - пиктограммы. Далее появляются конвенциональные образы, построенные на изоморфизме идей, связывающих знак с отображаемым (это все искусство и церемониалы).

Следующим типом знаковых систем являются словесно - алфавитно - символьные, обеспечивающие языково-письменный тракт получения и использования информации субъектом. Они обладают более мощными отображающими свойствами, ибо их замещение реальности «один к многим» осуществляется не по одному или нескольким различным свойствам (устойчивым признакам), а по системной комбинации разнородных признаков, причем динамически меняющихся по ситуации. Это приводит к тому, что замещение реальности осуществляется не по принципу «пучок - стягивающая точка», а «пучок пучков – точка». Объясняется это тем, что за каждым словом стоит множество смысловых ролей (нагрузок). Главные из них следующие:

слово, обозначая что-то, выделяет в нем свойства; слово ставит объект в нужное отношение к другим; слово относит объект к определенной категории.

Из-за этого слово является не только обозначателем (знаком) мира, но и инструментом его информационного анализа, создавая для нас основу определения количества информации, заключенной в слове. Для этого общее значение, обозначаемое словом, должно быть «расколото» на детали. Инструментом раскалывания (деления) слова является вопросно - ответная система.

Вопрос - это прямой запрос мысли, направленный на развитие, уточнение или дополнение знаний. То есть это инструмент добывания новой, в данном случае скрытой в контексте слова, фактурной (признаковой) информации. Чтобы дисциплинировать (направить) процедуру раскрытия, можно использовать полуформальную процедуру фрейм-сценария. Фрейм - сценарий обеспечивает рекурсивную процедуру задания вопросов по главным (фрей-

89

мовым) свойствам объектов, обозначаемых содержанием раскрываемого слова, с формированием ответов по привлекаемым источникам (базам данных). Разнообразие содержания ответов компактируется введением отношения эквивалентности. К полученным классам ответов вопросы задаются повторно. Процедура повторяется до получения фактов (ответов) нужной детальности. Количество фактов (ответов) нижнего уровня определяет количество информации, заключенной в слове. Более подробно об этом сказано в п. 2.6.

Произносимое слово для сохранения должно записываться. Для записи используются буквы и символы, которые как знаки имеют и дополнительную нагрузку. То есть слово оказывается записью информации благодаря алфавитно - символьному кодированию, осуществляемому по соответствующим правилам. Число знаков, используемых для записи, является очень ограниченным, жестко зафиксированным в виде алфавита. При этом правила алфавитного кодирования составляют основу соответствующего языка,. известного всем, а правила символьного кодирования могут быть известны только одному субъекту. Однако есть и общечеловеческие правила символьного кодирования, например математические, известные всем (если вводимые по тексту математические символы оговорены).

Кодовые системы - это системы высшего порядка с точки зрения абстрактности знаков. Базисным знаком кодовых систем является символ. Так как символ может быть применен к любому элементу реального мира, то он не несет никакой семантической нагрузки, а сигнализирует о поступлении информации только фактом появления и их частотой. Поэтому символы незаменимы при исследовании вопросов передачи информации, что и было гениально использовано К.Шенноном.

С помощью знаков рассмотренного типа происходит постепенное преобразование данных в информацию (знания). Так как понятия «данные» и «информация» часто путают, то представляет большой интерес для нас увидеть их разницу. Для этого необходимо рассмотреть, что делается с данными при преобразовании их в информацию.

90