Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

ТЕХНОЛОГІЇ МЕНЕДЖМЕНТУ ЗНАНЬ

.pdf
Скачиваний:
153
Добавлен:
07.02.2016
Размер:
3.02 Mб
Скачать

відображється у свідомості експерта (М1), а потім діяльність і досвід експерта інтерпретуються свідомістю інженера зі знань (М2), що слугує вже основою для побудови третьої інтерпретації (Р) – поля знань інтелектуальної системи. Процес пізнання, за суттю, скерований на створення внутрішньої репрезентації навколишнього світу у свідомості людини.

Якщо описати процеси I2 і I3 в термінології, введеній на початку розділу, то маємо справу з перетворенням експертного знання і теоретичного (книжного) досвіду Z1 в полі знань Z2, яке є матеріалізацією моделі світу М2 інженера зі знань.

У процесі видобування знань аналітика, здебільшого, цікавить компонент Z1, пов’язаний з неканонічними індивідуальними знаннями експертів, оскільки предметні області, що вимагають саме такого типу знань, вважаються найсприйнятливішими до впровадження інтелектуальних систем. Ці області зазвичай називають емпіричними, оскільки в них нагромаджений великий обсяг окремих емпіричних фактів і спостережень, тоді як їх теоретичне узагальнення – питання майбутнього.

Якщо вважати, що інженер зі знань витягає тільки фрагмент Z1’, тобто частину із системи знань експерта Z1, то його завдання, поперше, намагатися, щоб структура Z1’ відповідала Z1, і, по-друге, щоб Z1’ якомога повніше відображала Z1.

Пізнання часто супроводжується створенням нових понять і теорій. Іноді експерт виявляє нові знання прямо під час бесіди з аналітиком. Така генерація знань корисна і самому експертові, який до того моменту міг не усвідомлювати багато співвідношень і закономірностей предметної області. Аналітикові може допомогти тут і інструментарій системної методології, що дає змогу використовувати відомі принципи логіки наукових досліджень, понятійної ієрархії науки. Ця методологія змушує його завжди прагнути за часткою побачити загальне, тобто будувати ланцюжки.

Гносеологічний ланцюжок: факт – узагальнений факт – емпіричний закон – теоретичний закон.

Не завжди вдається дійти до останньої ланки цього ланцюжка, але вже саме прагнення до руху буває надзвичайно плідним. Такий підхід повністю узгоджується зі структурою самого знання, яке має два рівні:

1)емпіричний (спостереження, явища);

2)теоретичний (закони, абстракції, узагальнення).

61

Але теорія – це не лише струнка система узагальнення наукового знання, це також деякий спосіб виробництва нових знань. Основними методологічними критеріями науковості, що дають змогу вважати науковим і саме нове знання, й спосіб його одержання, є:

А3 – {S31, S32, S33} = (внутрішня узгодженість, системність, об’єктивність, історизм}.

Внутрішня узгодженість (S31)

Основні характеристики емпіричного знання:

S31 = {s31_і} = {модальність, суперечливість, неповнота}.

На перший погляд критерій внутрішньої узгодженості знання не відповідає реальним характеристикам, що описують знання з погляду етапу {s31_i}. Ці характеристики емпіричних знань підкреслюють його “багатоукладність” – так, часто факти не узгоджуються один з одним, визначення суперечать, критерії дифузні тощо. Аналітикові, що розуміє особливості емпіричного знання, доводиться згладжувати ці “шорсткості” емпірики.

Модальність (s31_1) знання означає можливість його існування в різних категоріях, тобто в конструкціях існування і повинності. Отже, частина закономірностей можлива, інша обов’язкова тощо. Крім того, доводиться розрізняти такі відтінки модальності, як:

експерт знає, що...; експерт думає, що...; експерт хоче, щоб...; експерт вважає, що...

Можлива суперечність (s31_2) емпіричного знання – природний наслідок з основних законів діалектики, і суперечності ці не завжди повинні вирішуватися в полі знань, а навпаки, саме суперечності слугують найчастіше відправною точкою в міркуваннях експертів.

Неповнота (s31_3) знання пов’язана з неможливістю повного опису предметної області. Завдання аналітика цю неповноту обмежити певною “повнотою”, тобто звузити межі предметної області або ввести обмеження і допущення, що спрощують проблему.

Системність (S32)

Системно-структурний підхід до пізнання (введений Гегелем) орієнтує аналітика на розгляд будь-якої предметної області з позицій закономірностей системного цілого і взаємодії складових його частин. Сучасний структуралізм виходить із багаторівневої ієрархічної орга-

62

нізації будь-якого об’єкта, тобто всі процеси і явища можна розглядати як дрібніші підмножини (ознаки, деталі) і, навпаки, будь-які об’єкти можна (і потрібно) розглядати як елементи вищих класів узагальнень. Наприклад, системний погляд на проблематику структурування знань дає змогу побачити його ієрархічну організацію. Докладніше про це нижче.

Об’єктивність (S33)

Процес пізнання глибоко суб’єктивний, тобто він істотно залежить від особливостей самого суб’єкта, що пізнає. “Факти існують для одного ока й відсутні для іншого” (Віппер). Отже, суб’єктивність поинається вже з опису фактів і збільшується в міру поглиблення ідеалізації об’єктів.

Коректніше говорити про глибину розуміння, ніж про об’єктивність знання. Розуміння – це співтворчість, процес тлумачення об’єкта з погляду суб’єкта. Це складний і неоднозначний процес, що здійснюється в глибинах людської свідомості і вимагає мобілізації всіх інтелектуальних і емоційних здібностей людини. Всі свої зусилля аналітик повинен зосередити на розумінні проблеми.

У психології відомий результат, який підтверджує факт, що люди, які швидко і успішно вирконують інтелектуальні завдання, більшу частину часу витрачають на зрозуміння його, тоді як погані виконавці швидко починають шукати рішення і найчастіше не можуть його знайти.

Історизм (S34)

Цей критерій пов’язаний з розвитком. Пізнання сьогодення – пізнання породжувача його минулого. І хоча більшість експертних систем дають “горизонтальний” зріз знань – без урахування часу (у статиці), інженер зі знань повинен завжди розглядати процеси з урахуванням тимчасових змін – як зв’язок з минулим, так і зв’язок з майбутнім. Наприклад, структура поля знань і база знань повинні допускати відлагодження і корекцію як у період розроблення, так і під час експлуатації ЕС.

Розглянувши основні критерії науковості пізнання, спробуємо тепер описати його структуру. Методологічна структура пізнання може бути подана як деяка послідовність етапів. Параметри {S3і} органічно вписуються в цю структуру пізнання, яка може подаватися як послідовність етапів, описаних далі з позицій інженера зі знань:

63

Е_1: опис і узагальнення фактів; Е_2: встановлення логічних і математичних зв’язків, дедукція й

індукція законів; Е_3: побудова моделі, що ідеалізується;

Е_4: пояснення і прогноз явищ.

Е_1. Опис і узагальнення фактів

Ретельність і повнота ведення протоколів під час процесу видобування і пунктуальна “домашня робота” над ними – ось гарантія продуктивного першого етапу пізнання та матеріал для опису й узагальнення фактів.

На практиці виявляється важко дотримуватися принципів об’єктивності й системності, описаних вище. Найчастіше на цьому етапі факти просто збирають і як би кидають у “загальний мішок”; досвідчений інженер зі знань часто відразу намагається знайти “поличку” або “скриньку” для кожного факту, тим самим приховано готуючись до етапу концептуалізації.

Е_2. Встановлення зв’язків і закономірностей

У пам’яті експерта всі поняття пов’язані й закономірності встановлені, хоча часто і неявно завдання інженера – виявити каркас висновків експерта. Реконструюючи міркування експерта, інженер зі знань може спиратися на дві найпопулярніші теорії мислення – логічну й асоціативну. Якщо логічна теорія завдяки гарячим шанувальникам в особі математиків широко цитується і всіляко експлуатується в роботах зі штучного інтелекту, то друга, асоціативна, набагато менше відома і популярна, хоча має також стародавнє коріння. Так, Р. Фейнман у своїх “Лекціях з фізики” відзначає, що у фізиці, як і раніше, переважним є вавілонський, а не грецький метод побудови знань. Відомо, що давньосхідні математики вміли робити складні обчислення, але формули їх не були логічно зв’язані. Навпаки, грецька математика дедуктивна (наприклад, “Початок” Евкліда).

Традиційна логіка формує критерії, які гарантують точність, валідність, несуперечність загальних понять, міркувань і висновків. Її основи закладені ще в “Органоне” Арістотеля в IV ст. до н. е. Великий внесок у розвиток логіки зробив Джон Стюарт Мілль (1806–1873).

Інженер зі знань і сам використовує операції традиційної логіки, і виділяє їх у схемі міркувань експерта. Це такі операції:

визначення; порівняння і розрізнення;

64

аналіз; абстрагування; узагальнення; класифікація; категоризація; виникнення думок; висновок;

складання силогізмів тощо.

Проте краса і стрункість логічної теорії не повинні заперечувати те, що людина рідко мислить у категоріях математичної логіки. Теорія асоціацій подає мислення як ланцюжок ідей, зв’язаних загальними поняттями. Основними операціями такого мислення є:

асоціації, придбані на основі різних зв’язків; пригадування минулого досвіду; проби і помилки з випадковими

успіхами; звичні (“автоматичні”) реакції тощо.

Проте ці дві теорії не вичерпують усього різноманіття психологічних шкіл. Великий інтерес для інженерії знань може становити ґештальт-психологія. Одним з її засновників є видатний німецький психолог М. Вертгеймер (1880–1943). Під ґештальтом (нім. Gestalt) розуміється принцип цілісності сприйняття як основа мислення. Ґештальт-психологи прагнуть у всьому виділяти якийсь цілісний образ або структуру як базис для розуміння процесів і явищ навколишнього світу. Ця теорія близька до теорії фреймів і об’єктного підходу й спрямована на збагнення глибинного знання, що характеризується стабільністю і симетрією. До того ж важливий “центр ситуації”, щодо якого розвивається знання про предметну область.

Для інженера зі знань це означає, що, виявляючи різні фрагменти знань, він не повинен забувати про головний, про ґештальт-фраг- мент, який впливає на решту компонентів і пов’язує їх у деяку структурну одиницю. Ґештальтом може бути якийсь головний принцип, або ідея, або гіпотеза експерта, або його віра через якісь окремі концепції. Цей принцип рідко формулюється експертом явно, він завжди так би мовити, за “кадром”, і мистецтво інженера зі знань – виявити цей основний ґештальт експерта.

У ґештальт-теорії існує закон “прагнення до хорошого ґештальту”, згідно з яким структури свідомості прагнуть до гармонії, зв’язності, простоти. Це близьке до стародавнього класичного прин-

65

ципу “бритви Оккама” – “сутності не повинні множитися без необхідності” – і формулюється як принцип прегнантності Вертгеймера: “Організація поля має тенденцію бути настільки простою і зрозумілою, наскільки дають можливість задані умови”. Міркування про ґештальт підводять впритул до третього етапу в структурі пізнання.

Е_3. Побудова ідеалізованої моделі

Для побудови моделі, що відображає уявлення суб’єкта про предметну область, необхідна спеціалізована мова, за допомогою якої можна описувати і конструювати ті ідеалізовані моделі світу, які виникають у процесі мислення. Мова ця створюється поступово за допомогою категоріального апарата, прийнятого у відповідній предметній області, а також формально-знакових засобів математики і логіки. Для емпіричних предметних областей така мова поки що не розроблена, і поле знань, яке напівформалізованим способом опише аналітик, може бути першим кроком до створення такої мови.

Будь-яке пізнавальне відбиття містить у собі умовність, тобто спрощення та ідеалізацію. Інженерові зі знань необхідне оволодіння такими специфічними гносеологічними прийомами, як ідеалізація, огрублення, абстрагування, які дають можливість адекватно відображати в моделі реальну картину світу. Ці прийоми доводять властивості й ознаки об’єктів до меж, що дають змогу відтворювати закони дійсності в лаконічнішому вигляді (без впливу неістотних деталей).

На тернистому шляху пізнання перевірений діалектичний підхід виявляється кращим “поводирем”. Інженер зі знань, що прагне пізнати проблемну область, має бути готовим постійно змінювати свої вже затверділі способи сприйняття й оцінювання світу і навіть відмовлятися від них. Найретельніше треба перевіряти правильність думок, які здаються найочевиднішими.

Е_4. Пояснення і пророкування моделей

Цей завершальний етап у структурі пізнання є одночасно і частковим критерієм істинності отриманого знання. Якщо виявлена система знань експерта повна й об’єктивна, то на її підставі можна робити прогнози й пояснювати будь-які явища з певної предметної області. Зазвичай бази знань ЕС страждають фрагментарністю і модульною незв’язаністю компонентів. Все це не дає змогу створювати дійсно інтелектуальні системи, які, рівняючись на людину, могли б передбачати нові закономірності й пояснювати випадки, не вказані в

66

явному вигляді в базі. Винятком тут є навчальні системи, які орієнтовані на генерацію нових знань і “прогноз”.

Пропонована методологія озброює аналітика апаратом, що дає змогу уникнути традиційних помилок, що призводять до неповноти, суперечливості, фрагментарності БЗ, і вказує напрямок, в якому необхідно рухатися розробникам. І хоча сьогодні більшість БЗ опрацьовуються лише до етапу Е_3, знання повної схеми збагачує і поглиблює процес проектування.

2.4. Теоретичні аспекти структурування знань

Поділ стадій видобування і структурування знань є доволі умовним, оскільки хороший інженер зі знань, вже видобуваючи знання, починає роботу зі структурування і формування поля знань, описаного в підрозділі 2.1.

Проте зараз простежується тенденція випередження технологічних засобів розроблення інтелектуальних систем стосовно їхнього теоретичного обґрунтування. Практично зараз існує прірва між блискучими, але трохи “пристарілими” математичними основами кібернетики (праці Вінера, Ешбі, Шеннона, Джорджа, Кліра, Йордона, Ляпунова, Глушкова й ін.), і сучасним поколінням інтелектуальних систем, які засновані на парадигмі опрацювання знань (експертні системи, лінгвістичні процесори, що навчають системи, тощо).

З одного боку, це пояснюється тим, що з перших кроків наука про штучний інтелект (ШІ) була спрямована на моделювання слабкоформалізованих сенсових завдань, у яких не застосовується традиційний математичний апарат; з іншого боку, ШІ – це галузь інформатики і активно розвивається як промислова індустрія програмних засобів в умовах жорсткої конкуренції, де часом важливіше швидке впровадження нових ідей і підходів, ніж їхній аналіз і теоретичне пророблення.

Необхідність розроблення теоретичних основ науки про методи розроблення систем, заснованих на знаннях – інженерії знань, – обґрунтовується в роботах Д.А. Поспєлова, Е.В. Попова, В.Л. Стефанюка, Р. Шенка, М. Мінського – провідних спеціалістів у галузі ШІ. Перші кроки в створенні методології (роботи Г.С. Осипова, В.Ф. Хоро-

67

шевського, А.М. Яшина, Wielinga, Slagle та ін.) фактично є піонерськими і найчастіше орієнтовані на певний клас завдань, що моделюються в межах конкретного програмного інструментарію.

У цьому підрозділі розглянуто нову методологію, що дає змогу здійснити стадію структуризації незалежно від подальшої програмної реалізації, спираючись на досягнення в області розроблення складних систем.

2.4.1. Історична довідка

Стадія концептуального аналізу або структуризації знань традиційно є (разом зі стадією видобування) “вузьким місцем” у життєвому циклі розроблення інтелектуальних систем. Методологія структуризації близька до сучасної теорії великих систем або складних систем, де традиційно акцент робиться на процесі проектування таких систем. Досліджували цю теорію й класики об’єктно-орієнтованого аналізу.

Розроблення інтелектуальних систем з упевненістю можна зарахувати до цього класу завдань, оскільки вони мають основні ознаки складності (ієрархія понять, внутрішньоелементні й міжелементні зв’язки тощо). Складність проектування ІС визначається, переважно, складністю предметних областей і керування процесом розроблення, а також складністю забезпечення гнучкості кінцевого програмного продукту й опису поведінки окремих підсистем.

Аналогічні концепції, але пов’язані не із загальносистемними дослідженнями, а інформаційними процесами, які розглядають у системах, таких як зв’язок і керування, стали основою кібернетики як самостійної науки. Цей підхід був істотно підтриманий роботами Шеннона з математичного моделювання поняття інформації.

Пізніше, в 1960-х рр., було зроблено кілька спроб сформулювати і розвинути математичні теорії систем високого рівня спільності. Істотний внесок до математичної теорії систем і основи структуризації внесли дослідники Н.Я. Моїсєєв, В.М. Глушков, А.Г. Івахненко, Д.А. Поспєлов та інші. Системний аналіз тісно переплітається з теорією систем і передбачає сукупність методів, орієнтованих на дослідження і моделювання складних систем: технічних, економічних, екологічних тощо.

68

2.4.2. Ієрархічний підхід

Проектування складних систем і методи структуризації інформації традиційно використовували ієрархічний підхід як методологічний прийом розчленовування формально описаної системи на рівні (або блоки, або модулі). На вищих рівнях ієрархії використовуються найменш деталізовані уявлення, що відображають тільки загальні риси і особливості проектованої системи. На наступних рівнях ступінь подрібленості зростає, система розглядається не загалом, а окремими блоками.

У теорії САПР такий підхід називається блочно-ієрархічним (БІП). Одне з переваг БІП полягає в тому, що складне завдання великої розмірності розбивається на послідовно вирішувані групи завдань малої розмірності.

На кожному рівні вводяться свої уявлення про систему та елементи. Елемент k-го рівня є системою для рівня k–1. Просування від рівня до рівня має строгу спрямованість, зумовлену стратегією проектування – згори донизу або знизу догори.

Спадна концепція (top-down) декларує рух від n = n+1 , де n n- й рівень ієрархії понять ПО (предметної області) з подальшою деталізацією понять, що належать відповідним рівням

STR

: Pn Pn 1

,..., Pn 1 ,

td

i

1

ki

де n – номер рівня концепту, що породжує; i – номер концепту, що породжує; kі – число породжуваних концептів, сума всіх kі по і становить загальне число концептів на рівні n+1.

Вихідна концепція (bottom-up) пропонує рух n n 1 з послідовним узагальненням понять.

STRtd : Pt n ,..., Pkn Pi n 1 ,

i

де n – номер рівня концептів, що породжують; i – номер породжуваного концепту; kі – число концептів, що породжують, сума всіх kі по i становить загальне число концептів на рівні n).

Підставою для припинення агрегації та дезагрегування є повне використання словника термінів, яким користується експерт, до того ж число рівнів є значущим чинником успішності структуризації (див. “вербальні звіти” у наступному розділі).

69

2.4.3. Традиційні методології структуризації

Наявні підходи до проектування складних систем можна розділити на два великі класи:

структурний (системний) підхід, або аналіз, заснований на ідеї алгоритмічної декомпозиції, де кожний модуль системи виконує один з найважливіших етапів загального процесу;

обєктний підхід, пов’язаний з декомпозицією і виділенням не процесів, а об’єктів, до того ж кожен об’єкт розглядається як екземпляр певного класу.

У структурному аналізі розроблена велика кількість виразних засобів для проектування, зокрема графічних: діаграми потоків даних (DFD – data-flow diagrams), структуровані словники (тезауруси), мови специфікації систем, таблиці рішень, стрілочні діаграми “об’єкт-зв’я-

зок” (ERD – entity-relationship diagrams), діаграми переходів (станів),

дерева цілей, блок-схеми алгоритмів (у нотації Нассі-Шнейдермана, Гамільтона-Зельдіна, Фестля тощо), засоби керування проектом (PERT-Діаграми, діаграми Ганта та ін.), моделі оточення.

Множинність засобів і їхня деяка надмірність пояснюються тим, що кожна предметна область, використовуючи структурний підхід як універсальний засіб моделювання, вводила свою термінологію, найвідповіднішу для відображення специфіки конкретної проблеми. Оскільки інженерія знань має справу з широким класом ПО (це “м’які” ПО), постає завдання розроблення достатньо універсальної мови структуризації.

Об’єктний (об’єктно-орієнтований) підхід (ООП), що виник як технологія програмування більших програмних продуктів, заснований на таких основних елементарних поняттях: об’єкти, класи як об’єкти, зв’язані спільністю структури і властивостей, і класифікації як засоби впорядкування знань; ієрархії зі спадкуванням властивостей; інкапсуляції як засоби обмеження доступу; методи і поліморфізм для визначення функцій і відносин.

ООП має свою систему умовних позначень і пропонує багатий набір логічних і фізичних моделей для проектування систем високого ступеня складності, при цьому ці системи добре структуровані, що породжує легкість їхньої модифікації. Вперше принцип ООП розроблений у 1979 р., а потім розвинений.

70