Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекція 1. Базові поняття штучного інтелекту.doc
Скачиваний:
49
Добавлен:
05.03.2016
Размер:
188.42 Кб
Скачать

4. Архітектура й основні складові частини систем ші

Існують різні підходи до побудови систем ШІ. Це поділ не є історичним, коли одна думка поступово поміняє інше, і різні підходи існують і зараз. Крім того, оскільки по-справжньому повних систем ШІ в цей час ні, те не можна сказати, що якийсь підхід є правильним, а якийсь помилковим.

Для початку коротко розглянемо логічний підхід. Чому він виник? Адже людина займається аж ніяк не тільки логічними вигадництвами. Це висловлення кінцеве вірно, але саме здатність до логічного мислення дуже сильно відрізняє людини від тварин.

Основою для даного логічного підходу служить булева алгебра. Кожен програміст знаком з нею й з логічними операторами з тих пор, коли він освоював оператор IF. Свій подальший розвиток булева алгебра одержала у вигляді вирахування предикатів – у якому вона розширена за рахунок введення предметних символів, відносин між ними, кванторів існування й загальності. Практично кожна система ШІ, побудована на логічному принципі, являє собою машину доказу теорем. При цьому вихідні дані зберігаються в базі даних у вигляді аксіом, правила логічного висновку як відносини між ними. Крім того, кожна така машина має блок генерації мети, і система висновку намагається довести дану мету як теорему. Якщо ціль доведена, то трасування застосованих правил дозволяє одержати ланцюжок дій, необхідних для реалізації поставленої мети. Потужність такої системи визначається можливостями генератора цілей і машиною доказу теорем.

Звичайно можна сказати, що виразності алгебри висловлень не вистачить для повноцінної реалізації ШІ, але варто згадати, що основою всіх існуючих ЕОМ є біт – комірка пам'яті, що може приймати значення тільки 0 й 1. У такий спосіб було б логічно припустити, що все, що можливо реалізувати на ЕОМ, можна було б реалізувати й у вигляді логіки предикатів. Хоча тут нічого не говориться про те, за який час.

Домогтися більшої виразності логічному підходу дозволяє такий, порівняно новий напрямок, як нечітка логіка. Основною її відмінністю є те, що правдивість висловлення може приймати в ній крім так/ні (1/0) ще й проміжні значення – не знаю (0.5), пацієнт скоріше живий, чим мертвий (0.75), пацієнт скоріше мертвий, чим живий (0.25). Даний підхід більше схожий на мислення людини, оскільки він на питання рідко відповідає тільки так чи ні. Хоча правда на іспиті будуть прийматися тільки відповіді з розряду класичної булевої алгебри.

Для більшості логічних методів характерна більша трудомісткість, оскільки під час пошуку доказу можливий повний перебір варіантів. Тому даний підхід вимагає ефективної реалізації обчислювального процесу, і гарна робота звичайно гарантується при порівняно невеликому розмірі бази даних.

Під структурним підходом ми маємо на увазі спроби побудови ШІ шляхом моделювання структури людського мозку. Однією з перших таких спроб був перцептрон Френка Розенблатта. Основною структурною одиницею що моделює, в перцептронах (як й у більшості інших варіантів моделювання мозку) є нейрон.

Пізніше виникли й інші моделі, які звичайно відомі під терміном "нейронні мережі" (НМ). Ці моделі розрізняються по будові окремих нейронів, по топології зв'язків між ними й по алгоритмах навчання. Серед найбільш відомих зараз варіантів НМ можна назвати НМ зі зворотним поширенням помилки, мережі Хопфілда, стохастичні нейронні мережі.

НМ найбільш успішно застосовуються в завданнях розпізнавання образів, у тому числі сильно зашумлених, однак є й приклади успішного застосування їх для побудови властиво систем ШІ, це вже раніше згадуваний ТАІР.

Для моделей, побудованих за мотивами людського мозку характерна не занадто більша виразність, легке розпаралелювання алгоритмів, і пов'язана із цим висока продуктивність паралельно реалізованих НМ. Також для таких мереж характерна одна властивість, що дуже зближає їх з людським мозком – нейронні мережі працюють навіть за умови неповної інформації про навколишнє середовище, тобто як і людина, вони на питання можуть відповідати не тільки "так" й "ні" але й "не знаю точно, але скоріше так".

Досить велике поширення одержав й еволюційний підхід. При побудові систем ШІ по даному підході основна увага приділяється побудові початкової моделі, і правилам, по яких вона може змінюватися (еволюціонувати). Причому модель може бути складена по всіляких методах, це може бути й НМ і набір логічних правил і будь-яка інша модель. Після цього ми включаємо комп'ютер і він, на підставі перевірки моделей відбирає найкращі з них, на підставі яких по всіляких правилах генеруються нові моделі, з яких знову вибираються найкращі й т.д.

У принципі можна сказати, що еволюційних моделей як таких не існує, існує тільки еволюційні алгоритми навчання, але моделі, отримані при еволюційному підході мають деякі характерні риси, що дозволяє виділити їх в окремий клас.

Такими особливостями є перенесення основної роботи розроблювача з побудови моделі на алгоритм її модифікації й те, що отримані моделі практично не супроводжують витягу нових знань про середовище, що оточує систему ШІ, тобто вона стає як би річчю в собі.

Ще один широко використовуваний підхід до побудови систем ШІ - імітаційний. Даний підхід є класичним для кібернетики з одним з її базових понять - "чорним ящиком" (ЧЯ). ЧЯ – пристрій, програмний модуль або набір даних, інформація про внутрішню структуру й зміст яких відсутні повністю, але відомі специфікації вхідних і вихідних даних. Об'єкт, поводження якого імітується, саме і являє собою такий "чорний ящик". Нам не важливо, що в нього й у моделі усередині і як він функціонує, головне, щоб наша модель в аналогічних ситуаціях поводилася точно так само.

У такий спосіб тут моделюється інша властивість людини – здатність копіювати те, що роблять інші, не вдаючись у подробиці, навіщо це потрібно. Найчастіше ця здатність заощаджує йому масу часу, особливо на початку його життя.

Основним недоліком імітаційного підходу також є низька інформаційна здатність більшості моделей, побудованих з його допомогою.

Із ЧЯ зв'язана одна дуже цікава ідея. Хто б хотів жити вічно? Я думаю, що майже всі відповідять на це питання "я".

Уявимо собі, що за нами спостерігає якийсь пристрій, що стежить за тим, що в яких ситуаціях ми робимо, говоримо. Спостереження йде за величинами, які надходять до нас на вхід (зір, слух, смак, тактильні, вестибулярні й т.д.) і за величинами, які виходять від нас (мова, рух й ін.). У такий спосіб людина виступає тут як типовий ЧЯ.

Далі цей пристрій намагається відбудувати якусь модель таким чином, щоб при певних сигналах на вході людини, вона видавала на виході ті ж дані, що й людина. Якщо дана витівка буде коли-небудь реалізована, то для всіх сторонніх спостерігачів така модель буде тією же особистістю, що й реальна людина. А після його смерті вона, буде висловлювати ті думки, які приблизно висловлювала би й змодельована людина.

Ми можемо піти далі й скопіювати цю модель й одержати брата близнюка з точно такими ж "думками".

Можна сказати, що "це звичайно все цікаво, але при чому тут я? Адже ця модель тільки для інших буде мною, але усередині її буде порожнеча. Копіюються тільки зовнішні атрибути, але я після смерті вже не буду думати, моя свідомість згасне (для віруючих людей слово "згасне" необхідно замінити на "покине цей мир")". Що ж це так. Але спробуємо піти далі.

Відповідно до філософських подань окремих авторів, свідомість являє собою порівняно невелику надбудову над нашою підсвідомістю, що стежить за активністю деяких центрів головного мозку, таких як центр мови, кінцевої обробки зорових образів, після чого "повертає" ці образи на початкові щаблі обробки даної інформації. При цьому відбувається повторна обробка цих образів, ми як би бачимо й чуємо, що думає наш мозок. При цьому з'являється можливість уявного моделювання навколишньої дійсності при нашому "активному" участі в даному процесі. І саме наш процес спостереження за діяльністю цих деяких центрів є тим, що ми називаємо свідомістю. Якщо ми "бачимо" й "чуємо" наші думки, ми у свідомості, якщо ні, то ми перебуваємо в несвідомому стані.

Якби ми змогли змоделювати роботу саме цих деяких "свідомих" нервових центрів (робота яких правда заснована на діяльності всього іншого мозку) у якості одного ЧЯ, і роботу "супервізора" у якості іншого ЧЯ, то можна було б із упевненістю говорити, що "так, дана модель думає, причому так само, як і я". Тут нічого не будемо говорити про те, як одержати дані про роботу цих нервових центрів, оскільки сьогодні немає нічого такого, що дозволило б стежити за мозком людини роками й при цьому не заважало б його роботі й життю.

І закінчуючи швидке ознайомлення з різними методами й підходами до побудови систем ШІ, хотілося б відзначити, що на практиці дуже чіткої границі між ними немає. Дуже часто зустрічаються змішані системи, де частина роботи виконується по одному типу, а частина по іншому.

Для того, щоб людина свідомо сприйняла інформацію (для приклада візьмемо креслення), воно повинно пройти досить тривалий цикл попередньої обробки. Спочатку світло попадає в око. Пройшовши через всю оптичну систему фотони зрештою попадають на сітківку – шар світлочутливих кліток – паличок і колбочок.

Уже тут – ще дуже далеко від головного мозку, відбувається перший етап обробки інформації, оскільки, наприклад, у ссавців, відразу за світлочутливими клітками звичайно перебувають два шари нервових кліток, які виконують порівняно нескладну обробку.

Тепер інформація надходить по зоровому нерві в головний мозок людини, у так називані "зорові бугри". Те, що саме сюди приходить відеоінформація для подальшої обробки, показують численні досліди над людьми під час різних операцій, у ході яких вироблялася трепанація черепа. При цьому пацієнтам дратували область зорових бугрів слабким електричним полем, що викликало в них різні світлові галюцинації. Причому, що цікаво, при зміні місця роздратування, пропорційно зсуву, зміщалися й місця галюцинацій, тобто на зорові бугри як би проектується те, що ми бачимо.

Деякі дослідники пішли далі, і вживляли сліпим людям цілу матрицю електродів, напруги на яких відповідали освітленості відповідних ділянок відеокамери, розміщеної на голові пацієнта. Після операції, сліпі починали розрізняти великі фігури (квадрат, трикутник, коло) і навіть читати текст (при вживлянні матриці 10×10). Широкому поширенню даного методу лікування сліпоти перешкоджають як недостатньо високий наш технічний рівень, так і надзвичайно висока небезпека операцій на відкритому мозку. Такого роду досвіди проводяться тільки попутно з операцією, викликаної іншими причинами.

Далі зорова інформація надходить у відділи мозку, які вже виділяють із її окремі складові – горизонтальні, вертикальні, діагональні лінії, контури, області світлого, темного, кольорового. До цих пор ми можемо без праці змоделювати роботу мозку застосовуючи різні графічні фільтри. Поступово образи стають усе більше складний і розмитими, але графічний образ картини пройде ще довгий шлях, перш ніж досягне рівня свідомості. Причому на рівні свідомості в нас буде не тільки зоровий образ, до нього домісяться ще й звуки, заходи (якщо картина являє собою натюрморт) і смакові відчуття. Подальші асоціації кожний може додумати сам.

Зміст усього сказаного полягає в тім, щоб показати, що в системах ШІ є підсистеми, які ми вже зараз можемо реалізувати навіть не знаючи про те, як вони реалізовані в людини. Причому можемо це зробити не гірше, ніж у прототипу, а найчастіше й краще. Наприклад, штучне око (а рівно й блок первинної обробки відеоінформації, засновані на найпростіших фільтрах або інших порівняно нескладних пристроях) не утомлюється, може бачити в будь-якому діапазоні хвиль, легко замінюється на нове, бачить при світлі зірок.

Пристрої обробки звуку дозволяють уловлювати девіацію голосу людини в 1-2 Герца. Дана зміна частоти відбувається при підвищеному порушенні вегетативної нервової системи, що у свою чергу часто обумовлена хвилюванням людини. На даному принципі засновані сучасні детектори неправди, які дозволяють виявити з високою ймовірністю навіть записані на плівку багато років тому помилкові висловлення.

Сучасні системи керування електродвигуном дозволяють із високою точністю тримати задані координати навіть при ударній зміні навантаження. Але ж це приблизно теж, що тримати на довгому ціпку баскетбольний м'яч, по якому те ліворуч, те праворуч кидають тенісні м'ячі.

За один і той-те час, комп'ютер зробить набагато більше арифметичних операцій і з більшою точністю, чим людина.

Антиблокувальна система на автомобілях дозволяє тримати гальма на грані заклинювання колеса, що дає найбільше тертя з дорогою, а це без АБС під силу тільки дуже досвідченим водіям.

У принципі такі приклади, де техніка виявляється нітрохи не гірше людини, можна продовжувати нескінченно. Загальний же зміст сказаного в тім, що при конструюванні ШІ, ми не зв'язані одним набором елементарних складових, як природа. У кожному конкретному випадку бажано застосовувати те, що дасть найбільший ефект. У тій області, де в людини панують рефлекси (чхання, швидка напруга м'яза, переварювання їжі, регулювання температури), ми взагалі можемо застосувати жорсткі системи керування, з раз і назавжди заданим алгоритмом функціонування. При цьому цілком можна чекати збільшення точності й зменшення часу їх навчання майже до нуля. При цьому ядро нашої системи ШІ буде вирішувати вже не настільки глобальні завдання.

Даний принцип розбивки завдання на підзадачі вже давно використовується природою. Приміром, ми далеко не повністю використовуємо всі можливості наших м'язів в області розмаїтості рухів. Ми не можемо змусити наші очі дивитися в різні сторони, не говорячи вже про те, щоб робити це на різному рівні (ліве око – нагору, праве – униз). При ходьбі ми часто використовуємо далеко не оптимальний набір рухів і далеко не всі поєднання варіантів напруги м'язів ми випробуємо. Спробуйте наприклад зробити хвилю животом. У принципі тут немає нічого складного, оскільки кожен пучок м'язів преса іннервується окремо, але якщо Ви цього не робили раніше, то одержати необхідний результат буде не просто – у повсякденному житті ця дія непотрібна, а значить її немає й в "словнику рухів", а на навчання необхідно певний час. А з приводу оптимальності ходи існують розрахунки, що якби людина завжди розраховувала оптимально траєкторію руху в якій існує більше 200 ступенів свободи, то вона б не ходила, а в основному б тільки думала про те, як треба ходити.

Насправді наша система керування побудована по ієрархічному принципу, коли завдання розподіляється між декількома рівнями. Вищий рівень нервової системи (пов'язаний з більшими півкулями мозку) ставить лише загальне завдання, скажемо, перекласти книгу на стіл. Цей рівень взагалі не контролює дії окремих рухових одиниць, спрямованих на рішення поставленого завдання. Тут доречна аналогія: командуючий армією, ставлячи перед своїми військами якесь загальне завдання, аж ніяк не пропонує кожному солдату і офіцеру, що саме він повинен робити в кожен момент операції.

Деталізація побудови рухів у людини відбувається на рівнях більше низьких, чим командний рівень кори більших півкуль. Більше того, у деяких випадках (коли ми відсмикуємо руку, доторкнувшись до гарячого предмета, навіть не встигнувши усвідомити ситуацію) все керування формується на нижчих рівнях, пов'язаних з різними відділами спинного мозку.

У загальному ситуація схожа з тією, коли програміст використовує бібліотеку підпрограм. При цьому йому не важливо, який алгоритм вони використовують, якщо програма працює нормально. А на написання своєї бібліотеки витрачається дорогоцінний час. Крім того, ще не відомо, чи буде вона працювати так само добре.

Загальний висновок даної лекції полягає в тому, що в цей час існують методи, алгоритми й пристрої, які дозволяють нам досить непогано змоделювати нижні рівні людського інтелекту, причому зовсім не обов'язково на такому ж фізичному принципі.