- •1. Базы знаний. Основные определения и назначение дисциплины.
- •2. Знания и данные.
- •3. Модели представления знаний. Формальные логические модели. Продукционные модели.
- •4. Модели представления знаний. Семантические сети. Фреймы.
- •5. Формальные логические модели представления знаний.
- •6. Метод резолюций.
- •7. Продукционная модель представления знаний. Виды продукций (3).
- •8. Процесс разработки продукционной модели знаний. И-Или граф.
- •9. Экспертные системы. Методология разработки экспертных систем. Стратегии разрешения конфликтов.
- •10. Деревья решений. Определение, назначение.
- •11. Алгоритмы обучения деревьев решений. Алгоритм id3. Критерии разбиений.
- •12. Алгоритм c4.5
- •13. Алгоритм cart. Построение дерева классификации и регрессии.
- •14. Ансамбли деревьев решений. Алгоритм Random Forest.
- •15. Алгоритм cart. Метод Cost complexity tree pruning.
- •16. Алгоритм сart. Выбор итогового дерева решений. Метод V-fold cross-validation.
- •17. Модель представления знаний на основе семантических сетей.
- •18. Ассоциативные сети.
- •19. Концептуальные графы.
- •20. Фреймовая модель представления знаний. Описание модели.
- •21. Применение фреймовых моделей.
- •22. Ооп как модель представления знаний.
- •24. Семантические технологии Web (Semantic Web). Определение и общее назначение технологии. Преимущества семантических сетей для интернета.
- •25. Технологии Semantic Web. Архитектура Semantic Web. Описание стека технологий и как они приведут к реализации Semantic Web.
- •26. Технологии Semantic Web. Xml. XmlSchema.
- •27. Технологии Semantic Web. Rdf.
- •29. Особенности поисковых систем. Структура организации и алгоритм работы.
- •30. Язык запросов поисковых систем.
- •31. Семантическая поисковая система.
- •34. Процесс разработки онтологий.
- •35. Технологии Semantic Web. Owl.
- •36. Компоненты онтологического языка Web на основе owl.
- •37. Применение онтологий. Значение онтологий для бизнеса.
- •38. Система разработки онтологий Protйgй. Назначение. Модель
- •39. Data Mining. Определение, назначение и решаемые задачи.
- •40. Data Mining. Классификация.
- •41. Data Mining. Кластеризация.
- •42. Date Mining. Прогнозирование.
1. Базы знаний. Основные определения и назначение дисциплины.
Данные – это представление фактов в формализованном виде, пригодном для передачи и обработки в некотором информационном процессе.
Знания – это совокупность информации (данных) и правил вывода о мере, свойствах и закономерностях достаточных для принятия решений…
Главное отличие знаний от данных:
структурности, активности.
могут изменять при добавлении новых фактов.
фиксируются в знаках естественных и искусственных языков
как правило для знаний существует собственный язык.
DIKW – информационная иерархия, где каждый следующий уровень добавляет определенные свойства к предыдущему уровню.( D(data) – данные (БД); I(information) – информация добавляет контекст (данные о данных – метаданные); K(knowledge) – уровень «как», т.е. как использовать;W(wisdom) – мудрость –знания о том когда и что применять).
Базы знаний – это особого роды базы данных, разработанные для оперирования знаниями (принятие решений на основе знаний). Знания получаются из данных. На основе знаний принимаются решения. Полноценная БЗ содержат в себе не только фактическую информацию, но и правила вывода допускающие умозаключения о выводимых фактах, и как следствие осмысленная обработка информации.
Инженерия знаний – область наук, изучающая БЗ и методы работы с ними.
Свойства БЗ:
Автоматическое доказательство – способность системы выводить новые знания из старых и находить закономерности.
Доказательство заключения – способность системы после выдачи ответа объяснить ход ее рассуждений.
Интроспекция – нахождение противоречий и нестыковок в БЗ и контроль правильной организации
Машинное обучение – набор опыта и переобучение
Двумя наиболее важными требованиями к информации, хранящейся в БД являются:
- Достоверность конкретных обобщенных сведений
- Релевантность информации получаемой с помощью правил вывода (релевантный – значимый, существенный, и имеющий отношение к данному вопросу и запросу; RageRank – алгоритм Google – поиск по графу с сортировкой по релевантности).
Применения:
Интеллектуальный анализ данных (Data Mining) - процесс обнаружения в сырых данных ранее неизвестных нетривиальных практически полезных и доступных и полезных знаний. Подразделяется на задачи классификации, моделирования, прогнозирования и т.д.
Экспертная система – программа помогающая принять решения (пользование знаниями как экспертом)
Гибридная интеллектуальная система (ГИС) – система в которой для решения задачи используется один или более методов имитации интеллектуальной деятельности человека. В ГИС входят: аналитические модели (диффуры), ИНС, нечеткие системы, генетические алгоритмы, имитационные статистические модели.
Машинное обучение – обучение по данным в БД и способность последующего принятия решений
Обработка естественного языка – анализ естественного языка и синтез ответа.
Wolfram Alpha – единственная коммерческая семантическая сеть.
Метаданные – это данные о данных; инфо об инфо; структурированные данные, представляющие собой характеристики описываемых сущностей.
Онтология – (наука о бытии) попытка всеобъемлимой и детальной формализации некоторой области знаний с помощью концептуальной схемы, обычно такая схема составляет структуры данных, содержащие все релевантные классы объектов, связи между ними, правила, теоремы, ограничения принятые в этой области. Онтология используется в БЗ как иерархический способ построения понятий и отношений между ними.