Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги2 / 260

.pdf
Скачиваний:
0
Добавлен:
24.02.2024
Размер:
4.34 Mб
Скачать

МинистерствообразованияинаукиРоссийскойФедерации Московскийгосударственныйтехнический университетим.Н.Э.Баумана Кафедра«Системыобработкиинформациииуправления»

ИНТЕЛЛЕКТУАЛЬНЫЕ ТЕХНОЛОГИИ И СИСТЕМЫ

Сборник учебно-методических работ и статей аспирантов и студентов

Выпуск 8

Под редакцией Ю.Н.Филипповича

НОК «CLAIM»

Москва

2006

УДК 007.52 ББК 32.813 И 76

Составитель: Ю.Н.Филиппович

Авторы статей:

А.А.Александрова, Е.М.Буркова, Ван Чэнь, Гуань Ли, И.С.Кесель, С.А.Кесель, А.Б.Кирнарский, Е.П.Коннова, А.А.Кононков, Ле Ба Хонг Минь, И.М.Нейский, Д.А.Никитченко, М.А.Павлова, А.И.Панченко, М.Е. Постников, А.А. Проскурнин, Б.И.Рабинович, Е.В.Ртищева, А.А.Самочетов, А.М.Серебряков. А.В.Сиренко, А.Ю.Филиппович, Анна Филиппович, Ю.Н.Филиппович, Г.А.Черкасова.

И 76 Интеллектуальные технологии и системы. Сборник учебно-

методических работ и статей аспирантов и студентов.

Выпуск 8 / Сост. и ред. Ю.Н.Филипповича. — М.: НОК «CLAIM», 2006. — 326 с.

Сборник содержит 18 научных статей аспирантов и студентов. Статьи посвящены: исследованию и разработке информационных технологий в области образования, ERP-системам и интеллектуализации биз- нес-процессов, компьютерной лексикографии и семиотики, проектированию баз знаний.

Сборник предназначен для преподавателей, аспирантов и студентов специальностей двух направлений: 230100 — Информатика и вычислительная техника, 230200 — Информационные системы.

©НОК «CLAIM», 2006

©Филиппович Ю.Н., 2006

©Авторы работ, 2006

Содержание

 

ПРЕДИСЛОВИЕ

 

РЕДАКТОРСКАЯ СТАТЬЯ

 

Ю.Н.Филиппович. Аспекты информационной технологии

 

когнитивного эксперимента создания

 

лингвокультурного тезауруса...................................................................

7

СТАТЬИ АСПИРАНТОВ И СТУДЕНТОВ

А.А.Александрова. Жестомимические

 

автоматизированные системы ...............................................................

33

Е.М.Буркова. Интеллектуальная система обработки смет и лимитов:

компонента разнесения договоров на статьи расходов .......................

39

Ван Чэнь, Гуань Ли. Китайские метафоры информатики ...................

63

И.С.Кесель. Интерактивное учебно-методическое пособие

 

по курсу «Защита информации в АСОИУ» .........................................

84

А.Ю.Филиппович, А.Б.Кирнарский. Проведение интерактивных

 

лингвистических ассоциативных экспериментов в сети Интернет....

96

Е.П.Коннова. Основные подходы к выделению и ранжированию

 

бизнес-процессов ....................................................................................

107

А.А.Кононков. Применение методов кластерного анализа

 

при проведении исследований ..............................................................

120

Ле Ба Хонг Минь. Алгоритм перевода слов

 

с русского языка на вьетнамский ..........................................................

126

И.М.Нейский. Классификация и сравнение

 

методов кластеризации...........................................................................

130

Д.А.Никитченко. Интеллектуализация деятельности

 

механического завода .............................................................................

143

М.А. Павлова. Интеллектуальные методы и подходы

 

к организации поиска информации.......................................................

157

А.И.Панченко. Программа для изучения новой

 

лексики «Les Mots» ................................................................................

177

М.Е. Постников. Методы выбора оборудования

 

для организации эффективной работы сети.........................................

188

А.А. Проскурнин. Автоматизированная система контроля знаний ....

200

Б.И.Рабинович. Среда обработки потоков данных .............................

208

Е.В.Ртищева. Автоматизация построения курсов лекций

 

по программированию на основе веб-технологий ..............................

244

А.А.Самочетов. Дистрибутивно-статистический анализ текстов .....

252

А.Ю.Филиппович, А.М.Серебряков. Генетические алгоритмы.

 

Пример реализации и исследование эффективности..........................

258

А.В.Сиренко. База данных лингвокультурного тезауруса

 

русского языка .......................................................................................

268

Анна Филиппович. Анализ типографских текстовых шрифтов

 

второй половины XVIII века .................................................................

279

МЕТОДИЧЕСКИЕ РАБОТЫ

 

С.А.Кесель. Аутентификация пользователей с использованием

 

ОТР-токенов компании Vasco. Методические указания к

 

лабораторной работе по дисциплине

 

«Защита информации в АСОИУ» .........................................................

292

Ю.Н.Филиппович, А.Ю.Филиппович, Г.А.Черкасова. Создание

 

базы данных Словаря Академии Российской 1789–1794 гг.

 

Методические указания к курсовой работе по дисциплине

 

«Семиотика информационных технологий»........................................

306

Предисловие

Ввосьмом выпуске сборника представлены научные статьи преподавателей, аспирантов и студентов кафедры «Системы обработки информации

иуправления (ИУ5) Московского государственного технического университетаим. Н.Э.Баумана.

Редакторская статья посвящена рассмотрению информационной технологии поддержки нового класса экспериментальных исследований языкового сознания — когнитивным экспериментам, одной из целей которых является создание лингвокультурноготезауруса(ЛКТ).

Начало исследованиям было положено несколько лет тому назад и связано с научными сообщениями и публикациями в 2002–2004 гг. чл.корр. РАН, д.ф.н., профессора Ю.Н.Караулова. Разработки ЛКТ в 2003–2004 гг. проводились в Московском государственном лингвистическом университете по Федеральной целевой программе «Русский язык» на 2002-2005 годы», а с 2005 по н.в. по гранту РФФИ 05-06-80284 «Языковое сознание нашего современника: когнитивная структура и лингвокультурное содержание».

Встатье рассматриваются три аспекта информационной технологии, условноназванные«создание», «функционирование» и«существование».

Анализируются состав и принципы концептуальной модели когнитивного эксперимента, лежащего в основе построения ЛКТ. Последовательно рассматривается исходная и расширенная концептуальные модели, а также возможные направления дальнейших ее расширений. Описывается архитектура автоматизированной системы поддержки эксперимента, основные процедуры планирования эксперимента и проектирование автоматизированной системы обработки экспериментальных данных. Подробно приведены описания ввода и первичной обработки данных, состава и структуры базы данных когнитивного эксперимента. Описаны процедуры получения различных проекций базы данных, операции формальной и семантической верификацииэкспериментальных данных.

Статьи аспирантов и студентов посвящены исследованию и разработкеинформационных технологийиконкретныхсистем.

Несколько статей сборника продолжают тему редакторской статьи. Так

встатье А.А.Проскурнина рассмотрена автоматизированная система контроля знаний, на основе когнемной модели Ю.Н.Караулова и однопараметрической модели обработки результатов педагогических экспериментов Раша. А.В.Сиренко подробно описывает рабочий вариант базы данных лингвокультурноготезаурусарусскогоязыка.

Встатьях А.Ю.Филипповича с А.Б.Кирнарским и А.М.Серебряковым рассматриваются вопросы моделирования вербального сознания: практическая реализация web-ориентированных интерактивных ассоциативных экспериментов и пример возможного использования генетических алгоритмов

впсихолингвистических исследованиях. Данные разработки ведутся по гранту РГНФ № 06-04-03803в «Автоматизированная система научных исследований динамики ассоциативно-вербальной модели языкового сознания русских как индикатора образа России в новейшей истории и современности» (руководитель А.Ю.Филиппович).

СтатьиИ.С.Кеселя иЕ.В.Ртищевойпосвященыразработкам обучающих систем. Они непосредственно связаны с учебными курсами, которые ве- дутсядлястудентовкафедрыИУ-5.

Всборнике представлено несколько статей-обзоров, раскрывающих предмет будущих исследований и разработок их авторов: А.А.АлександровойА.А.Кононкова, И.М.Нейского, М.А.Павловой, А.А.Самочетова.

Традиционными для сборника являются публикации посвященные интеллектуализации процессов переработки информации и принятия решений для практических систем. К ним относятся работы Е.М.Бурковой, Е.П.Конновой, Д.А.Никитченко, М.Е.Постникова, Б.И.Рабиновича.

Статья Ван Чэня и Гуань Ли содержит фрагмент возможного будущего русско-китайского словаряметафор информационныхтехнологий.

Встатье Ле ба Хонг Миня описан один из алгоритмов системы руссковьетнамского машинного перевода, разработка которой им ведется в рамкахмагистерсгого исследования.

Статья Анны Филиппович посвящена исследованиям особенностей и разработке элементов шрифтов кон. XVIII– нач. XIX вв., использованных при печати многих научных изданий этого исторического периода. Работа выполняется в рамках гранта РГНФ № 06-04-12412в «Интегрированная инструментальная информационно-программная среда для автоматизации исследованийСловаряакадемиироссийской1789–1794 гг.».

Всборник включены две методические разработки — рекомендации для студентов к выполнению лабораторных работ по дисциплине «Защита информации в АСОИУ» и курсового проекта по дисциплине «Семиотика информационныхтехнологий».

Благодарю за помощь в подготовке и выпуске сборника Г.А.Черкасову иА.Л.Волкова.

Ю.Н.Филиппович

Редакторская статья

Ю.Н.Филиппович

АСПЕКТЫ ИНФОРМАЦИОННОЙ ТЕХНОЛОГИИ КОГНИТИВНОГО ЭКСПЕРИМЕНТА

СОЗДАНИЯ ЛИНГВОКУЛЬТУРНОГО ТЕЗАУРУСА

Введение

Статья посвящена рассмотрению одной из компонент проекта РФФИ «Языковое сознание нашего современника: когнитивная структура и лингвокультурное содержание» (РФФИ 05-06-80284). Проект направлен на решение фундаментальной проблемы, касающейся комплекса наук о человеке, — исследование структуры, содержания и функционирования языкового сознания. В рамках проблемы поставлена конкретная задача — моделирование языкового сознания на основе анализа, не изучавшегося ранее знакопорождающего режима его работы, в противовес хорошо изученному смыслопорождающему режиму. Теоретические положения предложенного подхода включают рассмотрение взаимоотношений семантического и когнитивного уровней анализа, обоснование введения элементарной единицы знания, разработку процедур перехода от семантического уровня на когнитивный: от языковых единиц — к единицам знания. Экспериментальная часть строится как массовый психолингвистический эксперимент с носителями языкакультуры, в котором испытуемым предлагается по некоторому заданному смыслу установить знак, отвечающий этому смыслу. Материалы этого уникального эксперимента подвергаются специальной лингвокогнитивной обработке, в результате чего получается совокупность когнитивных единиц, которые формируются в базу знаний современного усредненного носителя русского языка и культуры. Работа с базой знаний позволяет установить метрику пространства языкового сознания и его

8 Аспекты информационной технологии когнитивного эксперимента…

содержание, характеризующее реальный и виртуальный миры, в которых живет современный человек. [Караулов 2003а-б, 2004а-в]

Впроводимом научном исследовании используются два понимания информационной технологии: «широкое» и «узкое». «Широкое» понимание информационной технологии, как способа существования мыслящей материи, используется в суждениях при моделировании вербального сознания носителя русского языка-культуры. «Узкое» понимание информационной технологии, как автоматизированной компьютерной системы поддержки деятельности исследователей, используется при практической реализации экспериментальных исследований. Связь этих пониманий находит свое выражение в компьютерной форме существования информационной технологии лингвокультурного тезауруса (ИТ ЛКТ) в виде информационно-программной модели вербальной картины мира носителя языка культуры.

Всвязи с этим отметим две особенности ИТ ЛКТ, как лингвистического научного исследования (эксперимента): а) в его основу положены принципы лингвистического конструирования; б) форма существования ЛКТ и информационная технология его получения в основе своей лексикографические.

Лингвистическое конструирование как понятие было введено в на-

учный оборот в 70-х годах XX века. Наиболее полно оно представлено в работе [Караулов 1981] и понимается как особое направление исследовательской деятельности, целью которого является построение новых лингвистических объектов с заданными свойствами. “Лингвистическое конструирование — это совокупность обобщенных способов и приемов компиляции и комбинирования “образцов решения проблем”, экстраполяции уже имеющихся, готовых теоретических и практических результатов, полученных в разных областях лингвистики и их прямого или эвристического использования для преодоления трудностей и решения проблем, возникающих в тех или других областях при построении новых лингвистических объектов” [Караулов1981. С.16].

Лексикографическая технология сегодня очень распространена практически во всех областях научной деятельности. Из инструментария языкознания, навыков и умений конкретной группы ученых, она сегодня превратилась в необходимую и обязательную составляющую любого научного исследования: во-первых, повсеместной практикой стало представление результатов исследований, экспериментов и вообще освоения некой предметной области реального мира в лексикографической форме, в виде словаря, справочника, энциклопедии и т.п.; вовторых, результат научного исследования стал представляться одновре-

Ю.Н.Филиппович

9

менно в двух формах — в виде основного текстового описания (представления знания) и дополнительного лексикографического метаописания (представления метазнания).

Необходимость включения в учебные и научные печатные, а теперь и электронные издания (а именно в таких формах чаще представляются результаты научных исследований или экспериментов) так называемого «научного аппарата» является стандартным требованием. Современный «научный аппарат издания» — это, прежде всего, различные указатели слов и понятий, глоссарии, словари (определений, частотные, переводные и др.) и фрагменты тезаурусов (понятийных, поисковых). В совокупности эти лексикографические компоненты «научного аппарата издания» придают результату научного исследования новые дополнительные дидактические и металогические свойства.

Применение лексикографического инструментария в научном исследовании как основного или дополнительного требует определенных ресурсных затрат, которые в общем случае только частично могут быть компенсированы достижением новых качественных показателей результата исследования.

Современный лексикографический инструментарий научных исследований и экспериментов — это компьютерные методы и средства лексикографической технологии, предназначенные для поддержки проведения исследований, и обеспечения существования его результатов.

Резюмируя приведенные суждения, выделим три основных аспекта ИТ ЛКТ: 1) аспект создания ЛКТ — разработка средств поддержки когнитивного эксперимента и оформление его результатов; 2) аспект функционирования ЛКТ — конструирование модели (моделирование) вербального сознания носителей языка культуры; 3) аспект существования ЛКТ — измерение параметров (характеристик) ЛКТ и установление возможных форм его существования.

Эти три аспекта являются отражением трех составных частей проводимого исследования: эмпирического эксперимента, теоретического анализа его результатов и создание форм их представления. Рассмотрим более подробно названные аспекты.

Аспект «Создание» ИТ ЛКТ

Информационная технология создания ЛКТ русского языка представляет собой совокупность методов и приемов использования современного программного обеспечения ЭВМ для автоматизации научных исследований. Она реализована как интеграция типовых инструментальных информационных технологий и специализированной лингвистической тех-

10 Аспекты информационной технологии когнитивного эксперимента…

нологии. Сама методика интеграции (последовательность использования функциональных средств поддержки методов обработки данных, представленных в применяемых компьютерных программах) традиционна и содержит этапы: 1) ввода и первичной обработки исходных данных; 2) формирование базы данных исследования; 3) получение обобщающих и выборочных данных; 4) лингвистическое конструирование – получение частотных словников, индексов и т.п. [Филиппович Ю. 2002 в]

Концептуальная модель когнитивного эксперимента

Сообразно уже приведенному «широкому» и «узкому» пониманию информационной технологии, когнитивный эксперимент будем понимать как некоторый конкретный вариант ее реализации.

Тогда в «широком» понимании когнитивный эксперимент — это конкретная информационная технология восприятия, осознания и представления реального мира субъектом в заранее определенной форме. Такой формой и объектом эксперимента являются данные результатов языковой игры «Кроссворд».

В «узком» понимании когнитивный эксперимент — автоматизированная компьютерная система поддержки конкретной деятельности субъектов-экспериментаторов. Такой деятельностью является сбор, обработка и представление данных эксперимента. Класс подобных систем получил название «систем извлечения знаний».

Определим когнитивный эксперимент как информационную технологию извлечения знаний о реальном мире, имеющихся у людей носителей языка культуры.

Традиционно при разработке информационных технологий первый этап проектирования называют концептуальным, подчеркивая тем самым то, что основное внимание на данном этапе проектирования сосредотачивается на тех понятиях, которые определяют существо предметной области. При этом концепты вводятся императивно и декларативно [Филиппович, 2001а, б].

Исходная концептуальная модель

Определим исходную концептуальную модель когнитивного эксперимента в следующем составе: субъект эксперимента — экспериментатор; объекты эксперимента — кроссворды, источники кроссвордов, карточка когнемы, картотека когнем; процессы эксперимента — поиск кроссворда, формирование когнем, сбор данных.

Экспериментатором в когнитивном эксперименте является Ю.Н.Караулов автор идеи эксперимента как способа создания ЛКТ и представления вербального знания носителя языка культуры в форме

Соседние файлы в папке книги2