- •Блюменау Д. И.
- •ВВЕДЕНИЕ
- •Глава 1. СВЕРТЫВАНИЕ ИНФОРМАЦИИ КАК ОДНО ИЗ УСЛОВИЙ ЧЕЛОВЕЧЕСКОГО ОБЩЕНИЯ
- •1.1.0 СУЩНОСТИ «СВЕРТЫВАНИЯ»
- •1.2. ИНФОРМАЦИОННОЕ СВЕРТЫВАНИЕ
- •1.3. СВЕРТЫВАНИЕ В СФЕРЕ ИНФОРМАЦИОННОГО ОБСЛУЖИВАНИЯ
- •2.1. ИНДЕКСИРОВАНИЕ
- •2.1.1. Индексирование — его назначение
- •2.1.2. Индексирование на основе «традиционных» ИПЯ
- •2.1.2.1. УДК как представитель ИПЯ иерархического типа
- •2.1.2.2. ИПЯ алфавитно-предметных рубрик
- •2.1.2.3. ИПЯ библиографических описаний
- •2.1.3. Режимы индексирования
- •2.1.4. Координатное индексирование на основе дескрипторных языков
- •2.1.4.1. Избыточное индексирование
- •2.1.4.2. Критерии выдачи и стратегия поиска по запросу
- •2.1.6. Автоматизация процесса индексирования
- •2.1.6.1. Индексирование в АИПС «Пусто — Непусто»
- •2.1.6.2. Индексирование в ИПС «Артефакт»
- •2.1.6.3. Индексирование в поисковой машине «Яндекс»
- •2.2. БИБЛИОГРАФИЧЕСКОЕ ОПИСАНИЕ
- •2.3. АННОТИРОВАНИЕ И РЕФЕРИРОВАНИЕ
- •2.3.1. Функции аннотаций и рефератов
- •2.3.2. Способы раскрытия содержания текстов
- •Пример аннотативной фразы:
- •Пример реферативной фразы:
- •Пример типичной аннотации:
- •2.3.4. Виды аннотаций и рефератов
- •2.4. КОНСПЕКТИРОВАНИЕ КАК РАЗНОВИДНОСТЬ РЕФЕРИРОВАНИЯ
- •2.5.1. Генезис и сущность концептографического обслуживания
- •2.5.2. Виды концептографического обслуживания
- •2.5.3. Обзорно-аналитическая деятельность
- •2.5.3.1. Виды обзоров
- •2.5.3.2. Функции обзоров в системе научных коммуникаций
- •2.5.4. Основы методики написания обзоров
- •Глава 3. НЕКОТОРЫЕ ХАРАКТЕРИСТИКИ ТЕКСТА С ТОЧКИ ЗРЕНИЯ ЕГО СВЕРТЫВАНИЯ
- •3.1. ТЕКСТ И ЕГО ОБЩАЯ ХАРАКТЕРИСТИКА
- •3.2. СТРУКТУРЫ ТЕКСТА
- •3.2.1. Синтаксическая структура текста
- •3.2.1.1. О связности текста
- •3.2.1.2. Средства внутритекстовой связности
- •Разновидности коннекторов
- •3.2.2. Коммуникативная структура текста
- •Пример
- •Пример
- •Пример
- •3.2.3. Аспектная структура текста
- •3.2.4. Семантическая структура текста
- •3.2.5. Информативная структура текста
- •4.1. ВИДЫ И СРЕДСТВА ФОРМАЛИЗОВАННОГО СВЕРТЫВАНИЯ
- •4.2. ФРАГМЕНТИРОВАНИЕ КАК ОДНО ИЗ НАПРАВЛЕНИЙ ИНФОРМАТИВНОГО СВЕРТЫВАНИЯ
- •4.2.1 • Подходы к реализации идеи фрагментирования
- •4.2.1.1. Семантический подход к проблеме фрагментирования
- •4.2.1.2. Синтаксический подход к проблеме фрагментирования
- •5.1. КВАЗИХРЕСТОМАТИЯ КАК ПОСОБИЕ ДЛЯ САМООБРАЗОВАНИЯ
- •5.1.1. О познавательной профессиональной потребности
- •5.1.2. Лексический аппарат формирования квазихрестоматии
- •5.2. ЭТАПЫ СОЗДАНИЯ КВАЗИХРЕСТОМАТИИ
- •5.2.1 • Формирование запроса и составление учебной программы (оглавления)
- •5.2.2. Составление поискового предписания и процедура поиска
- •5.2.3. Формирование и оформление хрестоматии
- •5.2.4. Пример подготовки квазихрестоматии
- •(AлБ)v[(BvИvKvЛ)л(ГvДvE)]v(BлЖ)v(BлЗ)
- •Глава 6. РАЗВИТИЕ ИНДИКАТОРНОГО МЕТОДА КОМПЬЮТЕРНОГО СВЕРТЫВАНИЯ ТЕКСТОВ
- •6.1. СРЕДСТВА И МЕТОДЫ ФОРМАЛИЗОВАННОГО СВЕРТЫВАНИЯ
- •6.2. ТЕХНОЛОГИЧЕСКАЯ ДОКУМЕНТАЦИЯ, ОБЕСПЕЧИВАЮЩАЯ ИЗБИРАТЕЛЬНОЕ СВЕРТЫВАНИЕ ТЕКСТОВ
- •6.3. ЭТАПЫ ФОРМИРОВАНИЯ ВТОРИЧНЫХ ДОКУМЕНТОВ
- •6.3.1. Формирование аннотаций и рефератов
- •6.3.2. Формирование минимальных релевантных фрагментов
- •6.3.3. Формирование квазиконспекта
- •РЕКОМЕНДУЕМАЯ ЛИТЕРАТУРА
- •Вопросы для самопроверки
- •ПОСЛЕСЛОВИЕ
- •ОГЛАВЛЕНИЕ
№ |
|
Самообразовательная |
||
Вид научно-технической литературы |
|
ситуация |
|
|
п/п |
3-я |
4-я |
5-я |
|
|
|
|||
13 |
Специальные энциклопедии |
12 |
7 |
5 |
14 |
Универсальные энциклопедии |
15 |
15 |
6 |
15 |
Фирменные проспекты и технические каталоги |
7 |
10 |
7 |
Эта оценка служит ориентиром в работе составителя хрестоматии при подготовке стратегии поиска и обращении к базам с целью выбора из них наиболее у ч е б н о е м к и х д о к у м е н т о в .
5.1.2.Лексический аппарат формирования квазихрестоматии
Основным инструментарием формализованного анализа докумен тов в данном случае выбран индикаторный метод, который, как уже указывалось, основывается на использовании маркеров, индикаторов, коннекторов и повторов.
Напомним, различают две группы формальных признаков —библи ографические, необходимые для идентификации документов в базах данных на уровне библиографического анализа, и текстовые, исполь зуемые для процедур обработки текстовой информации — выделения тех или иных фрагментов текста с целью их включения или исключе ния из текста подготавливаемой хрестоматии.
К числу формальных б и б л и о г р а ф и ч е с к и х признаков отно сятся прежде всего элементы библиографического описания —год из дания, язык издания, язык оригинала, страна-издатель, издательство, город, фамилия автора (составителя), коллективный автор (издающая организация), вид издания (статья, обзор, монография, справочник, учебник и т. д.), количество страниц, шифр базы данных; организация, где выполнена работа, и ее координаты, вид научной работы (теория, методика, эксперимент и т. д.), читательское назначение и нр.
К числу формальных т е к с т о в ы х признаков относятся прежде всего маркеры и индикаторы, позволяющие идентифицировать фразы документа, относящиеся к различным его смысловым (содержатель ным) аспектам (фрагментам). Процедура такого смыслового фрагмен тирования более или менее четко разработана в настоящее время в от ношении таких видов документов, как статьи (научно-технические — прежде всего посвященные решению конкретной задачи), патентные
описания, информационно-справочные листки. Эти разновидности до кументов преимущественно ориентированы на удовлетворение произ водственной информационной потребности —для принятия решений в ходе выполнения конкретной производственной (творческой) задачи, и могут лишь ограниченно использоваться при возникновении познава тельных потребностей в случае ситуации 3.
Основная задача применения текстовых формальных признаков сводится к идентификации фраз, относящихся к определенным фраг ментам текста (в нашем случае это чаще всего абзац, либо часть его, ли бо некоторая их совокупность в рамках суперсинтаксического целого),
сцелью, как уже говорилось выше, включения их или исключения из текста подготавливаемой хрестоматии, а также для определения конца такого ССЦ. Соответственно разделяются содержательные аспекты (и маркеры, их идентифицирующие) —«для исключения», «для включе ния». Эти маркеры включаются в число поисковых признаков (наряду
ссодержательными, тематическими признаками) в предписание, и по исковая процедура предусматривает выпечатку (или невыпечатку) со ответствующих фрагментов текста.
Кчислу аспектов, в которых раскрывается основное содержание описываемого объекта проблемы, относятся прежде всего: Предлагае мый вариант решения (ПВР), Описание предлагаемого варианта реше ния ( ОпПВР) , Особенность предлагаемого варианта решения (ОсПВР), Оценка предлагаемого варианта решения (ОцПВР), Резуль тат (Р), Вывод (В) и Рекомендации (Рек). Эти аспекты ориентирован ны на включение в подготавливаемую хрестоматию.
Кчислу «дополнительных», служебных аспектов, которые вводят читателя в курс проблемы, определяют ее место среди других проблем, указывают на цели исследования-разработки, относятся прежде всего: Известный вариант решения (ИВР), Оценку известного варианта ре шения (ОцИВР), Постановку проблемы (ПП), Целевую установку (ЦУ), Область применения (ОП). Эти аспекты ориентированы, как правило, на исключение их из текста подготавливаемой хрестоматии (однако в случае подготовки квазиобзоров эти аспекты играют немало важную роль). Каждый из содержательных аспектов, как мы знаем, располагает своим набором маркеров (формальных признаков). Так, ас пект ПВР идентифицируется такими, к примеру, маркерами, как «Ис следована возможность» (и его синонимичными вариантами —«Изуче на возможность», «Проанализирована вероятность» и т. п.), «Автором выполнена (осуществлена, изучена и т. и.)»; «Осуществлена разработка (конструкция, модель и т. д.)»; «Произведен расчет», «Интерес пред ставляет», «Исследован (предложен, разработан, установлен, проана
лизирован и т. д.)». Наличие указанных маркеров (одного — двух) в од ной из фраз абзаца документа указывает на отнесенность данного абза ца к определенному содержательному аспекту и тем самым на его даль нейшую судьбу («для включения» или «для исключения» из текста хрестоматии). (Фрагмент словаря маркеров приведен в Приложении 2).
Проблема сокращения машинным способом таких структурных единиц текста, как глава, параграф, подпараграф и т. п., в монографиях, руководствах, учебниках (т. е. в книгах), насколько известно, до насто ящего времени еще не решалась, и поэтому в данном пособии речь идет о выделении не только и не столько фрагментов, релевантных теме хре стоматии (см. главу 4), сколько о целых релевантных структурных еди ницах —параграфах, подпараграфах и т. и. Такие единицы выявляются на основе поиска по содержательным и формальным признакам или первым предложениям абзацев, разделов, параграфов и т. и. Важно только при этом, чтобы эти предложения были автосемаитичиыми. Со четание поисковых признаков заглавия раздела и первого предложения его абзаца, значительно повышает показатель релевантности при поис ке. Указанная процедура обнаружения релевантных теме хрестоматии структурных единиц текста значительно сокращает время (а следова тельно, и трудоемкость) поиска. При поиске структурных единиц текс та (статей) в таких видах документов, как справочники, энциклопедии и словари, серьезных проблем с релевантностью и сокращениями объе ма текста не возникает, поскольку они достаточно четко идентифици руются своим предметным заголовком, а тексты самих статей обычно сжаты и информативны.
5.2. ЭТАПЫ СОЗДАНИЯ КВАЗИХРЕСТОМАТИИ
Процедура формирования квазихрестоматии включает в себя це лый ряд этапов —от обработки (формирования) запроса до оформле ния пособия с включением всех необходимых для него составных час тей и выдачей его либо в печатной (человекочитаемой), либо в машино читаемой (например, на дискете) форме.
5.2.1• Формирование запроса и составление учебной программы (оглавления)
Любой запрос есть словесное выражение информационной (в на шем случае —познавательной) потребности, т. е. осознания субъектом недостаточности его знаний для достройки психологической модели
объекта, модели, отражающей уровень его представлений о данном объ екте (в нашем случае — о данной предметной области). Процесс верба лизации потребности, т. е. превращения ее в запрос, протекает, как из вестно, в четыре этана:
1- й этап —осознание потребности как некоторого дефицита в зна ниях, т. е. на психическом, образном уровне, уровне представлений;
2- й этап — «переход» с уровня представлений на уровень мышле ния, этап осмысления в виде мыслительной модели, мыслеобразов, в виде совокупности понятий;
3- й этап — «переход» с уровня мыслительной модели на языковый уровень; модель «обрастает» словами; здесь идет интенсивный поиск в синонимичных рядах наиболее адекватных синтагм, пока еще разроз ненных и грамматически неупорядоченных, неоформленных;
4- й этап — формирование в сознании субъекта синтаксической кон струкции, также наиболее адекватной семантическому представлению запроса на речевом уровне. Чаще всего, однако, субъект извлекает из своей памяти одну из типовых синтаксических конструкций, в рамках которой морфологически и упорядочиваются лексические единицы, сформировавшиеся на языковом уровне.
Столь подробно процесс вербализации потребности описан для то го, чтобы обратить внимание на явление содержательного обеднения первоначального образа-представления в процессе его движения через все этапы (уровни) психолингвистического пространства до его вопло щения на речевом уровне в виде фразы-запроса: многие детали образа теряются, некоторые искажаются, и на вербализованном уровне мы по лучаем подчас модель (запрос), лишь очень приблизительно соответст вующую модели на психическом уровне (самой потребности). Видимо, из понимания этого родилось известное выражение, что мысль выска занная есть ложь.
Но это лишь одна сторона проблемы формулирования запроса — проблема неадекватности выражения потребности в запросе.
Более серьезной, однако, является другая проблема: сама психичес кая (мыслительная) модель потребности в силу ряда причин порой очень приблизительно соответствует той действительно необходимой информации, которая требуется специалисту как для решения стоящей перед ним творческой задачи, так и для повышения (изменения) своей квалификации. По этой причине специалист нередко очень широко формулирует запрос, предполагая, что стоящая перед ним познаватель ная задача с большей вероятностью «уложится» в широкие рамки за проса. Что на практике получается из такой «запасливости», каждый библиотечно-информационный работник хорошо знает: в ответ на за
прос выдается порой слишком много нерелевантной информации, но и в «остатке» далеко не всегда обнаруживается нужное. Происходит это потому, что многие частные вопросы оказываются в ином классифика ционном ряду, нежели предполагал этот специалист, формулируя за прос.
Практикой библиотечно-информационного обслуживания вырабо таны различные способы уточнения и развертывания запросов. В на шем случае, кроме «уточнения и развертывания», необходимо также и формирование па основе этого развертывания учебной микропрограм мы, пусть иногда и очень краткой. Именно такая программа позволяет систематизировать, логически и дидактически упорядочить, организо вать учебный материал.
Приступая к формулированию и развертыванию запроса, первона чальный вариант которого фиксируется обычно на специальном блан ке, содержащем сведения о потребителе, составитель прежде всего дол жен определить, к какой познавательной ситуации относится запрос специалиста. Это нужно по той причине, что характер ситуации будет во многом определять действия составителя на каждой из последую щих операций формирования хрестоматии. Затем, используя библио течно-библиографические классификации, прежде всего УДК, рубри каторы, имеющиеся в его распоряжении информационно-поисковые тезаурусы, составитель проецирует запрос на соответствующие разде лы классификационных схем, что позволит в большинстве случаев дос таточно четко определить место данного запроса в системе той или иной отрасли знания и выявить ряд признаков, известных специалисту и важных для него, но не отраженных в первоначальной формулировке.
Иногда тема запроса не укладывается в рубрику классификацион ной схемы, поскольку последние строятся априори и базируются на формально-логических критериях, которые предусматривают четкое проведение границ между классифицируемыми объектами. В таких случаях следует «конструировать» тему, опираясь на два и более разде ла классификации.
Уточнив с помощью вспомогательных средств формулировку темы запроса (что является по сути дела заглавием будущего учебного мате риала), необходимо с помощью этих же средств произвести его предва рительное развертывание от общего к частному в виде оглавления (про граммы). Нередко для уточнения и развертывания запроса производят пробный поиск в системе с целью нахождения релевантных или «околорелевантных» наиболее фундаментальных работ из этой области зна ния (учебников, руководств, монографий), анализ оглавлений которых может позволить существенно пополнить и уточнить учебную програм