Добавил:
kiopkiopkiop18@yandex.ru Вовсе не секретарь, но почту проверяю Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

2 курс / Нормальная физиология / Физиология_речи_Восприятие_речи_человеком_Чистович_Л_А_

.pdf
Скачиваний:
1
Добавлен:
24.03.2024
Размер:
13.47 Mб
Скачать

Вывод о том, что специальные сигналы (в частности, пауза), указывающие место границы между словами, могут наблюдаться в устной речи, но что это отнюдь не обязательно, был сделан

также рядом исследователей, работавших с другими языками Q132, 412], см_ также главу 5).

Еще один вполне очевидный источник потерь информации в случае устной речи составляют разнообразные акустические помехи и искажения, наличие которых в естественной ситуации речевого общения можно считать скорее правилом, чем исклю­ чением.

Приведенные данные исключают предположение, что морфо­ логический анализ устной речи (преобразование фонетической последовательности в слова, описанные по их лексическим и грам­ матическим характеристикам) производится поочередно слово за словом. В случае устной речи последовательность фонети­ ческих элементов, соответствующих слову, может быть не выде­ лена, а если она и выделена, то ее фонемный состав может быть или не полностью определенным, или искаженным.

Это означает, что вместо одного слова мы в лучшем случае имеем дело с некоторым набором гипотез о возможных словах. Соответственно необходимо предположить, что уже при выборе между этими гипотезами используются грамматические и семан­ тические ограничения окружающего контекста.

Вопрос о том, как и в каких пределах используются эти огра­ ничения, критически зависит от объема оперативной памяти — длины фонетической последовательности, запоминаемой до пере­ хода к словам.

2.3. ОБЪЕМ ОПЕРАТИВНОЙ ПАМЯТИ НА ФОНЕТИЧЕСКИЕ ЭЛЕМЕНТЫ

Исследованию оперативной памяти у человека по­ священо колоссальное количество работ. Увлекательный обзор достигнутых результатов содержится в книге Линдсея и Нор­ мана [89].

Пожалуй, наиболее интересный вывод из исследований заклю­ чается в том, что объем оперативной памяти равен некоторому постоянному числу (7 + 2) независимых «единиц», предъявляемых для запоминания, и не зависит от количества информации, содер­ жащейся в этих «единицах». Что такое «единица» — формально не определено, однако интуитивно очевидно, что это нечто такое, что человек может описывать признаками, характеризующими это нечто как самостоятельное целое.

Показано, что в качестве единиц, в частности,”могут''выступать слоги. Это весьма любопытно, так как слог обычно рассма­ тривается как единица речи, но не языка. В описании языка по­ нятие слог не фигурирует — в качестве единиц, более мелких, чем слово, используются морфемы и фонемы.

В психологических экспериментах по исследованию памяти слоги предъявляются изолированно, с паузами между ними. По этой причине полученные данные позволяют лишь предпола­ гать, что человек использует слоги как единицы также и при записи в память фонетической последовательности. Для проверки этого предположения следовало провести такой эксперимент, где стимулами служили бы отрезки нормального речевого потока, но человек не мог бы запоминать их как слова или события, о ко­ торых идет речь в сообщении.

В приводимых ниже экспериментах [169] принималось допу­ щение, что в случае сильно искаженных фраз человеку требуется

Рис. 2.1. Фразовая (7) п словесная (2) разборчивость при разном числе слогов в сообщении. По [169].

По оси абсцисс — количество слогов в сообщении; по оси ординат — разборчивость (отно­ сительное количество правильно воспринятых слов или фраз).

Рис. 2.2. Вероятность пропуска слова при восприятии сообщения заданной длины. По [169].

По оси абсцисс — количество слогов в сообщении; по оси ординат — относительное коли­ чество пропущенных слов.

значительное время для перехода от запомненной последовательности фонетических элементов к решению о смысле сообщения. Если это так, а объем оперативной памяти на фонетические эле­ менты ограничен, то предъявление длинных фраз должно приво­ дить не к улучшению разборчивости, как это обычно имеет место (см. обзор [485]), а наоборот, к ее ухудшению за счет пропуска части фразы. Повышение разборчивости с увеличением длины фразы должно наблюдаться до тех пор, пока длина фразы не пре­ высит объема оперативной памяти на фонетическую последователь­ ность.

Всего было записано 10 таблиц, по 20 фраз в каждой. Фразы различной длины (от трех до двенадцати слогов) следовали друг за другом’в случайном порядке. Каждая фраза содержала от двух до пяти фонетических слов, составляла одну синтагму и при чтении произносилась слитно, без пауз между словами. Интервал между фразами составлял 20 с. Фразы произносил диктор, для которого русский язык был родным.

Искажения создавались путем пропускания речевого сигнала через полосовой фильтр (906—1141 Гц). Фразовая разборчивость, определенная по всему материалу суммарно, составила 30%. Зависимость фразовой (7) и словесной (2) разборчивости от числа слогов во фразе показана на рис. 2.1. Можно видеть, что разбор­ чивость несколько возрастает в пределах до семи слогов, затем резко падает. Это падение обусловлено преимущественно про­ пуском слов, о чем свидетельствует рис. 2.2.

Способность человека имитировать речевой сигнал без пони­ мания его смысла дает еще одну возможность исследования объема оперативной памяти на фонетическую последовательность. Хурмэ провел эксперименты [зм], в которых исследовалась имитация финских фраз разной длины десятью русскими испытуемыми, которые совсем не знали финского языка. Записанные на пленку фразы-ответы затем прослушивались и оценивались группой слушателей-финнов. Зависимость числа правильно воспроизве­ денных русскими финских фраз от количества слогов во фразе приведена на рис. 2.3. Видно, что фразы длиной в 5 слогов вос­ производятся достаточно хорошо; воспроизведение фраз, состоя­ щих из 9 слогов, становится для испытуемых практически невоз­ можным. |

Анализ зависимости вероятности правильного воспроизведения слога от его положения (порядкового номера) во фразе показал, что для фраз, состоящих из 5 и 6 слогов, отчетливой зависимости заметить не удается. Начиная с фраз длиной в 7 слогов проявля­ ется хорошо известный эффект места элемента в последователь­ ности — первые и последние слоги во фразе правильно воспро­ изводятся чаще, чем слоги, находящиеся в середине фразы.

Заметим, что описание слога как единицы речи не исчерпыва­ ется фонемной информацией. Характеристикой слога является также отсутствие или наличие ударения.

Если объем оперативной памяти на фонетическую последова­ тельность определяется действительно числом слогов, а не коли­ чеством информации, необходимой для описания этой последова­ тельности, логично ожидать, что те же ограничения проявятся в условиях, когда испытуемым нужно будет запомнить всего только ритмический рисунок последовательности, т. е. порядок следования ударных и безударных слогов.

В экспериментах Лисенко и Федоровой [92] исследовалось речевое воспроизведение ритмического рисунка последователь­ ности тональных посылок в виде последовательности слогов [tatata. . .]. Длительность «безударной» посылки (Т) равнялась длительности паузы и составляла 88 или 176 мс (в разных вариан­ тах опыта). Длительность «ударной» посылки равнялась 27'. Ритмические рисунки синтезированных последовательностей схе­ матически повторяли ритмические рисунки выбранных естествен­ ных русских фраз длиной от 5 до 13 слогов.

Последовательности были записаны на магнитную пленку с большими паузами между ними. Во время паузы испытуемый должен был воспроизвести услышанную последовательность.

Полученные результаты приведены на рис. 2.4. Можно видеть, что более быстрые последовательности, где длительность «слогов» близка к естественной речи, воспроизводятся несколько лучше.

По оси абсцисс — количество слогов в сообщении; по оси ординат — процент правильно воспроизведенных фраз.

Рис. 2.4. Точность речевого воспроизведения ритмического рисунка тональ­ ной последовательности. По [92].

По оси абсцисс — количество посылок топа в стимуле; по оси ординат — процент пра­ вильно воспроизведенных стимулов. 1 — стимулы с «короткими» посылками; 2— сти­ мулы с «длинными» посылками.

Существенно, что для обоих вариантов эксперимента характерно отчетливое ухудшение воспроизведения ритмического рисунка последовательности при увеличении числа элементов последо­ вательности. Когда число элементов больше семи, правильное воспроизведение наблюдается менее чем в 50% случаев.

Таким образом, все приведенные выше данные достаточно хо­ рошо согласуются между собой и позволяют считать, что объем оперативной памяти на последовательность фонетических эле­ ментов действительно составляет примерно семь слогов.

2.4. ЗАДАЧА ПЕРЕХОДА ОТ ПОСЛЕДОВАТЕЛЬНОСТИ ФОНЕТИЧЕСКИХ ЭЛЕМЕНТОВ К СЛОВАМ ЯЗЫКА

Семь слогов соответствуют не более чем двум-трем знаменательным русским словам. Таким образом, приходится считать, что модель «видит» как последовательность фонетических элементов только часть анализируемого предложения. Эта «фо­ нетически видимая» часть соответствует настоящему и ближай­ шему прошлому речевого сигнала. Дальнее прошлое сигнала

(нм будет, например, начало длинного предложения в момент окончания предложения) должно, очевидно, запоминаться или в форме слов как единиц языка (описанных в лексических и грам­ матических терминах), или в неязыковой форме.

Очевидно, что модель морфологического анализатора, преобра­ зуя последовательность фонетических элементов в слова языка, может воспользоваться тем обстоятельством, что соседние слова в пределах одной синтагмы в естественных предложениях в боль­ шинстве случаев связаны по форме и по смыслу.

Прежде чем обсуждать возможные способы использования этой грамматической и семантической связанности, подчеркнем тот факт, что соседние слова в предложении могут быть синтакси­ чески независимыми и семантически несовместимыми. Например, слова куртке и громко во фразе Человек в кожаной куртке громко закричал являются независимыми, они принадлежат разным синтаксическим группам.

Если программа основывается в своей работе на гипотезе о связанности соседних слов, она, естественно, должна получать информацию о том, когда эту гипотезу нельзя использовать. Иначе говоря, необходимы специальные сигналы, указывающие границы между синтаксическими группами; информация о гра­ ницах групп не только также должна записываться в оперативную память, она должна быть как-то привязана к фонетическим эле­ ментам.

Обратимся теперь к случаю, когда на гипотезу о связанности соседних слов можно положиться. Основная трудность в этом случае состоит в том, что на уровне последовательности фонети­ ческих элементов слова не отделены друг от друга (могут быть не отделены), а проверка грамматической согласованности может быть осуществлена только после того, как слова выделены.

Это обусловлено тем, что русские грамматические морфемы по своему фонемному составу, а следовательно и по своим фоне­ тическим и акустическим характеристикам, в принципе не отли­ чаются от других возможных сочетаний фонем (внутри слова и на стыках слов. Их особенностью является то, что они нахо­ дятся либо в конце слова (флексии), либо перед словом (предлоги), либо в начале слова (приставки).

Кажется, что единственный разумный способ поведения в та­ кой ситуации состоит в том, чтобы осуществлять пробные членения последовательности и проверять, получится ли при данном чле­ нении сочетание из грамматически согласованных осмысленных слов.

Применение такого способа требует какой-то стратегии проб­ ных членений, обеспечивающей минимизацию времени поиска и ошибок членения. Иначе говоря, у человека должны быть ка­ кие-то правила применения пробных членений, использующие как свойства самой входной последовательности фонетических эле­ ментов, так и общие сведения о языке (речи).

2.5. ЧЛЕНЕНИЕ НА «СЛОВА» БЕССМЫСЛЕННЫХ РЕЧЕВЫХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ И ПСЕВДОПРЕДЛОЖЕНИЙ

Указания на то, что носители русского языка ис­ пользуют какие-то стандартные правила членения фонетической последовательности, были впервые получены в работе Лисенко [90J. Эксперименты преследовали другую цель — автор хотел выяс­ нить, совпадают ли услышанные «слова» с теми, которые были произнесены диктором.

Слушателям (16 человек) была предъявлена магнитофонная запись бессмысленных «двухсловных» сочетаний (табл. 2.1), произнесенных диктором с разными вариантами членения на

«слова». Из

таблицы следует, что

испытуемые

не

воспринимали

 

 

 

 

 

 

Т аблица 2.1

Членение человеком на «слова» бессмысленных слогосочетаний

 

 

 

 

Количество принятых сообщений

 

 

со следующими ритмическими рисунками:

Переданные сообщения

 

•о

0

 

I

1

 

 

1

1

-5

о

с

 

и их ритмический рисунок

 

 

 

 

 

i

1

1

i

1

1

 

 

 

 

т

 

 

1

 

 

 

 

 

1

1

 

 

 

 

1

-5

 

 

 

-)

1

 

 

 

 

 

 

 

 

I

 

 

 

 

f

О — |----------О

16

4

 

 

 

 

 

мумакабппита

 

0--1--0

12

 

 

 

 

 

 

1 О----------|-О

15

1

 

 

 

 

 

 

( 0-1----------о

15

 

 

 

 

 

павилакинаыа

 

О —— | —— О

15

 

 

 

 

 

 

1 VJ----------j —-Д

15

 

 

 

 

 

лйбатанукатб

С

О — |----------О

2

11

1

 

 

 

 

 

О------| —— О

4

8

 

 

 

 

 

1, о----------1-0

3

11

 

 

 

 

павитакинама

С о-|----------о

1

14

 

 

 

 

 

O--I--O

1

13

 

 

 

 

 

1

о----------1-0

2

И

 

 

 

 

 

Г

_О|------ О —

_

_

15

 

 

гатйлатабапа

1.

_О-|-у-

— — — — 15

1

 

 

— ------ | о - -

14

 

затббппатона

г

— О11------О —

—,

1

14

 

 

J

— О — | — О —

15

 

 

 

1 - О - - I О -

— — — — 15

 

 

натанатубапака

(

— о — I------ О —

 

30

1 - о - - | - О -

 

 

 

32

Примечание. 0 обозначает ударный

слог;

— обозначает

неударный

слог;

1 обозначает границу между словами.

 

 

 

 

 

 

 

46

намерений диктора в отношении членения, что хорошо согласу­ ется с данными Бондарко и др. [20], приведенными в разделе 2.2.

Неожиданным результатом эксперимента оказалось порази­ тельное единообразие членений у всех слушателей, хотя, каза­ лось бы, отсутствие грамматической и семантической информации должно было привести к случайному поведению. Некоторые пред­ ставления о том, на какой информации основывается членение, были предложены Клаас [79].

Исходной задачей автора было исследование влияния грамма­ тического контекста псевдопредложения на решение о границе между первым и вторым словами в предложении.

Были взяты пары фраз типа:

1.а) Рохом буха не перетюлыгаешъ

б) Рох амбуха затюлыгял

2.а) Тифёлънику ганзйтъ несантъпно

б) Тифёльник уганзйл всантык и т.д.

Рис. 2.5. Сравнение результатов членения бессмысленных предложений на псевдо­ слова (7) с распределением русских слов

 

по количеству слогов {2,

3). По [”]•

По

оси

абсцисс — количество

слогов в

слове;

по

оси

ординат — частота встречаемости

слов

 

 

соответствующей длины.

 

 

Фразы были в случайном порядке записаны на магнитную

пленку и предъявлены

слушателям.

 

Гипотезу о влиянии контекста проверить не удалось, так как

примерно в 40% случаев слушатели членили предложения иначе, чем предполагалось автором (письменным текстом) и, соответст­ венно, диктором. При этом слушатели вели себя весьма едино­ образно, а записанные ими предложения были грамматически правильными (об этом можно было судить по орфографии). Пы­ таясь найти причину отклонений, автор проанализировала все содержащиеся в записях испытуемых псевдослова с точки зрения количества слогов и положения ударения. Оказалось, что получен­ ные распределения достаточно хорошо согласуются с данными по статистике русского языка [71, 164 ].

На рис. 2.5 приведены распределения русских слов по числу входящих в них слогов (кривые 2 и 3) и распределения записанных псевдослов по числу слогов (кривая 1). Можно видеть, что кри­ вая 1 является как бы утрированным вариантом кривых 2 и 3.

Заметим, что процедура пробных членений на слова наверняка требует предварительного обнаружения ударения (ударного глас­ ного или слога) как опорного сигнала. Если два таких опорных сигнала (два ударения) уже есть, можно установить пробную границу так, чтобы число заударных слогов первого слова и число

предударных слогов второго слова наилучшим образом соответ­ ствовало статистике русской речи. При этом, естественно, под­ разумевается, что процедура умеет в каком-то смысле считать и что «считаемыми» единицами являются именно слоги (или слогообразующие гласные), но не фонемы вообще.

*

2.6. ФОНЕТИЧЕСКИЙ ОБРАЗ СЛОВА

Можно заметить, что до сих пор мы все время поль­ зовались допущением, что существует некоторый алгоритм, кото­ рый, получив на вход последовательность фонетических элемен­ тов, -трактует ее как слово, т. е. пытается описать ее в терминах грамматических и семантических характеристик. Если описание окажется непротиворечивым (например, не возникнет такая си­ туация, что слово определено как глагол в родительном падеже), то оно условно принимается как возможное и сравнивается с опи­ саниями соседних слов.

Вне зависимости от того, как конкретно организован такой алгоритм, он, несомненно, весьма часто будет сталкиваться с та­ кими случаями, когда по входной последовательности нельзя полностью определить слова. Например, входная последователь­ ность не совпадает полностью ни с одним словом русского языка, но частично совпадает сразу с несколькими русскими словами.

Если соседние слова также не снимают неопределенности, очевидный выход в такой ситуации состоит в том, чтобы предпо­ честь фонетически наиболее похожее слово. Понятно, что вели­ чина сходства будет определяться тем, какие признаки исполь­ зуются для описания фонетического образа слова.

В теоретической фонологии принимается, что слово является последовательностью фонем, где каждая фонема в свою очередь описана набором значений по дифференциальным признакам (более подробно об этом см. главу 4). В таком случае максимально близкими словами считаются слова, отличающиеся по одному диф­ ференциальному признаку, например дочка и бочка, кот и пот.

Легко заметить, что в этих примерах подразумевается, что сходство определяется путем поэлементного сравнения двух слов: первая фонема одного слова сравнивается с первой фонемой дру­ гого слова, вторая фонема со второй и т. д. Для поэлементного сравнения логически необходимо, чтобы элементы были прону­ мерованы. При допущении, что фонетический образ слова есть пронумерованная последовательность элементов, сразу же воз­ никает вопрос, что является точкой отсчета при нумерации и что именно (и как) пронумеровано.

Основными источниками информации для ответа на эти воп­ росы являются ошибки приема слов при искажениях речи, замены бессмысленных слов па осмысленные при восприятии псевдопред­ ложений. результаты шкалирования сходства звучания слов. Данные, полученные всеми этими методамп, являются достаточно

однозначными и подтверждают то, что давно эмпирически известно относительно «ослышек». Необходимым условием близости слов является совпадение их ритмических рисунков (одинаковое число слогов и одинаковое положение ударений).

Замена сочетания из нескольких согласных на один согласный или, наоборот, замена одного согласного на сочетание согласных производится очень легко [79> 169 ]. Оценки субъективной бли­ зости слов в таких парах, как малина—калина и малина—маслина,

примерно совпадают.

Можно видеть, что эти результаты несовместимы с представле­ нием о пофонемной нумерации. Удобный способ нумерации за­ ключается в том, что за точку отсчета (элемент с номером, равным нулю) принимается ударный гласный. Относительно него нуме­ руются остальные гласные. Согласному (или сочетанию согласных) приписываются два номера, соответствующие тем гласным, между которыми этот согласный находится; внутри сочетания соглас­ ных применяется собственная нумерация, т. е. сочетание согласных рассматривается как подпоследовательность.

2.7. ТРЕБОВАНИЯ К ОПИСАНИЮ ФОНЕТИЧЕСКОЙ

ПОСЛЕДОВАТЕЛЬНОСТИ

Из приведенных ранее данных с несомненностью следует, что записанная в оперативной памяти последовательность фонетических элементов должна содержать в явном (выделенном) виде как фонемную, так и просодическую информацию.

Относительно фонемной информации можно утверждать:

1) выгодно сохранить позиционные варианты гласных, отра­ жающие положение гласного в слове относительно ударения, т. е. записываемая информация должна ближе соответствовать фонетической, чем фонематической транскрипции русских гласных; 2) очевидно, что следует избегать необоснованных решений; с этой точки зрения было бы удобно описывать фонему не симво­

лом, но ее значениями по дифференциальным признакам; отсут­ ствие решения по признаку было бы эквивалентно указанию группы возможных фонем;

3)

гласные и согласные должны быть в памяти разделены;

4)

запись согласных должна обеспечивать возможность отнесе­

ния согласного как к предыдущему, так и к последующему слогу, т. е. предпочтительно, чтобы при преобразовании речевого сигнала в фонетическую последовательность вопрос об открытом или за­ крытом характере слога остался нерешенным.

Относительно просодической информации можно только ут­ верждать, что она должна быть представлена в максимально гото­ вом для использования виде. Нужны сигналы, указывающие гра­ ницы между грамматически и семантически несогласованными словами, и очень важно, чтобы решение об ударенности слога (гласного) принималось достаточно быстро, так как до обнару­ жения ударенного гласного нельзя начинать анализ слова.

РАЗДЕЛ II

ФОНЕТИЧЕСКАЯ ИНТЕРПРЕТАЦИЯ РЕЧЕВОГО СИГНАЛА

Глава 3

ПРИРОДА ФОНЕТИЧЕСКОГО ОБРАЗА

В основе науки о языке лежит допущение о том, что речевой сигнал представлен в сознании слушателя последо­ вательностью дискретных фонетических элементов. Заметим, что справедливость этого допущения самой лингвистикой не прове­ ряется. Важно, что, не приходя в противоречие с эмпирически известными фактами, это допущение позволяет дальше строить конструктивную теорию как самого языка, так и процесса рече­ вого общения.

Нужно подчеркнуть, что эти дискретные фонетические эле­ менты, по предположению, появляются лишь в «сознании», т. е. в изображении сообщения, записанном в оперативную память слушателя. В самом речевом сигнале они присутствуют в неявном виде, для их получения нужна определенная обработка сигнала.

Для исследователя, изучающего восприятие речи человеком или разрабатывающего систему автоматического распознавания речи, указанное допущение означает, что модель (система) должна включать блок, превращающий звуковой речевой сигнал в последо­ вательность дискретных фонетических элементов. Действия, вы­ полняемые этим блоком, обычно обозначаются как фонетическая интерпретация сигнала.

Предметом настоящей главы является рассмотрение фунда­ ментального вопроса теории фонетической интерпретации — воп­ роса об отношениях между фонетическим элементом и отрезком (сегментом) речевого сигнала.

3.1. ПОНЯТИЕ ФОНЕТИЧЕСКОЙ ПОСЛЕДОВАТЕЛЬНОСТИ

Для того чтобы отчетливо представить себе, что подразумевается под понятием фонетической последовательности, примем, что оперативная память представляет собой ряд ячеек; в каждую ячейку записывается только один фонетический эле­ мент, (А+1)-ый элемент записывается в ближайшую ячейку справа относительно той, куда записан А-тый элемент. Записывае­

Соседние файлы в папке Нормальная физиология