Механизмы речи

Анализ направлений изучения речевого процесса. Методические приемы исследования артикуляции. Акустические измерения. Синтетическая речь, принимаемая слухом. Слоговая стереотипия слова. Корковый уровень регулировки произносительного процесса, его дефекты.

Рубрика Педагогика
Вид книга
Язык русский
Дата добавления 04.02.2011
Размер файла 526,6 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Мейер-Эпплер приводит еще один остроумный, но неубедительный аргумент в пользу отсутствия резонанса у некоторых шумных согласных. Он предвидит возражение против выставленного им положения, состоящее в том, что на альвеолярном или постдентальном с можно просвистать мелодию (т. е. вызвать смену резонанса), да и механизм шума при произнесении двугубного ф имеет много общего со свистом. При ф и при свисте воздушный поток без всякого участия голосовых связок выходит из острого отверстия рта. Можно перейти от свиста к ф так, что внешняя картина не изменится. И все же, говорит Мейер-Эпплер, в обоих этих случаях происходят совершенно разные физические процессы. Свист -- это синусоидальные звуковые колебания почти без примеси шума, шум же согласного -- это чистый шум без периодических колебаний. Аэродинамические различия между свистом и произнесением ф делаются тотчас же заметными, если приложить ко рту две сложенных в трубку руки. В то время как ф приобретает немного «темный» (сходный с у) характер, свист теряет стабильность и превращается в шумный звук. То же произойдет, если во время свиста поставить перед ртом какое-либо препятствие, например палец -- свист пропадет, шумный же согласный останется без всякого изменения. Все это объясняется тем, что Щ и свисте возникают собственные колебания, частота которых совпадает с частотой резонатора, в результате чего собственные колебания усиливаются или ослабляются. При сравнении свиста и произнесения согласного особенно бросаются в глаза различия в аэродинамических условиях. При свисте нет и речи о линейной зависимости между звуковым давлением и внутриротовым воздушным давлением. Внутриротозое давление мгновенно возрастает в квадрате, и только в этот момент появляется звук свиста. Нельзя свистеть как угодно тихо, тогда как это вполне возможно при шипении и шиканий. Из этого объяснения делается вывод о том, что при произнесении с мелодия может получаться только за счет возможной при этом произнесении роговой артикуляции, которая меняет то«, но при палатальном с или х это уже невозможно без изменения звучания.

Утверждения Мейера-Эпплера об аэродинамических условиях образования свиста и шума согласных вполне убедительны. Однако из этого не следует, что некоторые согласные (с--х) не обладают никаким резонансом. Конечно, если палатальное с сделается твердым, то характер звучания изменится, но это и значит, что ранее бывший резонанс заменится другим резонансом. Резонанс не может измениться, если ничего не изменилось в резонаторах, но в обоих случаях, как при изменении, так и без изменения, резонанс как таковой остается. Между прочим, еще Рэлей обратил внимание на то, что свистящие звуки, издаваемые ртом, изменяются по высоте (примерно от с до с6) главным образом за счет внутренней емкости резонатора.

Поставленный вопрос имеет общее значение в связи с не ре-шейным еще до конца противоречием между теорией Гельмгольца и Германа. Согласно концепции Гельмгольца форманты возникают в резонаторах как вынужденные колебания, гармонические от основного тона голосовых связок. По Герману, форманты образуются как собственные колебания резонаторов и могут быть негармоническими к тону голосовых связок. Рэлей заметил, что между этими теориями меньше противоречия, чем обычно думают2. Однако при обсуждении этого вопроса имеют в виду только гласные, не учитывая спектра согласных и шепотное произнесение гласных. Если принять во внимание опыты по камертонной методике, проводившиеся Русело и Л.В. Щербой, в которых тон резонаторов определялся на шепоте, т. е. без участия голосовых связок, то действительно, противоречие между указанными теориями значительно сглаживается. Так как на шепоте нет основного тона от голосовых связок, то в резонаторах возникают собственные колебания, при этом в весьма широкой полосе частот. Услышать этот тон на фоне общего шумового спектра не так просто, вот почему его обнаруживают при помощи резонанса камертона. Таким образом, на шепоте функция генерации звука гласных переходит от голосовых связок к полости рта -- области генерации и резонанса совпадают. Такое же совпадение имеет место и при образовании согласных. Здесь резонирует вся та часть трубки, которая не занята сужением при генерации звука. В слоговом механизме все время происходит перестройка с одного вида генерации звука на другой. Когда работают голосовые связки, ротоглоточный резонатор приобретает вынужденные колебания с наличием гармонических составляющих, когда же генерация звука перемещается в самую резонаторную полость или в ее часть, тогда в резонаторной трубке возникают собственные колебания и в составе спектра появляются негармонические составляющие. Вообще же говоря, шумовой фон сохраняется и при произнесении гласных с голосом. Вот почему в описанном выше «вакодере» (искусственная речь) для гласных ставится жужжащий генератор. Во всяком случае в механизме образования речевого звука нельзя исключить ни одну из основных систем, как бы они ни переместились. При образовании звуков речи все процессы происходят в трубках -- воздухоносных или резонирующих. Так как при известных энергетических условиях в этих же трубках происходит генерация звука, то они будут резонировать. Исключить резонанс из механизма речи, значит, исключить смену речевых тембров, т. е. членораздельность и различия сигналов для различения их сигнальных значений.

Итак, в интересной по фактическому материалу работе Мейера-Эпплера оставлены без внимания, во-первых, речевое дыхание в глубоких частях дыхательной системы и, во-вторых, учет резонаторной системы, главным образом в части полости глотки. Пропущенные звенья речевого механизма имеют существенное значение в образовании слога.

Изложенный в этой главе разбор методов изучения артикуляции и результатов некоторых относящихся к нашей теме экспериментальных работ показал, что принципы комплексной методики не осуществляются в той мере, как это необходимо для изучения механизма речи. Каждый из исследователей выбирает какое-то одно или в лучшем случае два звена этого механизма и вменяет им весь эффект работы механизма в целом. На самом же деле любое из явлений или особенностей процесса речевого произнесения настолько тесно связано со всеми другими, что изучение только отдельного звена, вне связи с остальными, в лучшем случае прибавляет сырой фактический материал, но не решает проблемы в целом.

3. АКУСТИЧЕСКИЕ ИЗМЕРЕНИЯ

Для исследования механизма речи целесообразно выбрать эффекторное звено, так как в нем сочетаются разложенные на элементы речедвижения и происходит синтез акустического эффекта. Необходимо результаты акустических измерений сопоставлять со всей системой речедвижений с тем, чтобы на основе этих данных сделать выводы о центральном управлении процессом воспроизводства речи. В этой главе будет рассмотрена техническая сторона примененной методики. Вследствие того, что рентгенография и в особенности кинорентгенография и рентгенокимография до сих пор не применялись в психологии, этим вопросам будет уделено несколько большее внимание.

В акустические измерения должно входить определение интенсивности звука, частоты основного тона, спектра и времени. Для наших целей Прежде всего надо было зафиксировать слоговую динамику, поэтому в качестве индикатора был выбран быстродействующий измеритель уровня -- аппарат Неймана или, как его часто называют, «самописец». Этот прибор записывает: а) уровень звукового давления в децибелах с точностью до + 1 об, б) отмечает длительность звучания и паузы с точностью до 0,2 секунды 1. Самописец менее пригоден для точных измерений абсолютных. величин, например для определения средних, мгновенных и пиковых мощностей звука, но незаменим для сравнительного анализа слоговой динамики. Возможности его применения к изучению речевого процесса оценены еще недостаточно. При произнесении отдельных слов он с полной точностью фиксирует слогоразделы и отчетливо показывает разносильность слогов. При произнесении фраз, вследствие инертности прибора, которая может быть учтена полностью, слогоразделы сглаживаются. Однако сравнительный анализ слов, произнесенных отдельно, и тех же слов, произнесенных во фразе, дает возможность судить о фразовых перестройках в звуковой оболочке слова «а основании различия слоговых профилей двух записей. Значительным преимуществом прибора является также и то, что .он ведет запись по разграфленной на децибелы сетке. Это обстоятельство позволяет оценить ступени прироста интенсивности в равномерной шкале. Если перед самописцем включить в цепь усилитель шумомер, учитывающий в среднем завалы интенсивности при изменениях частоты основного тона, то запись выравнивается примерно по кривым равной громкости и приближается к уровням среднего нормального уха. Вероятность получения таких именно записей увеличивается, если, как в наших опытах, они проводятся в сжатом диапазоне обычной громкой речи от 60 до 75 дБ.

Для измерения частоты основного тона применялся электромагнитный рекордер, позволяющий регистрировать частоту в пределах от 50 до 2500 кол/сек, что для речевых наблюдений вполне достаточно Ч. Этот рекордер является портативным, упрощенным осциллографом для регистрации частот основного тона в пределах речевого диапазона. Запись производится на закопченной ленте большого кимографа. Удобство прибора состоит в том, что при его помощи можно проанализировать по основному тону относительно большие отрезки речи, состоящие из ряда фраз.

Для получения звуковых спектров применялся автоматический спектрограф, сконструированный в лаборатории экспериментальной фонетики и психологии речи МГПИИЯ, где и проводилась эта часть работы. Выше указывалось, что в речевой динамике звуковые спектры все время меняются, в зависимости от их места в составе слова и слова в составе фразы. Необходимо уловить эту изменчивость. Комплексная методика требует прежде всего учета динамики речи. Речевой звук длится меньше чем 0,2 секунды, но и за это краткое время его спектр закономерно меняется, поэтому для учета динамики нельзя было применить такой спектрометр, при помощи которого обычно производятся аналогичные акустические измерения и -который срабатывает за время в 1 минуту. Нельзя было пользоваться также и методом срезания полос частот сверху и снизу, так как и при этом получился бы лишь статический срез данного звука за весь период его длительности и, кроме того, учитывалась бы только полоса частот без регистрации относительных амплитуд составляющих. Для установления динамики звука необходим быстродействующий автоматический спектрометр. Именно такой прибор и был в нашем распоряжении.

Устройство такого спектрометра состоит в следующем. От микрофона напряжение поступает на входной усилитель, делитель напряжения и 23 фильтра. Назначение делителя состоит в том, чтобы подобрать для каждого из фильтров необходимое рабочее напряжение. Сигнал, пройдя через фильтр, детектируется специальным устройством у каждого фильтра и сохраняет на выходе напряжение, пропорциональное своему значению. Каждый из фильтров связан с коммутатором-кольцом, по которому скользит токоснимающая щетка со скоростью 60 оборотов в секунду. За секунды щетка сделает один оборот и встретится один раз с контактом № 24, который имеет постоянное значение по величине отрицательной полярности и поэтому служит для отметки завершения полной окружности, скользящей по контактам токоснимающей щеткой. Эти отметки отделяют кадр за кадром периоды в 16 миллисекунд, в каждый из которых токоснимающая щетка проходит по контактам, связанным с каждым из 23 фильтров в порядке убывания их номеров. На выходе получается напряжение, характеризующее: а) частотное и б) амплитудное значение гармонических составляющих сложного звука. Частотное значение определяется по номеру фильтра, амплитудное -- по величине напряжения. На выходе включается усилитель постоянного тока. Для графической регистрации полученных таким образом сигналов они поступают на шлейфовый осциллограф. На одном из Шлейфов записывается спектрограмма, на другом -- отметка времени и на третьем, в случае необходимости, суммарная осциллограмма сложного звука. В дальнейшем спектрограмма обрабатывается на приборе для чтения микрокниг.

Вся спектрограмма разбита по кадрам отметчиком 24-го контакта. Внутри кадров отмечаются импульсы напряжения от каждого из 23 фильтров. Путем прикладывания линейки по горизонтали кадра устанавливается номер фильтра, другой линейкой по вертикали устанавливается амплитуда наличной частоты в условных единицах длины. По этим дан-Р1ЫМ может быть составлен спектр в микроинтервалах времени, т. е. за период 16 миллисекунд. Спектрометр измеряет частоты в пределах от 62 до 5430 кол/сек. Во всех приводимых в этой работе спектрах указаны лишь номера фильтров. Соответствующие им полосы частот могут быть определены по таблице 3.

Таблица 3 УКАЗАТЕЛЬ РАСЧЕТНЫХ ДАННЫХ ЗВУКОВОГО СПЕКТРОМЕТРА

Резонансная частота

Граничная частота

Полоса пропускания

100

62

80

198

142

103

303

245

ПО

416

355

119

537

474

124

667

598

135

807

733

145

957

878

155

1119

1033

172

1292

1205

180

1480

1338

197

1681

1580

210

1897

1700

220

2130

2010

240

2380

2250

200

2649

2510

280

2938

2790

300

3248

3090

390

3582

3410

340

3941

3760

370

4327

4130

400

4742

4530

430

5188

4960

470

5430

При обработке спектрограмм возникает вопрос о том, какой из кадров принять за исходный пункт сравнения. Возможны два решения -- или выбрать те средние два-три кадра, в которых звук приобретает наибольшую устойчивость, или учесть всю длительность звука в составе меняющихся спектров. Для поставленных в этой работе целей было целесообразнее встать на второй путь. Полученные спектральные данные обрабатывались статистически -- устанавливалась частость встречаемости импульса на соответствующем фильтре, средняя величина амплитуды импульса и квадратичная ошибка по амплитуде. Усреднение величин, во-первых, позволяло учесть сумму спектров на протяжении длительности данного звука и, во-вторых, уменьшало погрешности аппарата при определении величины амплитуд составляющих.

Процедура записи состояла в следующем. В процессе рентгенографии органов речи перед испытуемым ставился микрофон и производилась запись произнесения на магнитофоне. Таким образом, получалось два Документа -- рентгенограмма и запись звука, который мог быть проанализирован по спектру, основной частоте, интенсивности и длительности.

4. РЕНТГЕНОЛОГИЧЕСКАЯ МЕТОДИКА

Исследование речедвижений проводилось при помощи рентгенологической методики. Прежде всего, производилась статическая рентгенография произнесения гласных. В Институте рентгенологии и радиологии в Москве доктором медицинских наук В.Г. Гинзбургом разработана методика и сконструирован специальный станок для рентгенографии органов речи от гортани до губ. Нами был собран материал при непосредственном участии и консультации В.Г. Гинзбурга. По идее В.Г. Гинзбурга при съемке применяются лучи повышенной жесткости--до 100 k W при сравнительно малом ампераже--20 тА. В этих условиях при применении рассеивающей решетки и экспозиции до 0,2 секунды получаются очень четкие изображения как костного скелета, так и всех мягких тканей разной плотности. Особенно хорошо видны «воздушные полости», т. е. уменьшение плотности мягких тканей при растяжении их воздухом.

Съемка производилась следующим образом. Произносящий удобно помещался на стуле, прислонив висок к станку, в котором находилась кассета. Нижний край кассеты плотно упирался в плечо так, чтобы на пленке получалось изображение не только гипофарингса, но и гортани в боковой проекции. Это достигалось также дополнительно и тем, что произносящий несколько вытягивал шею и слегка запрокидывал голову назад. Для сравнения разных снимков особенное внимание обращалось на тождество положения головы в разных экспозициях. Для этого голова устанавливалась в положение по отметкам на доске и мягко поддерживалась затылочным фиксатором. Испытуемый после данного ему сигнала о готовности аппаратуры произносил исследуемый звук и сам нажатием кнопки включал рентгеновскую трубку. Съемка производилась на пленке размером 18X24 смл. Статическая рентгенография надставной трубки дает хорошее представление о способах образования гласных. Наблюдения же за образованием согласных, слогов, слов и фраз требуют применения кинорентгеносъемки. Поставленная нами проблема нуждалась именно в этой методике. Для производства кинорентгеносъемки было достаточно соблюсти следующие условия. Количество падающей на объект энергии рентгеновских лучей измерялось с тем, чтобы определить толерантную дозу и установить время облучения. В выбранных нами условиях время облучения ограничивалось двумя сеансами, около 5 сек. каждый. После этого данное лицо больше не подвергалось облучению и заменялось другим.

Киноаппарат помещался на линии трубка--объект--экран--киноаппарат и экранировался от рентгеновских лучей. Съемка производилась с одного и того же расстояния через свинцовое стекло. Перед каждой отдельной пятисекундной съемкой проверялась наводка объектива на фокус. Предварительно точно устанавливалось положение головы в кадре, так, чтобы туда входила вся исследуемая надставная трубка. Нижняя рамка экрана, укрепленного на штативе, плотно прилегала к плечу объекта съемки. Для увеличения площади нижней части кадра соответствующая часть рамки экрана суживалась до 2--3 мм. Применялся экран Паттерсона, обладающий достаточной светосилой и малой инертностью, по расчетным данным 0,02 секунды. Надо заметить, что инертность экрана при кинорентгеносъемке имеет большое значение. Остаточное изображение, сливаясь с изображением предшествующего кадра, может привести к значительной нечеткости всего заснятого за 5 секунд куска. Так как съемка производилась со скоростью 24 кадра в секунду, то инертность экрана в 0,02 секунды была вполне допустимой. При проверке оказалось, что на следующем кадре негатива после выключения рентгеновской трубки все же остается едва заметный контур профиля объекта. Плотность тени настолько незначительна, что практически это обстоятельство не имело значения.

Съемка производилась на аппарате «Акилей», дающем возможность широкого раскрытия щели обтюратора; объектив со светосилой 0,95 («Astro»), пленка РФ-3, обладающая повышенной чувствительностью к левой части спектра. Материал проявлялся ручным способом небольшими порциями. Было снято 29 кусков длительностью 4--5 секунд, каждый, в общей сложности больше 3 тысяч кадров. Съемка производилась в Институте рентгенологии и радиологии при консультации В.Г. Гинзбурга, В.В. Дмаховского и при участии Б.Н. Мельникова; оператор П.П. Петров. Съемочная аппаратура и пленка были предоставлены Московской киностудией научно-популярных фильмов.

Таким образом, к интересующей нас области глоточного резонатора должна быть отнесена средняя глотка, где происходят основные резонансные модуляции, и нижняя часть гложи. В дальнейшем обе эти часта вместе будут обозначаться термином «глоточный резонатор», или просто «глотка». Носоглотка и полости носа включаются в резонанс лишь в результате изменения положения мягкого нёба, а собственными модуляциями не обладают.

Узкая часть называется стебельком (petiolus), который при помощи связки прикреплен к щитовидному хрящу гортани. В боковых рентгенограммах надгортанник отчетливо заметен в виде светлой (в негативе) или темной (в позитиве) тени, при этом верхняя часть лепестка то загибается крючком вперед, к корню языка, то выпрямляется и значительно отходит кзади. На представленных в этой работе схемах надгортанник изображен в виде белой полоски, на рентгенограммах -- в виде темной тени (позитив). Перпендикулярно надгортаннику, т.е. по горизонтали рентгенограммы, видна подъязычная кость. Надгортанник связан с подъязычной костью при помощи подъязычно-надгортанной связки. Кроме того, надгортанник связан с корнем языка при помощи трех складок слизистой оболочки -- средней и двух боковых. Между этими складками образуются парные надгортанные углубления -- валлекулы (valleculae epiglotticae). Рентгенологи валлекулой называют воздушный просвет между краем надгортанника и корнем языка. В процессе произнесения звуков речи этот просвет все время меняется по форме и величине. Учет этих изменений имеет большое значение для понимания рентгенограмм. Понятно, что в негативной рентгенограмме (и в представленных ниже схемах) валлекула имеет вид темной тени, в позитивной -- заметна по просветлению.

Для учета динамики изменения глоточной трубки нами производилось 10 промеров, где определялись:

I. Размеры глот очной т рубки. 1) Ширина трубки в области зева от корня языка до превертебральной тени. Превертебральная тень, образуемая глубокими мышцами шеи, четко просматривается (вдоль хода позвонков в виде белой линии на негативе и темной в позитиве. Эта линия не смещается и может служить точкой отсчета для всех поперечных измерений. 2) Ширина глоточной трубки вместе с валлекулой по линии, пересекающей надгортанник посередине, т. е. от крайнего переднего положения корня языка до превертебральной тени. Это измерение двойное, так как надо знать как общую величину поперечника по этой линии, так и составляющие, а именно: а) величину валлекулы и б) величину от валлекулы до превертебральной тени. Соотношение этих величин в общей сумме бывает разным при разных произнесениях. 3) Ширина глоточной трубки (измеряется в самом низу, у края гортани). 4) Величина и форма валлекулы. Это измерение также двойное, оно производится по двум взаимно перпендикулярным линиям, одна из которых проходит вдоль валлекулы, другая поперек. Наклон валлекулы по отношению к превертебральной тени может быть учтен в градусах угла. 5) Длина глоточной трубки определяется менее точно. Для отсчета может быть выбрана какая-либо неподвижная точка, например на уровне твердого нёба. Длину трубки все же удобнее измерять по уровню позвонков, лучше всего третьего. Трудность измерения состоит в том, что нижний край воздушной полости трубки приобретает не только разную форму, но и различен по фотометрической плотности. При сравнении измерение следует производить от указанных выше неподвижных точек до однозначно соответствующей точки нижнего края глотки в сравниваемых рентгенограммах.

II. Положение надгортанника при произнесении звуков речи все время меняется. Три необходимых здесь измерения исключительно важны для понимания всего процесса. 6) Положение верхней части надгортанника определяется до превертебральной тени. 7) Положение средней части определяется так же. 8) Высота стояния надгортанника может быть определена от верхней его точки до любой другой неподвижной точки лицевого скелета или по уровню позвонков.

III. Положение подъязычной кости. Она все время колеблется в процессе произнесения вверх и вниз. 9) Эти колебания могут быть определены расстоянием от определенной точки лицевого скелета или по уровню позвонков. Рога подъязычной кости могут принимать разные положения. Иногда один рог далеко отходит от другого, иногда они сближаются, иногда, возможно, вибрируют. Поведение рогов подъязычной кости в процессе фонации представляет особую проблему, требующую специального изучения.

IV. Контур корня языка. Это измерение указано выше, однако целесообразно особо, в отдельной графе, учесть этот контур, так как отношение корня и спинки языка весьма своеобразно, о чем будет сказано в дальнейшем. 10) Необходимо измерить расстояние от края корня языка до превертебральной линии и всегда обращать внимание на форму линии по корню языка до его спинки. Все эти измерения при статической рентгенографии следует проводить по негативу на негатоскопе л-ря размере пленки 18X24. В этих условиях точность измерения может доходить до 1 мм.

При измерении кадров кинорентгеносъемки можно пользоваться проекционным фонарем, поместив его на всегда определенное расстояние от разграфленного в сетку экрана. Однако на экране контуры измеряемых частей глотки будут размыты, что значительно затруднит и снизит точность измерений. Для измерения можно применять обычный флюороскоп, увеличивающий кадр в 2,5 раза. На окошечко флюороскопа следует вделать (или приклеить) прозрачную пленку с делениями по вертикали и горизонтали. Передвигая заснятый материал кадр за кадром по этой шкале, можно получить достаточно точные измерения интересующих величин.

В зависимости от проблемы исследования может возникнуть необходимость определения размеров глоточного и ротового резонаторов в абсолютных, числах, имея в виду их натуральную величину при произнесении разных звуков речи. Для этого надо учесть, что в рентгенограмме изображение увеличено на определенную величину вследствие расхождения пучка рентгеновских лучей. Однако- по рентгенограмме точный учет объема глоточной трубки затруднителен. Глотка имеет воронкообразную форму, обращена широким концом вверх и сплющена спереди назад. Кроме того, полость глотки занята телом надгортанника и подъязычной кости, внутри глотки имеется много складок и углублений. Все это затрудняет точное вычисление объема по данным плоской рентгенографической проекции. В большинстве случаев все же различия в величине и форме глоточного резонатора при разных артикуляциях настолько велики и характерны, что даже по внешнему их виду и с учетом указанных параметров измерения можно сделать ряд важнейших, принципиальных выводов о механизме словопроизнесения.

Так как в задачу методики входило исследование взаимодействия всех органов речи, то ограничиться наблюдениями за функциями только надставной трубки было нельзя. Для изучения речевого дыхания был применен также рентгенологический метод. Широкие возможности для этого представляет применение рентгенокимографии.

Первый рентгенокимограф был сконструирован в 1911г. русским врачом В. Саббатом. В дальнейшем аналогичные приборы стали применяться и за границей. Однако у нас распространение рентгенокимография получила лишь в 30-х годах 1. Появилась новая модель рентгенокимографа В.Г. Гинзбурга, и; было произведено много научных исследований, заставивших пересмотреть прежние представления о процессе так называемого внешнего дыхания (Шик, Гринберг, Голонзко, Крестовников, Цибульский, Соколов, Ротермель, Жученко, Соболев и др.). Ни в одной из этих работ вопрос о речевом дыхании не ставился. Вместе с тем полученные на речевом материале результаты для лиц, специально разрабатывающих методику рентгенокимографии и познакомившихся с этими результатами, оказались совершенно неожиданными. Это объясняется специфическими и совершенно неисследованными особенностями речевого дыхания.

Принципы устройства рентгенокимографа состоят в следующем. В деревянный остов футляра вмонтированы решетка и рама для кассеты с пленкой. Решетка состоит из 24 свинцовых пластин шириной по 12 мм Между пластинами образованы щели в 1 мм. Таким образом, рентгеновские лучи проходят только через щели и не проходят через пластины. Решетка или кассета могут скользить по специальным пазам в футляре и могут быть попеременно связаны с масляным тормозом для регулировки скорости хода или скольжения. Таким образом, может двигаться или только решетка, или только кассета. Два контакта, расставленные на ширину пластины решетки (12 мм), позволяют включать и выключать рентгеновскую трубку. В первый момент движения решетки или кассеты включается первый контакт, вследствие чего трубка начинает работать; пройдя 12 мм, решетка или кассета встречают второй контакт, который выключает трубку. Таким образом, съемка происходит только во время движения кассеты или решетки.

При неподвижности решетки на двигающейся в кассете пленке записываются колебания одной точки объекта, видимой через щель между пластинами. В результате получится так называемая ступенчатая рентгенокимограмма. При подвижной решетке на пленке будет непрерывно фиксироваться, при ее прохождении за щелью, весь путь и соответствующие колебания объекта на этом пути в 12 мм. Это так называемая скользящая рентгенокимограмма.

Рентгенокимограф устанавливается на штативе по линии трубка -- объект--решетка--пленка. Тянущим механизмом является пружина, которая взводится перед началом съемки. Кимограф устанавливается так, чтобы решетка и соответственно ее щели шли параллельно главному компоненту движения объекта. При исследовании дыхания основным объектом наблюдения является диафрагма, мощная система мышц которой поглощает рентгеновские лучи больше, чем легочная ткань, поэтому на рентгенограмме отчетливо выделяется ее краевой контур. Так же хорошо проецируются и ребра, особенно пятое. Так как главный компонент движения диафрагмы вертикальный, то и рентгенокимограф устанавливается так, чтобы его пластины имели вертикальное направление. Движение ребер происходит по дугам разного радиуса, поэтому проекция амплитуд их колебаний меньше отражает реальное движение и более сглажена. В наших наблюдениях целесообразно было сосредоточить главное внимание на движениях диафрагмы, имея в виду, что ее экскурсии совершенно синхронны реберным. При этом, конечно, следует учитывать тип дыхания.

По наблюдениям В.С. Соболева, максимальные колебания диафрагмы приходятся на ее задние отделы, соответствующие поясничной части. В большинстве случаев эта часть диафрагмы и является крае-образующей. Колебания убывают в направлении к центральным отделам куполов диафрагмы и сходят на нет или даже инвертируются в самых передних отделах вследствие интерференции противоположных сил. Эти наблюдения В.И. Соболев производил при боковой проекции диафрагмы. Для решения нашей задачи было достаточно ограничиться фронтальной проекцией, наиболее демонстративной, вследствие возможности обозрения всех разделов по фронту обоих куполов диафрагмы. Однако приведенное наблюдение В.И. Соболева должно быть принято во внимание, учитывая, что различие амплитуд движений задних и передних отделов диафрагмы при фронтальных съемках может быть иногда обнаружено по разной плотности проецируемого края группы диафрагмальных мышц.

Рентгенограмма читается в зависимости от способа съемки. При скользящей рентгенокимограмме она читается в направлении движения решетки, при ступенчатой (т. е. при движении кассеты) -- в направлении, обратном движению кассеты. Под рентгенокимограммой всегда стрелкой показано направление ее чтения, т. е. начало произнесения того или другого речевого звука. Каждая отдельная полоса соответствует движению одной щели решетки за 3 секунды. За это время на каждом из участков диафрагмы, проецирующихся в полосах, происходил один и тот же процесс -- вдох, выдох, вдох. Опускание диафрагмы соответствует вдоху, подъем -- выдоху. Получается треугольник, в котором одна сторона отражает вдох, другая -- выдох.

Кроме многощелевого рентгенокимографд, применяется однощелевой, в котором вместо решетки имеется лишь одна щель в 1 мм. Однощелевая рентгенокимограмма отмечает движение одной точки диафрагмы на большем пространстве пленки, чем ступенчатая многощелевая, но не дает возможности широкого обзора движений всех точек объекта. Для предварительного исследования такого неизученного явления, как речевое дыхание, целесообразно прежде всего получение обзорной, многощелевой скользящей рентгенокимограммы. Кроме того, речевой звук длится очень короткое время, а скорость движения пленки ограничена (10 мм/сек.). Таким образом, нет прямой необходимости в этих условиях растягивать линию записи.

Нами были получены материалы как на однощелевом, так скользящие и ступенчатые кимограммы на многощелевом рентгенокимографе. Практически для наблюдения за диафрагмой различие между ступенчатой и скользящей кимограммами ничтожно и заметно только в движениях ребер. В дальнейшем будет приводиться материал преимущественно скользящих многощелевых рентгенокимограмм. Однощелевой рентгенокимограф мы применяли в том случае, когда заметили различие в амплитудах движений правого и левого куполов диафрагмы. Для уточнения движений правого купола, который иногда у некоторых лиц колеблется в процессе произнесения речевых звуков с меньшей амплитудой, чем левый, мы производили съемку одной точки этого правого купола на однощелевом рентгенокимографе.

Рентгенокимографическая методика для изучения дыхания, и тем более речевого, является несравненно более точной, чем пнеймографическая, широко применяемая в физиологии и психологии. Пнеймографы, в том числе и электрические, помещаемые в разных частях тела, дают косвенные и суммарные данные о механизме внешнего дыхания. Рентгенокимография дает возможность прямого наблюдения и точной регистрации движений диафрагмы, как одного из основных индикаторов механизма в системе дыхательных мышц. В предшествующей главе приводились наблюдения Я.Л. Шика, из которых ясно видно преимущество рентгенокимографа по сравнению с пнеймографической методикой.

Рентгеиокимография речевого дыхания производилась нами в рентгеновском кабинете Института переливания крови при консультации И.Б. Гуревича и в рентгеновском кабинете Московского педиатрического института РСФСР при консультации проф. Н.А. Панова.

По ходу исследования обнаружились такие явления в движении диафрагмы при речевой фонации, которые потребовали дополнительных наблюдений за процессами, происходящими в трахеобронхиальном дереве. Механизм речи не может быть установлен без изучения всего процесса речевого дыхания. Для исследования перистальтики бронхов во время речи была применена бронхокимография. Лицу, произносящему слова, после анестезии верхних дыхательных путей, в один из бронхов назально вводилось контрастное вещество. После этого на ступенчатом рентгенокимографе производилась регистрация бронхиальной перистальтики при произнесении звуков речи и при свободном дыхании. По понятным причинам бронхография не производится на здоровых лицах, поэтому в качестве объектов съемки были выбраны такие больные, которым показана эта процедура для соответствующих диагностических целей. Это обстоятельство не отразилось на наших наблюдениях, так как больные отбирались из подконтрольной группы после /проведенного лечения. Контрастное вещество вливалось в здоровую половину легкого. Фактически у отобранных лиц патологических изменений в бронхиальном дереве не было обнаружено. Затруднения состояли только в том, что приходилось дожидаться случаев для отбора таких лиц. Рентгенокимобронхография производилась доктором И.В. Макаровым при консультации проф. Н.А. Панова в Московском педиатрическом институте РСФСР.

ЧАСТЬ ТРЕТЬЯ. РЕЗУЛЬТАТЫ ИССЛЕДОВАНИЯ

1. СИНТЕТИЧЕСКАЯ РЕЧЬ, ПРИНИМАЕМАЯ СЛУХОМ

В трех параграфах этой главы будут рассмотрены некоторые акустические явления, достаточное объяснение которым может быть дано только в последующих главах, начиная с десятой. На выходе речевых эффекторов образуется синтезированный звук. Уже простой слог (а, о, и и т. п.) является синтезированным. Прежде всего надо узнать, что в этом синтезированном звуке остается постоянным и что, при сохранении постоянства, изменяется и нет ли в самих изменениях также постоянства, т. е. закономерности. Только после этого следует спросить, от чего зависит постоянство и изменчивость и как речедвижения воспроизводят то и другое. Это и будет объяснением, в котором синтетическая сторона явления будет соотнесена с аналитической. Звук, определенный в акустических измерениях как один и тот же, в системе синтеза сообщения выступает как элемент, а в системе анализа как целое, состоящее из других элементов, т. е. признаков звука. Поэтому управление для включения этого звука в синтетическую или аналитическую систему будет разным. При акустических измерениях недостаточно учитывать лишь физические параметры, надо определить их функцию в аналитико-синтетической системе, т. е. рассматривать звук психологически, как средство речевого общения. Задача следующего параграфа состоит в том, чтобы показать, как один и тот же звук входит одновременно в систему произвольного и непроизвольного управления.

2. РАЗНОМОЩНОСТЬ РЕЧЕВЫХ ЗВУКОВ И СЛОГОВОЕ КВАНТОВАНИЕ

Если при помощи самописца Неймана записать несколько фраз живой разговорной речи, то мы получим кривую динамики этого произнесения. Игла аппарата запишет колебания интенсивности в процессе речи. Получить такую кривую нетрудно, но возникают исключительные затруднения при попытке понять ее, объяснить и расшифровать. Обращает на себя внимание не только то, чгго кривая интенсивности лишь изредка падает до нуля, в большинстве колеблясь на среднем уровне, но и то, что количество слоговых вершин на кривой не совпадает с количеством слотов в произнесенном слове. Отдельные слоги как бы пропадают в записи, а динамика одного и того же слова в разных фразах перестраивается до неузнаваемости. Особое затруднение для толкования записи возникает вследствие того, что ударный слог слова часто оказывается менее интенсивным, чем другие, неударяемые, хотя слух отчетливо воспринимает ударение именно там, где оно должно быть. Динамика речи изучалась очень мало, и на указанные явления не обращалось должного внимания. К ним не подходили как к явлениям фразового произнесения и как к элементам анализа и синтеза. Однако при изучении отдельных звуков речи давно уже столкнулись с фактами, систематизация которых позволяет получить ответ на некоторые из основных вопросов, первоначально вызывающих недоумение.

Ответ этот следующий. Разные звуки речи обладают разной акустической мощностью, поэтому их энергия квантуется по разным шкалам. Допустим, что а обладает большей акустической мощностью, чем и, тогда поток энергии а достигнет определенного уровня скорее, чем поток энергии при произнесении и. Для того чтобы поднять динамику и на равные с а ступени, надо на и затратить большую работу, чем на а, т.е. приложить большую силу при произнесении м, чем а. Это и значит, что расчет ступеней акустической мощности будет разным для а и и. При одинаковой или даже меньшей акустической мощности w, на нем уже будет слышаться ударение, если оно усилено по своей собственной шкале «а величину, соответствующую слоговому ударному выделению. Для того чтобы эти чисто физические соотношения приобрели психологический смысл, т. е. обнаружили функцию слогового квантования, его сигнальное значение в процессе речевого общения и управление системой квантования, полезно кратко ознакомиться с историей вопроса определения разномощности звуков речи.

Еще в 1871 г. Вольф производил измерения слышимости разных звуков речи, применяя очень простую методику. Опыт производился в тишине, ночью, в местности, окруженной лесом. Диктор получал инструкцию произносить отдельные звуки речи с одинаковой силой. Исследователь и его помощники постепенно отходили от диктора на такое расстояние, на котором данный звук переставал слышаться. Это расстояние, измеренное в шагах, являлось показателем слышимости или громкости данного звука речи.

Аналогичные данные получил и Русело. О. Есперсен сделал из этих фактов далеко идущие выводы. Он устанавливает следующий ниспадающий ряд громкости гласных: а, о, и, и, г. За ним следуют по убыванию громкости или, по терминологии О. Есперсена, сонорности звонкие согласные [по порядку убывания: а) проточные--боковые, носовые, узкого образования, б) взрывные и, наконец, шумные согласные (узкого образования: закрытые p, t, к).] На основе различий сонорности звуков. О. Есперсен, как указывалось выше, строит свою теорию слога и ударения. Слог образуемся из сочетания разносонорньих звуков. Сам Есперсен считает, что среди фонетистов не может быть сомнения в точности установленных рядов сонорности.

Однако в 1953 г. появилась работа О. Эссена, в которой при помощи современной, более точной инструментальной методики были установлены факты, значительно не совпадающие с только что приведенными.

Так же как и в прежних опытах, дикторы получили инструкцию произносить отдельные звуки речи с одинаковой физической силой. Каждый звук произносился подряд 10 раз 11-ю дикторами. Их произнесение записывалось на магнитофоне и напряжение на выходе измерялось по вольтметру, показания которого пересчитывались в децибелах

Получились следующие результаты Б средних величинах для всех испытуемых (табл. 5).

Таблица 5 РАЗНОГРОМКОСТЬ ЗВУКОВ РЕЧИ (по О. Эссену)

Звуки

Децибел

о

( 50,7+2,3

о

49.9+2,2 i

т

49,3 + 2,3 !

иМ,п

48,5+2,4

/

48,1+2,5

с

48,0+2,5

а

47,2+2,5

i

46,*l+2,3

b

44,4+3,5

j

42,5+3,3

v

41,9+2,9

z

41,5+2,9

s

39,3+2,8

X

36,5+2,8

s

35,8+2,4

ОС

34,2+1,7

f

28,4+1,6

Взрывные /с, p, t, b, d не измерялись, вследствие их краткости и ненадежности показаний стрелки вольтметра. Как видно, полученная Эссеном таблица значительно расходится с ранее приведенной. В дальнейшем Эссен приводит следующие данные. Если произнесение каждого из дикторов разбить на три группы: а) наиболее сильное произнесение 100-- 90%; б) произнесение 89--80%; в) произнесение ниже 80%, -- то получается, что звук а попадает в первую группу в шести случаях, во вторую -- в четырех случаях и ни разу в третью группу. Звук и попадает в первую группу в восьми случаях, во вторую -- в двух случаях, не встречаясь в третьей. Вообще, каждый звук, кроме о, попадает или в первые две группы или во вторую и третью, а такие звуки, как v и z, встречаются во всех трех группах. Эти же явления видны и из приведенной таблицы О. Эссена. Если отклонение при о взять с минусом, то получится 48,4 дБ, а отклонение при а взять с плюсом, то получится 49,7 дБ. Иначе говоря, встречаются случаи, когда а оказывается более громким, чем о. Даже i может достигнуть 48,4 дБ (уровень о).

Аналогичные измерения проводил и Флетчер. У него получились результаты, значительно отличающиеся от данных, приведенных в обеих таблицах. Для гласных Флетчер дает такой ряд (в скобках указана мощность в микроваттах): а (25); о (24); у (23); е (22); и (20).

Спрашивается, чем можно объяснить полное несоответствие полученных разными исследователями результатов? Прежде всего можно усомниться в точности данных Вольфа, так как измерение расстояния шагами и определение мощности звука по слуху не может идти в сравнение с инструментальным измерением. Кроме того, данные Эссена получены на материале немецкого языка, а Флетчера-- на материале английского. Это обстоятельство, несомненно, играет большую роль. Но главное различие данных, полученных Эссеном и Флетчером, заключается в другом. В опытах Эссена дикторы произносили отдельные звуки, а дикторы Флетчера произносили слова. Это методическое различие является принципиальным. Отдельно произносимый звук речи, т. е. слог, составляет целое. Это отдельный акт произнесения. Как только звук попадает в состав слова, он становится элементом целого, произносительным же целым теперь является слово. Управление целым произнесением и управление элементами в составе целого произнесения различно, поэтому различны и шкалы квантования того и другого по динамическим уровням. Отдельный слог а, как целое, может получить любые градации громкости: от неслышного на расстоянии метра шепота до крика. Любой другой звук, например самый маломощный из гласных и, может быть произвольно поднят в громкости до уровня а и даже превзойти этот уровень. Таким образом, о разномощности звуков речи, казалось бы, можно говорить как о величине только статистической, к тому же при сильных вариативных отклонениях.

Инструкция, дававшаяся Вольфом и Эссеном дикторам, -- говорить с одинаковой силой-- психологически невыполнима. Никто из дикторов и сами экспериментаторы не могли проверить одинаковость этой силы. Такая инструкция могла быть обращена только к слуховому контролю, а это значит, что дикторы выравнивали по слуху громкость произнесения. Они усиливали акустически слабые звуки и ослабляли сильные. Однако и при выравнивании звуки оказались разными по мощности. Это значит, что они оцениваются слухом в разных шкалах квантования. Звуки а и и кажутся выровненными, т. е. равногромкими, хотя акустическая мощность и меньше, чем о или а. Звук и, пройдя только три-четыре ступени вверх, уже достиг уровня повышенной громкости по сравнению со своим исходным уровнем, звуки же а или о должны пройти шесть-семь ступеней для того, чтобы достигнуть такого же превышения своего собственного исходного уровня. Опыты с отдельными звуками представляют психологический интерес, так как даже в этих условиях обнаруживаются разные шкалы для разных звуков речи. Однако эти опыты не могут быть признаны точными, если принять во внимание, что разные дикторы неизбежно будут выравнивать звуки на разных абсолютных уровнях. При этом следует учесть весьма разную слуховую чувствительность дикторов, произвольно регулирующих громкость своего произнесения.

Иная картина получается при произнесении слов, куда звуки входят как элементы. Будем ли мы произносить все слово тихо, средне по громкости или очень громко, соотношение мощностей отдельных звуков в составе слова не изменится, так как произвольная громкость теперь задается всему слову, а громкость каждого из его элементов регулируется непроизвольно. При произнесении слов «е будет необходимости выравнивать по слуху отдельные звуки, и инструкция -- произносить все звуки с одинаковой силой -- отпадает. При таком опыте мы получим, так сказать, чистую акустическую разиомощность звуков речи. Вот почему данные Флетчера больше дают для решения поставленной проблемы, чем данные Эссена. Однако и данные Флетчера не решают в полной мере вопроса о разных шкалах квантования речевых звуков. Для того чтобы решить этот вопрос, надо сравнивать разные звуки в составе того слова, в котором они находятся, так как задача и состоит в том, чтобы узнать соотношение элементов в составе целого. Флетчер поступал иначе. Он измерял мощность оо (у) в слове too/, мощность а в слове tap, мощность еа в слове team, т. е. звуки измерялись в разных словах. Диктор и здесь должен был выравнивать произвольную громкость всех произносимых им слов, иначе одно слово, произнесенное более громко, чем другое, вызвало бы увеличение мощности измеряемого звука за счет громкости, заданной всему слову, а не за счет той непроизвольной громкости, по которой отдельные звуки распределяются внутри слова.

Для решения поставленного вопроса нами были произведены записи на самописце Неймана как отдельных звукослогов, так и слов. В последнем случае задача состояла в том, чтобы сравнить интенсивность звуков, находящихся не в разных словах, а в одном и том же слове, учитывая не абсолютную интенсивность, а ее приросты в разных звуках того же слова. Только таким способом можно определить чистую, непроизвольно управляемую акустическую мощность звуков и доказать наличие в механизме речи разных шкал квантования для приема и воспроизводства речевых звуков. Наиболее отчетливые различия в интенсивности заметны лишь между группой гласных и некоторых согласных (глухих, взрывных). Гласные не удается расположить в определенный ряд по разномощности. Такие гласные, как у или и, то произносятся на 4---5 дБ менее интенсивно, чем а и о, то вровень с ними. Подсчет усредненных статистических величин в данном случае был бы мало показателен, так как он определил бы лишь среднюю степень чувствительности слухового контроля, а не действительную величину акустической разномощности этих звуков. Кроме того, задача выравнивания простых слогов по громкости под контролем уха не имеет "Практически большого значения, так как реально в речи такой процесс не встречается. Слоги как элементы сопоставляются по громкости внутри слова или фразового произнесения, а не как отдельные образования, так как по отдельности они не составляют сообщения.

Следует особо подчеркнуть, что во всех словах, где и находится под ударением, интенсивность этого звука, безусловно, должна быть большей, чем в неударном положении. Во всех без исключения случаях, когда записываются слова с сочетанием звуков а ни с ударением на слоге, в состав которого входит в, оказывается, что и в ударном слоге на 3--6 дБ, а иногда на 10--15 дБ менее сильно, чем а в неударном слоге того же слова. Это и есть основной факт, свидетельствующий об акустической разномощности речевых звуков. То, что не получалось при измерении отдельно произносимых слогов, тотчас же обнаруживается в том случае, когда эти слоги входят как элемент в состав слова. Это и значит, что управление элементами в составе целого иное, чем управление всем этим целым. Слог а, произносимый как целое, т. е. в отдельности, регулируется иначе, чем тот же слог, включенный как элемент в состав целого слова. Есть две шкалы динамических уровней: одна для целых словесных образований, другая для элементов. Этим и достигается аналитико-синтешческое выделение элементов и конструирование их в более сложное, системное образование. Так как признаки каждого из элементов, входящих /в слово, разные, то для каждого из них существует своя особая шкала квантования по интенсивности. Сами эти признаки каждого из элементов сохраняют постоянство в их соотношении, вследствие чего звуки речи узнаются как себе тождественные. Они узнаются во всех случаях, на всех ступенях квантования. Они узнаются и в функции целого, и в функции элементов. Но, как только звуки входят в состав целого, они квантуются лишь как элементы, тем самым обнаруживая аналитическую расчлененность целого. В этом и состоит членораздельность речи.

Слог по самой своей природе является динамическим образованием, но так как отдельный слог не составляет сообщения, т. е. не имеет предметного сигнального значения, то и любая ступень квантования отдельно произносимого слога не несет никакой сигнальной функции. Но как только слог входит как элемент в слово или сам выступает как слово или фраза, так тотчас же квантование приобретает сигнальное значение. Так, в ранее приведенном примере латинского / («Поезжай») слог 7 является фразой, целым сообщением, поэтому его динамические градации (звуко-высотные, силовые, временные) приобретают смысл. Таким образом, слог как динамический компонент в такой же мере выполняет сигнальную функцию в сообщении, как и фонема. Только сами эти функции различны. Фонема -- это статический различитель слов, независимо от того, входят ли эти слова в законченный ряд сообщения, или нет. В бессмысленном наборе слогов, не составляющих сообщения, они также будут различаться между собой. Слог же, сам по себе пустой, если исключить входящие в него пункты тождеств а, составляющие постоянные словоразличители, вступает в действие лишь в составе конструктивного целого -- сообщения. Слоговое квантование приобретает сигнальное значение только в определенной системе слов. Тогда квантуется все сообщение по слоговым позициям. Только в результате этого процесса получается конкретное целое сообщение. Слоги, расчленяя сообщение, тем самым составляют целое, которого бы не было, если не было бы расчлененности. Обработка слов, записанных на самописце, с разными сочетаниями гласных, включенных в их состав, дает возможность установить для русского языка ряд гласных по их убывающей акустической мощности а\ о\ э; у; и1. Этот ряд имеет первостепенное методическое значение, так как позволяет установить соотношение синтетического акустического эффекта со всей суммой аналитически раздробленных речедвижений в резонаторной, генераторной и энергетической системах произнесения. В дальнейшем мы увидим, что этот ряд в точности совпадает с рядом объемов глоточного резонатора и рядом градаций силы воздушного давления. Тем самым устанавливается соотношение между статикой и динамикой речи.


Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.