Механизмы речи

Анализ направлений изучения речевого процесса. Методические приемы исследования артикуляции. Акустические измерения. Синтетическая речь, принимаемая слухом. Слоговая стереотипия слова. Корковый уровень регулировки произносительного процесса, его дефекты.

Рубрика Педагогика
Вид книга
Язык русский
Дата добавления 04.02.2011
Размер файла 526,6 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

В связи со сказанным следует обратить внимание на самое понятие акустической мощности. Мощность звука -- это поток звуковой энергии, проходящей через определенную площадь за единицу времени. За единицу принимают работу в 1 эрг, совершенную в 1 секунду, или 1 эрг\сек -- JO"7 ватт. Мощность -- величина статическая, она определяет эффективность силы, производящей работу в данный момент времени. В другой момент мощность может измениться, в зависимости от увеличения работы за то же время. Таким образом, квантование звуков речи в процессе изменения динамического диапазона следует отнести за счет изменения количества работы в единицу времени. Иначе говоря, квантование по динамике зависит только от энергетической системы речи. Так как разные звуки речи образуются в резонаторах разных объемов, то в каждом из этих случаев потребуется разное количество работы для достижения одинакового эффекта. Этим и определяется разномощность звуков речи, так же как и явление статики.

Так как в пределах своей средней мощности каждый звук речи может градуировать по количеству энергии, то возникает квантование как явление динамическое и разное для каждого из звуков речи. Можно сказать, что каждый из звуков речи обладает как бы разной звуковой массой. Так а обладает меньшей звуковой массой, чем и, поэтому для его квантования будет прикладываться меньшая сила, чем для квантования и. Если выразиться менее точно и более образно, то можно сказать, что а делается из более легкого и более податливого для квантования звукового материала, чем и. Вообще же гласные значительно легче квантуются, чем согласные, поэтому гласные и являются слоговыми. Именно ,на них идет рост и падение слоговой динамики. Из всего этого вытекает, что в эффекторах речи следует отыскать такие устройства, которые бы обеспечили, соответственно акустическому эффекту, разновидность звуков, с одной стороны, и квантование в пределах их мощности, с другой стороны. Такие устройства и будут показаны в главе X.

Оба эти устройства различны, так же как и их функции. То, которое определяет разномощность звуков, есть не что иное, как определенность формы и объема резонаторов; то, которое модулирует динамические ступени, входит в состав энергетической системы. Первое определено самим составом звуков данного языка. Это, так сказать, предписанные и заданные условия. Если правила для образования звуков усвоены речедвигательным анализатором, то разномощность звуков появится сама собой как произвольно не регулируемый компонент. Больше того, всякое произвольное изменение звука речи в этой части разрушило бы процесс общения. Наоборот, квантование все время колеблется в разных пределах, следовательно, подчиняется другим правилам регулировки.

При этом можно различать два случая. Подобно тому, как звук может выступать или как отдельно произносимый слог, или как элемент в составе слова, так и самое слово можно рассматривать или как самостоятельное образование, или как элемент в составе сообщения. Роль слогового квантования в этих двух случаях будет разной. Так будут разными функции слова и, соответственно, правила для осуществления этих функций в процессе общения. Отдельно взятое слово должно легко узнаваться, включенное же в состав сообщения, оно должно, кроме того, еще и пониматься в соединении с другими словами. Таким образом, существуют одни правила для конструирования звуковой оболочки слова, выполнение которых обеспечивает его узнавание, и другие правила, определяющие место слова в составе сообщения. Оба вида правил предписывают определенного вида слоговое квантование.

Рассматривая любой динамический график записи отдельно произнесенного слова, Подъем и падение интенсивности за определенное время образует слог. Таким образом, слог акустически есть не что иное, как непрерывное нарастание и падение интенсивности звука, воспринимаемое слухом как дуга громкости. Внутри слога нарастание величины интенсивности идет непрерывно, один слог составляет отдельную порцию энергии, отделенную от другой ветвью падения интенсивности, В каждом слове соотношение слоговых вершин сохраняет относительное постоянство, достаточное для узнавания отдельно произносимого слова. Для точного прочтения кривой, фиксирующей акустический слоговой стереотип слова, необходимо учитывать две величины - г - величину разномощности входящих в слог звуков и силу слоговой позиции данного слога в данном слове. Взаимный учет этих величин устраняет при прочтении динамических графиков основные из тех затруднений, о которых говорилось в начале этого параграфа.

Как видно», слоговые дуги в составе целого слова, как правило, не опускаются до нулевого уровня, а подхватываются новым звуковым давлением. При этом глубина ниспадания слоговой дуги имеет такое же значение для определения силы слоговой позиции, как и относительный прирост интенсивности на одном слоге по сравнению с другими или как длительность слога. Эти три величины могут компенсировать друг друга и взаимно замещаться. Однако во всех случаях дуга слоговой громкости сохранится, так как у звука не может пропасть признак интенсивности. Из этого следует, что слогообразующей силой является именно- дуга интенсивности. Совершенно очевидно, что вариации высоты не могут образовать слога. Ни в одном языке не происходит так, чтобы на каждом слоге основной тон то поднимался, то опускался. То же самое и в отношении долготы слога. Для того чтобы слог был более или менее долгим, необходима какая-либо интенсивность того звука, на котором происходит его укорочение. Слоговые раздельности как простых звуков, так и звуков, сложившихся в один слог, могут возникать лишь в. дуге громкости. Однако как только слог образовался, т. е. образовалась хотя бы минимальная дуга громкости, выделение этого слога по сравнению с другими может происходить самыми различными способами, при этом интенсивность может играть относительно меньшую роль, чем долгота или изменения основного тона на данном, уже возникшем в дуге громкости слоге. Разностный порог различения интервалов времени и высоты более тонок, чем на градации громкости, поэтому слоговые различения в отдельно произносимых словах (русского языка) происходят преимущественно на основе долготы, выделение же слогов в словах при фразовом произнесении происходит на основе колебаний высоты основного тона. Вместе с тем модуляция высоты на слоге неизбежно вызовет некоторое удлинение времени, что в свою очередь потребует и динамического усиления. Но во всех случаях главную роль будет играть индивидуальная шкала динамического -квантования каждого звука речи. Так в фразе «дан на память» -- даннъпамит звук нн будет значительно удлиняться и несколько усиливаться, но ударение все равно останется -на слоге па, так как шкалы квантования для я и а различны. Вообще говоря, конечно, мыслимо чрезвычайное усиление слога ннъ так, чтобы он стал ударным, но это приведет к такому искажению всего звукового состава, что слова перестанут узнаваться. Это значит, что место ударения в слове входит в стабильную подпрограмму словопроизнесения.

Регулировка слоговых позиций в слове происходит при помощи произвольного управления, хотя и здесь, как и во всем, действует извне строгая норма языка. Можно сказать каша вместо каша, в результате получится некоторое произнесение, хотя не нормативное и мало пригодное для общения. Если же произносятся ненормативно звуки речи, т. е. не как звуки данного языка, то вообще нет речевого произнесения. Слоговой стереотип можно перестроить путем инструктивного сообщения говорящему, в котором будет сказано, какие слоги следует выделить и какие ослабить. Такой инструкции не может быть составлено для регулировки произнесения звуков речи, так как синтез звуковых признаков контролируется лишь слуховым эталоном. Однако и слоговой стереотип складывается, как правило, .под контролем слухового эталона, без специальных инструкций. Он вырабатывается и закрепляется раньше, чем появляется возможность для его регулировки по инструкции, которая может быть принята говорящим лишь после анализа слова по слоговым элементам. Известно, что перестройка ненормативного слогового стереотипа вызывает большие трудности. Ненормативное произнесение слова для говорящего сохраняет полную силу подкрепления, так как его предметное значение не меняется. Побуждением к перестройке является только неузнавание слова со стороны слушающего, который не всякий раз может исправить говорящего. Наоборот, фразовые перестройки слогового стереотипа, обычно очень значительные, происходят с исключительной легкостью, так как всякий раз подкреплены для говорящего и слушающего переменой сигнальных значений в изменившейся ситуации. Разговаривающие, не уловившие таких перестроек, перестают понимать друг друга.

Таким образом, звуки речи в первой ступени непроизвольного управления распределяются по градациям звуковой мощности, вследствие чего они могут квантоваться в слогах каждый только по особой шкале. Во второй ступени звуки речи, входя в слог как элемент слова, квантуются по слоговой силе и образуют слышимый устойчивый нормативный стереотип или узнаваемый образ слова. В третьей, наивысшей ступени речевые звуки квантуются в системе фразы, приобретая при этом новые предметные сигнальные значения, в зависимости от ситуации.

Из сказанного в этом параграфе вытекает, что акустическая мощность речевого звука -- это обратная сторона его спектра. Оба понятия определяют слышимое качество каждого из речевых звуков. Различны лишь методические способы измерения этих качеств и, соответственно системы связываемых понятий. В спектре вскрывается аналитический состав данного речевого звука, а в акустической мощности находится интеграл слышимого качества. Сложение и вычитание спектров дает; возможность учесть всю систему дискретной статики и переходов от одного речевого звука к другому, а учет акустической мощности определяет уровень для отсчета квантования каждого отдельного- звука по его собственной шкале. В одном случае сравнивается ряд разных звуков а, и, с, ф в другом случае -- ряд квантования одного и того же звука а, а, а", а" (принимая отметки, " ", как обозначение силовых позиций). Сочетание этих рядов показывает, что спектры относятся к постоянным величинам, а элементы квантования -- к переменным, но так как квантование происходит по определенно измеримым ступеням, то сохраняется закономерность перехода от одного ряда к другому и в самой изменчивости квантования есть постоянство закономерности.

слово речь артикуляция произносительный

3. СЛОГОВЫЕ ПЕРЕСТРОЙКИ В СЛОВЕ

Приводимые в дальнейшем наблюдения опираются на запись речевой динамики, произведенной на самописце. Следует, прежде всего, сделать методическое замечание. Инертность этого прибора позволяет записывать с точностью до 1 дБ. Таким образом, различия в пределах этой ошибки должны отбрасываться. Однако нас не интересовало установление. абсолютных уровней динамики, а везде только соотношение кривой одной записи с другой кривой. Так как записи происходили на одном и том же экземпляре прибора, полученные кривые сравнимы с учетом указанной ошибки.

Теперь постараемся прочесть полученную запись. В первом произнесении первая вершинка соответствует звуку г. Так как этот звук на мгновение прервался дрожащим р, то игла самописца опустилась. Сонорное p образовало еще большую, вторую вершинку и снова дало опускание. За этим возникла еще большая вершинка, образованная редуцированным гласным. Здесь произошла слоговая модуляция, появился слоговой квант, что видно по падению слоговой дуги громкости глубоко вниз. Однако дуга не опустилась до нуля, а была подхвачена новым слогом, в котором оба звука слились вместе в восходящей дуге и образовали главенствующую, ударную вершину да. Чтение двух других произнесений аналогично. Таким образом, в этих произнесениях зарегистрированы две большие вершины, соответствующие двум слогам слова. Кроме того, первая большая вершина несет на себе три малые вершинки. Вспоминается приведенное выше хорошее сравнение Стетсона, когда он на общей дыхательной кривой находил слоговой пульс, как зыбь от ветра на бегущей волне. Однако полученная здесь запись опровергает Отетсона, так как малые вершинки «ветровой зыби» не являются слоговыми. Это различия в акустической мощности звуков речи. Слоговой вершиной является третья, считая слева. Только все эти три вершинки вместе составляют первый слог.

На рисунке 9 представлено шесть произнесений слова ряда (рада) и два произнесения слова рада. Главное отличие слова ряда от только что разобранного состоит в переносе ударного центра на первый слог. Сравнение графиков и здесь показывает отчетливо выраженное постоянство общей структуры слова. Однако по внешности второе произнесение слова рада очень напоминает график динамики произнесения слова гряда. Как там, так и здесь в левой половине три группы вершинок и одна острая, большая, последняя вершина.

Вместе с тем положение ударного центра в этих словах различно. Первоначально трудно различить эти слова по силовой структуре. Но, если принять во внимание звуковой состав, вопрос решается просто. Во всех графиках для слова ряда первая, левая, малая вершинка отмечает акустическую мощность р. Далее следует быстрый и энергичный подъем -кривой на а. Интересно, что во всех произнесениях, кроме последнего, ниспадающая дуга громкости на а идет от вершины не ровно, а с изгибом, занимающим примерно 2--3 дБ. Это явление следует объяснить влиянием дрожащего p в сильном слоте. После дрожащего согласного а перестраивается не сразу. Объемы резонаторов при образовании этого согласного и а резко различны, поэтому мгновенный переход невозможен. Это и отражается на модуляции громкости. В последнем произнесении, где этого явления не наблюдается, p произносилось слабее, что заметно по малому подъему первой вершинки слева. Сила слоговой позиции во всех этих случаях обусловлена прежде всего длительностью ударного слога, а иногда, дополнительно, и большей его громкостью. В первом произнесении слова рада неударный слог даже на 2--3 дБ сильнее, чем ударный. Во втором же произнесении они равны, но во всех случаях ударный слог заметно более длителен. Это явление показывает наличие взаимной компенсации и заменяемости величин силы и долготы, как однородных средств слогового квантования. Так же как и в предшествующей серии произнесений малые вершины и здесь соответствуют неслоговым колебаниям на отдельных звуках.

В дополнение к этим записям приводим график динамики произнесения слова радан. Объяснение его не встречает затруднений. Стоит только обратить внимание на последнюю вершинку справа, з которой также отмечено неслоговое колебание на сонорном носовом н.

Особенно отчетливо видна слоговая перестройка по силовым позициям на материале слов с одинаковым звуковым составом. На рисунке 10 представлены по два произнесения слов мокрота и мокрота. Отчетливо видна однородность структуры произнесений разными дикторами одинаковых по динамике слов и перестройка этих структур при другой динамике. То же явление можно наблюдать и в записях рисунка 7 и да и нет; и да и нет. Звук и, как самый маломощный из гласных, не до- 1 стихает по силе безударных, но акустически более мощных а и э и, как элемент в составе слова, оценивается в ударной позиции по собственной шкале квантования.

Приведенный материал подтверждает положения, выставленные з предшествующем параграфе в общей форме. Слуховой прием динами- j ки произнесения отдельного слова осуществляется на двух ступенях j анализа и синтеза. На первой ступени вычленяется качественная акустическая мощность каждого из звуков речи, синтезируемая вне данного слова в рядах а, и, о, п, к и т. д. На основе этого внутри данного слова на второй .ступени анализа и синтеза выделяются сильные и слабые слоговые позиции, которые квантуются по разным шкалам первой ступени, но оцениваются внутри слова как его устойчивая динамическая структура.

Когда слова сочетаются во фразу, то слоговой синтез развертывается в еще более сложной системе. Слогоделение приобретает сигнальное значение, так как становится средством выделения значащих слов по их весу в составе сообщения. Прежде всего все три слова, произнесенные по отдельности, достигают довольно высокого, но одинакового уровня. Попав во фразу, общее соотношение уровней слов изменилось. Во втором варианте произнесения первое слово значительно поднялось по уровню над третьим словом, но не достигло уровня второго слова. Выделенное слово, кроме того, приобрело большую долготу, а ослабленные сократились во времени. В первом варианте произнесения два слова по краям записи равномерно снизились по уровню, а среднее слово образовало командную вершину. Усиление позиции и здесь выражено не только громкостью, но и длительностью. Хотя все слоги одинаково хорошо отмечены как в отдельно произносимых словах, так и в фразе, но соотношение слоговых раздельностей различно. Существенно также и то обстоятельство, что в фразовом произнесении, подобно тому, как это бывает в отдельно произносимом слове, ниспадающие дуги громкости не опускаются до нуля, а все время подхватываются звуковым давлением последующего слога, чем создается общее синтетическое единство всего фразового объединения.

Этот материал показывает наличие третьей ступени анализа и синтеза в системе слоговых перестроек. Хотя звуки слов во всей фразе следуют без перерыва в общем звуковом давлении, они как постоянные различители продолжают различать слова и разделять их друг от друга, так как эта система словоразличения не смешивается с системой слогового квантования. Больше того, из графиков видно, что слоговая структура каждого из трех слов перестроилась во фразе по сравнению со структурой тех же слов в их отдельном произнесении, однако слова по-прежнему хорошо узнаются. Это значит, что квантование слогов во фразе отделяется в анализе от слоговой конструкции, обеспечивающей узнавание слова. Такое отделение происходит потому, что функция узнавания слова имеет одно сигнальное значение, а функция выделения слова во фразе -- другое сигнальное значение, хотя и то и другое осуществляется средствами слогового квантования. Различие этих квантований и составляет различие слоговых перестроек.

В фразовых слоговых перестройках, если их наблюдать на записях живой разговорной речи, происходят весьма тонкие и своеобразные явления, которые кажутся на первый взгляд парадоксальными. Обычное представление состоит в том, что группа звуков, если они произнесены, всегда будет при наличии слогового гласного образовывать слог. Слог -- это произносительная единица, и вне ее, казалось бы, невозможно произнесение звуков. Однако ряд наблюдений заставляет признать, что одним из средств слоговых перестроек является потеря или «пропажа» слогов. Выпадение слога в словах живой разговорной речи, или нуль слогоделения, является не чем иным, как средством относительного усиления других, особо выделяемых слогов. Это явление сходно с известным в языкознании случаем нулевой морфемы, когда наличие или отсутствие группы звуков, выполняющих функцию морфемы, одинаково является знаком для различения форм слова.

Так как поставленный вопрос является сложным и новым, его необходимо исследовать по возможности разносторонне. В этом параграфе будет рассмотрена только та часть проблемы, которая может быть решена при помощи акустических измерений.

Из этого наблюдения вытекают два вывода. Во-первых, следует допустить, что существует специальный орган слогообразования, не совпадающий с органами, артикулирующими отдельные звуки речи. Во-вторых, слоговые модуляции могут иметь как разную положительную силу, так и переходить в нулевую величину. Последнее явление следует рассматривать как одно из средств динамической выразительности речи. При сглаживании слоговых различий в одной части фразы слоговые выделения в другой ее части, даже незначительные по абсолютной величине, приобретают в соотношении с нулем значительный вес. Это явление, возникающее, надо думать, вследствие специфической инерции слогоделительного прибора, значительно большей, чем инерция языковой артикуляции, санкционируется как нормализованное, средство выделения и ослабления значимых элементов сообщения.

Сглаживание слоговых модуляций вплоть до нуля следует рассматривать как сжатие динамического диапазона речи. Это положение подтверждается анализом только что приведенных записей. Для записи интенсивности в данном случае был выбран прибор, который учитывает динамические колебания не в логарифмических единицах, а в линейном масштабе. Это значит, что при значительных колебаниях динамического уровня игла прибора дойдет до своего «потолка» и вместо подъема будет чертить горизонтальную прямую. Динамические колебания в громкой речи могут доходить до 30--40 дБ, что соответствует в линейном измерении увеличению больше чем в 200 раз. Если минимальный подъем иглы нашего рекордера был 2--3 мм, то максимальный достигнет больше полуметра. На такой большой подъем игла этого аппарата не рассчитана, да и на ленте сферического кимографа такая кривая вышла бы за пределы окружности. Имея это в виду и обращаясь к записям, мы видим, что при слогораздельном произнесении записывающая игла действительно дошла до «потолка», так как после крутого подъема она идет горизонтально на пределе своего подъема, Иная картина обнаруживается на другой записи. Здесь игла не дошла до «потолка», продолжая колебания. Это значит, что, при одинаковой разборчивости обоих произнесений, в слогораздельном варианте было значительно меньшее сжатие динамического диапазона, чем в слитном произнесении. Очевидно, что в последнем случае сжатие динамического диапазона произошло не в записывающем приборе, а в самом произносительном аппарате. Таким образом, речевой прибор работает лишь в определенных сжатых пределах динамического диапазона. Следует признать, что при регулировке громкости речи действует механизм экстремального управления, т. е. управления по минимуму и максимуму. Громкость речи не спускается ниже определенного динамического уровня и не поднимается выше максимального уровня. В дальнейшем будет показано, в чем конкретно состоит оборудование этого механизма в речевых эффекторах. Вполне понятно, что и акустическая разномощность звуков речи зависит от особенностей оборудования этого механизма.

На основании приведенного в этой главе материала может быть сформулировано общее положение о соотношении акустического сигнала и несомого им сигнального значения. Речевой звук есть величина переменная. Изменяясь в системе слога по двум осям х -- у в двух фазах, он в первой фазе приобретает постоянное акустическое значение форманты, во второй фазе -- постоянное сигнальное значение фонемы. Переход от одной фазы к другой, т.е. от одной аналитико-синтетической системы к другой, осуществляется путем переменной сигнализации.

Это положение может быть разъяснено так. Если по оси у отложить звуки речи данного языка, а по оси х -- ступени квантования их мощности, то всегда может быть найдено постоянное акустическое значение каждого из звуков при заданной мощности. Так как каждый звук речи работает то на полную, то на ослабленную в разной степени мощность, то всякий раз меняется и спектр звука. Практически определение постоянного значения заключается в том, что должен учитываться не только спектр, но и ступень, или номер, квантования. В результате такой операции находится серия формант данного звука речи. Однако для того, чтобы эти акустические сигналы приобрели фонемные и словесные значения, необходима вторая фаза процесса, в которой происходит отбор звуков и слоговое квантование. Если, как в приведенных выше кривых, по оси у отложить только те звуки, которые по норме входят в состав данного слова, а по оси х отложить ступени слогового квантования, т. е. сильные и слабые слоговые позиции, заданные также по норме, то будут найдены два постоянных сигнальных значения -- словоразличающие фонемы и звуковая структура слова, несущая предметное сигнальное значение. Отбор звуков будет различать слова по звуковому спектру, а слоговые позиции явятся признаками узнавания слова.

Необходимость двухфазного развития этого процесса обусловлена тем, что в нем происходит двойной переход в анализе и синтезе: от элементов к целому и снова от этого целого, ставшего элементом, k новому целому. Такой переход возможен лишь через переменную сигнализацию. Речевой звук в составе множества его элементов, как только он определяется в точке (пересечения осей х<--у, становится целым, t. e. определенной формантой. Но он еще не имеет предметного сигнального значения до тех пор, пока во второй фазе не войдет в состав определенного слова с его определенным предметным сигнальным значением. В этот момент перехода речевой звук перестает быть целым, и сам становится только элементом слова. Вследствие этого прежний состав элементов звука может в процессе квантования быть заменен другим составом элементов, если целое (самый звук) продолжает выполнять прежнюю сигнальную функцию фонемы, т. е. как элемент находится на определенном месте слова, например в его корне, приставке, суффиксе или в окончании. Так второй звук а в слове вода выполняет ту же функцию, что и второй звук о в слове воды. Можно сказать даже Вот так, в-а-а-а-а-а-да, и все равно этот чрезвычайно изменный звук а-а-а-а будет выполнять для различения этого слова от других такую же функцию, как и о. Полная перестройка звука в его элементах и замена целого ряда этих элементов не играют роли для различения этого слова, например в слове гада (года), но необходимы для нормативных слоговых перестроек слова.

Слово является грамматически и фонетически оформленным. А это значит, что постоянные (фонемные) значения его переменных к -- у определяются в процессе анализа и синтеза всех меняющихся форм слова, включая сюда как морфемные, так и произносительные интонационные формы. Если предметное значение слова вообще сохраняется, то как бы ни изменялись звуки в процессе их квантования, постоянная функция словоразличения, свойственная этим звукам, также сохраняется. Одно идет в счет различения слов, другое -- в счет узнавания и понимания выразительных перестроек. Особый интерес представляет то обстоятельство, что выразительные перестройки слова могут изменить всю его звуковую структуру, и все-таки слова продолжают различаться и узнаваться. Возможность этого обусловлена тем, что новые фразовые перестройки звуков речи и слов подкрепляются новыми сигнальными значениями. Материал по этому вопросу будет представлен в следующем параграфе.

4. СЛОГОВЫЕ ПЕРЕСТРОЙКИ В ФРАЗЕ

Приведенные в предшествующем параграфе записи слоговой динамики отражали, так сказать, лабораторную, искусственную речь. По специальному отбору произносились отдельные слова разными диктофонами. Но отдельно произнесенное слово вне всякого контекста и вне ситуации не составляет сообщения и не является речью. Приведенный в том же параграфе пример фразового произнесения был также искусственным. Слова этого примера объединялись лишь внешними акустическими средствами и также произносились вне ситуации. Все это было необходимо для того, чтобы заметить наиболее элементарные слоговые перестройки в отдельных нормативно произносимых словах. Представленный материал показал, что любой звук речи квантуется. Но так как шкалы квантования их различны, то только некоторые из звуков речи (гласные), обладающие способностью максимально и равномерно нарастать в дуге громкости и/падать, становятся слогообразующими. После установления элементарных положений появляется возможность расшифровать весьма сложную структуру динамических записей живой разговорной речи.

Проведение аналитических записей динамики живой речи встречает методические затруднения и поэтому обычно не осуществляется. Так как живая речь разнообразна по отбору слов, то даже при удаче записи сравнение слоговых перестроек на разном лексическом материале не показательно. Произнесение же специально найденных или составленных и заученных диктором фраз или чтение по тексту резко отличаются от живой речи, так тесно связанной с ситуацией разговора. В этих условиях может возникнуть только чтецкая, а не разговорная интонация. Кроме того, возможны смысловые интонационные разночтения, которые трудно предусмотреть, если читаемый отрывок или фраза взяты в ограниченном контексте. Анализ же читаемого произведения в целом вносит еще более значительные сложности в толкование отдельно произносимой фразы, даже если диктор и экспериментатор постараются об этом договориться. Поставленная задача аналитической записи живой речи должна быть решена достаточно надежным и относительно простым способом в такой мере, чтобы ценность конечного результата была гарантирована практикой жизни. Таким способом является запись сценической речи. Если заданная актеру ситуация совершенно проста, элементарная задача не осложняется сверхзадачей (т. е. созданием -сквозного действия и образа), а текст ограничен несколькими словами, то осуществление всего этого вполне доступно профессиональному актеру. В своей ежедневной работе он выполняет задачи значительно более трудные и сложные. Вместе с тем конечный результат, т. е. образец типичной разговорной речи, различной в разных ситуациях общения, гарантирован практикой театрального искусства. Театральный зритель принимает речь со сцены как живой разговор действующих лиц.

Для наших записей были привлечены высоко-квалифицированные, опытные айтеры по два из трех московских театров (Художественного театра им. А.М. Горького, театра им. Евг. Вахтангова и Театра кукол, руководимого С.В. Образцовым). Сравнение произнесений актеров из разных театров позволяло элиминировать некоторые различия направлений, естественно присущие каждому из этих театров.

Для записи было составлено 9 сценарных эпизодов. Постоянная экспериментальная фраза Сколько это стоит была окружена меняющимся текстом, соответственно изменяющейся ситуации разговора. Сущность ситуации находится из переменной лексики и всего контекста. Задача записей заключалась только в том, чтобы определить особенности слогового квантования в фразовых перестройках живой разговорной речи; специальные вопросы сценической речи в этом параграфе не обсуждаются.

Приведенные ниже графики, отражающие динамику произнесения, расположены по порядку номеров сценарных ситуаций. Полный текст каждой ситуации следующий.

1. -- Я возьму эту книгу. Сколько она стоит?

-- Сто рублей.

-- Как?! Сколько это стоит? Так дорого?.

2. -- Я возьму эту книгу. Сколько она стоит?

-- Пятнадцать копеек.

-- Как! Сколько это стоит? Так дешево?

3. -- Ну, как ваш экзамен? Сдали?

-- Да, сдал (ла). Но (иногда А) сколько это стоит, если б вы знали! Сколько труда и бессонных ночей!

4. -- Ну, как ваш экзамен? Сдали?

-- Сдал (ла). А (иногда Ну) сколько это стоит -- пустяки! 4

5. -- Я возьму эту книгу. Сколько она стоит?

-- Сто пятьдесят рублей.

-- Как!? Вы с ума сошли! Сколько это стоит?

6. -- Я возьму эту книгу. Сколько она стоит?

-- Пятнадцать копеек.

-- Как! Я вас спрашиваю серьезно, сколько это стоит?

(В подтексте ситуации № 6 предполагается, что продающий посмеивается над покупателем и называет ему явно ничтожную цену за покупку) .

7. -- Почему Вы ко мне не приходили? Я вас ждал (ла).

-- У меня был экзамен.

-- Э, пустое!

-- А сколько это стоит, если б вы знали, сколько труда и бессон* ных ночей!

8. -- Я очень хочу пойти на спектакль.

-- Охотно верю, но я беспокоюсь о вас. Ведь у вас скоро экзамен, вам нужно готовиться.

-- Какие пустяки! Ну сколько это стоит -- сдать экзамен!

9. Нейтральное, бесситуативное произнесение слов «Сколько это стоит».

(Ситуации 3 и 4 отличаются от ситуаций 7 и 8 тем, что в последних двух случаях оценка дается как возражение на противоположную оценку первого партнера, тогда как в ситуациях 3 и 4 первый партнер не высказывает оценки).

В каждом из представленных ниже графиков (рис. 15--23) совмещены все три шкалы квантования: а) по динамическому уровню в децибелах (на графиках -- сплошная линия); б), по времени в секундах (на горизонтали); в) по движению основного тона в центах (только для экопериментальной фразы; на графике это обозначено пунктиром). Пересчет частоты звуковых колебаний сделан с точностью до первого знака после запятой. Отнесение в график делалось по ближайшему интервалу темперированного строя, например соотношение в 315,6 цента приравнивалось к малой терции, т. е. 300 центам. Начальный тон отмечался по абсолютной величине в герцах, приравнивался к нулю центов и обозначался на уровне нулевой линии. Таким образом, подъем звуковысотной кривой (пунктир) на определенное число центов обозначает, повышение основного тона от уровня начального, а опускание кривой ниже нуля (обозначается со знаком минус) указывает на падение тона от того же уровня. Кроме того, видны и внутренние интервалы. Такого рода графическое изображение делает сравнимым весь материал, произнесенный разными мужскими и женскими голосами на разных абсолютных высотах начального тона отсчета. Нередко графики, составляемые в фонетических исследованиях при изучении интонации, в которых шкала строится по абсолютному числу колебаний в герцах, сильно затрудняют сравнение материала, произнесенного разными голосами на разных начальных уровнях.

Обратимся к рассмотрению графиков. Буквы К.; Б.; Гер.; Горн.; М.; Гр. являются начальными буквами фамилий актеров. Прежде всего присмотримся к колебаниям динамического диапазона. Число децибел дано не от порога слышимости, поэтому можно устанавливать лишь сравнительные соотношения графиков, имея в виду приросты интенсивности, что и входило в задачу записи. Таким образом, общий диапазон «больших волн» интенсивности сжат в среднем до 15 дБ. На этих «несущих больших волнах» часто возникают вторичные, дополнительные подъемы и опускания интенсивности.

Как видно, разнообразие в слоговых перестройках при фразовом произнесении в живой разговорной речи исключительно велико. Каждый график чем-нибудь отличается от другого в этом отношении. В записях отдельных слов, приведенных в предшествующем параграфе, всегда вырисовывались слоги как отдельные малые вершинки (кроме одной записи -- слова колокола). Допустим, что при фразовом произнесении аппарат не успел записать всех слотов, но сравнение графиков показывает, что в одних записях он все же успел это сделать и пропустил слоги в других. В графике Горн. (сит. 9) произнесение длилось около двух секунд (1,85 сек). За это время из трех слов вырисовались только два и каждое без малых слоговых вершинок. В графике же Гр. (сит 9) за время в 1 секунду вырисовались слоги в словах это и стоит. Таким образом, даже при удлиненном времени произнесения слоги могут не появляться, но иногда возникают при более кратком произнесении. При всем этом разборчивость произнесения во всех случаях полная.

Из приведенных наблюдений следуют два вывода. Во-первых, подтверждается предположение о том, что существует особый орган слогообразования и слогоделения, работающий в непосредственной связи, но вместе с тем независимо от артикуляции отдельных речевых звуков. Во-вторых, происходит резкая слоговая перестройка слов в тот момент, когда слово переходит из синтетической системы в аналитическую. В фазе синтеза отдельного слова из элементов, как правило, прежнем виде. В результате слова различаются как всегда себе тождественные и постоянные элементы, но, приобретая слоговые перестройки и замены, вступают на основании этих сигналов в отношения к другим словам и тем самым приобретают особые сигнальные значения.

Группировка и слитие слоговых вершин образуют синтетические большие подъемы, плато и глубокие опускания динамического уровня.

Это отдельные фразы и их синтагматическое членение. На самих плато или в местах подъема и опускания вершин синтагм возникают меньшие несомые вершины, соответствующие словам. Наконец, внутри слов то возникают, то пропадают мелкие слоговые вершинки. Глубокие опускания линии рельефа графика показывают аналитическую раздельность больших единиц, слитность вершинок сигнализирует их объединение и ослабление как выделяемых элементов, а вся система в целом определяет фразовую аналитико-синтетическую структуру. Так как слова обладают предметным значением, то включение их в определенное место аналитико-синтетической системы приводит к изменению их сигнальной функции в этой системе. Так, в графике К. (сит. 1) слово стоит отставлено от слов сколько это, вследствие этого отставленное слово приобрело интонационное выделение и соответственно большую значимость и вес. В графике же Гр. (сит. I) отставилось в особую раздельность слово сколько, а слово это присоединилось к слову стоит. Здесь больший сигнальный вес приобрело слово сколько.

Механизм всего этого процесса состоит IB слоговом усилении и редуцирующем ослаблении динамики. Диапазон колебаний при опускании и подъеме вершин разных степеней охватывает от 20 дБ до 0,5 дБ и даже, возможно, меньше, т. е. образует минимум 40 градаций. Отставку слова или тем более слога в отдельную большую вершину следует рассматривать как максимальное выделение, возрастающее вместе с увеличением паузы. Ход по малым ступеням надо понимать как наибольшее ослабление фразовой интонационной позиции. Наибольшее ослабление возникает на отрицательной ступени слогоделения, т. е. при пропуске слогов. Несомненно, каждое данное произнесение чем-нибудь отличается от другого. Это видно из графиков, этого следовало ожидать и независимо от акустических записей динамики. Наиболее интересный вопрос состоит в том, чтобы найти общие, постоянные черты в разных произнесениях. Только найдя такие постоянные, можно признать, что фразовые слоговые .перестройки действительно несут на себе определенные, всегда тождественные, хотя может быть и очень разнообразные, сигнальные коммуникативные значения.

Слово как в обоих случаях отставлено от последующей группы вершин на 1,35 сек. Эта последняя группа разделена на две вершины, из которых первая в свою очередь делится на две, хотя соотношение этих вершин несколько разное. Основной тон в обоих случаях вначале поднимается, потом опускается.

Таким образом, при наличии индивидуальных различий во всех графиках есть общий признак, состоящий в том, что в ситуации дорого слово как значительно отставляется от последующих слов, в ситуации же дешево то же слово близко примыкает к последующим. Эта тенденция обнаруживается у всех шести актеров, работающих в трех разных театрах. Надо думать, что разбираемое явление определяется не индивидуальными особенностями людей или различиями школ, а особенностями понимания и оценки самих ситуаций.

Таким образом, слоговые перестройки во фразе приобретают характерную и закономерную форму, в зависимости от ситуации общения. Если снять все слоговые перестройки и сохранить только постоянные словоразличители (т. е. дать просто текст в буквенных обозначениях), то все слова будут различаться и речь будет вполне разборчивой. И без замены звуков буквами может быть создано монотонное слогораздельное произнесение текста. Такое сообщение будет также принято. Имея это в виду, можно было бы сказать, что слоговые перестройки составляют избыточность речи. Если один элемент системы достаточно устойчиво связан с другим или другими элементами, то при появлении первого элемента можно с определенной степенью вероятности ожидать появления другого. Сказав вчер, можно с достаточной уверенностью решить, что последним элементом будет а. Казалось бы, что, получив все звуки слов, слушатель уже получил весь полный объем сообщения. Какие бы ни происходили слоговые перестройки, если сохранены постоянные словоразличители, то и сохранено постоянство словесных значений. Если переданы все слова, то и передано все сообщение. Ведь при помощи слов сообщается не только содержание отражаемой действительности, но и отношение к ней. Отбор лексических элементов с большой вероятностью влечет за собой появление новых элементов, а именно -- экспрессивных синонимических значений. Для обозначения одних и тех же предметных отношений могут быть подобраны разные слова и обороты -- в одном случае, например, деликатные, в другом -- грубые. Выражения: Куда прешь?; Скотина!; Врешь! и т. п. -- могут быть заменены другими: Сюда не следует идти; Вы сделали аморальный поступок; Вы ошибаетесь и т. п.

Однако в действительности сообщение не ограничивается составом слов. Передача слов не составляет еще полного сообщения. Один и тот же отбор слов может приобрести столько слоговых перестроек, сколько есть экспрессивных значений. Это значит, что нет никакого определенного порядка, по которому от лексических элементов можно было бы перейти к элементам экспрессивных значений. Здесь действует полная неопределенность и вероятность случайного явления. Слоговые перестройки определяются не составом слов, а ситуацией, т. е. отношением человека к данным явлениям. Поэтому в состав сообщения, кроме слов, должны войти элементы, определяющие ситуацию. Слушающий не осведомлен о том, в какую ситуацию попал говорящий. Так как отбор слов не восполняет этих сведений, необходимы другие, новые сигналы; они и появляются в виде интонационных слоговых перестроек. Это то, что раньше иногда называлось языком чувств и про что Н.В. Гоголь сказал: «Звуки души и сердца, выраженные словами, во много фаз разнообразнее музыкальных звуков».

Вышеприведенные лексические замены типа Врешь! Вы ошибаетесь обычно называют изменением «тона» речи. Предлагая собеседнику переменить «тон», очень часто имеют в виду отбор слов. Это значит, что существует закономерный переход не от слов к экспрессивным значениям, а, наоборот, от этих значений к отбору слов. Ситуация влияет и на слоговые перестройки, и на отбор слое. Но если переход от ситуации к отбору слое закономерен, то переход от отбора слое к ситуации остается неопределенным. На этом законе держится сценическая речь. Если актер не усвоил ситуацию, т. е. предлагаемые обстоятельства, то никакой отбор слов не будет достаточен для обнаружения этой ситуации. В определенных условиях взаимоотношений людей слово свинья или поросенок, сказанное с определенной интонацией, может и не быть грубым или ругательным.

Однако по закону замены слов интонационные перестройки могут быть заменены словами. В этом состоит расшифровка или декодирование подтекста. Иронически сказанное Он умен обозначает: Он глуп или Он не умен. Возможность таких замен показывает, что интонационные перестройки обладают смыслом. Но так как всякий смысл может быть выражен словами, то и интонационный может быть также переведен в лексику. Если бы такой перевод всегда происходил в процессе речевого общения, тогда избыточность сообщения возросла бы неимоверно. Говорящий, освободившись от интонации, должен был бы находить специальные слова для выражения того, что обозначала интонация. В действительности интонация увеличивает объем сообщения, приходящийся на один лексический элемент, так как при этом сообщается не только то, что содержится в тексте, но и в подтексте. Но вместе с тем существует определенная длина текста, достаточная для установления ситуации разговора. Как только находится эта ситуация, находится и интонация прочтения данного куска текста. Следовательно, все же есть совершенно определенный и закономерный переход от текста к интонационным перестройкам слов в составе этого текста, Такой переход осуществляется через звено усвоения ситуации. Не отдельные слова, а их совокупность в составе текста выясняет ситуацию, и только после этого находится правило для определения интонационного ряда.

Таким образом, оценка ситуации и интонация коррелятивны. По интонации может быть восстановлена ситуация, а по ситуации найдена интонация. Это положение вытекает из описанных выше наблюдений. Мы видели, что один и тот же лексический состав приобретает определенные закономерные слоговые перестройки у разных лиц при наличии данной ситуации. Следовательно, существуют экспрессивно интонационные постоянные, которые можно назвать интонемами, подобно тому как существуют постоянные звуков речи -- фонемы, постоянные формы слова -- морфемы и постоянные конструкции предложения -- синтагмы. Зная правило перехода от ситуации к интонации, возможно по списку ситуаций составить искусственными акустическими средствами выразительную интонацию живого разговора, подобно тому как теперь синтезируются искусственные речевые звуки и слова, обладающие качеством разборчивости.

Конечно, весь интерес и психологическая сущность поставленной проблемы об интонационных постоянных заключается не в том, чтобы научиться синтезировать искусственную интонацию естественной речи -- это лишь один из возможных путей решения более важной задачи. Здесь возникает одна из центральных проблем психологии общения -- вопрос о речевом действии. Если человек один раз удивляется, узнав высокую стоимость интересующей его книги, другой раз удивляется ее малой цене, а третий раз возмущается, подозревая неуместную шутку со стороны лица, называющего смехотворно малую цену той же книги, то во всех этих случаях производятся разные речевые действия или, можно сказать, разные речевые поступки. Один и тот же лексический и грамматический состав высказывания приобретает совершенно разный смысл и образует разные формы речевого общения. В одних и тех же словах передаются два совершенно разных вида сообщения. В одном из них сообщается о некоторых явлениях и фактах действительности, в другом -- об оценке этих фактов и явлений со стороны говорящего. Вероятно, в каждой речи всегда наличны оба эти компонента в разнообразно меняющихся соотношениях. Вследствие принципиального различия этих видов сообщения, несущие их сигналы также различны. В одном случае это статические форманты (как бы они ни заменялись), как постоянные словоразличения, в другом случае -- это постоянные в ступенях динамики слогового квантования. Следует признать, что и управление для воспроизводства этих видов сигналов и соответственно определение постоянных будет различным. Всякий грамотный человек, имея перед глазами текст, может прочитать записанные слова и понять описанную в них ситуацию, но не всякий может воспроизвести те интонационные слоговые перестройки, которые вытекают из этой ситуации и определяются ею. Вместе с тем любой человек сам попав в аналогичную ситуацию, легко воспроизведет адекватную ей интонационную перестройку. Читая текст, человек совершает одно речевое действие, а вступая в живое речевое общение и применяя при этом те же слова, он производит совершенно другое речевое действие. Это различие и позволяет говорить о разных видах управления речевыми движениями. Так как речедвижения эквивалентны акустическому эффекту, можно параллельно акустическим формантам говорить об артикуляционных кинемах, а параллельно слоговым перестройкам -- об интонационных кинемах. Ответ на вопрос о том, при каких условиях один речевой поступок может быть заменен другим, т. е., например, чтецкая интонация -- живой, разговорной интонацией, будет получен в том случае, когда будут найдены способы управления кинемами одного и другого вида. После исследования системы управления речевыми органами в этой работе будет выдвинута гипотеза об управлении произвольно не управляемой системой речедвижений, что и соответствует проблемам замены интонаций, замены речевых поступков или маскировки одного речевого поступка другим.

5. ОБРАЗОВАНИЕ РАЗЛИЧИЙ АКУСТИЧЕСКОЙ МОЩНОСТИ ГЛАСНЫХ

Анатомия речевых органов сложилась у человека в процессе формирования языка и применения речи. Эволюция состояла не просто в том, что органы, входящие в пищеварительную и дыхательную системы (рот, глотка, носоглотка, трахеобронхиальное дерево), приспособились k выполнению новой функции, но главным образом в том, что произошли значительные изменения во взаимном расположении некоторых анатомических элементов, что и обеспечило постепенное овладение речевой фонацией. Такое переустройство органов фонации и резонанса, конечно, не могло быть местным процессом, распространяющимся только на периферию. В связи с переходом от стадной жизни к общественно-трудовой и одновременно с этим к прямохождению изменился мозг человека, о чем убедительно говорил Ф. Энгельс. В этот период и формировался речедвигательный анализатор как в своей периферической, так и в центральной части. Если «чрезвычайная прибавка» в виде речи (по терминологии И.П. Павлова) резко бросается в глаза при сравнении человека с животным, то на изменения в органах фонации обычно обращают мало внимания. Однако эти переустройства в такой же мере могут быть названы чрезвычайной прибавкой, как и образование речевых зон в коре большого мозга, так как это один и тот же процесс.

У павиана надгортанник поднят высоко вверх и почти смыкается с нёбной занавеской, полость рта и глотки соединены лишь очень узким проходом, воздух по глотке может поступать легче в носоглотку, чем в рот. У человека гортань и надгортанник опустились значительно вниз. Вследствие этого полость рта и полости средней и нижней глотки образовали одну общую надставную трубку. Можно сказать, что у животного две трубки -- одна дыхательная, другая -- пищеварительная. У человека обе трубки слились в одну, образовав резонаторную систему, необходимую для речи и пения.

Крики высших млекопитающих, образуемые в гортани, конечно, приобретают резонанс при раскрытии рта и в связи с этим меняются по тембру, но модуляции этих тембров крайне ограничены. В особенности бросается в глаза то обстоятельство, что в модуляциях крика животных нет сжатия динамического диапазона, которое так характерно для речи. Оглушительный рев сменяется едва слышимыми гортанными шумами, резкий визг возникает мгновенно и также мгновенно пропадает. Нет и устойчивой сетки для перехода к разным длительностям одного и того же звука. У человекообразных обезьян насчитывается больше 30 звуковых комплексов, имеющих определенное сигнальное значение, но сами эти комплексы не расчленены на отдельные речевые звуки. Хотя некоторые исследователи пытаются обозначить буквами те звуки, которые входят в состав комплексов, но делается это на основе субъективного слухового анализа; спектральный состав криков обезьян не определен. Кроме того, сами звуковые комплексы входят з общий нерасчлененный эмоционально-двигательный состав и с трудом поддаются условно-рефлекторному выделению из этого состава. Нет никакого сомнения в том, что у. обезьян отдельный звук не может быть отделен от всего звукового комплекса. Это и значит, что у них нет того материала, из которого, как из элементов, могли бы составляться слова, т. е. отсутствует первый, элементарный отдел речевого механизма. Так как здесь нет отдельного звука, который мог бы меняться, входя в разные звукоряды, то нельзя говорить о постоянных звукоразличителях и о рядах акустической мощности разных звуков.


Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.