Компьютерное исследование певческого голоса

Использование современных информационных технологий для анализа фонограмм вокальных исполнителей, работающих в различных жанрах. Проблема оценки звуковысотного строения песенных образцов. Характер колебаний голосовых связок при произнесении или пении.

Рубрика Программирование, компьютеры и кибернетика
Вид статья
Язык русский
Дата добавления 15.08.2020
Размер файла 219,6 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Компьютерное исследование певческого голоса

доц. Рудиченко Т.С.,

доцент Тищенкова Т.В.,

ст. преподаватель Донцов В.М.

Использование современных информационных технологий для анализа фонограмм вокальных исполнителей, работающих в различных жанрах, позволяет глубже понять закономерности восприятия человеком окружающего мира. Становится возможным сопоставление субъективных характеристик певческого мастерства, раскрываемых в терминах, которыми сами певцы и их слушатели описывают ту или иную манеру исполнения с объективными параметрами звукового сигнала.

Применение быстродействующих вычислительных машин дает новый взгляд на проблему оценки звуковысотного строения песенных образцов. Компьютерный анализ позволяет определить достаточно точное значение высоты звука и показывает, какое деление может иметь октава в фольклорном пении, не ограниченном рамками равномерно-темперированного звукоряда. информационный фонограмма вокальный

Одним из первых и наиболее широко известных методов исследования звуковых сигналов вообще и певческого голоса в частности является спектральный анализ. Характер колебаний голосовых связок при произнесении или пении гласных звуков не является строго периодическим. Фонограммы часто содержат множество посторонних шумов. С точки зрения анализа певческого мастерства, к помехам следует отнести также и музыкальное сопровождение.

Классические непараметрические методы спектрального анализа в приложении к цифровой вычислительной машине легко позволяют получить оценку распределения плотности мощности звуковых колебаний по частоте для отдельных фонем, составляющих вокальную речь. Графическое представление таких оценок носит название "спектрограмма". Различие форм спектрограмм хорошо соотносится с различиями в тембре голоса. Однако тембр определяется еще и другими факторами. Значение имеет то, как перераспределяется энергия между отдельными участками спектра динамически, в процессе исполнения [1].

Совокупность отдельных пиков на спектрограмме, лежащих близко друг к другу (возможно, - сливающихся в один, вследствие недостаточного разрешения) называют "певческой формантой". Большинство спектрограмм состоит из нескольких формант. Считается, что именно соотношения между формантами и динамика этих соотношений определяет восприятие тембра исполнителя. Общепризнанно, например то, что уровень верхней певческой форманты (2500-3500 Гц) влияет на "полетность" звука. Любопытным является следующее наблюдение: у одного и того же певца, если этот певец обладает хорошим голосом, верхняя певческая форманта не сдвигается по частотной шкале, как все другие форманты, при пении нот разной высоты и разных гласных. На рисунке 1 приведены примеры спектрограмм. Исследуемые нами фонограммы были записаны от известных фольклорных исполнителей в экспедициях в различных районах Смоленской и Орловской областей.

Видно, что огибающие спектрограмм одних и тех же фонем, произнесенных разными исполнителями, довольно близки. В данном примере уровень верхней певческой форманты у исполнительницы Макаровой выражен гораздо менее ярко, чем у других певиц, соответственно, ее голос менее "звонок" и "полетен".

Размещено на http://www.allbest.ru/

Рисунок 1 - Спектрограммы

Сравнительно недавно начало развиваться новое направление в компьютерном анализе фонограмм - оценка звуковысотного строения. Слуховая система человека воспринимает высоту звука в соответствии с частотой основного тона колебаний близких к периодическим. Следует отметить, что существует ряд звуков, которые оцениваются человеком как имеющие определенную высоту, однако анализ этих звуков не позволяет выявить фундаментальную частоту. К таким звукам относится, например, колокольный звон. Экспериментально показано, что значение для слуховой системы имеет не сама первая гармоника, а соотношения между несколькими высшими гармониками [1].

Функциональная зависимость высоты звука от времени носит названия "мелограмма". Исследование мелограмм позволяет выявить ряд очень интересных и важных аспектов, характеризующих манеру исполнения и индивидуальные особенности исполнителей. Обычно в качестве шкалы высоты звука выбираются "центы". Это связано с логарифмическим характером восприятия человеком частоты колебаний. В рассматриваемой шкале одна октава соответствует 1200 центам. Один полутон в равномерно темперированном звукоряде соответствует 100 центам.

Для целей нашего исследования был выбран модифицированный автокорреляционный метод оценки частоты основного тона звуковых колебаний, известный под названием "YIN" [2].

Полученные нами мелограммы имеют "провалы", соответствующие тем местам исходных фонограмм, в которых ожидаемая погрешность оценки фундаментальной частоты оказывалась выше допустимой (был выбран порог в 2 цента). Эти места в основном отвечают произношению гласных звуков. Таким образом, мелограмма легко позволяет судить и о метроритмическом строении песенных образцов.

Размещено на http://www.allbest.ru/

Рисунок 2 - Мелограммы

В процессе исследования особое внимание было уделено такому исполнительскому приему, как вибрато. Было показано, что размах вибрато может достигать 100 и более центов. Однако, слишком "широкое" вибрато на слух воспринимается как "покачивание" голоса.

Высокая разрешающая способность алгоритма "YIN" позволила выявить еще один любопытный факт. У большинства исполнительниц наблюдается незначительное повышение высоты звука на 10-20 центов в течение примерно 1 секунды, что дает на слух ощущение светлой окраски звука.

На рисунке 2 приведено несколько отрывков мелограмм, отражающих исполнение с вибрато гласных звуков. Также приведен результат анализа тестовой фонограммы.

Статистический анализ мелограмм дает возможность построить звукоряд, используемый исполнителем. Октава в фольклорном пении имеет более мелкое деление, чем привычное двенадцати полутоновое [3]. Исследования нескольких десятков песенных образцов показали, что для народного пения характерны звукоряды, в которых расстояние между ступенями меньше, чем в темперированном строе. Примеры такого рода звукорядов приведены на рисунке 3.

Размещено на http://www.allbest.ru/

Рисунок 3 - Звуковысотное строение фонограмм

Краткие выводы. В результате исследования фонограмм народных исполнителей при помощи компьютера нами были получены спектрограммы, мало отличающиеся от спектрограмм исполнителей, работающих в академической манере. Используемая нами методика не позволяет адекватно оценивать тембральные характеристики голоса.

Выявлены особенности вибрато народных исполнителей.

В нашей работе, как и в более ранних, выявлены звукоряды с более мелким делением, чем равномерно темперированный ряд.

Выводы, полученные нами в результате проведенных исследований, основаны на довольно ограниченном материале (количественно и территориально). Тем не менее, они позволили соотнести слуховые данные (живое звучание и аудиозаписи) с объективными показателями и подтвердить правомерность первых. В перспективе, возможно, проанализировать более широкий стилевой материал для выявления общих закономерностей для различных певческих традиций.

Литература

1. Харуто А.В. Музыкальная информатика. Компьютер и звук: Учебное пособие по теоретическому курсу для студентов и аспирантов музыкального вуза. - М.: Московская государственная консерватория, 2000. - 387 с., илл.

2. de Cheveignй, A., Kawahara, H. (2002) "YIN, a fundamental frequency estimator for speech and music", J. Acoust. Soc. Am. 111, 1917-1930

3. Смирнов Д.В., Харуто А.В. Нелинейный звукоряд в музыкальном фольклоре: общая закономерность и индивидуальность. // Языки науки - языки искусства / Общ. ред. З.Е. Журавлевой, В.А. Копцика, Г.Ю. Резниченко. - М., 2000. - С. 347-352.

Размещено на Allbest.ru


Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.