Синтез речи по правилам – программа "Vocaloid"

Особенности программного обеспечения "Vocaloid" компании Yamaha, имитирующего поющий голос человека на основе заданной мелодии и текста. Использование программой компьютерной технологии полного синтеза речи с использованием отрезков естественного языка.

Рубрика Программирование, компьютеры и кибернетика
Вид статья
Язык русский
Дата добавления 15.03.2019
Размер файла 14,0 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

ФГБОУ ВО "Тюменский индустриальный университет"

Синтез речи по правилам - программа "Vocaloid"

Захарова С.П.

Научный руководитель:

к.п.н., доцент Сенкевич Л.Б.

г. Тюмень, Россия

В современном мире, чтобы создать музыку, не обязательно иметь огромную студию с живыми инструментами и обладать сильным голосом. Достаточно иметь компьютер и пару программ, которые заменят вам целый оркестр и подкорректируют ваш голос. Новейшие технологии не только упрощают работу профессионалам, но и делают создание музыки доступным для всех.

Так и поступила компания Yamaha, создавшая программное обеспечение, имитирующее поющий голос человека на основе заданной мелодии и текста. Программа работает на основе технологии полного синтеза речи с использованием отрезков естественного языка. Любую программу на основе Vocaloid можно условно поделить на две части: систему синтеза голоса (пения) и библиотеки исполнителей. Сначала голос разбивается на небольшие отрывки и записывается в базу данных. Далее, пользователь вводит мелодию произведения, указывает для каждой ноты соответствующую фонему текста песни, после чего Vocaloid синтезирует пение. Предусмотрена возможность изменения тембра, скорости, частот, наложения различных эффектов. Другими словами, с этой технологией можно петь без певца. Поющие голоса синтезированы на основе фрагментов голосов, взятых у исполнителей; эти фрагменты собраны в единую базу Singer Library. Существует бесчисленное множество музыкальных композиций, загруженных на Nico Video, Youtube.

Данная программа приобрела огромную популярность. В 2010 году в Токио был проведен первый концерт Хатсуне Мику, где эта искусственная исполнительница танцевала и перевоплощалась в разные наряды прямо на сцене под живую музыку! Эта 3D-галлограмма с компьютерным голосом покорила не только всю Японию, но и другие страны. CD диски с песнями Vocaloid вошли в топы продаж, популярные песни люди пели в караоке, так что софт и музыка, основанные на Vocaloid, стали собственной музыкальной культурой.

С первого превью этой программы произошло множество изменений: теперь сложно найти различия между ней и голосом живых людей. Пользователям стало легко создавать свои каверы и прочие приятные вещи. Интернет предоставляет возможности для развития Vocaloid, можно будет в будущем использовать множество интересных решений, которые позволят пользоваться различными приложениями на основе Vocaloid на мобильных телефонах и портативных игровых устройствах.

Самые известные продукты (так же их можно назвать исполнителями) на базе программного обеспечения фирмы Yamaha Corporation:

1. Хатсуне Мику (яп.Џ‰‰№ѓ~ѓN) - виртуальная певица, созданная компанией Crypton Future Media 31 августа 2007 года. Ее голос синтезирован из семплированного голоса японской сейю Саки. В переводе с английского языка слово sample означает "образец". Применительно к звуку и музыкальным секвенсорам сэмпл - это какой-то оцифрованный фрагмент звучания инструмента или голоса. Образ зеленоволосой девушки был создан японским иллюстратором KEI Garou, работавшим над внешностью других вокалоидов для Crypton Future Media. Она является самым известным и популярным вокалоидом и стала поп-идолом. Также, благодаря технологии лазерной 3D-голографии, она даёт и живые концерты. Свыше 2,5 миллиона пользователей подписано на её страницу в Facebook.

2. Голос Мэйко полностью создан компьютером, поэтому звучит более грубо. За основу взят голос японской певицы Мэйко Хайго. Мэйко может исполнять любые песни различных жанров, такие как рок, поп, джаз, детские песни. Согласно официальному дизайну, она одета в белую жилетку, короткую юбку малинового цвета с двумя белыми ремешками и коричневые сапоги. Она первый женский ВОКАЛОИД первой серии, выпущенный в Японии. vocaloid речь голос мелодия

3. 27 декабря 2007 был выпущен второй пакет Кагаминэ Рин/Лен с персонажами-зеркальными двойниками: мальчик Лен и девочка Рин.

"Голоса" Рин и Лен основаны на голосе сэйю Асами Симода (Asami Shimoda).

В ближайшем будущем пользоваться Vocaloid станет так же естественно, как играть на музыкальных инструментах; платформа поддерживает должное внимание композиторов уже долгое время! Главной особенностью данной программы Технология Vocaloid будет распространяться среди все большего числа людей, которые, в свою очередь, найдут новые возможности использовать ее для своего удовольствия. Я надеюсь, что она станет неотъемлемой частью музыкальной индустрии.

Источники

1. http://all-vocaloids.ru/ofitsial-no-vocaloid-yamaha/

2. https://ru.wikipedia.org/wiki/Мику_Хацунэ

3. https://ru.wikipedia.org/wiki/Vocaloid

Размещено на Allbest.ru


Подобные документы

  • Функции текстового редактора как программы для работы с текстом. Использование редактора MS Word в научной деятельности исследователя-ономаста. Технология распознавания текста и организация работы с программой FineReader. Системы распознавания речи.

    реферат [979,3 K], добавлен 16.10.2013

  • Появление поисковых систем. Применение семантических сетей для анализа текста. Определение релевантности, ранжирование и индексация. Особенности программы Balabolka. Системы анализа речи. Современные особенности поиска. Развитие сервисов поисковых систем.

    реферат [3,2 M], добавлен 22.04.2015

  • Проектирование системы голосового управления в автоматизированных жилых комплексах. Распознавание и порождение (синтез) речи компьютером. Синтез устной речи. Технология поиска ключевых слов. Нейросетевое сравнение на основе простых персептронов.

    дипломная работа [4,3 M], добавлен 19.06.2011

  • Описание среды разработки Microsoft Visual Studio. Поддерживаемые технологии и языки программирования. Возможности и особенности компьютеризированного тестирования человека. Проектирование программного обеспечения с использованием объектного подхода.

    курсовая работа [3,0 M], добавлен 09.02.2013

  • Появление искусственных систем, способных воспринимать и понимать человеческую речь. Автоматическая обработка естественного языка. Анализ, синтез текстов. Системы автоматического синтеза. Проблема понимания, оживление текстов. Модели коммуникации.

    реферат [19,0 K], добавлен 02.11.2008

  • Принцип работы нейросетей и модели синтеза. Ключевые моменты проблемы распознавания речи. Система распознавания речи как самообучающаяся система. Описание системы: ввод звука, наложение первичных признаков на вход нейросети, модель и обучение нейросети.

    курсовая работа [215,2 K], добавлен 19.10.2010

  • Требования к технологии проектирования программного обеспечения (ПО). Состав и описание стадий полного жизненного цикла ПО. Классификация моделей жизненного цикла ПО, их особенности. Методологии разработки ПО, приёмы экстремальный программирование.

    презентация [874,4 K], добавлен 19.09.2016

  • Изучение элементов языка С++, программирование разветвлений и циклов с использованием операторов условного и перехода. Обработка одномерных массивов. Поиск максимального элемента массива с заданной размерностью. Листинги программы и результатов.

    курсовая работа [647,7 K], добавлен 05.02.2013

  • Оценка акустической защищённости на основе "метода формантной разборчивости" с использованием инструментальных средств. Расчет значений октавного уровня соотношения "сигнал/шум" на основе исходных данных. Определение словесной разборчивости речи.

    курсовая работа [721,0 K], добавлен 28.05.2015

  • Разработка программного обеспечения для регистрации удержаний из заработной платы. Характеристика используемой операционной системы и языка программирования. Написание алгоритма и текста программы меню, ввода данных и формирования выходных документов.

    курсовая работа [2,1 M], добавлен 20.11.2012

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.