Концепция звукового музыкального блокнота

Требования к музыкальному блокноту и устройствам автоматического распознавания нот. Алгоритмы обработки музыки в аналого-цифровых преобразователях. Влияние разрядности и частоты дискретизации звукового процессора на качество воспроизведения аудиофайлов.

Рубрика Программирование, компьютеры и кибернетика
Вид статья
Язык русский
Дата добавления 29.03.2014
Размер файла 79,2 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://allbest.ru

Ижевский государственный технический университет

имени М.Т. Калашникова

Концепция звукового музыкального блокнота

Ю.В. Кружалова, студент

докт.техн.наук, профессор А.И. Нистюк

В данной статье рассматривается концепция звукового блокнота, который способен записывать, воспроизводить, а также преобразовывать звук в ноты - графическое обозначение звука музыкального произведения.

Задача распознавания музыкальных звуков на сегодняшний день является актуальной проблемой. Большинство современных методов, используемых для ее решения, требуют больших вычислительных ресурсов. Невозможность широкого применения многих алгоритмов сегодня, например, в мобильных устройствах заставляет исследователей искать эффективные методы. Для этого необходимо сформулировать основные требования к подобным устройствам. Данное исследование является актуальным в области музыки, так как может использоваться для быстрого создания музыкального произведения. Применение устройств автоматического распознавания особенно актуально для создания музыкальных произведений в нотной записи, идентификации музыкальных произведений, выявление заимствования (плагиат) и др.

Реализация систем распознавания сложна по той причине, что звуковые сигналы сильно зависят от громкости, акустических свойств окружающей среды. Существует целое множество различных факторов, которые могут оказывать негативное влияние на точность распознающей системы - шум окружающей среды, скорость «напевания», интонация и т. д.

Для распознавания музыки используются алгоритмы, основанные на математических методах.

Для осуществления обработки требуется аналоговый сигнал перевести в цифровой сигнал. Цифровая система обработки звукового сигнала предполагает представление аналогового речевого сигнала в цифровом виде. В результате аналого-цифрового преобразования (АЦП) непрерывный сигнал переводится в ряд дискретных временных отсчетов, каждый из которых представляет собой число. Точность представления зависит от ширины диапазона получаемых чисел, а, следовательно, от разрядности АЦП. Процесс извлечения из сигнала численных значений называется квантованием. Процесс разбиения сигнала на отсчеты - дискретизацией. Число отсчетов в секунду называется частотой дискретизации.

Для извлечения информации обычно используют фильтры тоновых частот (мел-скейл фильтры), которые усредняют спектральные составляющие в определенных диапазонах частот, тем самым делая сигнал менее зависимым от диктора. Такие фильтры являются основой технологии MFCC (Mel-Frequency Cepstral Coefficients), которая используется в распознающей системе. музыкальный аудиофайл процессор

Ещё один метод основан на векторе признаков. Происходит так называемая реализация слова, т. е. цифровая запись произнесения слова (звука) в виде последовательности отсчётов звукового сигнала.

Реализация слова (звука) в процессе цифровой обработки разбивается на последовательность кадров.

Кадром считается последовательность отсчетов звукового сигнала. Длина кадра фиксирована во времени. Каждому кадру сопоставляются некоторые данные, характеризующие звук наилучшим образом.

Такие данные формируют вектор свойств (или вектор признаков). С математической точки зрения это может быть как вектор из пространства , так и набор функций или одна функция. Задачей системы будет являться отождествление каждого слова, поступающего на вход, с заранее определенным классом.

В последнее время распространение получают алгоритмы, использующие нейронные сети. За счет своей простоты и небольшого количества операций на каждой итерации алгоритм стохастической аппроксимации (РАСА) может быть использован для распознавания речи в реальном времени.

Алгоритм основан на использовании пробных одновременных возмущений, которые являются искусственными воздействиями с заранее определенными статистическими свойствами, обеспечивающими состоятельность оценок алгоритма при почти произвольных помехах. В случае зашумленных измерений функции потерь алгоритм сохраняет состоятельность доставляемых оценок при почти произвольных помехах. В задаче распознавания отдельных музыкальных звуков такими помехами могут являться фазовые и спектральные сдвиги звукового сигнала, шум окружающей среды, настройки записывающего устройства и т.д. Алгоритм достаточно прост для реализации в виде электронного устройства.

Наилучшей, с нашей точки зрения, является программа WIDI Recognition System (одна из интерпретаций этого названия - Wave to mIDI) , поэтапно анализирующая музыкальную композицию и превращающая звуки в ноты. Нота (лат. «знак», «метка») в музыке -- это графическое обозначение звука музыкального произведения, один из основных символов современной музыкальной нотации.

Вариации в изображении ноты, а также сочетания с другими символами позволяют задать такие характеристики обозначаемого нотой звука, как высоту, длительность и порядок исполнения по отношению к другим звукам [1].

Чтобы получить в конечном варианте ноты, можно использовать различные источники звука. Это может быть звуковой файл, либо сигнал с внешнего источника - магнитофона, микрофона, иного источника звука. В программе есть собственный звукозаписывающий модуль, который обеспечивает запись звука от внешнего источника. Он обеспечивает как монофоническую, так и стереофоническую запись. Распознавание записи проводится в два этапа.

На первом вычисляются спектральные данные специального вида - в программе этот этап называется преобразованием "Звук-в-Тон". Для этого распознавания используются несколько различных алгоритмов. Какой из них подходит для выбранного произведения, лучше всего определить методом пробы.

Кроме распознавания музыки из файла, программа распознает музыку в реальном времени. Это означает, что можно играть или петь перед микрофоном, а программа будет в это же время распознавать и преобразовывать звуки в формат MIDI.

В состав программы включен специализированный редактор TrueTone для MIDI. Его уникальное отличие от других подобных редакторов заключается в том, что в окне редактирования одновременно отображаются как спектрограмма исходного произведения, так и распознанные ноты.

Ноты накладываются на спектрограмму и позволяют визуально сличать их. Для удобства редактор устроен по принципу Piano Roll, когда ноты располагаются на фоне нотного стана. Эти особенности позволяют редактировать распознанные записи даже тем людям, у которых отсутствует большой опыт работы с музыкой.

Редактор позволяет выполнять над нотами различные действия. Он позволяет "склеивать" ошибочно разделенные при распознавании ноты, проигрывать видимый фрагмент файла, сохранять промежуточные результаты в файл специального формата, содержащий как ноты, так и спектрограмму.

Возможно проигрывание фрагмента как с нормальной, так и с замедленной скоростью, а также синхронное проигрывание фрагмента и исходного файла. Ноты можно добавлять и стирать, изменять их высоту и длительность, назначать для исполнения любой выбранной ноты тот или иной инструмент [2].

Таким образом, во-первых, алгоритмы обработки звуковых сигналов проходят по одной схеме "аналоговый сигнал - преобразование в цифровой сигнал - обработка - нотная запись - воспроизведение нотной записи".

Во-вторых, наиболее перспективными алгоритмами для бытовых устройств, скорее всего, будут алгоритмы, основанные на нейронных сетях.

В-третьих, конструктивно подобные устройства должны выглядеть как блокнот со сменными страничками. Микрофон может представлять собой авторучку к блокноту.

Концептуальный вид музыкального блокнота представлен на рисунке.

Рис. Звуковой музыкальный блокнот

Предполагается, что звуковой блокнот будет способствовать быстрой записи музыкальных произведений с достаточной достоверностью, что является целью дальнейших исследований.

Список литературы

1. Википедия - свободная энциклопедия [Электронный ресурс]// Нота (музыка): [сайт].[2012]. URL:http://ru.wikipedia.org/wiki/Нота_(музыка) (дата обращения: 04.02.2013).

2. Брод М. Переложим музыку на ноты. [Электронный ресурс]// softkey.info: онлайновый журн. 2004. URL:http://softkey.info/reviews/review689.php (дата обращения: 04.02.2013).

3. Takashi Yamada.Yanko design [Электронный ресурс]// Gadgets portable audio technology. Compose music all high tech like: [сайт]. [2008]. URL:http://www.yankodesign.com/2008/08/18/compose-music-all-high-tech-like/ (дата обращения: 29.01.2013).

Размещено на Allbest.ru


Подобные документы

  • Разработка программного обеспечения, предназначенного для изменения характеристик исходного звукового сигнала с целью изменения характеристик его звучания. Алгоритмы обработки и фильтрации звукового сигнала, редактирование его, изменение темпа и уровня.

    дипломная работа [1,8 M], добавлен 08.07.2008

  • Создание оболочки для воспроизведения аудиофайлов. Аналитический обзор языков программирования, их сравнительные характеристики, описание предметной области и формата mp3. Алгоритм разработки инсталляционного пакета. Диаграмма деятельности объектов.

    курсовая работа [581,3 K], добавлен 30.01.2014

  • Формат звукового файла wav, способ его кодирования. Реализация возможностей воспроизведения звука в среде программирования MATLAB. Составление функциональной схемы программы. Апробирование информационной технологии воспроизведения звуковых файлов.

    курсовая работа [1,2 M], добавлен 13.02.2016

  • Анализ процесса оцифровки зависимости интенсивности звукового сигнала от времени. Характеристика технологии создания музыкальных звуков в современных электромузыкальных цифровых синтезаторах. Изучение основных звуковых форматов, способов обработки звука.

    курсовая работа [2,3 M], добавлен 23.11.2011

  • Характеристика периферийных устройств, преобразующих результаты обработки цифровых машинных кодов в удобную для человека форму. Основные характеристики матричных, струйных, лазерных и термических принтеров, виды плоттеров. Особенности звукового вывода.

    презентация [7,5 M], добавлен 25.09.2012

  • Ознакомление с комплектацией и классификацией звуковых карт; рассмотрение их основных характеристик - частоты дискретизации, разрядности, динамического диапазона, коэффициента нелинейных искажений, поддерживаемых спецэффектов. Диапазон цен на аудиоплаты.

    презентация [647,5 K], добавлен 17.11.2011

  • Генерирование и сохранение мелодии в виде звукового файла формата wav. Проведение частотного анализа полученного сигнала. Зависимость объема wav-файлов от разрядности кодирования сигнала. Спектр нот записанного wav-файла с заданной разрядностью.

    лабораторная работа [191,0 K], добавлен 30.03.2015

  • Появление технических систем автоматического распознавания. Человек как элемент или звено сложных автоматических систем. Возможности автоматических распознающих устройств. Этапы создания системы распознавания образов. Процессы измерения и кодирования.

    презентация [523,7 K], добавлен 14.08.2013

  • Понятие и способы дискретизации аналоговых сигналов. Ознакомление с примерами аналого-цифрового преобразование звука. Изучение способов кодирования цифровых изображений, видеоданных и текста. Рассмотрение теоремы Котельникова и теории информации.

    презентация [1,2 M], добавлен 15.04.2014

  • Процессы распознавания символов. Шаблонные и структурные алгоритмы распознавания. Процесс обработки поступающего документа. Обзор существующих приложений по оптическому распознаванию символов. Определение фиксированного шага и сегментация слов.

    дипломная работа [3,3 M], добавлен 11.02.2017

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.