Моделювання гри на фортепіано з використанням генеративно-змагальної мережі

Принципи створення системи штучного інтелекту, яка здатна генерувати гру на фортепіано, реалістичну та музично забарвлену. Механізм моделювання властивостей гри живої людини на фортепіано – вільне виконання, тембральні та динамічні властивості гри.

Рубрика Программирование, компьютеры и кибернетика
Вид статья
Язык украинский
Дата добавления 17.04.2024
Размер файла 62,8 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

Львівський національний університет ім. І. Франка

Моделювання гри на фортепіано з використанням генеративно-змагальної мережі

Тертичний Дмитро Сергійович,

аспірант факультету прикладної математики та інформатики

Колос Надія Мирославівна,

канд. фіз.-мат. наук, доцент кафедри дискретного аналізу та інтелектуальних систем

Метою даної роботи є створення системи штучного інтелекту, яка здатна генерувати гру на фортепіано в форматі MIDI, достатньо реалістичну та музично забарвлену. Основою для генерації, тобто вхідними даними системи, є нотне подання бажаної мелодії в форматі MIDI. Отримавши формальний нотний запис певної мелодії, система ШІ здатна згенерувати дані MIDI-формату, які будуть моделювати властивості гри живої людини на фортепіано - вільне виконання, тембральні та динамічні властивості гри тощо.

Навчання людини гри на музичному інструменті складається з багатьох етапів та потребує роки тренувань. Окрім вивчення нотної грамоти, розвитку пам'яті, моторики м'язів та інших необхідних навичок для гри, не менш важливим є правильне виконання музики. Воно залежить від багатьох факторів, як об'єктивних так і суб'єктивних - музична епоха, композиторські особливості, специфіка музичного середовища, суб'єктивні вподобання музиканта тощо. Завдяки цьому, музика в сучасному розумінні є багатогранною та неповторною.

Формат подання та обміну музичними даними MIDI дозволяє в достатній мірі описати процес та властивості гри: натискання клавіш фортепіано, їх тривалість, сила натискання. Складність створення системи ШІ та її навчання полягає в тому, що, як і у випадку людини, мережа повинна навчатися на реальному виконанні музики, наприклад, записах концерту або вказівках вчителя. Це зумовлено тим, що на сьогоднішній день не існує достатньої кількості даних для навчання нейронних мереж з подібними вимогами, оскільки навчальні вибірки повинні містити десятки та сотні годин запису гри професійних музикантів у форматі MIDI.

Запропонована система ШІ складається з двох незалежних між собою модулів - вирівнювача (VAE) та генеративно-змагальної мережі (GAN). Задача вирівнювача полягає в згладжуванні характеристик звуку реальних записів гри та приведенні його до деякого уніфікованого подання, яке використовується як взірець для дискримінатору GAN. Це необхідно через суттєву різницю в акустичних та тембральних властивостях звуку різних записів гри на фортепіано. В якості генератора GAN виступає згорткова нейронна мережа прямого поширення, вхід якої отримує синтезоване з MIDI аудіо, а результатом роботи є внутрішнє подання MIDI-формату. Обидва модулі в процесі навчання користуються тільки аудіоданими завдяки синтезуванню звуку зі згенерованих інструкцій MIDI.

штучний інтелект фортепіано музичний

Рис. 1. Архітектура системи

Компоненти Вирівнювача:

- Rawaudio - аудіосигнал, що подається на вхід вирівнювача.

- VAE - автокодувальник, який виконує функцію «вирівнювання» даних.

- Alignedaudio - аудіосигнал, який є результатом роботи вирівнювача.

Компоненти Генератора:

- MIDI input - дані, які містять інформацію про ноти певної мелодії. Є вхідними даними системи.

- Synthesizedaudio - аудіосигнал, який є синтезованим з попереднього компоненту та подається на вхід генератора.

- Generator - нейронна мережа, яка виконує функцію генератора.

- Generated MIDI - дані, які містять музичну інформацію та є результатом роботи генератора.

- Generatedaudio - аудіосигнал, синтезований з результату роботи генератора.

- Discriminator - нейронна мережа, яка є дискримінатором.

Запропонована система дозволяє генерувати MIDI-файли, які мають характеристики гри живої людини. Завдяки сучасним можливостям синтезування звуку, результат роботи нейронної мережі легко перетворити в синтезований аудіосигнал. На сьогоднішній день існує велика кількість синтезаторів, що базуються на основі якісних семплів - записів музичних інструментів.

Модель генератора з вирівнювачем може бути використана в багатьох цілях:

- Генерація реалістичної гри на фортепіано та інших музичних

інструментах, які підтримують формат MIDI, на основі нот.

- Використання моделі для стилізації музики, надання їй різноманітних характеристик та особливостей.

- Розробка автоматичного помічника для навчання гри на цифровому фортепіано - завдяки тому, що модель генератора є однонаправленою, швидкість її роботи є достатньою для аналізу MIDI-сигналу в режимі реального часу.

- Частина генератора, яка конвертує аудіосигнал в MIDI-дані може бути використана для часткового вирішення задачі транскрипції - автоматичної анотації музики.

Недоліки запропонованої системи VAE + GAN є притаманними більшості задач, пов'язаних з аналізом аудіоінформації: необхідність у великому розмірі навчальних вибірок, повільна швидкість навчання мережі, складна архітектура.

Список використаних джерел

[1] Donahue, C., McAuley, J., &Puckette, M. (2018). Adversarialaudiosynthesis. [Електронний ресурс] Вилучено з: https://arxiv.0rg/pdf/1802.04208.pdf

[2] Donahue, J., Dieleman, S., Binkowski, M., Elsen, E., &Simonyan, K. (2020). End-to-end adversarial text-to-speech. [Електронний ресурс] Вилучено з: https://arxiv.org/pdf/2006.03575.pdf

[3] Hawthorne, C., Elsen, E., Song, J., Roberts, A., Simon, I., Raffel, C.,… &Eck, D. (2017). Onsetsandframes: Dual-objectivepianotranscription. [Електронний ресурс] Вилучено з: https://arxiv.org/pdf/1710M 1153.pdf

Размещено на Allbest.ru


Подобные документы

  • Оформлення зручного, зрозумілого інтерфейсу та створення малюнку, на якому відображались клавіші фортепіано. Відтворення звуку при натисненні відповідної клавіші, а також замальовування тієї частини екрану, що відповідала натиснутій клавіші на клавіатурі.

    курсовая работа [560,0 K], добавлен 11.10.2013

  • Логічний, структурний, еволюційний та імітаційний підходи до побудови системи штучного інтелекту. Використання формально-логічних структур, що обумовлено їх алгоритмічним характером. Методи реалізації системи штучного інтелекту, інтелектуальні програми.

    реферат [34,5 K], добавлен 14.04.2014

  • Засоби візуального моделювання об'єктно-орієнтованих інформаційних систем. Принципи прикладного системного аналізу. Принцип ієрархічної побудови моделей складних систем. Основні вимоги до системи. Розробка моделі програмної системи засобами UML.

    курсовая работа [546,6 K], добавлен 28.02.2012

  • Поняття моделювання як процесу, що полягає у відтворенні властивостей тих чи інших предметів і явищ за допомогою абстрактних об’єктів та описів у вигляді зображень, планів, алгоритмів. Системи масового обслуговування. Модель роботи видавничого центру.

    курсовая работа [255,8 K], добавлен 15.09.2014

  • Поняття штучного інтелекту, його порівняння з природним. Коротка характеристика особливостей використання штучного інтелекту в медицині, військовій справі та комп'ютерних іграх. Проблема взаємодії носіїв універсального штучного інтелекту та суспільства.

    контрольная работа [29,6 K], добавлен 07.01.2014

  • Опис та криптоаналіз шифрів простої заміни, перестановки та багатоалфавітних шифрів. Стандарт DЕS. Мережі Фейстеля. Криптосистеми з відкритим ключем. Структура системи RSA. Означення та принципи організації криптографічних протоколів. Кодування алфавіта.

    дипломная работа [782,5 K], добавлен 29.01.2013

  • Етапи розробки системи моделювання позаштатних ситуацій у виробничому процесі, яка реалізована за допомогою технологій National Instruments з використанням пакету графічної мови програмування Labview. Обладнання для вирощування монокристалічного кремнію.

    дипломная работа [2,4 M], добавлен 25.10.2012

  • Мова VHDL. Створення проекту для моделювання цифрових і аналогових схем. Синтез і моделювання комбінаційних пристроїв, заданих в табличній формі, за допомогою системи Active-HDL 6.1. Створення ієрархічних структур при проектуванні складних пристроїв.

    реферат [287,3 K], добавлен 14.02.2009

  • Висвітлення та розкриття поняття 3д-моделювання, його видів та особливостей. Аналіз основних видів моделювання, їхнє практичне використання, переваги та недоліки кожного виду. Розгляд найпоширеніших програм для створення 3-д зображень та їх функції.

    статья [801,7 K], добавлен 18.08.2017

  • Сутність та особливості параметричного, воксельного, полігонального моделювання, моделювання сплайнами та скульптингу. Застосування 3D моделювання в науці, техніці, рекламі, маркетингу, дизайні інтер'єру, архітектурі, анімаці, кіно та медицині.

    доклад [873,9 K], добавлен 04.05.2022

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.