Методи аналізу і розпізнавання складних сигналів в автоматизованих системах мовного діалогу

Розробка алгоритмів розпізнавання мовних сигналів. Розгляд та характеристика багатовимірних функцій у базисі елементарних функцій: для параметричного уявлення спектра і частотної функції мовотворного тракту - резонансних функцій другого порядку.

Рубрика Коммуникации, связь, цифровые приборы и радиоэлектроника
Вид автореферат
Язык украинский
Дата добавления 12.07.2014
Размер файла 260,9 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

6. Карпов О.Н. Метод последовательных приближений вычисления параметров передаточной функции речеобразующего тракта // Актуальні проблеми автоматизації та інформаційних технологій. Д., 2002. Т.5. С.

7. Карпов О.Н. Представление многомерных функций в базисах элементарных функций // Питання прикладної математики і математичного моделювання. Д., 2001. С.2639 .

8. Карпов О.М. Вступ до курсу "Технологія проектування пристроїв розпізнавання мови": Навч. посіб. Д., 2000. 64с.

9. Карпов О.Н. Быстросходящиеся алгоритмы распознавания слов речи // Вопр. прикладной матем. и мат. моделирования. Д., 1997. С.6263.

10. Карпов О.Н. Быстрый и надежный алгоритм сопоставления выборок речевых сигналов // Вопросы прикладной математики и мат. моделирования. Д., 1995. С. 2829.

11. Карпов О.Н., Карпов А.О. Качественный анализ связи амплитудно-частотных параметров речевого сигнала, геометрических размеров резонаторов и входных управляющих воздействий речеобразующей системы //Автоматич. распознавание и синтез речевых сигналов. К., 1989. С. 8993.

12. Карпов О.Н. Многокритериальный динамический иерархический подход к задаче распознавания речи //Вопросы прикладной математики и математического моделирования. Д., 1991. С.128131.

13. Карпов О.Н. Некоторые вопросы автоматизации описания сегментов речи элементарными функциями //Методы решения нелинейных задач и обработка данных. Д., 1985. С.95100.

14. Карпов О.Н. Некоторые свойства сплайн-модели фазочастотных характеристик речевых сигналов // Питання прикладної математики і математичного моделювання. Д.: РВВ ДНУ, 2000. С. 35-37.

15. Карпов О.Н. Некоторые цепочки анализа речи // Вопросы прикладной математики и мат. моделирования. Д., 1994. С. 2021.

16. Карпов О.Н., Носенко Э.Л., Чугай А.А. Электронные речевые анализаторы и возможности их практического применения //Психологический журнал АН СССР. 1981. Т.2, N6. С. 104106.

17. Карпов О.Н. Обобщенная постановка задачи распознавания речи, эмоционального состояния и индивидуальных особенностей говорящего //Актуальные пробл. ЭВМ и программирования. Д., 1981. С. 3943.

18. Карпов О.Н. Оптимальный формантный анализ речи //Вопр. прикладной математики и мат. моделирования. Д., 1992. С. 89 92.

19. Карпов О.Н. Посегментное распознавание слов //Решение прикладных задач мат. физики и дискр. математики. Д., 1985. С. 95100.

20. Карпов О.Н. Представление знаний в системах анализа и распознавания речи //Вопросы прикладной математики и мат. моделирования. Д., 1994. С.18-19.

21. Карпов О.Н. Речь как продукт работы прогнозирующей следящей речеобразующей системы с дискретным управлением//Вопросы прикладной математики и математического моделирования. Д., ДГУ, 1988. С. 93-98.

22. Карпов О.Н., Сегеда Н.Е. Информационное и программное обеспечение системы распознавания речи // Вопросы прикладной математики и мат. моделирования. Д., 1995. С. 3844.

23. Карпов О.Н., Сегеда Н.Е. Исследование связей между параметрическим, фонемным и символьным представлениями речевого сообщения //Речевая информатика. К., 1989. С. 94101.

24. Карпов О.Н. Сегментация речи как функция длительности периодов сигналов в формантных областях //Вопросы прикладной математики и математического моделирования. Д., 1991. С. 88 90.

25. Карпов О.Н. Структурное моделирование аппроксимирующих функций //Вопросы прикладной математики и математического моделирования. Д., 1995. С.3235 .

26.А.С. N743016, СССР, МКИ G 10 L 1/02. Устройство для автоматического распознавания устных команд / О.Н. Карпов, Г.Н. Бордовский // Открытия. Изобретения. 1980. N 23. С.282.

27. А.С. 773689, СССР, МКИ G 10 L 1/02. Устройство для выделения частоты основного тона /О.Н. Карпов, Э.Л. Носенко, А.А. Чугай// Там же. 1980. N39.С. 247.

28. А.С. N817746, СССР, МКИ G 10 L 1/04. Электронный анализатор распознавания эмоционального состояния человека. Электронный регистратор временных характеристик речи / О.Н. Карпов, А.А. Чугай, Э.Л. Носенко // Там же. 1981. N 12. С.212.

29. А.С. N1180969, СССР, МКИ G 10 L 5/00. Спектрополосный анализатор для распознавания речевых команд / О.Н. Карпов, А.А. Чугай, Л.Н. Исаев и др. // Открытия. Изобретения. 1985. N 35. С.235.

30. А.С. N1690688, СССР, МКИ 5A 61 B 8/02. Ультразвуковой вазолокатор / О.Н. Карпов, В.М. Школьник, Е.И. Белоусова // Там же. 1991. N 42. С.61.

31. Выделение и ввод в ЭВМ параметров речевого сигнала // Методы решения нелинейных задач и обработка данных / В.Е. Дуранин, О.Н. Карпов, Чугай А.А. и др. Д., 1983, С. 98101.

АНОТАЦІЇ

Карпов О.М. Методи аналізу і розпізнавання складних сигналів в автоматизованих системах мовного діалогу. Рукопис.

Дисертація на здобуття вченого ступеня доктора технічних наук за спеціальністю 05.13.06 автоматизовані системи управління і прогресивні інформаційні технології. Національний авіаційний університет. Київ. 2003.

Дисертація присвячена питанням побудови моделей аналізу складних сигналів і їх спектрів, методів визначення параметрів систем, що формують ці сигнали, розробки алгоритмів розпізнавання мовних сигналів і розробка на цій основі інформаційних технологій побудови систем розпізнавання мови.

Для розв'зання поставлених задач у роботі запропоновані нові методи аналізу сигналів і їх спектрів, що розглядають їх як функції багатьох змінних з невідомим порядком і складом компонент, що входять до них і невідомими параметрами компонент. Методи рішення виходять із теореми Колмогорова A.М. про те, що функцію багатьох змінних можна уявити як суму, добуток і суперпозицію одновимірних функцій. У даній роботі розглядається уявлення багатовимірних функцій у базисі елементарних функцій виду: для параметричного уявлення спектра і частотної функції мовотворного тракту резонансні функції другого порядку, в тому числі функції запізнюючіх ланок і експоненційні функції; для непараметричного уявлення спектра параболи другого порядку і локон Аньєзі крива 3-го порядку. Для резонансних функцій і запізнюючих ланок задача вирішена в часовій і частотній областях. Параметри мовного тракту визначені методами: послідовного вилучення складових сигналу CET і послідовних наближень SAT для акустичної і біомеханічної систем.

Алгоритми розпізнавання реалізовані як послівне, фонемне і сегментно-складове розпізнавання з застосуванням згладжуючих сплайнів, сплайн-ідентифікації і сплайн-синтезу. Реалізований базовий алгоритм розпізнавання на основі екстремальних функцій, який досліджений по словнику 800 слів і виявив стабільну надійність розпізнавання слів не менше 98% на одного диктора. Словник еталонів, в загальному випадку, утримує по одної реалізації кожного слова. Добре розрізняються слова типу “бочка - дочка”.

Ключові слова: перетворення Фур'є, аналіз сигналів, параметричне уявлення, розпізнавання мови, спектр, алгоритм, частотна функція.

Карпов О.Н. Методы анализа и распознавания сложных сигналов в автоматизированных системах речевого диалога. Рукопись.

Диссертация на соискание ученой степени доктора технических наук по специальности 05.13.06 автоматизированные системы управления и прогрессивные информационные технологии. Национальный авиационный университет. Киев. 2003.

Диссертация посвящена вопросам построения моделей анализа сигналов и их спектров, методов определения параметров систем, формирующих эти сигналы, разработки алгоритмов распознавания речевых сигналов и разработки на этой основе информационных технологий построения устройств распознавания речи.

Для решения поставленных задач в работе предложены новые методы анализа сигналов и их спектров, рассматривающие их как функции многих переменных с неизвестным порядком и составом компонент, входящих в них, и неизвестными параметрами компонент. Методы решения исходят из теоремы Колмогорова А.Н. о том, что любую функцию многих переменных можно представить как сумму, произведение и суперпозицию функций одной переменной. В данной работе рассматривается представление функций многих переменных в базисе элементарных функций. В общем случае представление многомерной функции речевого сигнала может быть построено в разных базисах. Базисные функции должны обладать следующими свойствами: для представления резонанса функция должна быть колоколообразной (иметь максимум на заданной частоте); ширина функции должна определяться некоторым параметром; ветви функции должны обеспечивать описание инерционных и дифференцирующих свойств.

В качестве элементарных функций рассмотрены: для параметрического представления спектра и передаточной функции речеобразующего тракта резонансные функции второго порядка, запаздывающие звенья и экспоненциальные функции; для непараметрического представления спектра параболы второго порядка и локон Аньези кривая 3-го порядка. Для резонансных функций и функций запаздывающих звеньев задача решена во временной и частотной областях.

Параметры речевого тракта определены методами: последовательного извлечения составляющих сигнала CET и последовательных приближений SAT для акустической и биомеханической систем.

Для решения поставленных задач распознавания исходный речевой сигнал разбивается на интервалы длительностью 10 мсек. На каждом интервале вычисляется спектр Фурье, формируя двумерное спектрально-временное представление речевого высказывания (слов). Решение задачи описания спектрально-временного представления заключается в обнаружении двумерных всплесков в частотно-временных координатах и их аналитического описания в классе колоколообразных функций, которые характеризуют резонансные свойства речеобразующей системы. Для этого вычисляются параметры функций, характеризующие положение максимума по частоте (резонанс) и по времени, коэффициент усиления, ширину по частоте (добротность) и по времени. Построенные по методу СЕТ функции вычитаются из исходного спектрально-временного представления, устремляя остаток спектра к нулю, по методу SAT суммируются, приближаясь к исходному спектрально-временному представлению.

Для целей распознавания в соответствии с вычисленными параметрами колоколов синтезируется спектрально-временное представление, которое является параметрическим описанием эталонных и предъявленных реализаций. Для уменьшения времени распознавания больших словарей строится многоэтапная иерархическая схема сокращения объема распознаваемого подмножества. Это достигается за счет формирования нескольких видов параметрических представлений: из синтезированного описания спектрально-полосное, из исходного спектрально-временного описания отфильтрованное двумерным тригонометрическим фильтром. В каждом из видов параметрического описания задается внутренняя иерархия.

Реализованы пять способов формирования функции сегментации: верификация последовательности параметров; дифференцирование функций динамики частот в полосах; идентификация отрезков речи по групповым признакам; выделение из огибающих в частотных полосах сигналов с полосой частот 3 12 Гц; применение параметров колоколообразных функций.

Алгоритмы распознавания реализованы как пословное, фонемное и сегментно-слоговое распознавание с применением сглаживающих сплайнов, сплайн-идентификации и сплайн-синтеза. Реализован базовый алгоритм распознавания на основе экстремальных (колоколообразных) функций, который проверен на словаре 800 слов и обеспечил стабильную надежность распознавания слов не менее 98% на одного диктора. Словарь эталонов, в общем случае, содержит по одной реализации каждого слова. Хорошо различаются слова типа “бочка - дочка”.

Основные результаты научных исследований прошли апробацию на школах-семинарах по распознаванию речи и при выполнени госбюджетных и хоздоговорных работ. Принципы анализа методами CET и SAT имеют общий характер и могут быть применены для анализа других сигналов, имеющих сложный состав.

Ключевые слова: преобразование Фурье, анализ сигналов, параметрическое представление, распознавание речи, спектр, алгоритм, передаточная функция.

Karpov O.N. The methods of analyse and recognition of the complex signals in the automized systems of a speech dialog. Manuscript.

Thesis submitted the scientific degree of the Doctor of Science and Engineering under speciality 05.13.06 Automized Control Systems and Progressive Information Technologies. National Air University. Kyiv. 2003.

The thesis is devoted to the problem of construction of models of the analysis of signals and their spectra, methods of definition of parameters of systems, which form these signals, development of algorithms of recognition of speech signals and on their basis the information technologies of construction of devices for speech recognition.

For solution of the set tasks in operation the new methods of the analysis of signals and their spectra are offered which consider them as many-dimensional functions with the unknown order and structure of components, which enter in them and unknown parameters of components. The methods of solution goout from the theorem Kolmogorov A.N. That is possible to present any many-dimensional function as the sum, product and superposition of one-dimensional functions. In the given operation the representation of many-dimensional functions in base of elementary functions of sort is considered: for parametric representation of a spectrum and frequent function of a speech tract resonant functions of the second order, delay components and exponential functions; for nonparametric representation of a spectrum of a parabola of the second order and ringlet of a An'esi a curve of 3-rd order. For resonant functions and delay components the task is decided(solved) in temporary and frequent areas. The parameters of a speech tract are defined(determined) by methods: Sequential extract making of a signal CET and successive approximations SAT for audio and biomechanical systems.

The algorithms of recognition are realized as word-by-word, phonetics and segment - syllable recognition with application of smoothing splines, spline - identification and spline - synthesis. The text editor with speech handle is realized, in which the programs word-by-word and phonetics of recognition are built - in. The basic algorithm has been realized with accuracy 98% for the dictionary 800 words.

Keywords: Fourier transformation, analysis of signals, parametric representation, speech recognition, spectrum, algorithm, frequent function.

Размещено на Allbest.ru


Подобные документы

  • Розкладання складної функції в неперервну чи дискретну послідовність простіших, елементарних функцій. Системи ортогональних функцій. Спектральний опис періодичних сигналів. Комплексна форма опису ряду Фур’є. Спектральна функція детермінованих сигналів.

    курсовая работа [299,1 K], добавлен 13.01.2011

  • Роль і місце вагових функцій у задачах просторово-часової обробки сигналів і випадкових процесів у радіотехнічних системах. Властивості й особливості використання атомарних функцій як складових вікон. Вагова обробка регулярних і випадкових процесів.

    автореферат [1,6 M], добавлен 11.04.2009

  • Огляд математичних моделей елементарних сигналів (функції Хевісайда, Дірака), сутність, поняття, способи їх отримання. Динамічний опис та енергетичні характеристики сигналів: енергія та потужність. Кореляційні характеристики детермінованих сигналів.

    курсовая работа [227,5 K], добавлен 08.01.2011

  • Спектральний аналіз детермінованого сигналу. Дискретизація сигналу Sv(t). Модуль спектра дискретного сигналу та періодична послідовність дельта-функцій. Модулювання носійного сигналу. Амплітудні та фазові спектри неперіодичних та періодичних сигналів.

    курсовая работа [775,5 K], добавлен 05.01.2014

  • Опис процедури обчислення багатовіконного перетворення, етапи її проведення, особливості сигналів та вейвлет-функцій для різних значень. Дослідження властивості розрізнювання вейвлет-перетворення. Апроксимуюча і деталізуюча компоненти вейвлет-аналізу.

    реферат [410,9 K], добавлен 04.12.2010

  • Структура тракту передачі сигналів. Розрахунок частотних характеристик лінії зв’язку, хвильового опору і коефіцієнта поширення лінії. Розрахунок робочого згасання тракту передачі і потужності генератора, вхідного та вихідного узгоджуючого трансформатора.

    курсовая работа [2,2 M], добавлен 25.11.2014

  • Цифрові аналізатори спектра випадкових сигналів. Перетворення Фур’є. Амплітуда і форма стиснутого сигналу. Гетеродинний аналізатор спектру. Транспонований (стиснутий у часі) сигнал. Цифрові осцилографи та генератори синусоїдних сигналів та імпульсів.

    учебное пособие [217,6 K], добавлен 14.01.2009

  • Розробка функціональної і структурної схеми телевізійного приймача з можливістю прийому сигналів до стандарті MPEG-2, принципової схеми тракту обробки відеосигналу. Розрахунок ланцюгів придушення звукової складової для тракту обробки відеосигналу.

    дипломная работа [1,7 M], добавлен 21.11.2010

  • Часові характеристики сигналів з OFDM. Спектральні характеристики випадкової послідовності сигналів. Смуга займаних частот і спектральні маски. Моделі каналів розповсюдження OFDM-сигналів. Розробка імітаційної моделі. Оцінка завадостійкості радіотракту.

    дипломная работа [2,3 M], добавлен 07.10.2014

  • Цифрові системи як важливий різновид систем обробки сигналів, їх загальна характеристика та відмінні особливості, оцінка переваг та недоліків практичного застосування. Сутність і зміст типових прийомів при логічному проектуванні цифрових блоків.

    лабораторная работа [95,0 K], добавлен 23.04.2014

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.