Классификация цифровых методов повышения качества и разборчивости речи. Алгоритм амплитудного спектрального вычитания
Цифровые методы повышения качества речи аудиозаписей, их классификация. Адаптивный компенсатор помех, его устройство и принцип работы. Метод статистической фильтрации во временной области и применение скрытой марковской цепи в обработке речевого сигнала.
Рубрика | Коммуникации, связь, цифровые приборы и радиоэлектроника |
Вид | реферат |
Язык | русский |
Дата добавления | 20.11.2008 |
Размер файла | 194,2 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
1
УЧРЕЖДЕНИЕ ОБРАЗОВАНИЯ
“БЕЛОРУССКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
ИНФОРМАТИКИ И РАДИОЭЛЕКТРОНИКИ”
Кафедра Сетей и устройств телекоммуникаций
РЕФЕРАТ
на тему:
«Классификация цифровых методов повышения качества и разборчивости речи. Алгоритм амплитудного спектрального вычитания»
МИНСК, 2008
1. Классификация цифровых методов повышения качества и разборчивости речи
Речевые сигналы, с которыми приходится иметь дело на практике, всегда в той или иной степени зашумлены. В тех случаях, когда шум имеет значительную интенсивность, его наличие может существенно исказить результаты обработки, анализа или распознавания речи. В целом ряде других случаев, например, при анализе зашумленных записей в криминалистических целях или восстановлении аудиозаписей в архивах, задача очистки сигнала от шума носит самостоятельный характер и является единственной целью работы. Поэтому разработка методов очистки сигнала от шума является весьма актуальным направлением исследований. К настоящему времени разработано очень большое количество различных методов цифровой обработки зашумленных речевых сигналов.
Основным типом шумов, для методов, представленных в обзоре, является аддитивный шум. В целях упорядочения рассмотрения методов очистки сигнала от шума целесообразно произвести их классификацию. Основным признаком, по которому будут классифицироваться алгоритмы, является характер или тип тех закономерностей, которые служат основой для выделения речевого сигнала из смеси с шумом. В качестве вспомогательного признака будет использоваться классификация по типу того математического или алгоритмического аппарата, который использован для фильтрации. Подобная классификация, конечно, весьма условна, так как многие из рассматриваемых методов нельзя безоговорочно отнести к какой-либо одной категории. Как правило, одни и те же методы используют одновременно различные принципы, и в этом случае можно говорить лишь о преимущественном влиянии какой-либо концепции.
С учетом сделанного замечания можно выделить следующие группы:
- методов цифровой обработки зашумленных речевых сигналов:
- методы адаптивной компенсации помех;
- методы, основанные на использовании математических моделей речевых сигналов во временной области (например, авторегресионная модель речевого сигнала и рекуррентные алгоритмы оценки параметров и речевого сигнала);
- методы, основанные на использовании математических моделей речевых сигналов в частотной области (оценивание минимальной среднеквадратической ошибки, марковские модели сигнала и шума);
- методы, основанные на использовании спектральных характеристик шума (вычитание амплитудных спектров, Винеровская фильтрация);
- методы, основанные на использовании моделей искусственных нейронных сетей;
- методы, основанные на моделях восприятия речи человеком;
Адаптивные компенсаторы помех
Этот класс методов цифровой обработки зашумленных сигналов основан на использовании, помимо собственно зашумленного сигнала, который подлежит очистке, также одного или нескольких опорных сигналов - сигналов, которые коррелированны с шумовым сигналом и некоррелированные (или слабо коррелированные) с полезным сигналом, подлежащим выделению. С помощью опорных сигналов формируется сигнал, который является оценкой помехи. Этот сигнал затем вычитается из зашумленного сигнала и результат этой операции рассматривается как оценка не зашумленного сигнала.
На рис. 1 представлена схема адаптивного компенсатора помех, который использует один опорный сигнал.
Рис 1. Схема адаптивного компенсатора помех
Здесь u(n) - дискретный отсчет полезного сигнала в момент времени n; n=0,1,2…; e(n) - шумовой сигнал; e1(n) - опорный сигнал; ?(n) - сигнал ошибки; u1(n) - выходной сигнал компенсатора; УУВК - устройство управления весовыми коэффициентами.
Наиболее важной частью адаптивного компенсатора помех является устройство управления весовыми коэффициентами - линейный фильтр, через который пропускается опорный сигнал e1(n). Задача адаптивной компенсации помехи e(n) сводится к подбору коэффициентов фильтра таким образом, чтобы минимизировать энергию сигнала на выходе компенсатора u1(n). В этом случае будет максимизировано выходное отношение сигнал/шум. Минимизация энергии обычно осуществляется на основе градиентных методов поиска экстремума функций многих переменных. Известно, что адаптивные компенсаторы помех позволяют значительно улучшить качество зашумленных сигналов - на несколько десятков децибел, но требование наличия опорного сигнала существенно сужает их область применения. Во многих приложениях цифровой обработки речевых сигналов (например, при реставрации архивных записей или в криминалистике), опорного сигнала, по крайней мере, в явном виде, не имеется. Поэтому для применения методов адаптивной компенсации помех опорный сигнал в таких случаях приходится получать на основе косвенных соображений, связанных с особенностями речевого сигнала, а сам адаптивный компенсатор в этом случае будет являться одной из составных частей более сложного алгоритма выделения речевого сигнала.
Методы, основанные на использовании статистических моделей речевых сигналов во временной области
Класс методов цифровой обработки зашумленных речевых сигналов, который основан на построении математических моделей речевых сигналов и обработке речевых сигналов с использованием этих моделей быстро развивается и в настоящее время эти методы приводят к самым успешным результатам. Задача выделения речевого сигнала из смеси с шумом в случае использования достаточно адекватной модели сводится к оценке каким-либо образом параметров этой модели и последующим синтезом или фильтрации речевого сигнала фильтром, построенным на основе или с помощью оцененных параметров.
Одними из наиболее перспективных методов в этом классе являются методы статистической фильтрации во временной области. Фильтрация речевого сигнала, моделируемого авторегрессией, осуществляется при этом методами теории оптимального оценивания, например, с помощью построения оптимального линейного фильтра (фильтра Калмана).
Вычислительно эффективная (но с менее удачным результатом обработки) реализация алгоритма фильтрации речевого сигнала, моделируемого авторегрессионной моделью с параметрами, связанными в марковскую цепь. Совместная оценка сигнала и параметров марковской цепи вычисляются рекуррентным способом с помощью алгоритма максимизации математического ожидания (expectation maximization - EM), причем для вычисления условного ожидания (expectation step) сигнала относительно наблюдений использован фильтра Калмана-Бьюси. Экспериментальные испытания на речевом сигнале в смеси с некоррелированным аддитивным белом шумом с отношениями сигнал/шум 0, 10 и 20 дб показали увеличение отношения сигнал/шум в среднем на 4 дб. Собственно фильтрация осуществляется модифицированным фильтром Винера в частотной области. Предварительные измерения (смесь речи с белым шумом) показали значительное увеличение отношения сигнал/шум: на +15 дб при начальном отношении -5 дб (соответственно, при начальном SNR +5 дб улучшение составило 11 дб).
Методы, основанные на обработке речевого сигнала с использованием аппарата скрытых марковских моделей
Другим классом методов обработки зашумленных речевых сигналов основанных на использовании статистических моделей речевого сигнала являются методы, в которых речевой сигнал моделируется скрытой Марковской цепью. То есть для моделирования речевого сигнала использован наиболее эффективный для распознавания речи подход. Известно, что традиционно используемые методы фильтрации (вычитание спектров или фильтр Винера) не используют фонетическую информацию, переносимую речевым сигналом. Недавние исследования показали, что знание и применение в процессе обработки фонетической структуры сигнала приводит к улучшению качества фильтрации. Поэтому вполне естественным является применение в процессе очистки речевого сигнала от шумов его статистической модели в виде скрытой марковской цепи, которая связана с фонетической структурой сигнала.
Для эффективной обработки нестационарных сегментов отдельно оценивалась Марковская модель шума. В отличие от простых моделей состояний полезного сигнала шум моделировался набором состояний, каждое из которых содержало несколько гауссовских компонент. Во время обработки зашумленного сигнала при определении отсутствия полезного сигнала выполнялось декодирование сегмента паузы процедурой Витерби для выбора оптимальной модели шума. Модель шума, обеспечивающая максимальное правдоподобие наблюдаемой последовательности использовалась далее для обработки сигнала. Для сохранения ”преемственности” между итерациями применялись инерционная схема фильтра Винера.
Методы, основанные на использовании, отдельных характерных свойств речевого сигнала
К методам этого типа относятся прежде всего класс методов обработки зашумленных речевых сигналов, которые используют квазипериодичность речевого сигнала. Первая группа методов использует периодичность речевых сигналов для построения адаптивного компенсатора помех, с помощью которого обрабатывается зашумленный речевой сигнал. Предполагается, что исходный речевой сигнал s(n) строго периодичен с периодом T, кратным частоте дискретизации, а случайный аддитивный шум v(n) некоррелирован с s(n). В качестве опорного сигнала для адаптивной компенсации помехи используется:
(1)
где
Отношение сигнал/шум может быть увеличено на 7 - 10 дб., однако разборчивость отфильтрованной речи при этом несколько понижается. Вторая группа методов, использующих периодичность звонких звуков основана на представлении сигнала в кепстральной области. В этом случае периодический характер речевого сигнала используется для синтеза адаптивной гребенки фильтров.
Исследования проведенные на синтетических гласных звуках показали, что при надлежащем выборе взвешивающих коэффициентов можно добиться значительного эффекта для улучшения восприятия речи в тех случаях, когда помеха или шум являются структурированными.
Исследования проведенные на синтетических гласных звуках показали, что при надлежащем выборе взвешивающих коэффициентов можно добиться значительного эффекта для улучшения восприятия речи в тех случаях, когда помеха или шум являются структурированными.
Методы, основанные на оценке спектральных характеристик шума
Наиболее часто используемыми методами, основанными на использовании спектральных характеристик шума, являются методы, реализующие различные модификации алгоритма вычитания амплитудных спектров. Блок-схема алгоритма вычитания амплитудных спектров приведена на следующем рисунке.
Рис.2. Блок-схема алгоритма вычитания амплитудных спектров
Исследования качества и разборчивости речи, получаемой в результате применения описанной методики, показали, что в тех случаях, когда шум или помеха имеют стационарный (или квазистационарный) характер и их спектр имеет гармоническую структуру, достигается значительное на слух повышение как качества так и разборчивости речи. Однако, в случае шумов с быстроизменяющимися спектральными характеристиками такая обработка малоэффективна.
Метод оценивания минимальной среднеквадратической ошибки
Описываемый алгоритм (оригинальное название Minimum Mean-Square Error estimation) впервые был предложен в работе. Как и вычитание спектров алгоритм основан на оценке амплитудного спектра сигнала и общая блок-схема алгоритма в целом соответствует рис. 2. Среди других методов фильтрации, предполагающих наличие только одного микрофона, алгоритмы, основанные на минимуме среднеквадратической ошибки являются одними из наиболее полезных. Их использование приводит к значительному сокращению уровня шума в сигнале без внесения остаточных искажений типа музыкальных тонов. В недавно проведенных исследованиях утверждается, что в значительной мере превосходство метода оценивания минимальной среднеквадратической ошибки над методиками типа Винеровской фильтрации или вычитания амплитудных спектров связано именно с введением априорной оценки сигнал/шум в каждой спектральной полосе. В связи с этим, были предложены модификации стандартных подходов (винеровской фильтрации, вычитания амплитудных спектров и оценок максимального правдоподобия) использующие априорные отношения сигнал/шум, что привело к существенному улучшению результатов фильтрации.
Подавление аддитивного квазистационарного шума методом вычитания амплитудных спектров
В качестве типичного примера можно привести шумы кондиционеров, видеокамеры, автотрансформаторов и усилителей. Поведение алгоритма контролируется набором параметров, включая предварительно измеренные характеристики шума. Для того, чтобы пользователь смог полностью использовать все возможности, заложенные в алгоритме, предусмотрен аналоговый режим работы, когда выбор и изменение параметров и режимов обработки выполняется в ходе обработки, причем оператор контролирует качество работы метода прослушиванием обработанного сигнала.
Рис.3. Блок-схема алгоритма вычитания амплитудных спектров
2. Алгоритм амплитудного спектрального вычитания
Для повышения разборчивости речи применяется алгоритм спектрального вычитания. Спектральное вычитание оценивает спектр мощности очищенного сигнала путем вычитания спектра шума из зашумленного сигнала.
1
Рис.4. Обобщенная схема алгоритма спектрального вычитания
Алгоритм спектрального вычитания состоит из следующих этапов
Этап 1. Исходный зашумленный сигнал x(l), состоящий из чистого речевого сигнала s(l) и некоррелированного аддитивного шума d(l)
, (2)
где - индекс дискретизации.
Этап 2. Деление сигнала на перекрывающиеся кадры длиной .
Применение оконной функции w(l) для точного вычисления коэффициентов Фурье. Окна подавляют просачивание спектральных составляющих, которое может привести к смещению оценок амплитуд и положений гармонических составляющих сигнала.
, (3)
где - индекс кадра, - сдвиг от кадра к кадру, - длина кадра.
Этап 3. Дискретное преобразование Фурье
, (4)
где - значение k-й спектральной компоненты -го кадра зашумленного сигнала, - фазовый спектр -го кадра зашумленного сигнала, - амплитудный спектр -го кадра зашумленного сигнала, .
Этап 4. Сглаживание спектра мощности -го кадра зашумленного сигнала
(5)
где - значение k-й спектральной компоненты спектра мощности -го кадра зашумленного сигнала, - коэффициент сглаживания или забывания, выбираемый для предотвращения как музыкального шума, так и слишком большого искажения сигнала. Обычно лежит в пределах .
Этап 5. Оценка шума на основе отслеживания минимумов в области спеткра мощности от кадра к кадру:
(6)
где - k-й локальный минимум спектра мощности -го кадра зашумленного сигнала
- коэффициент адаптации к локальному минимуму.
Этап 6. Спектральное вычитание шума в области амплитудного спектра:
(7)
где - передаточная функция фильтра подавления шума,
- улучшенный кратковременный амплитудный спектр m-го кадра,
subf - постоянная спектрального минимального уровня для ограничения максимального вычитания,
- коэффициент избыточного спектрального вычитания как функция отношения сигнал-шум кадра и частотного индекса.
Этап 7. Аппроксимационные SNR или частотное расстояние в качестве критерия качества фильтрации зашумленного сигнала для оценки параметров алгоритма спектрального вычитания:
(8)
(9)
Литература
1. Шелухин О.И., Лукьянцев Н.Ф. Цифровая обработка и передача речи.- М.: Радио и связь, 2000.
2. Рабинер Л.Р., Шафер Р.В. Цифровая обработка речевых сигналов. -М.: Радио и связь, 20011.
3. Секунов Н.Ю. Обработка звука на PC.- СПб.: БХВ - Петербург, 2001.
5. Дж. Миано «Форматы и алгоритмы сжатия изображений в действии».- М.: 2003.
6. Нейрокомпьютеры в системах обработки изображений. - М.: Радиотехника, 2003.
10. Назаров М.В., Прохоров Ю.Н. Методы цифровой обработки и передачи речевых сигналов.- М.: Радио и связь, 2005.
Подобные документы
Жесткий и гибкий пороги фильтрации речевого сигнала. Графики вейвлет-разложения речевого сигнала. Блок схема алгоритма фильтрации с гибким порогом. Статистический метод фильтрации речевого сигнала. Оценка качества восстановленного речевого сигнала.
реферат [440,2 K], добавлен 01.12.2008Общие сведения о шумах и адаптивной фильтрации речевого сигнала. Компенсаторы помех: устройство и компоненты, функции. Подавление аддитивного квазистационарного шума методом вычитания амплитудных спектров, основанном на искусственных нейронных сетях.
курсовая работа [359,7 K], добавлен 02.05.2016Задачи при передаче речи и данных. Цифровая передача речи. Категории методов цифрового кодирования речи. Кодеры формы сигнала. Вид амплитудной характеристики компрессора. Дискретная модель речеобразования. Особенности метода кратковременного анализа.
контрольная работа [56,6 K], добавлен 18.12.2010Описание устройства регулятора напряжения. Основное назначение и область применения прибора. Рассмотрение особенностей регулятора на основе тиристоров, магнитных усилителей, транзисторов. Синхронный компенсатор: понятие, назначение, принцип работы.
реферат [133,7 K], добавлен 03.11.2015Основная идея адаптивной обработки сигнала. Алгоритмы адаптивной фильтрации. Детерминированная задача оптимальной фильтрации. Адаптивные фильтры в идентификации систем. Алгоритм RLS с экспоненциальным забыванием. Реализация моделей адаптивных фильтров.
курсовая работа [1,0 M], добавлен 11.03.2015Назначение, классификация и основные характеристики оптических средств обнаружения, принцип действия, универсальность и особенности применения. Сущность сигналообразования, классификация помех, сравнительный анализ методов повышения помехоустойчивости.
реферат [1,8 M], добавлен 27.08.2009Преимущества радиоканальных охранных систем. Основные направления кодирования речи: кодирование формы (Waveform coding) и источника сигнала (Source coding). Структурная схема процесса обработки речи в стандарте GSM. Оценка качества кодирования речи.
реферат [46,8 K], добавлен 20.10.2011Определения в области испытаний и контроля качества продукции, понятие и контроль. Проверка показателей качества технических устройств. Цель технического контроля. Классификация видов и методов неразрушающего контроля. Электромагнитные излучения.
реферат [552,7 K], добавлен 03.02.2009Методика контроля коэффициента ошибок. Эксплуатационная норма качества на цифровые тракты и каналы. 15-минутные и 24-часовые пороги уровня качества. Виды повреждений кабельных линий, краткая характеристика методов их обнаружения. Метод бегущей волны.
контрольная работа [373,8 K], добавлен 20.01.2013Функциональное и конструктивное построение цифровых диктофонов. Принцип работы диктофона при записи речи. Методы и технические средства выявления и подавления цифрового диктофона. Необходимость предотвращения скрытой записи речевой информации на диктофон.
курсовая работа [1,3 M], добавлен 23.04.2012