Разработка и исследование алгоритма очистки речевого сигнала
Разработка и исследование алгоритма очистки речевого сигнала Оптимальные алгоритмы и методы, основанные на вычитании амплитудных спектров. Разработка программной реализации алгоритма спектрального вычитания. Оценка качества очистки речевого сигнала.
Рубрика | Коммуникации, связь, цифровые приборы и радиоэлектроника |
Вид | дипломная работа |
Язык | русский |
Дата добавления | 06.04.2013 |
Размер файла | 2,9 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
В целом, методы, основанные на вычитании спектров, считаются одними из лучших - они приводят к удовлетворительным результатам обработки и не требуют больших вычислительных ресурсов. Что же касается музыкальных тонов, которые существенно ухудшают восприятие обработанного сигнала, то для их подавления разработаны различные алгоритмы, основанные на эмпирических и эвристических соображениях [5,3].
К классу методов, основанных на оценке спектральных характеристик шума, относятся также методы коррекции спектра речевого сигнала, основанные на Виннеровской фильтрации [6].
В этих методах зашумленный речевой сигнал фильтруется фильтром с частотной характеристикой, рассчитанной из условия минимизации среднеквадратической ошибки фильтрации, то есть, если - частотная характеристика такого фильтра определяется выражением (2.2.)
(2.2.)
где - спектральная плотность мощности сигнала
- спектральная плотность мощности шума
В реальных условиях применения частотную характеристику (2.2.) аппроксимируют выражением (2.3.):
, (2.3.)
где и - усредненные квадраты амплитудных спектров сигнала и шума соответственно, причем оценка величин и осуществляется так же как и в методе вычитания амплитудных спектров.
Как было упомянуто, одним из основных недостатков спектрального вычитания является наличие артефактов в обработанном сигнале. Музыкальные тона существенно ухудшают качество сигнала, поэтому неудивительно, что одним из приоритетных направлений в развитии этого подхода стало создание постпроцессоров, снижающих эффект музыкальных тонов без дальнейших искажений в сигнале.
В большинстве случаев речь идет о пост-обработке сигнала в спектрально-временной области. Идея состоит в том, что музыкальные тона в спектрально-временном представлении представляют собой локальные (во времени и по частоте) спектральные максимумы. В работе [7] поиск спектральных максимумов, соответствующих музыкальным тонам осуществляется методами обработки изображений.
Анализируя проводимые авторами упомянутых работ результаты, характеризующие эффективность очистки сигнала от шума, следует отметить, что практически во всех случаях, при использовании методик типа вычитания спектров в качестве характеристики работоспособности алгоритма используются меры качества звучания сигнала или объективные меры типа усредненных евклидовых расстояний между отфильтрованным сигналом и незашумленным сигналом (предполагается, что он доступен). Следует отметить, что такая оценка методов, не всегда является объективной и обоснованной, поэтому актуальной является задача оценки предлагаемых методов в соответствии с существующими государственными стандартами.
Интересная модификация вычитания спектров - вычитание сигналов во временной области предложена в работе [9]. Там же продемонстрировано, что этот метод, в отличие от вычитания амплитудных спектров и винеровской фильтрации дает хорошие результаты (в том числе, повышает как качество, так и разборчивость сигнала при исходных соотношениях сигнал/шум -10дб и -30 дб) на нестационарных и коррелированных с речевым сигналов шумах типа мешающего диктора, гармонических помехах, одновременном фоновом разговоре (бормотании) нескольких дикторов.
Метод предполагает доступ к передаваемому незашумленному сигналу на передающей стороне и основан на технике добавления нулевых отсчетов в передаваемый речевой сигнал (то есть сигнал квантуется с удвоенной частотой, причем каждый второй отсчет - нулевой). На принимающей стороне характеристики шума оцениваются исходя из величин дополнительных (нулевых в начале передачи) отсчетов. Поскольку большинство практически встречающихся шумов (например, все речеподобные сигналы) коррелированны на интервалах между соседними отсчетами, оценка шума выполненная для дополнительных отсчетов вполне пригодна для фильтрации сигнала.
Очевидными недостатками предлагаемой методики является условие доступа к данным на передающей стороне и удвоение скорости передачи данных, поэтому область практического применения алгоритма существенно сужена.
2.2 Динамическое шумоподавление
Для решения практической задачи шумоочистки целесообразно использовать методы динамического шумоподавления, основанные на использовании характеристик шума [8]. Как наиболее эффективное можно рассмотреть двухступенчатое шумоподавление. На первом этапе происходит динамическое шумоподавление (рис. 2.2), суть которого заключается в том, что выбирается определенный порог сигнала - порог шума, а все сигналы ниже данного уровня считаются шумом и отсекаются.
Следует отметить, что обрабатывается весь спектр сигнала, а не только речевой диапазон. Выявленные участки относительной тишины сохраняются и используются в дальнейшем шумопонижении. Входной сигнал должен иметь нормированный уровень, для чего в микрофонном усилителе используется автоматическая регулировка усиления, что также позволяет наиболее эффективно использовать АЦП, задействовав всю его разрядность.
Рис. 2.2. Динамическое шумоподавление
Применение данного метода обусловлено тем, что одновременно с подавлением шумов происходит выделение так называемых образцов шума, которые используют на следующем этапе для спектрального вычитания. На втором этапе используются методы, основание на различных модификациях алгоритма вычитания амплитудного спектра. Такой подход оптимален в случае широкополосных непрерывных и импульсно-непрерывных помех, пересекающихся с областью спектра речи. Шумы данного типа не могут быть удалены другими методами (например, адаптивной фильтрацией), поскольку такие помехи являются рассредоточенными по спектру и пересекаются с областью спектра речи. Пусть - спектр зашумленного сигнала на р-м фрейме, - спектр шума, - спектр восстановленного сигнала на р-м фрейме. На практике шум вычисляется на шумовых фреймах сигнала . Это связано с тем, что обычно известен только зашумленный сигнал. Таким образом, воспользуемся выражением (2.4.) фильтрации по Боллу [23].
, (2.4.)
Где передаточная характеристика определяется (2.5.)
- коэффициент адаптации спектра зашумленного сигнала .
- коэффициент сглаживания шума в области спектра мощности шумовых фреймов.
(2.5.)
Данное выражение описывает спектральное вычитание амплитуды шума по модулю. На начальном этапе осуществляется разложение сигнала с помощью быстрого преобразования Фурье (БПФ), затем производится оценка спектра шума, далее «вычитание» амплитудного спектра шума из амплитудного спектра сигнала. Восстановление речевого сигнала во временной области осуществляется с помощью обратного преобразования Фурье. Под оценкой спектра шума подразумевается выборка сигналов без полезной информации, содержащей только шум. Данные выборки получены в результате динамического шумоподавления.
При выборе метода шумоочистки необходимо руководствоваться, в первую очередь, для очистки речевых сигналов, от какого типа шумов помех и искажений буде применяться разработанный на его основе алгоритм. Так как в нашем случае основными негативными и искажающими воздействиями являются стационарные и квазистационарные шумы и импульсно-непрерывные помехи и искажения, то разработка алгоритма на основе метода вычитания амплитудных спектров представляется наиболее целесообразной и перспективной. При этом следует отметить, что в случае, когда шум или помеха имеют стационарный (или квазистационарный) характер и их спектр имеет гармоническую структуру, применение данного рода методов, позволяет достичь значительного повышения как качества, так и разборчивости речи. Однако если шум имеет быстроизменяющуюся спектральную характеристику, то необходимо применять пост - обработку сигнала в спектрально - временной области для чего используются различные алгоритмы.
2.3 Разработка этапов алгоритма спектрального вычитания
Этап 1. Пусть имеется исходный зашумленный сигнал , состоящий из чистого речевого сигнала и некоррелированного аддитивного шума , который определяется выражением (2.6.).
, (2.6.)
где - индекс дискретизации.
- общая длина исходного сигнала в отсчетах.
Этап 2. Разделим исходный сигнал на неперекрывающиеся кадры длиной .
Применение оконной функции w(l) для точного вычисления коэффициентов Фурье. Окна подавляют просачивание спектральных составляющих, которое может привести к смещению оценок амплитуд и положений гармонических составляющих сигнала.
, (2.7.)
где - индекс кадра,
- длина кадра (сдвиг от кадра к кадру),
,
- текущее значение исходного сигнала для текущего кадра,
- оконная функция для текущего кадра,
- индекс дискретизации, для текущего кадра.
Выберем тип оконной функции:
При спектральном анализе сигнала с известным или заданным динамическим диапазоном необходимо выбирать такую оконную функцию, уровень боковых лепестков спектра которой меньше заданного динамического диапазона. В противном случае некоторые спектральные составляющие сигнала могут быть не обнаружены. Динамический диапазон данного сигнала можно определить как отношение максимальной амплитуды гармоники к минимальной.
Так, например, если динамический диапазон сигнала не превышает 40 дБ целесообразно использовать окно Хемминга, боковые лепестки спектра которой не превышают -42 дБ. Если же динамический диапазон сигнала не превышает 60 дБ, то можно использовать окно Блэкмана (уровень боковых лепестков спектра -58 дБ). Динамический диапазон для окна определяется выражением (2.8.).
, (2.8.)
где -динамический диапазон в децибелах,
- количество разрядов АЦП.
В случае 8-битного АЦП динамический диапазон сигнала можно считать равным 48.16 дБ, а в случае 16 -битного 96.32 дБ. В нашем случае, динамический диапазон аудиосигнала не превышает 40 дБ и при спектральном анализе можно использовать окно Хемминга даже при 16-битном квантовании.
Выберем размер выборки для обеспечения разрешения по частоте
Расстояние между спектральными отсчетами определяется выражением (2.9.):
, (2.10.)
где -частота дискретизации сигнала,
- длина выборки сигнала
При заданном окне, которое выбирается исходя из динамического диапазона сигнала, нормированная ширина главного лепестка спектра для обеспечения требуемого разрешения по частоте необходимо выполнение условия (2.10.).
, (2.10.)
где -частота дискретизации сигнала определяемая выражением (2.11.)
, (2.11.)
где -нормированная ширина главного лепестка спектра для выбранного типа окна.
При фиксированной частоте дискретизации для увеличения разрешения по частоте необходимо увеличивать длину выборки. Таким образом для обеспечения разрешения по частоте и частоте дискретизации , а так же с учетом того, что сглаживание осуществляется при использовании окна Хемминга . Тогда из (2.11.) с учетом (2.9.) получаем (2.12.) и (2.13.):
(2.12.)
; (2.13.)
Таким образом, для определенных параметров (, ) в качестве оконной функции будем использовать окно Хемминга, определяемое выражением (2.14.), а размер выборки БПФ должен составлять 8192 точек.
(2.14.)
Этап 3. Дискретное преобразование Фурье, используется для перехода в спектральную область.
В Общем случае интеграл Фурье имеет вид [15] выражение (2.15.) интеграл Фурье имеет вид:
, (2.15.)
где- спектр сигнала (в общем случае и сигнал и спектр -- комплексные).
Выражение для дискретного преобразования Фурье (ДПФ) представлено выражением (2.16.).
(2.16.)
Выражение (2.16.) для ДПФ ставит в соответствие отсчетам дискретного сигнала , где , в общем случае комплексного, отсчетов спектра , где .
Учитывая выражения (2.15.) и (2.16.) запишем выражение (2.17.) для значения k-й спектральной компоненты -го кадра зашумленного сигнала .
, (2.17.)
,
.
Этап 4. Сглаживание спектра мощности -го кадра зашумленного сигнала.
Берется предыдущий спектр мощности сигнала, который перемножается на коэффициент , - коэффициент сглаживания или забывания, выбираемый для предотвращения как музыкального тона, так и слишком большого искажения сигнала. Обычно лежит в пределах и подбирается индивидуально. Результирующее значение складывается с амплитудным спектром m-го кадра . Производится усреднение спектра мощности по всему кадру.
Тогда выражение для спектра мощности текущего кадра - (2.18.) будет определяться как сумма спектра мощности предыдущего кадра умноженного на и спектра мощности текущего кадра умноженного на .
(2.18.)
Этап 5. Оценка шума на основе отслеживания минимумов в области спектра мощности от кадра к кадру:
С учетом динамического шумоподавления описанного в пункте 2.2 и (2.4), за шум будем принимать адаптированный и взвешенный локальный минимум спектра мощности зашумленного сигнала. Если локальный минимум спектра мощности предыдущего кадра меньше спектра мощности текущего кадра, используются коэффициенты адаптации к локальному минимуму и коэффициент сглаживания минимума в области спектра мощности текущего кадра , при этом коэффициенты и подбираются индивидуально. Локальный минимум спектра мощности m-го кадра зашумленного сигнала сглаживается в области спектра и складывается с разностью текущего и предыдущего кадров.
Если же локальный минимум спектра мощности предыдущего кадра больше спектра мощности текущего кадра последний и будет использоваться в качестве k-го локального минимума спектра мощности -го кадра зашумленного сигнала с учетом (2.4) примет вид (2.19.).
(2.19.)
где - k-й адаптированный и взвешенный локальный минимум спектра мощности -го кадра зашумленного сигнала.
- коэффициент адаптации к локальному минимуму.
- коэффициент сглаживания минимума в области спектра мощности текущего кадра.
Этап 6. Спектральное вычитание шума в области амплитудного спектра:
Следует обратить внимание, что спектральное вычитание шума следует производить в области амплитудного спектра. При этом, производится оценка произведения передаточной функции фильтра на спектр k-го кадра с ограниченным спектром . Значение передаточной функции фильтра определяется выражением (2.20.)
(2.20.)
В качестве спектра текущего кадра выбирается либо отфильтрованный спектр , либо ограниченный спектр , в том случае, если текущий уровень шума будет иметь значение превышающее порог, регулируемый в свою очередь - постоянной спектрального минимального уровня. С учетом этого, улучшенный кратковременный амплитудный спектр m-го кадра будет определяться выражением (2.21.)
(2.21.)
где - передаточная функция фильтра подавления шума,
- улучшенный кратковременный амплитудный спектр m-го кадра,
- постоянная спектрального минимального уровня для ограничения максимального вычитания
Этап 7. Обратное дискретное преобразование Фурье, используется для перехода в спектральную область.
В Общем случае интеграл Фурье имеет вид [15] выражение (2.22.) интеграл Фурье имеет вид:
, (2.22.)
где- спектр сигнала (в общем случае и сигнал и спектр -- комплексные).
Выражение для обратного дискретного преобразования Фурье (ДПФ) представлено выражением (2.23.).
(2.23.)
Выражение (2.16.) для ДПФ ставит в соответствие отсчетам дискретного сигнала , где , в общем случае комплексного, отсчетов спектра , где .
Учитывая выражения (2.15.) и (2.16.) запишем выражение (2.24.) для значения k-й спектральной компоненты -го кадра зашумленного сигнала .
, (2.24.)
,
.
2.4 Разработка схемы работы программы
На основании разработанных этапов работы алгоритма спектрального вычитания и в соответствии ГОСТ 19.701-90 (ИСО 5807-85) «Схемы алгоритмов, программ, данных и систем. Условные обозначения и правила выполнения» [13], были разработаны схема работы программы и схема работы системы.
2.5 Разработка программной реализации алгоритма спектрального вычитания в среде MatLab
В качестве программной среды для реализации предложенного алгоритма была выбрана среда разработки MATLAB, как наиболее удобный, с точки зрения решения прикладных инженерных задач в области реализации вычислительных схем, программных алгоритмов и моделей.
MATLAB (сокращение от англ. «Matrix Laboratory») -- пакет прикладных программ для решения задач технических вычислений и одноимённый язык программирования, используемый в этом пакете. Язык MATLAB является высокоуровневым интерпретируемым языком программирования, включающим основанные на матрицах структуры данных, широкий спектр функций, интегрированную среду разработки, объектно-ориентированные возможности и интерфейсы к программам, написанным на других языках программирования.
2.6 Очистка речевых сигналов алгоритмом спектрального вычитания, реализованным в среде MatLab, а так же способы подавления нежелательных эффектов, возникающих в процессе очистки
Для реализации алгоритма очистки речевого сигнала от шума при помощи спектрального вычитания задается исходный речевой сигнал, имеющий вид, представленный на (рис.2.3.):
Рис. 2.3. Спектограмма исходного сигнала
При помощи программных средств среды MatLab накладываем аддитивный гауссовский белый шум (АГБШ), отношение сигнал/шум 10 дБ (рис. 2.4.):
Рис. 2.4. Спектрограмма сигнала с наложенным АГБШ.
Применяем к сигналу с наложенным АГБШ, разработанный алгоритм спектрального вычитания, после воздействия алгоритма сигнал имеет вид (Рис. 2.5.):
Рис. 2.5. Спектральный вид сигнала после очистки
Исходя из полученных графиков можно сделать вывод о том, что после очистки речевого сигнала, используя алгоритм спектрального вычитания происходит достаточно качественная очистка сигнала, но главным недостатком является появление так называемых «музыкальных тонов».
2.5.1 Методы борьбы с «музыкальным тоном»
Одна из проблем метода спектрального вычитания - так назывемый «музыкальный тон». Он появляется вследствие того, что коэффициенты STFT шумовых сигналов статистически случайны, что приводит к их неравномерному подавлению. В результате, очищенный сигнал содержит кратковременные и ограниченные по частоте всплески энергии, которые на слух воспринимаются как «колокольчики» или «льющаяся вода». В некоторых случаях этот эффект даже менее желателен, чем исходный подавляемый шум.
Для подавления этого артефакта можно применять следующие методы:
* Завышение оценки шумового порога. Приводит к подавлению слабых компонент полезного сигнала, звук становится глуше.
* Неполное подавление шума. Часть шума остается в сигнале и отчасти маскирует «музыкальный тон».
* Сглаживание по времени оценок спектра. Приводит к размытию или подавлению транзиентов (резких всплесков в сигнале: ударов, атак музыкальных инструментов).
Наиболее распространенный способ подавления «музыкального тона» - использует сглаживание спектра по времени. Для этого к STFT-коэффициентам исходного сигнала применяется рекурсивная фильтрация по времени.
Более качественного подавления можно достичь, применяя к спектрограмме адаптивные двумерные алгоритмы фильтрации, такие как билатеральный фильтр или алгоритм нелокального усреднения, используемые в шумоподавлении для изображений.
В нашем случае для борьбы с эффектом музыкального тона, будем применять следующие методы:
1. Увеличение порога вычитания - в (2.21.).
Особенности: Завышение оценки шумового порога приводит к подавлению слабых компонент полезного сигнала, звук становится глуше. Уменьшение порога приводит к появлению музыкальных тонов.
2. Увеличение коэффициента сглаживания или забывания, выбираемый для предотвращения как музыкального тона, так и слишком большого искажения сигнала - для (2.18.)
Особенности: большой коэффициент приводит к увеличению искажений сигнала, низкий к появлению музыкальных тонов.
3. Увеличение постоянной сглаживания по времени оценки мощности сигнала - для (2.19.).
Особенности: увеличение приводит к размытию или подавлению транзиентов (резких всплесков в сигнале: ударов, атак музыкальных инструментов). Уменьшение приводит к увеличению музыкальных тонов.
4. Уменьшение постоянной сглаживания по времени оценки мощности сигнала для оценки шума - для (2.19.).
Особенности: уменьшение к подавлению уровня музыкальных тонов, однако влияние данного коэффициента на уровень музыкальных тонов незначителен.
5. Увеличение числа буферов минимизации, для оценки минимума спектра - для (2.7.), (2.17.), (2.18.), (2.19.), (2.20.), (2.21).
Особенности: большое число буферов - большой расход памяти, низкое число буферов - шумовые искажение.
На (рис. 2.6.) представлен сигнал, очищенный от «музыкальных шумов» с помощью завышения оценки шумового порога.
Рис. 2.6. Спектральный вид сигнала после очистки и удаления «музыкальных тонов».
В действительности, после применения метода завышения шумового порога сигнал стал глуше, но избавился от «музыкального шума», а именно звук «льющейся воды» практически исчез.
В главе были рассмотрены и проанализированы особенности методов, основанных на вычитании амплитудных спектров, для очистки речевых сигналов от стационарных и квазистационарных шумов непрерывных импульсных помех и искажений. Разработаны эффективные вычислительные схемы и алгоритм очистки речевого сигнала для такого рода шумов, помех и искажений в программной среде MatLab. Была проведена обработка зашумленного речевого сигнала реализованным алгоритмом. В результате проведенного эксперимента опытным путем были подобраны параметры алгоритма для уменьшения негативного воздействия искажений возникающих в процессе обработки, разработанным алгоритмом.
Глава 3. Оценка качества очистки речевого сигнала разработанным алгоритмом в соответствии в существующими государственными стандартами
В настоящей главе проводится оценка качества очистки речевых сигналов от стационарных и квазистационарных шумов непрерывных импульсных помех и искажений разработанными эффективными вычислительными схемами и алгоритмом очистки речевого сигнала для такого рода шумов, помех и искажений в соответствии с существующими государственными стандартами. Проводятся измерения разборчивости речи и узнаваемости голоса диктора, методом артикуляционных измерений и методом парных сравнений.
3.1 Определения эффективности очистки речевых сигналов разработанным алгоритмом
Для определения эффективности очистки речевых сигналов от шумов помех и искажений, необходимо провести ряд исследований нацеленных на получение качественных результатов, по итогам которых выносится оценка качества и эффективности исследуемого программного или программно-аппаратного средства.
Исследования проводились в соответствии с ГОСТ Р 50840-95 «Передача речи по трактам связи. Методы оценки качества, разборчивости и узнаваемости» [10], а также ГОСТ Р 51061-97 «Системы низкоскоростной передачи речи по цифровым каналам. Параметры качества речи и методы измерений» [11]. Стандарты регламентируют получение комплексной оценки качества передачи речи, основанной на методах измерения показателей разборчивости, качества и узнаваемости речи. Разборчивость речи можно определить через относительное количество (в процентах) правильно принятых элементов (слогов, слов, фраз) артикуляционных таблиц. Узнаваемость голоса диктора представляет собой величину, характеризующую степень сохранения субъективно воспринимаемых индивидуальных признаков голоса диктора.
В рамках исследований и в соответствии с [10] и [11], измерения разборчивости речи и узнаваемости голоса диктора проводились методами:
· артикуляционных измерений;
· парных сравнений.
Для проведения исследования был собран лабораторный стенд. Структурная схема стенда представлена на рисунке 3.1.
Рисунок 3.1. Структурная схема лабораторного макета
Персональный компьютер ПК1 воспроизводит записанные звуковые файлы. Речевой сигнал, воспроизведенный ПК1, поступает на плату «Тишина», которая производит его очистку от шумов и помех в соответствии с реализованным алгоритмом шумоочистки. Очищенный речевой сигнал поступает на устройство воспроизведения звуковых данных. При проведении исследования будем подвергать исходные речевые сигналы следующим видам шумов и помех: тональные помехи 50, 100 и 2000 Гц, розовый шум и белый шум, так как они являются квазистационарными (шум толпы, моря, станков, двигателей, эфира - при передаче по каналам связи), а потому представляют наибольший практический интерес.
По результатам измерений, в рамках исследований, выносится оценка качества произведенной очистки речевого сигнала реализованным алгоритмом.
3.2 Оценка качества очистки речевого сигнала артикуляционным методом измерения разборчивости
Измерения проводятся бригадой операторов в составе: трех дикторов: двое мужчин и одна женщина (далее Д1, Д2 и Д3); трех аудиторов: двое женщин и мужчина (далее А1, А2 и А3).
Перед началом измерений бригада операторов проходит обучение (тренировку), в рамках которой: знакомится со структурой речевого материала; осваивает технику его произношения; адаптируется к восприятию искаженной речи. Дикторами отрабатывается техника чтения для достижения зачитывания слогов ровным голосом, четко, но без подчеркивания с постоянным уровнем речи.
Время работы бригады составляет не более 4 ч за один день. После приема 5 таблиц (одного диктора) делается перерыв 5-10 мин.
Учитывая работу в акустических шумах, аудиторы приступают к измерениям спустя 5-10 мин после пребывания в условиях шума.
Измерения разборчивости речи артикуляционным методом проходят в два этапа.
3.2.1 Первый этап измерения разборчивости речи артикуляционным методом
1. Дикторы, в составе трех человек (Д1, Д2 и Д3), прошедшие тренировку и отработавшие технику чтения зачитывают таблицы слогов (пример таблицы приведен в приложении 1).
Каждым диктором зачитывается по 5 таблиц слогов.
Слоги начитываются в ритме: 1 слог в (3+/-0,3) сек, на протяжении всей таблицы.
Таблицы слогов принимаются в универсальный динамический микрофон и сохраняются в памяти ПЭВМ.
В результате получаем 15 записанных оригинальных речевых сигналов (далее РС).
2. В записанные (сохраненные в памяти ПЭВМ) речевые сигналы РС при помощи встроенных средств MatLab искусственным способом вносятся шумы и помехи, имеющие стационарный характер, с отношением сигнал\шум равным 10Дб:
· Тональная помеха 50 Гц;
· Тональная помеха 100 Гц;
· Тональная помеха 2000 Гц;
· Розовый шум;
· Белый шум
для последующей их очистки разработанным алгоритмом. В результате получаем 75 речевых сигналов (15 РС * 5 типов помех), с внесенными помехами далее (РС”).
3. Разработанными программными средствами производится очистка зашумленных речевых сигналов РС”, для последующей оценки качества и эффективности. В результате получаем 75 обработанных речевых сигналов (далее РС').
4. Аудиторы, в составе трех человек (А1, А2 и А3) прошедшие тренировку (обучение) прослушивают РС' и РС” и записывают их в бланк, форма которого приведена в приложении 2.
В случае, когда аудитор не понял переданного слога, он прочеркивает соответствующую пронумерованную строку в бланке принятых слогов.
3.2.2 Второй этап измерения разборчивости речи артикуляционным методом
На втором этапе измерений речи артикуляционным методом проводится цикл измерений.
Цикл измерений включает в себя результат приема всех аудиторов от всех дикторов по 5к таблиц (к=1,2,3) РС' и PC'' (т.е. прием 5к таблиц с внесенными помехами и 5к таблиц, обработанных разработанным алгоритмом очистки речи).
1. Для каждого измерения вычисляется среднее значение разборчивости (S) по формуле:
, (3.1.)
где - результат единичного измерения, % (диктор-таблица-аудитор),
- число единичных измерений.
В рамках проводимых исследований: - это процент верно распознанных слогов в одной таблице от одного аудитора, прослушавшего одного диктора, а - одно единичное измерение т.е. одна таблица, поэтому получаем пять единичных измерений (для РС”).
2. Проведем вычисления результатов средней разборчивости для речевых сигналов, обработанных разработанным алгоритмом очистки речи (РС'').
Измерения разборчивости А1 Д1 в условиях пяти типов помех:
2.1. Тональная помеха 50 Гц А1 Д1
1) Вычислим среднее значение разборчивости (3.1.) по формуле (3.2.)
%(3.2.)
2) Вычислим среднее квадратическое отклонение (СКО) по формуле (3.3):
(3.3.)
=
3) Находим единичные измерения, для которых |Si-S| > 2, с целью исключения сомнительных значений и вычисления нового среднего значения:
а) |74-72,8| ... 2*4,89, т.о. 1,2<7,8
б) |78-72,8| ... 2*4,89, т.о. 5,2<7,8
в) |68-72,8| ... 2*4,89, т.о. 4,8<7,8
г) |74-72,8| ... 2*4,89, т.о. 1,2<7,8
д) |70-72,8| ... 2*4,89, т.о. 2,8<7,8
Сомнительных значений Si не выявлено.
2.2. Тональная помеха 100 Гц А1 Д1
1) Вычислим среднее значение разборчивости (3.1.) по формуле (3.4.):
% (3.4.)
2) Вычислим среднее квадратическое отклонение (СКО) (3.3.)
=(3.5.)
3) Находим единичные измерения, для которых |Si-S| > 2, с целью исключения сомнительных значений и вычисления нового среднего значения:
а) 0,4<3,03
б) 2,4<3,03
в) 2,4<3,03
г) 4,4<3,03
д) 2,4<3,03
Сомнительных значений Si не выявлено.
2.3 Тональная помеха 2000 Гц А1 Д1
Вычислим среднее значение разборчивости (S) (3.1.)
% (3.6.)
1) Вычислим среднее квадратическое отклонение (СКО) (3.3.)
= (3.7.)
3) Находим единичные измерения, для которых |Si-S| > 2, с целью исключения сомнительных значений и вычисления нового среднего значения:
а) |66-70| ... 2*4,89, т.о. 4<9,78
б) |72-70| ... 2*4,89, т.о. 2<9,78
в) |64-70| ... 2*4,89, т.о. 6<9,78
г) |76-70| ... 2*4,89, т.о. 6<9,78
д) |72-70| ... 2*4,89, т.о. 2<9,78
Сомнительных значений Si не выявлено.
2.4. Розовый шум А1 Д1
1) Вычислим среднее значение разборчивости (S) (3.1.):
% (3.8.)
2) Вычислим среднее квадратическое отклонение (СКО) (3.3.):
= (3.9.)
3) Находим единичные измерения, для которых |Si-S| > 2, с целью исключения сомнительных значений и вычисления нового среднего значения:
а)1,6 <6,6
б) 2,4<6,6
в) 4,4<6,6
г) 1,6<6,6
д) 3,6<6,6
Сомнительных значений Si не выявлено.
4.5. Белый шум А1 Д1
1) Вычислим среднее значение разборчивости (S) (3.1.):
% (3.10.)
2) Вычислим среднее квадратическое отклонение (СКО) (3.3.)
= (3.11.)
3) Находим единичные измерения, для которых |Si-S| > 2, с целью исключения сомнительных значений и вычисления нового среднего значения:
а)0 <6,3
б)2 <6,3
в)4 <6,3
г) 4<6,3
д) 2<6,3
Сомнительных значений Si не выявлено. После себя приема всеми аудиторами от всех дикторов по 5к таблиц РС”, и вычислений средней разборчивости был получен результат, отраженный в таблице 3.1.1.
Таблица 3.1. Результат прослушанных таблиц - количество верно распознанных слогов, разработанным алгоритмом очистки речи (PC''),%
Тональная помеха 50 Гц |
||||
А1 |
А2 |
А2 |
||
Д1 |
72,8 |
76,8 |
74,0 |
|
Д2 |
74,4 |
77,2 |
75,2 |
|
Д3 |
73,2 |
80,8 |
77,6 |
|
Тональная помеха 100 Гц |
||||
А1 |
А2 |
А3 |
||
Д1 |
70,0 |
72,4 |
68,0 |
|
Д2 |
70,8 |
73,6 |
71,6 |
|
Д3 |
72,4 |
73,2 |
71,6 |
|
Тональная помеха 2000 Гц |
||||
А1 |
А2 |
А3 |
||
Д1 |
70,0 |
73,6 |
68,4 |
|
Д2 |
72,0 |
73,2 |
71,36 |
|
Д3 |
72,4 |
73,2 |
67,6 |
|
Розовый шум |
||||
А1 |
А2 |
А3 |
||
Д1 |
68,4 |
72,0 |
67,2 |
|
Д2 |
72,0 |
72,8 |
70,8 |
|
Д3 |
69,2 |
73,6 |
64,4 |
|
Белый шум |
||||
А1 |
А2 |
А3 |
||
Д1 |
64,0 |
66,0 |
64,4 |
|
Д2 |
67,2 |
69,6 |
66,0 |
|
Д3 |
67,6 |
70,8 |
66,4 |
Вычисления приведены в приложении 3.
3. Проведем аналогичные вычисления результатов средней разборчивости для речевых сигналов с внесенной помехой (РС`).
Измерения разборчивости А1 Д1 в условиях пяти типов помех.
3.1. Тональная помеха 50 Гц А1 Д1
1) Вычислим среднее значение разборчивости (S) (3.1.):
% (3.12.)
2) Вычислим среднее квадратическое отклонение (СКО) (3.3.):
= (3.13.)
3) Находим единичные измерения, для которых |Si-S| > 2, с целью исключения сомнительных значений и вычисления нового среднего значения:
а) |60-58| ... 2*2, т.о. 2<4
б) |56-58| ... 2*2, т.о. 2<4
в) |56-58| ... 2*2, т.о. 2<4
г) |60-58| ... 2*2, т.о. 2<4
д) |58-58| ... 2*2, т.о. 2<4
Сомнительных значений Si не выявлено.
4.2. Тональная помеха 100 Гц А1 Д1
1) Вычислим среднее значение разборчивости (S) (3.1.):
% (3.14.)
2) Вычислим среднее квадратическое отклонение (СКО) по формуле:
= (3.15.)
3) Находим единичные измерения, для которых |Si-S| > 2, с целью исключения сомнительных значений и вычисления нового среднего значения:
а) |54-54,8| ... 2*1,1, т.о. 0,8<2,2
б) |56-54,8| ... 2*1,1, т.о. 1,2<2,2
в) |54-54,8| ... 2*1,1, т.о. 0,8<2,2
г) |56-54,8| ... 2*1,1, т.о. 1,2<2,2
д) |54-54,8| ... 2*1,1, т.о. 0,8<2,2
Сомнительных значений Si не выявлено.
4.3. Тональная помеха 2000 Гц А1 Д1
1) Вычислим среднее значение разборчивости (S) (3.1.):
% (3.16.)
2) Вычислим среднее квадратическое отклонение (СКО) по формуле:
= (3.17.)
3) Находим единичные измерения, для которых |Si-S| > 2, с целью исключения сомнительных значений и вычисления нового среднего значения:
а) |56-56,4| ... 2*1,67, т.о. 0,4<1,67
б) |54-56,4| ... 2*1,67, т.о. 2,4<1,67
в) |58-56,4| ... 2*1,67, т.о. 1,6<1,67
г) |56-56,4| ... 2*1,67, т.о. 0,4<1,67
д) |58-56,4| ... 2*1,67, т.о. 1,6<1,67
Сомнительных значений Si не выявлено.
4.4. Розовый шум А1 Д1
1) Вычислим среднее значение разборчивости (S) (3.1.):
% (3.18.)
2) Вычислим среднее квадратическое отклонение (СКО) (3.3.):
= (3.19.)
3) Находим единичные измерения, для которых |Si-S| > 2, с целью исключения сомнительных значений и вычисления нового среднего значения:
а) |50-52| ... 2*3,16, т.о. 2<6,32
б) |54-52| ... 2*3,16, т.о. 2<6,32
в) |58-52| ... 2*3,16, т.о. 4<6,32
г) |52-52| ... 2*3,16, т.о. 0<6,32
д) |56-52| ... 2*3,16, т.о. 4<6,32
Сомнительных значений Si не выявлено.
5.5. Белый шум А1 Д1
1) Вычислим среднее значение разборчивости (S) (3.1.):
% (3.20.)
2) Вычислим среднее квадратическое отклонение (СКО) (3.3.):
= (3.21.)
3) Находим единичные измерения, для которых |Si-S| > 2, с целью исключения сомнительных значений и вычисления нового среднего значения:
а) |52-54,4| ... 2*1,67, т.о. 2,4<3,34
б) |54-54,4| ... 2*1,67, т.о. 0,4<3,34
в) |56-54,4| ... 2*1,67, т.о. 1,6<3,34
г) |54-54,4| ... 2*1,67, т.о. 0,4<3,34
д) |56-54,4| ... 2*1,67, т.о. 1,6<3,34
Сомнительных значений Si не выявлено.
После себя приема всеми аудиторами от всех дикторов по 5к таблиц РС', и вычислений средней разборчивости был получен результат, отраженный в таблице 3.2.
Таблица 3.2. Результат прослушанных таблиц - количество верно распознанных слогов с внесенной помехой (РС'), %
Тональная помеха 50 Гц |
||||
А1 |
А2 |
А2 |
||
Д1 |
58,0 |
62,8 |
58,8 |
|
Д2 |
59,2 |
54,4 |
56,4 |
|
Д3 |
56,8 |
57,2 |
54,8 |
|
Тональная помеха 100 Гц |
||||
А1 |
А2 |
А3 |
||
Д1 |
54,8 |
52,8 |
55,2 |
|
Д2 |
51,2 |
50,0 |
52,4 |
|
Д3 |
53,2 |
55,2 |
54,8 |
|
Тональная помеха 2000 Гц |
||||
А1 |
А2 |
А3 |
||
Д1 |
56,4 |
54,4 |
55,2 |
|
Д2 |
54,8 |
56,0 |
55,2 |
|
Д3 |
52,4 |
54,4 |
56,2 |
|
Розовый шум |
||||
А1 |
А2 |
А3 |
||
Д1 |
52,0 |
54,0 |
54,4 |
|
Д2 |
52,8 |
54,4 |
53,6 |
|
Д3 |
54,8 |
52,4 |
54,0 |
|
Белый шум |
||||
А1 |
А2 |
А3 |
||
Д1 |
54,4 |
54,0 |
53,6 |
|
Д2 |
55,6 |
53,2 |
51,2 |
|
Д3 |
52,8 |
51,6 |
50,4 |
Вычисления приведены в приложении 4.
Вывод:
1. Усредняя полученные результаты, приведенные в таблицах 3.1 и 3.2, получим средний показатель разборчивости по двум видам: PC” и PC' (таблица 3.3), рис. 3.2.
Таблица 3.3 Средний показатель разборчивости, %
Помехи |
PC” |
PC' |
Разница PC”- PC' |
|
50 Гц |
75,77 |
57,6 |
18,17 |
|
100 Гц |
71,5 |
53,3 |
18,2 |
|
2000 Гц |
71,3 |
55,0 |
16,3 |
|
Розовый шум Гц |
70,0 |
53,6 |
16,4 |
|
Белый шум Гц |
68,9 |
52,9 |
16,0 |
|
Итого |
17,014 |
Рис. 3.2. Средние показатели разборчивости до и после очистки
Из рис.3.2. и таблицы 3.3 видно, что результат очистки речевых сигналов разработанным алгоритмом очистки речи повысил среднее значение разборчивости на 17,014%, из них:
· Тональная помеха 50 Гц - разборчивость повысилась на 18,17%;
· Тональная помеха 100 Гц - разборчивость повысилась на 18,2%;
· Тональная помеха 200 Гц - разборчивость повысилась на 16,3%;
· Розовый шум Гц - разборчивость повысилась на 16,4%;
· Белый шум Гц - разборчивость повысилась на 16,0%,
что свидетельствует об эффективности выбранного устройства.
1. Опираясь на табл. 3.3, также можно судить и об эффективности очистки разработанным алгоритмом очистки речи по отношению к разным типам помех.
Так, например, результат разборчивости PC', при тональной помехе в 100 Гц, повысился на 18,2% после очистки, что является наиболее высоким результатом, чем результат разборчивости PC' после очистки в условиях белого шума который составил 16,8% (рис.3.3).
Рис.3.3. Результат эффективности разработанного алгоритмом очистки речи к определенным типам помех.
Таким образом, разработанный алгоритм очистки речи, в рамках проводимых исследований, более эффективен (по убыванию) к:
1. Тональная помеха 100 Гц;
2. Тональная помеха 50Гц;
3. Розовому шуму;
4. Тональная помеха 2000 Гц;
5. Белому шуму.
3.3 Оценка качества очистки речевого сигнала методом парных сравнений
Измерения узнаваемости голоса диктора методом парных сравнений проводит бригада операторов в составе: пяти дикторов: трех мужчин и двух женщин (далее Д1, Д2, Д3, Д4 и Д5); пятнадцати аудиторов: шести мужчин и девяти женщин (далее А1, А2, ..., А15).
Перед началом измерений бригада операторов проходит обучение (тренировку), в рамках которой: знакомится со структурой речевого материала; осваивает технику его произношения; адаптируется к восприятию искаженной речи.
Дикторами отрабатывается техника чтения для достижения зачитывания слогов ровным голосом, четко, но без подчеркивания с постоянным уровнем речи.
3.3.1 Первый этап измерения разборчивости речи методом парных сравнений
1. Дикторы, в составе пяти человек (Д1, Д2, Д3, Д4 и Д5), прошедшие тренировку и отработавшие технику чтения зачитывают тестовые фразы для оценки узнаваемости голоса диктора, указанные в приложении 5.
Каждым диктором начитывается по семь тестовых фраз (речевых сигналов).
Фразы принимаются в универсальный динамический микрофон и сохраняются в памяти ПЭВМ.
В результате получаем 35 записанных оригинальных тестовых фраз (речевых сигналов, далее РС)
2. В записанные (сохраненные в памяти ПЭВМ) речевые сигналы РС при помощи встроенных средств MatLab искусственным способом вносятся шумы и помехи имеющие стационарный характер, с отношением сигнал\шум равным 10Дб:
· Тональная помеха 50 Гц;
· Тональная помеха 100 Гц;
· Тональная помеха 2000 Гц;
· Розовый шум;
· Белый шум,
для их последующей очистки. В результате получаем 175 речевых сигналов (35 РС * 5 помех) с внесенными помехами (далее РС').
3. Разработанными программными средствами производится очистка зашумленных речевых сигналов РС', для последующей оценки качества и эффективности. В результате получаем 175 обработанных речевых сигналов (РС”).
4. Аудиторы, в составе пятнадцати человек (А1, А2, А3,... и А15) прошедшие тренировку (обучение) прослушивают РС, РС', РС” три раза в следующей последовательности: фраза без обработки, и далее фразы, с внесенной помехой и очищенные, в случайном порядке.
На основании сравнения звучания РС” и РС' аудиторами отмечается наиболее близкий, к естественной по сохранению признаков узнаваемости голоса диктора речевой сигнал и записывается в бланк, форма которого приведена в приложении 6.
3.3.2 Второй этап измерения разборчивости речи методом парных сравнений
1. На втором этапе измерений узнаваемости голоса диктора методом парных сравнений, определяется величина предпочтения одного из сравниваемых речевых сигналов РС” по узнаваемости голоса диктора,
Вычисления проводятся по формуле:
(3.22.)
где - величина предпочтения;
- число случаев предпочтения узнаваемости голоса диктора одного тракта перед другим, в процентах; - число единичных измерений.
В рамках проводимых исследований: - сколько раз один аудитор предпочел узнаваемость голоса диктора при PC”, в сравниваемых РС, %
- одна единица измерения таким образом одна фраза это семь единиц измерения (7 фраз).
Так, например, величина предпочтения речевых сигналов (тестовых фраз) обработанных разработанным алгоритмом очистки речевых сигналов (РС”), по отношению к речевым сигналам (тестовым фразам) с внесенной помехой (РС'), у первого аудитора (А1), прослушавшего первого диктора (Д1), с внесенной тоновой помехой 50 Гц, составляет:
В дальнейшем величины предпочтения, РС”, по отношению к РС' (тоновая помеха 50 Гц, тоновая помеха 100 Гц, тоновая помеха 2000 Гц, белый шум, розовый шум), вычислялись по формуле (3.22.). Результаты вычислений приведены в таблице 3.4.
Таблица 3.4. Результат величин предпочтения РС”, по отношению к РС'
Тональная помеха 50 Гц, % |
||||||||||||||||
А1 |
А2 |
А3 |
А4 |
А5 |
А6 |
А7 |
А8 |
А9 |
А10 |
А11 |
А12 |
А13 |
А14 |
А15 |
||
Д1 |
100 |
100 |
100 |
100 |
85,7 |
100 |
85,7 |
100 |
100 |
100 |
85,7 |
100 |
100 |
100 |
71,4 |
|
Д2 |
100 |
85,7 |
85,7 |
85,7 |
100 |
100 |
100 |
100 |
85,7 |
100 |
100 |
100 |
100 |
100 |
85,7 |
|
Д3 |
100 |
100 |
100 |
100 |
100 |
100 |
85,7 |
100 |
85,7 |
85,7 |
85,7 |
100 |
85,7 |
71,4 |
100 |
|
Д4 |
85,7 |
71,4 |
100 |
85,7 |
100 |
85,7 |
71,4 |
85,7 |
100 |
85,7 |
100 |
85,7 |
85,7 |
85,7 |
100 |
|
Д5 |
100 |
100 |
100 |
100 |
85,7 |
100 |
100 |
100 |
100 |
100 |
100 |
85,7 |
100 |
100 |
100 |
|
Тональная помеха 100 Гц, % |
||||||||||||||||
А1 |
А2 |
А3 |
А4 |
А5 |
А6 |
А7 |
А8 |
А9 |
А10 |
А11 |
А12 |
А13 |
А14 |
А15 |
||
Д1 |
71,4 |
85,7 |
100 |
85,7 |
85,7 |
100 |
71,4 |
85,7 |
85,7 |
85,7 |
71,4 |
85,7 |
100 |
100 |
85,7 |
|
Д2 |
71,4 |
71,4 |
71,4 |
71,4 |
85,7 |
85,7 |
100 |
71,4 |
71,4 |
85,7 |
85,7 |
100 |
85,7 |
85,7 |
71,4 |
|
Д3 |
85,7 |
100 |
85,7 |
100 |
71,4 |
71,4 |
85,7 |
71,4 |
100 |
71,4 |
85,7 |
85,7 |
100 |
71,4 |
71,4 |
|
Д4 |
71,4 |
85,7 |
85,7 |
85,7 |
71,4 |
85,7 |
85,7 |
85,7 |
85,7 |
71,4 |
71,4 |
85,7 |
71,4 |
85,7 |
100 |
|
Д5 |
100 |
71,4 |
71,4 |
71,4 |
85,7 |
71,4 |
71,4 |
85,7 |
71,4 |
100 |
100 |
71,4 |
71,4 |
71,4 |
85,7 |
|
Тональная помеха 2000 Гц, % |
||||||||||||||||
А1 |
А2 |
А3 |
А4 |
А5 |
А6 |
А7 |
А8 |
А9 |
А10 |
А11 |
А12 |
А13 |
А14 |
А15 |
||
Д1 |
85,7 |
100 |
85,7 |
100 |
85,7 |
85,7 |
71,4 |
85,7 |
100 |
71,4 |
100 |
71,4 |
100 |
85,7 |
100 |
|
Д2 |
85,7 |
100 |
100 |
100 |
100 |
100 |
100 |
100 |
71,4 |
100 |
85,7 |
100 |
85,7 |
85,7 |
71,4 |
|
Д3 |
71,4 |
85,7 |
71,4 |
85,7 |
85,7 |
71,4 |
85,7 |
71,4 |
85,7 |
85,7 |
100 |
85,7 |
85,7 |
71,4 |
85,7 |
|
Д4 |
85,7 |
85,7 |
85,7 |
85,7 |
100 |
85,7 |
85,7 |
85,7 |
85,7 |
85,7 |
85,7 |
100 |
85,7 |
100 |
85,74 |
|
Д5 |
100 |
71,4 |
100 |
85,7 |
85,7 |
100 |
100 |
85,7 |
100 |
100 |
100 |
100 |
85,7 |
100 |
100 |
|
Белый шум, % |
||||||||||||||||
А1 |
А2 |
А3 |
А4 |
А5 |
А6 |
А7 |
А8 |
А9 |
А10 |
А11 |
А12 |
А13 |
А14 |
А15 |
||
Д1 |
85,7 |
100 |
100 |
71,4 |
71,4 |
100 |
71,4 |
85,7 |
85,7 |
85,7 |
85,7 |
71,4 |
85,7 |
85,7 |
85,7 |
|
Д2 |
100 |
100 |
85,7 |
71,4 |
100 |
71,4 |
71,4 |
100 |
100 |
85,7 |
71,4 |
100 |
71,4 |
100 |
71,4 |
|
Д3 |
71,4 |
71,4 |
71,4 |
85,7 |
100 |
85,7 |
85,7 |
71,4 |
85,7 |
85,7 |
100 |
85,7 |
85,7 |
71,4 |
100 |
|
Д4 |
85,7 |
71,4 |
85,7 |
100 |
71,4 |
71,4 |
85,7 |
71,4 |
71,4 |
100 |
85,7 |
71,4 |
71,4 |
71,4 |
71,4 |
|
Д5 |
71,4 |
85,7 |
71,4 |
85,7 |
85,7 |
100 |
100 |
85,7 |
85,7 |
100 |
71,4 |
100 |
71,4 |
100 |
71,4 |
|
Розовый шум, % |
||||||||||||||||
А1 |
А2 |
А3 |
А4 |
А5 |
А6 |
А7 |
А8 |
А9 |
А10 |
А11 |
А12 |
А13 |
А14 |
А15 |
||
Д1 |
85,7 |
85,7 |
71,4 |
100 |
85,7 |
100 |
85,7 |
85,7 |
100 |
85,7 |
85,7 |
71,4 |
85,7 |
100 |
71,4 |
|
Д2 |
85,7 |
100 |
100 |
85,7 |
100 |
85,7 |
00 |
85,7 |
85,7 |
100 |
71,4 |
100 |
100 |
85,7 |
100 |
|
Д3 |
85,7 |
85,7 |
85,7 |
85,7 |
85,7 |
85,7 |
71,4 |
85,7 |
85,7 |
100 |
100 |
85,7 |
85,7 |
85,7 |
85,7 |
|
Д4 |
100 |
100 |
85,7 |
100 |
85,7 |
100 |
85,7 |
71,4 |
71,4 |
71,4 |
100 |
85,7 |
85,7 |
100 |
85,7 |
|
Д5 |
85,7 |
85,7 |
100 |
100 |
85,7 |
85,7 |
100 |
85,7 |
100 |
85,7 |
85,7 |
100 |
71,4 |
85,7 |
100 |
Исходя из величин предпочтения РС” узнаваемости голоса диктора, вычисляем величины не предпочтенных фраз РС' (с внесенной помехой) по формуле:
(3.24.)
Полученные результаты занесены в таблицу 3.5.
Таблица 3.5. Результат величин предпочтения РС' по отношению к РС”
Тональная помеха 50 Гц |
||||||||||||||||
А1 |
А2 |
А3 |
А4 |
А5 |
А6 |
А7 |
А8 |
А9 |
А10 |
А11 |
А12 |
А13 |
А14 |
А15 |
||
Д1 |
0 |
0 |
0 |
0 |
14,3 |
0 |
14,3 |
0 |
0 |
0 |
14,3 |
0 |
0 |
0 |
28,6 |
|
Д2 |
0 |
14,3 |
14,3 |
14,3 |
0 |
0 |
0 |
0 |
14,3 |
0 |
0 |
0 |
0 |
0 |
14,3 |
|
Д3 |
0 |
0 |
0 |
0 |
0 |
0 |
14,3 |
0 |
14,3 |
14,3 |
14,3 |
0 |
14,3 |
28,6 |
0 |
|
Д4 |
14,3 |
28,6 |
0 |
14,3 |
0 |
14,3 |
28,6 |
14,3 |
0 |
14,3 |
0 |
14,3 |
14,3 |
14,3 |
0 |
|
Д5 |
0 |
0 |
0 |
0 |
14,3 |
0 |
0 |
0 |
0 |
0 |
0 |
14,3 |
0 |
0 |
0 |
|
Тональная помеха 100 Гц |
||||||||||||||||
А1 |
А2 |
А3 |
А4 |
А5 |
А6 |
А7 |
А8 |
А9 |
А10 |
А11 |
А12 |
А13 |
А14 |
А15 |
||
Д1 |
28,6 |
14,3 |
0 |
14,3 |
14,3 |
0 |
28,6 |
14,3 |
14,3 |
14,3 |
28,6 |
14,3 |
0 |
0 |
14,3 |
|
Д2 |
28,6 |
28,6 |
28,6 |
28,6 |
14,3 |
14,3 |
0 |
28,6 |
14,3 |
14,3 |
14,3 |
0 |
14,3 |
14,3 |
28,6 |
|
Д3 |
14,3 |
0 |
14,3 |
0 |
28,6 |
28,6 |
14,3 |
28,6 |
0 |
14,3 |
14,3 |
14,3 |
0 |
28,6 |
28,6 |
|
Д4 |
28,6 |
14,3 |
14,3 |
14,3 |
28,6 |
14,3 |
14,3 |
14,3 |
14,3 |
28,6 |
28,6 |
14,3 |
28,6 |
14,3 |
0 |
|
Д5 |
0 |
28,6 |
28,6 |
28,6 |
14,3 |
28,6 |
28,6 |
14,3 |
28,6 |
0 |
0 |
28,6 |
28,6 |
28,6 |
14,3 |
|
Тональная помеха 2000 Гц |
||||||||||||||||
А1 |
А2 |
А3 |
А4 |
А5 |
А6 |
А7 |
А8 |
А9 |
А10 |
А11 |
А12 |
А13 |
А14 |
А15 |
||
Д1 |
14,3 |
0 |
14,3 |
0 |
14,3 |
14,3 |
28,6 |
14,3 |
0 |
28,6 |
0 |
28,6 |
0 |
14,3 |
0 |
|
Д2 |
14,3 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
28,6 |
0 |
14,3 |
0 |
14,3 |
14,3 |
28,6 |
|
Д3 |
28,6 |
14,3 |
28,6 |
14,3 |
14,3 |
28,6 |
14,3 |
28,6 |
14,3 |
14,3 |
0 |
14,3 |
14,3 |
28,6 |
14,3 |
|
Д4 |
14,3 |
14,3 |
14,3 |
14,3 |
0 |
14,3 |
14,3 |
14,3 |
14,3 |
14,3 |
14,3 |
0 |
14,3 |
0 |
14,3 |
|
Д5 |
0 |
28,6 |
0 |
14,3 |
14,3 |
0 |
0 |
14,3 |
0 |
0 |
0 |
0 |
14,3 |
0 |
0 |
|
Белый шум |
||||||||||||||||
А1 |
А2 |
А3 |
А4 |
А5 |
А6 |
А7 |
А8 |
А9 |
А10 |
А11 |
А12 |
А13 |
А14 |
А15 |
||
Д1 |
14,3 |
0 |
0 |
28,6 |
28,6 |
0 |
28,6 |
14,3 |
14,3 |
14,3 |
14,3 |
28,6 |
14,3 |
14,3 |
14,3 |
|
Д2 |
0 |
0 |
14,3 |
28,6 |
0 |
28,6 |
28,6 |
0 |
0 |
14,3 |
14,3 |
0 |
28,6 |
0 |
28,6 |
|
Д3 |
28,6 |
28,6 |
28,6 |
14,3 |
0 |
14,3 |
14,3 |
28,6 |
14,3 |
14,3 |
0 |
14,3 |
14,3 |
28,6 |
0 |
|
Д4 |
14,3 |
28,6 |
14,3 |
0 |
28,6 |
28,6 |
14,3 |
28,6 |
28,6 |
0 |
14,3 |
28,6 |
28,6 |
28,6 |
28,6 |
|
Д5 |
28,6 |
14,3 |
28,6 |
14,3 |
14,3 |
0 |
0 |
14,3 |
14,3 |
0 |
28,6 |
0 |
28,6 |
0 |
28,6 |
|
Розовый шум |
||||||||||||||||
А1 |
А2 |
А3 |
А4 |
А5 |
А6 |
А7 |
А8 |
А9 |
А10 |
А11 |
А12 |
А13 |
А14 |
А15 |
||
Д1 |
14,3 |
14,3 |
28,6 |
0 |
14,3 |
0 |
14,3 |
14,3 |
0 |
14,3 |
14,3 |
28,6 |
14,3 |
0 |
28,6 |
|
Д2 |
14,3 |
0 |
0 |
14,3 |
0 |
14,3 |
0 |
14,3 |
14,3 |
0 |
28,6 |
0 |
0 |
14,3 |
0 |
|
Д3 |
14,3 |
14,3 |
14,3 |
14,3 |
14,3 |
14,3 |
28,6 |
14,3 |
14,3 |
0 |
0 |
14,3 |
14,3 |
14,3 |
14,3 |
|
Д4 |
0 |
0 |
14,3 |
0 |
14,3 |
0 |
14,3 |
28,6 |
28,6 |
28,6 |
0 |
14,3 |
14,3 |
0 |
14,3 |
|
Д5 |
14,3 |
14,3 |
0 |
0 |
14,3 |
14,3 |
0 |
14,3 |
0 |
14,3 |
14,3 |
0 |
28,6 |
14,3 |
0 |
Далее вычисляется заметность различия (В) РС” и РС' по формуле:
(3.25.)
Полученные результаты представлены в таблице 3.6.
Таблица 3.6. Заметность различия РС” - РС'
Тональная помеха 50 Гц, % |
||||||||||||||||
А1 |
А2 |
А3 |
А4 |
А5 |
А6 |
А7 |
А8 |
А9 |
А10 |
А11 |
А12 |
А13 |
А14 |
А15 |
||
Д1 |
100 |
100 |
100 |
100 |
71,4 |
100 |
71,4 |
100 |
100 |
100 |
71,4 |
100 |
100 |
100 |
42,8 |
|
Д2 |
100 |
71,4 |
71,4 |
71,4 |
100 |
100 |
100 |
100 |
71,4 |
100 |
100 |
100 |
100 |
100 |
71,4 |
|
Д3 |
100 |
100 |
100 |
100 |
100 |
100 |
71,4 |
100 |
71,4 |
71,4 |
71,4 |
100 |
71,4 |
42,8 |
100 |
|
Д4 |
71,4 |
42,8 |
100 |
71,4 |
100 |
71,4 |
42,8 |
71,4 |
100 |
71,4 |
100 |
71,4 |
71,4 |
71,4 |
100 |
|
Д5 |
100 |
100 |
100 |
100 |
42,8 |
100 |
100 |
100 |
100 |
100 |
100 |
71,4 |
100 |
100 |
100 |
|
Итого 100% - 48, 71,4% - 22, 42,8% - 5 |
||||||||||||||||
Тональная помеха 100 Гц, % |
||||||||||||||||
А1 |
А2 |
А3 |
А4 |
А5 |
А6 |
А7 |
А8 |
А9 |
А10 |
А11 |
А12 |
А13 |
А14 |
А15 |
||
Д1 |
42,8 |
71,4 |
100 |
71,4 |
71,4 |
100 |
42,8 |
71,4 |
71,4 |
71,4 |
42,8 |
71,4 |
100 |
100 |
71,4 |
|
Д2 |
42,8 |
42,8 |
42,8 |
42,8 |
71,4 |
71,4 |
100 |
42,8 |
71,4 |
71,4 |
71,4 |
100 |
71,4 |
71,4 |
42,8 |
|
Д3 |
71,4 |
100 |
71,4 |
100 |
42,8 |
42,8 |
71,4 |
42,8 |
100 |
42,8 |
71,4 |
71,4 |
100 |
42,8 |
42,8 |
|
Д4 |
42,8 |
71,4 |
71,4 |
71,4 |
42,8 |
71,4 |
71,4 |
71,4 |
71,4 |
42,8 |
42,8 |
71,4 |
42,8 |
71,4 |
100 |
|
Д5 |
100 |
42,8 |
42,8 |
42,8 |
71,4 |
42,8 |
42,8 |
71,4 |
42,8 |
100 |
100 |
42,8 |
42,8 |
42,8 |
71,4 |
|
Итого 100% - 14, 71,4% -32, 42,8% - 29 |
||||||||||||||||
Тональная помеха 2000 Гц, % |
||||||||||||||||
А1 |
А2 |
А3 |
А4 |
А5 |
А6 |
А7 |
А8 |
А9 |
А10 |
А11 |
А12 |
А13 |
А14 |
А15 |
||
Д1 |
71,4 |
100 |
71,4 |
100 |
71,4 |
71,4 |
42,8 |
71,4 |
100 |
42,8 |
100 |
42,8 |
100 |
71,4 |
100 |
|
Д2 |
71,4 |
100 |
100 |
100 |
100 |
100 |
100 |
100 |
42,8 |
100 |
71,4 |
100 |
71,4 |
71,4 |
42,8 |
|
Д3 |
42,8 |
71,4 |
42,8 |
71,4 |
71,4 |
42,8 |
71,4 |
42,8 |
71,4 |
71,4 |
100 |
71,4 |
71,4 |
42,8 |
71,4 |
|
Д4 |
71,4 |
71,4 |
71,4 |
71,4 |
100 |
71,4 |
71,4 |
71,4 |
71,4 |
71,4 |
71,4 |
100 |
71,4 |
100 |
71,4 |
|
Д5 |
100 |
42,8 |
100 |
71,4 |
71,4 |
100 |
100 |
71,4 |
100 |
100 |
100 |
100 |
71,4 |
100 |
100 |
|
Итого 100% - 29, 71,4% - 35, 42,8% - 11 |
||||||||||||||||
Белый шум, % |
||||||||||||||||
А1 |
А2 |
А3 |
А4 |
А5 |
А6 |
А7 |
А8 |
А9 |
А10 |
А11 |
А12 |
А13 |
А14 |
А15 |
||
Д1 |
71,4 |
100 |
100 |
42,8 |
42,8 |
100 |
42,8 |
71,4 |
71,4 |
71,4 |
71,4 |
42,8 |
71,4 |
71,4 |
71,4 |
|
Д2 |
100 |
100 |
71,4 |
42,8 |
100 |
42,8 |
42,8 |
100 |
100 |
71,4 |
42,8 |
100 |
42,8 |
100 |
42,8 |
|
Д3 |
42,8 |
42,8 |
42,8 |
71,4 |
100 |
42,8 |
71,4 |
42,8 |
71,4 |
71,4 |
100 |
71,4 |
71,4 |
42,8 |
100 |
|
Д4 |
71,4 |
42,8 |
71,4 |
100 |
42,8 |
42,8 |
71,4 |
42,8 |
42,8 |
100 |
71,4 |
42,8 |
42,8 |
42,8 |
42,8 |
|
Д5 |
42,8 |
71,4 |
42,8 |
71,4 |
71,4 |
100 |
100 |
71,4 |
71,4 |
100 |
42,8 |
100 |
42,8 |
100 |
42,8 |
|
Итого 100% - 20, 71,4% - 25, 42,8% - 30 |
||||||||||||||||
Розовый шум, % |
||||||||||||||||
А1 |
А2 |
А3 |
А4 |
А5 |
А6 |
А7 |
А8 |
А9 |
А10 |
А11 |
А12 |
А13 |
А14 |
А15 |
||
Д1 |
71,4 |
71,4 |
42,8 |
100 |
71,4 |
100 |
71,4 |
71,4 |
100 |
71,4 |
71,4 |
42,8 |
71,4 |
100 |
42,8 |
|
Д2 |
71,4 |
100 |
100 |
71,4 |
100 |
71,4 |
1 00 |
71,4 |
71,4 |
100 |
42,8 |
100 |
100 |
71,4 |
100 |
|
Д3 |
71,4 |
71,4 |
71,4 |
71,4 |
71,4 |
71,4 |
42,8 |
71,4 |
71,4 |
100 |
100 |
71,4 |
71,4 |
71,4 |
71,4 |
|
Д4 |
100 |
100 |
71,4 |
100 |
71,4 |
100 |
71,4 |
42,8 |
42,8 |
42,8 |
100 |
71,4 |
71,4 |
100 |
71,4 |
|
Д5 |
71,4 |
71,4 |
100 |
100 |
71,4 |
71,4 |
100 |
71,4 |
100 |
71,4 |
71,4 |
100 |
42,8 |
71,4 |
100 |
|
Итого 100% - 26, 71,4% - 40, 42,8% - 9 |
Сравнивая результаты, приведенные в таблице 3.6., с нормой заметности (ГОСТ Р 50840-95) приведенной в таблице 3.7, присваиваем характеристику и степень заметности различия речевых сигналов.
Таблица 3.7. Нормы заметности
Степень заметности |
Характеристика |
Норма заметности (%) |
|
0 1 2 3 |
Незаметно Едва заметно Заметно Сильно заметно |
<57,5 58-65 66-75 >75 |
Полученные показатели заносим в таблицу 3.8.
Таблица 3.8. Присвоенные характеристики и степени заметности
Характеристика / Степень заметности |
|||||
Незаметно / 0 |
Едва заметно / 1 |
Заметно / 2 |
Сильно заметно / 3 |
||
Тональная помеха 50 Гц |
5 (6,6%) |
22 (29,3%) |
48 (64%) |
||
Тональная помеха 100 Гц |
29 (38,6%) |
32 (42,6%) |
14 (18,6%) |
||
Тональная помеха 2000 Гц |
11 (14,6%) |
35 (46,6%) |
29 (38,6%) |
||
Белый шум |
30 (40%) |
25 (33,3%) |
20 (26,6%) |
||
Розовый шум |
9 (12%) |
40 (53,3%) |
26 (34,6%) |
По результатам таблицы 3.8. построим график "Доли предпочтений» рис. 3.4.
Рис.3.4 Доли предпочтений
Большинство аудиторов, при прослушивании речевых сигналов с внесенной помехой, и речевых сигналов с произведенной очисткой, при измерении узнаваемости голоса диктора, отдали свое предпочтение РС” (речевым сигналам обработанным разработанным алгоритмом очистки).
Из таблицы 3.8. и можно увидеть, что:
· Разница сравниваемых речевых сигналов с внесенной тональной помехой 50 Гц и очищенных от нее - самая существенная и составляет 64%. В соответствие с ГОСТ Р 50840-95, ей присваивается 3я степень заметности и характеристика «сильно заметно», что свидетельствует об эффективности очистки по отношению к данной помехе/шуму;
Подобные документы
Жесткий и гибкий пороги фильтрации речевого сигнала. Графики вейвлет-разложения речевого сигнала. Блок схема алгоритма фильтрации с гибким порогом. Статистический метод фильтрации речевого сигнала. Оценка качества восстановленного речевого сигнала.
реферат [440,2 K], добавлен 01.12.2008Способы представления речевого сигнала. Разработка алгоритма, структурной и функциональной схемы цифрового полосового вокодера. Расчёт параметров и характеристик набора цифровых полосовых фильтров. Оценка степени сжатия и моделирование в среде Matlab.
курсовая работа [1,1 M], добавлен 28.10.2011Общие сведения о шумах и адаптивной фильтрации речевого сигнала. Компенсаторы помех: устройство и компоненты, функции. Подавление аддитивного квазистационарного шума методом вычитания амплитудных спектров, основанном на искусственных нейронных сетях.
курсовая работа [359,7 K], добавлен 02.05.2016Методы обработки и передачи речевых сигналов. Сокращение избыточности речевого сигнала как одна из проблем ресурсосберегающего развития телефонных сетей. Кодирование речевых сигналов на основе линейного предсказания. Разработка алгоритма программы.
дипломная работа [324,7 K], добавлен 26.10.2011Спектральные характеристики периодических и непериодических сигналов. Свойства преобразования Фурье. Аналитический расчёт спектра сигнала и его энергии. Разработка программы в среде Borland C++ Bulder 6.0 для подсчета и графического отображения сигнала.
курсовая работа [813,6 K], добавлен 15.11.2012Метод выделения огибающей АМ-сигнала при помощи преобразования Гильберта. Эквивалентная схема программного алгоритма. Способы выделения амплитудного огибающего сигнала. Синтез АМ-сигнала с несущей и боковыми частотами. Формирователь амплитудной огибающей.
курсовая работа [279,1 K], добавлен 23.06.2009Расчёт объёма звукового файла и порядка фильтра Баттерворта как основа для приложений обработки сигналов. Спектр входного сигнала и его частота. Расчет порядка фильтра и дискретная функция передач. Амплитудная модуляция и детектирование сигнала.
курсовая работа [1,6 M], добавлен 07.05.2012Формирование математической модели сигнала и построение ее графика. Спектральный состав сигнала. Исследования спектрального состава сигнала с помощью быстрых преобразований ряда Фурье. Построение графика обработанного сигнала. Верхняя граничная частота.
курсовая работа [187,7 K], добавлен 14.08.2012Разработка схемы алгоритма программной генерации сигнала заданной формы. Обоснование назначения отдельных блоков программы, описание ее работы в целом. Формирование последовательности из трех пилообразных импульсов с заданным временем паузы и нарастания.
контрольная работа [28,0 K], добавлен 25.05.2015Анализ алгоритма функционирования системы накопления радара некогерентного рассеяния. Разработка амплитудного накопителя сигнала. Определение и формирование режима накопления контрольных сеансов. Технология и этапы сборки амплитудного накопителя.
дипломная работа [473,7 K], добавлен 14.02.2012