Алгоритм кодирования речи CELP

Сущность линейного предсказания с мультикодовым управлением как алгоритма кодирования речи, первоначально предложенный М.Р. Шредером и Б.С. Аталом. Характеристика четырех идей алгоритма CELP. Процесс расширения полосы пропускания, искажение шумом.

Рубрика Программирование, компьютеры и кибернетика
Вид реферат
Язык русский
Дата добавления 26.10.2014
Размер файла 26,5 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru

Содержание

Введение

1. CELP декодер

2. CELP кодер

3. Искажение шумом

4. Модификации и области применения

Введение

Алгоритм кодирования речи CELP

Линейное предсказание с мульти кодовым управлением (англ. Code Excited Linear Prediction, CELP) представляет собой алгоритм кодирования речи, первоначально предложенный М. Р. Шредером и Б. С. Аталом в 1985 году. В то время алгоритм обеспечивал значительно лучшее качество, чем существовавшие тогда алгоритмы с низким битрейтом, такие, как аудиокодеки RELP и LPC (например, FS-1015). Наряду с вариантами, как, например, ACELP, RCELP, LD-CELP и VSELP, на сегодня это наиболее широко используемый алгоритм кодирования речи. CELP в настоящее время используется как общий термин для класса алгоритмов, а не для определенного кодека. Кодеры речевых сигналов, использующие алгоритм CELP, относятся к классу гибридных и занимают промежуточное положение между кодерами формы, в которых сохраняется форма колебания речевого сигнала в процессе его дискретизации и квантования, и параметрическими вокодерами, основанными на процедурах оценки и кодирования небольшого числа параметров речи. При этом в кодерах CELP сохраняются преимущества обоих типов кодеров. Метод кодирования CELP основан на линейной авто регрессионной модели процесса формирования и восприятия речи и входит в группу методов анализа через синтез.

Алгоритм CELP базируется на четырех основных идеях:

Использование модели источника-фильтра для воспроизведения речи на основе линейного предсказания (ЛП);

Использование адаптивной и фиксированной кодовых таблиц в качестве базы для модели линейного предсказания;

Замкнутый поиск в «перцептуально взвешенном домене».

Применение векторного квантования (VQ)

Оригинальный алгоритм Шредера и Атала в 1983 году, при запуске на суперкомпьютере Cray I, требовал 150 секунд для кодирования речевого сигнала длиной 1 секунду. С возникновением более эффективных способов реализации таблиц кодов и совершенствованием вычислительных возможностей- запуск алгоритма стал возможен во встраиваемых устройствах, таких как мобильные телефоны.

шум мультикодовый алгоритм

1. CELP декодер

Прежде, чем исследовать сложный процесс кодирования CELP мы рассмотрим принцип работы декодера. Иллюстрация (ниже дана внешняя ссылка на схему) описывает универсальный декодер CELP. Возбуждение производится через суммирование вкладов от адаптивной (иначе тактовой) таблицы кодов и фиксированной (иначе стохастической) таблицы кодов:

где является адаптивным (тактовым) взносом таблицы кодов и является фиксированным (стохастическим) вкладом таблицы кодов. Фиксированная таблица кодов- векторный словарь квантования, который является (неявно или явно) жестко закодированным в кодек. Эта таблица кодов может быть алгебраической ACELP или сохраненной явно (например. Speex). Записи в адаптивной таблице кодов состоят из отсроченных версий возбуждения. Это позволяет эффективно кодировать периодические сигналы, такие как человеческая речь.

2. Кодер CELP

Основной принцип, заключённый в основе CELP называют (Абсолютным) «Анализом через синтез», что означает, что кодирование (анализ) выполнено, перцепционно оптимизируя декодированный сигнал в замкнутом цикле. В теории, лучший поток CELP был бы произведён в результате комбинаций всех возможных наборов двоичных знаков и выбором тот, который производит декодированный сигнал наилучшего звучания. Это очевидно не возможно по двум причинам: сложность реализации выше любых в настоящее время доступных аппаратных средств, и критерий отбора «лучшее звучание» подразумевает в качестве слушателя- человека.

Чтобы осуществить кодирования в реальном времени, используя ограниченные вычислительные ресурсы, поиск CELP разбит на мелкие, более управляемые, последовательные поиски, используя простую перцептуальную функцию надбавки. Как правило, кодирование выполнено в следующем порядке:

Линейные Коэффициенты Предсказания (ЛКП) вычислены и квантованы, обычно как LSP

Происходит поиск по адаптивной (тактовой) таблице кодов, и ее содействие/взнос/ удаляется

Поиск по фиксированной (стохастической) таблице кодов

3. Искажение шумом

Большинство (если не все) современные звуковые кодеки пытаются сформировать искажение в кодировании так, чтобы оно проявилось главным образом в тех частотных областях, где его не может уловить человеческое ухо. Например, ухо более терпимо к искажению в частях звукового диапазона, которые громче и наоборот. Именно поэтому вместо минимизации квадратичной ошибки, CELP минимизирует ошибки на взвешенной области. Взвешивающий результат по кривой W (z), как правило, вытекает из фильтра ЛКП при помощи расширения полосы пропускания:

где .

4. Модификации и области применения

Со временем алгоритм CEMP подвергся модификациям и изменениям, а также получил широкий круг применения.

Гибридное сжатие сочетает в себе лучшие качества рассмотренных ранее методов сжатия -- сжатие формы волны и использование вокодера. При этом создается голосовое сообщение высокого качества и небольшого объема. Такой метод широко используется в сотовой цифровой телефонии. Данная схема кодировки существенно экономит полосу пропускания в каналах распределенных сетей. Одно из последних усовершенствований рассматриваемого метода называется линейный предикативный кодер (code excited linear predictive -- CELP). Данный метод поддерживает "кодовую книгу" форм волны, представляющих звуки, которые может издавать человеческий голос. Каждой форме волны назначается бинарный код. Когда абонент говорит, все формы волн регистрируются и сравниваются с образцами, содержащимися в кодовой книге, и ближайшая по форме волна направляется по каналу в виде заранее заготовленного бинарного образца. Однако высокое качество, достигаемое при использовании такого метода, требует значительной мощности оборудования и большого объема памяти. При этом также возникает значительная задержка из-за продолжительного времени, затраченного на кодировку.

Другая вариация метода CELP называется CELP с малой задержкой (low-delay CELP). В данной модификации кодовая книга создается не на основе заранее заготовленных образцов, а на основе голоса самого говорящего, что приводит к уменьшению времени обработки сигнала и зачастую к более точному представлению голоса. Метод LD-CELP был принят в качестве стандарта ITU-T и получил название G.728. Он работает на скорости 16000 бит/с.

Третья модификация метода CELP стала возможной благодаря появлению спениатизи-рованных микропроцессорных чипов -- цифровых процессоров сигнсиюв (digital signal processor -- DSP). Использование алгебраического метода CELP связанной структуры (conjugate structure algebraic CELP -- CS-ACELP) позволяет добиться высокого качества звука при скорости 8000 бит/с. Первоначальный алгоритм LD-CELP был несколько модифицирован для повышения его эффективности и более точного воспроизведения исходного звука. Кодовая книга обладает большей способностью к адаптации, чем в методе CS-ACELP, поскольку она использует более сложный математический аппарат для оценки и кодирования сигнала. Ввиду лучшей адаптируемости метода легче происходит переход к другим языкам. При использовании исходного алгоритма CELP кодовая книга создавалась на основе звуков американского варианта английского языка, что ограничивало сферу использования данного метода. При использовании метода CS-CELP формы волн, содержащиеся в кодовой книге, могут бьпъ приспособлены к различным вариантам человеческой речи и, соответственно, к различным языкам. Такой метод был принят организацией ITU-Т в качестве стандарта и получил название G.729. Он имеет несколько базовых вариаций.

Стандарт G.729a также представляет собой метод кодировки CS-ACELP, однако его алгоритм несколько упрощен для повышения эффективности. Хотя качество, достигаемое при использовании этого метода, очень высокое, надежность его несколько ниже, чем у первоначального метода G.729. Двумя другими модификациями метода G.729 являются стандарты G.729B и G.729AB. Они также работают со скоростью 8 Кбит/с, однако содержат встроенный алгоритм определения голосовой активности (Voice Activity Detection -- VAD), который позволяет дополнительно экономить полосу пропускания.

К достоинствам гибридного метода сжатия следует отнести три основных фактора:

прекрасное качество звука;

значительная экономия полосы пропускания;

адаптируемость к особенностям речи абонента.

Недостатки гибридного сжатия перечислены ниже.

Для сжатия требуется специализированная аппаратура (процессор DSP).

Метод требует много памяти.

Гибридное сжатие увеличивает задержку, что связано с обработкой данных.

Размещено на Allbest.ru


Подобные документы

  • Методика разработки и механизм отладки программы на языке Лисп, реализующей криптографический алгоритм кодирования информации с открытым ключом – RSA. Математические и алгоритмические основы решения задачи, его программная модель, составление блок-схемы.

    курсовая работа [675,7 K], добавлен 20.01.2010

  • Разработка программы кодирования текстового файла при помощи блочного алгоритма шифрования ТЕА типа "Сеть Фейштеля", который основан на битовых операциях с 64-битным блоком и имеет 128-битный ключ шифрования. Результаты кодирования и декодирования.

    лабораторная работа [299,9 K], добавлен 18.07.2013

  • Методы арифметического кодирования. Основные функции программ, реализующие алгоритмы кодирования по методам Хаффмана, Голомба, Фибоначчи и Элиаса. Разработка программно-аппаратных средств оптимального арифметического кодирования и их экономический расчет.

    дипломная работа [1,1 M], добавлен 26.05.2012

  • Оценка вычислительной сложности программы. Реализация алгоритма кодирования информации Хаффмана. Кодировка теста двоичным кодом и в дереве Хаффмана. Бинарный код символов. Символ и частота его появления в тексте. Вычисление трудоемкости алгоритма.

    контрольная работа [21,0 K], добавлен 16.12.2012

  • Критерий разработки кодирующих устройств. Международный стандарт кодирования для передачи речи в телефонном канале PCM. Оценка качества сигнала. Задача спектрального оценивания. Гармонический алгоритм Берга. Системы синтеза речи. Форматы звуковых файлов.

    дипломная работа [905,3 K], добавлен 17.10.2012

  • Разработка с помощью пакета MATLAB ряда функций, осуществляющих сжатие речи по алгоритму векторного квантования, обеспечивающих сжатие речи до уровня 2400 бит/с и ниже, несколько ступеней сжатия. Дикторо-зависимый и дикторо-независимый режимы системы.

    курсовая работа [1,1 M], добавлен 12.03.2009

  • Особенности кодирования информации с помощью метода Хаффмана. Реализация кодера и декодера с использованием статического алгоритма Хаффмана. Структура программы, оценка ее эффективности (степени сжатия) в зависимости от типа и размера сжимаемых файлов.

    курсовая работа [136,2 K], добавлен 15.06.2013

  • Описание и особенности некоторых алгоритмов архивации. Построение кода Хаффмана. Динамический алгоритм построения кода Хаффмана. Обратное восстановление текста. Способы двухступенчатого кодирования информации. Практическая реализация алгоритма LZ77.

    курсовая работа [51,7 K], добавлен 24.12.2012

  • Основные определения и свойства колец и полей. Принцип расширения ключа (Key Expansion) для увеличения криптостойкости. Основные процедуры AddRoundKey, SubBytes, ShiftRows, MixColumns, играющие главную роль в работе алгоритма. Общий алгоритм работы AES.

    курсовая работа [569,2 K], добавлен 23.11.2013

  • Сущность линейного и двухмерного кодирования. Схема проверки подлинности штрих-кода. Анализ способов кодирования информации. Расчет контрольной цифры. Штриховое кодирование как эффективное направление автоматизации процесса ввода и обработки информации.

    презентация [1,1 M], добавлен 05.10.2014

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.