Исследование параметров мультимедийных файлов

Изучение основных форматов звуковых файлов wav, mp3 и установление зависимости размера файла различных форматов от степени сжатия с учетом субъективной оценки качества воспроизведения и с использованием полученных в результате анализа спектрограмм.

Рубрика Программирование, компьютеры и кибернетика
Вид лабораторная работа
Язык русский
Дата добавления 12.12.2011
Размер файла 18,6 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Лабораторная работа

"Исследование параметров мультимедийных файлов"

Цель работы

звуковой файл размер сжатие

Изучить основные форматы звуковых файлов WAV, MP3 и установить зависимости размера файла различных форматов от степени сжатия с учетом субъективной оценки качества воспроизведения и с использованием полученных в результате анализа спектрограмм.

1. Основные сведения о форматах звуковых файлов

Звуковые файлы могут иметь различные форматы; опираясь на данные замечательной книги [4], рассмотрим наиболее распространенные из них.

Формат AU. Этот простой и распространенный формат на системах Sun и NeXT (в последнем случае, правда, файл будет иметь расширение SND). Файл состоит из короткого служебного заголовка (минимум 28 байт), за которым непосредственно следуют звуковые данные. Широко используется в Unix-подобных системах и служит базовым для Java-машины.

Формат WAVE (WAV). Стандартный формат файлов для хранения звука в системе Windows. Является специальным типом другого, более общего формата RIFF (Resource Interchange File Format); другой разновидностью RIFF служат видеофайлы AVI. Файл RIFF составлен из блоков, некоторые из которых могут, в свою очередь, содержать другие вложенные блоки; перед каждым блоком данных помещается четырехсимвольный идентификатор и длина. Звуковые файлы WAV, как правило, более просты и имеют только один блок формата и один блок данных. В первом содержится общая информация об оцифрованном звуке (число каналов, частота дискретизации, характер зависимости громкости и т.д.), а во втором - сами числовые данные. Каждый отсчет занимает целое количество байт (например, 2 байта в случае 12-битовых чисел, старшие разряды содержат нули). При стереозаписи числа группируются парами для левого и правого канала соответственно, причем каждая пара образует законченный блок - для нашего примера его длина составит 4 байта. Такая, казалось бы, излишняя структурированность позволяет программному обеспечению оптимизировать процесс передачи данных при воспроизведении, но, как в подобных случаях всегда бывает, выигрыш во времени приводит к существенному увеличению размера файла.

Формат MP3 (MPEG Layer3). Это один из форматов хранения аудиосигнала, позднее утвержденный как часть стандартов сжатого видео. Природа получения данного формата во многом аналогична уже рассмотренному нами ранее сжатию графических данных по технологии JPEG. Поскольку произвольные звуковые данные обратимыми методами сжимаются недостаточно хорошо, приходится переходить к методам необратимым: иными словами, базируясь на знаниях о свойствах человеческого слуха, звуковая информация «подправляется» так, чтобы возникшие искажения на слух были незаметны, но полученные данные лучше сжимались традиционными способами. Это называется адаптивным кодированием и позволяет экономить на наименее значимых с точки зрения восприятия человека деталях звучания. Приемы, применяемые в MP3, непросты для понимания и опираются на достаточно сложную математику, но зато обеспечивают очень значительный эффект сжатия звуковой информации. Успехи технологии MP3 привели к тому, что ее применяют сейчас и во многих бытовых звуковых устройствах, например, плеерах и сотовых телефонах.

Формат MIDI. Название MIDI есть сокращение от Musical Instrument Digital Interface, т.е. цифровой интерфейс для музыкальных инструментов. Это довольно старый (1983 г.) стандарт, объединяющий разнообразное музыкальное оборудование (синтезаторы, ударные, освещение). MIDI базируется на пакетах данных, каждый из которых соответствует некоторому событию, в частности, нажатию клавиши или установке режима звучания. Любое событие может одновременно управлять несколькими каналами, каждый из которых относится к определенному оборудованию. Несмотря на свое изначальное предназначение, формат файла стал стандартным для музыкальных данных, которые при желании можно проигрывать с помощью звуковой карты компьютера безо всякого внешнего MIDI-оборудования. Главным преимуществом файлов MIDI является их очень небольшой размер, поскольку это не детальная запись звука, а фактически некоторый расширенный электронный эквивалент традиционной нотной записи. Но это же свойство одновременно является и недостатком: поскольку звук не детализирован, то разное оборудование будет воспроизводить его по-разному, что в принципе может даже заметно исказить авторский музыкальный замысел.

Формат MOD. Представляет собой дальнейшее развитие идеологии MIDI-файлов. Известные как «модули программ воспроизведения», они хранят в себе не только «электронные ноты», но и образцы оцифрованного звука, которые используются как шаблоны индивидуальных нот. Таким способом достигается однозначность воспроизведения звука. К недостаткам формата следует отнести большие затраты времени при наложении друг на друга шаблонов одновременно звучащих нот.

Итак, при обработке звука на компьютере можно воспользоваться уже имеющимися звуковыми файлами, а можно создать (ввести) их самостоятельно. Любые используемые файлы, даже сделанные специально для данного проекта, не всегда полностью соответствуют его потребностям. Для приведения звуковых материалов к необходимому виду используется процесс редактирования. В ходе редактирования можно подкорректировать небольшие дефекты записи (например, укоротить слишком длинную паузу или повысить уровень громкости фрагмента), перекомпоновать части звукового файла в нужном порядке или дополнить его из других файлов, сохранить данные в новом требуемом формате (скажем, преобразовать для экономии места в MP3). Важной задачей является изготовление мультимедийных документов, например, вставка полученного звукового файла в презентацию.

Таковы наиболее общие виды работы со звуковой информацией на компьютере. Заметим, что по смыслу они во многом аналогичны задачам компьютерной обработки текстовой и графической информации.

Формат файла определяет способ хранения содержащейся в нем информации и используется для того, чтобы файл можно было открыть и сохранить. На формат файла указывает 3-буквенное расширение, добавляемое в конце имени файла.

Звуковые файлы можно разделить на два типа: с оцифрованным звуком и с нотной записью.

2. Файлы с оцифрованным звуком

Файлы с оцифрованным звуком содержат значения амплитуды звукового сигнала, измеренные через одинаковые промежутки времени tд. Процесс замены непрерывного сигнала последовательностью его значений называют дискретизацией (sampling). Частота дискретизации (sampling rate) fд - величина, обратная промежутку времени между измерениями (fд = 1/tд), показывающая, сколько раз в секунду считывается значение сигнала, измеряется в герцах или килогерцах (Гц, кГц).

Каждое измеренное значение преобразуют в целое число длиной 8 или 16 битов со знаком или без (квантование, quantizing). Как и в магнитофоне, запись может осуществляться в режимах моно и стерео. Дискретизация и квантование выполняются аналого-цифровым преобразователем (АЦП). Воспроизводится оцифрованный звук с помощью цифро-аналогового преобразователя (ЦАП). Измеренная амплитуда звукового сигнала называется отсчетом (sample).

В соответствии с теоремой отсчетов (теорема Котельникова) в сигнале, измеряемом с частотой дискретизации fд, не должны содержаться гармонические компоненты с частотами выше fд/2, иначе цифровое представление сигнала не будет адекватно аналоговому. Значит, частота дискретизации должна быть как минимум вдвое больше максимальной частоты аналогового сигнала fmax: fд >= 2fmax.

Наиболее часто встречаются следующие частоты дискретизации: 8 (используется для оцифровывания телефонного сигнала), 11, 16, 22 и 44 кГц.

Процесс оцифровки называется импульсно-кодовой модуляцией (ИКМ).

Для осуществления ИКМ необходимо произвести 3 операции:

- дискретизацию сигналов во времени;

- квантование полученных импульсов по амплитуде;

- кодирование квантованных по амплитуде импульсов (преобразование квантованного импульса в число).

При квантовании непрерывно изменяющаяся величина преобразуется в ступенчато-изменяющуюся с заданными размерами ступеней. Этот процесс может выполняться с равномерными и неравномерными ступенями квантования. Ступень квантования - разность между двумя соседними заданными значениями квантованной величины. Так осуществляется преобразование аналогового звука в цифровой формат WAV. При этом в максимальной степени сохраняется исходный звук с определенной степенью точности, но размер файла оказывается достаточно большим. Например, при частоте дискретизации 44 кГц (16 битов на отсчет, стерео) размер файла будет составлять 44Ч16Ч2=1408 кбит в одной секунде звучания или 1408/8=176 кбайт. Поэтому часто используется сжатие звука, при этом удаляется часть информации, которую не воспринимает человеческое ухо.

Самый популярный на сегодняшний день цифровой формат аудиосжатия MP3. В алгоритме сжатия Mpeg Layer 3 обычно применяется обрезание маскированных частот (звуков такой частоты, которую человеческое ухо не улавливает или улавливает плохо).

Алгоритм сжатия использует особенности восприятия звуков человеческим ухом - так называемый, психоакустический эффект. Сигнал определенной частоты (тон), воздействуя на ухо, не позволяет различить (маскирует) другие тоны, близкие к нему по частоте и меньшие по амплитуде. В реальном звуковом сигнале одновременно присутствуют несколько маскирующих тонов на различных частотах.

Совокупным действием всех маскирующих тонов определяется граница маскирования - функция от частоты, определяющая минимальную амплитуду воспринимаемых сигналов. Компоненты сигнала, амплитуда которых лежит ниже границы маскирования, человеческим ухом не воспринимаются, поэтому их можно не передавать.

За счет вышеперечисленных вещей, а также специальных алгоритмов компрессии и достигается сжатие исходного файла (аналогично формату WAV) в 10-12 раз.

Таким образом, форматы с оцифрованным звуком являются наиболее универсальными и могут содержать любую звуковую информацию (музыку, речь, природные и любые другие звуки) с заранее заданным качеством.

3. Файлы с нотной записью

Файлы с нотной записью (MIDI) содержат последовательность команд, сообщающих какую ноту и каким инструментом и как долго нужно воспроизводить в тот или иной момент времени.

Формат может предусматривать одновременную игру нескольких музыкальных инструментов. Размер такого файла может быть в десятки и сотни раз меньше файлов с оцифрованным звуком. Однако такие файлы не могут воспроизводить речь, природные и любые другие звуки, а только музыку без слов. Это связано с тем, что в микросхеме звуковой платы записаны заранее синтезированные звуки основных музыкальных инструментов и, соответственно, воспроизводить музыку можно только теми инструментами, которые имеются в наличии, т.е. какие инструменты есть в оркестре, те и будут воспроизводить музыку.

4. Задание

1. Ознакомиться с форматами звуковых файлов WAV, MP3, MIDI.

2. Подобрать музыкальный фрагмент звукового файла формата WAV (размер файла будет зависеть от числа бит на один отсчет или разрядности квантования, частоты дискретизации, режима записи и продолжительности звучания) с продолжительностью звучания 10-15 с и частотным спектром, включающим частоты до 20 кГц.

3. Получить зависимости размера файла от частоты дискретизации для файлов формата WAV и степени сжатия для формата MP3 для переменной и постоянной скоростей воспроизведения (bitrate); исследовать влияние частоты дискретизации для файлов формата WAV и степени сжатия для формата MP3 на размеры файлов с учетом субъективной оценки качества воспроизведения и с использованием полученных в результате анализа спектрограмм для звукового фрагмента с наиболее богатым спектром.

4. Подобрать музыкальный фрагмент звукового файла формата MIDI, аналогичный исследуемому фрагменту формата WAV, и оценить его размер и качество звучания.

Размещено на Allbest.ru


Подобные документы

  • Формат звукового файла wav, способ его кодирования. Реализация возможностей воспроизведения звука в среде программирования MATLAB. Составление функциональной схемы программы. Апробирование информационной технологии воспроизведения звуковых файлов.

    курсовая работа [1,2 M], добавлен 13.02.2016

  • Исследование проблемы сравнения звуковых файлов и определение степени их схожести. Сравнение файлов с использованием метода нечеткого поиска, основанного на метрике (расстоянии) Левенштейна. Сравнение MIDI-файлов и реализация алгоритмов считывания.

    курсовая работа [2,0 M], добавлен 14.07.2012

  • Архивация и компрессия как методы сжатия изображений. Алгоритмы сжатия данных. Вспомогательные средства, которые используются для понижения объемов файлов: изменение цветовой модели изображения, изменение разрешения растрового файла, ресемплирование.

    презентация [45,3 K], добавлен 06.01.2014

  • Исследование основных видов программ-архиваторов. Сжатие файлов при архивации. Показатель степени сжатия файлов. Оценка функциональности самых популярных программ-упаковщиков. Технические характеристики процессов сжатия. Методы архивации без потерь.

    реферат [1,6 M], добавлен 05.12.2013

  • Обзор различных методик и программ кодировки информации. Восстановление поврежденных файлов. Конфиденциальность и контроль за личными сведениями. Преобразование форматов файлов и способов кодировки. Утилиты - конвертеры и перекодировщики. Windows Vista.

    курсовая работа [283,4 K], добавлен 14.11.2008

  • Описание промышленных компьютерных сетей. Анализ файлов, передаваемых по ним и общие требования к реализуемой библиотеке. Архитектура и уровни интерфейса библиотеки, принципы реализации алгоритмов исполняемых и неисполняемых структурированных файлов.

    дипломная работа [883,5 K], добавлен 12.08.2017

  • Особенности кодирования информации с помощью метода Хаффмана. Реализация кодера и декодера с использованием статического алгоритма Хаффмана. Структура программы, оценка ее эффективности (степени сжатия) в зависимости от типа и размера сжимаемых файлов.

    курсовая работа [136,2 K], добавлен 15.06.2013

  • Определение понятия "пиксел", его применение в компьютерной графике, коэффициент прямоугольности изображения. Характеристика файлов с расширениями bmp, gif, jpg, png, pcx, их особенности, достоинства и недостатки. Сравнение форматов графических файлов.

    реферат [17,9 K], добавлен 05.04.2009

  • Понятия файлов и каталогов. Область внешней памяти, группа файлов на одном носителе. Древовидная структура файлов на диске. Имя и местонахождение файла. Маршрут или путь по файловой системе. Запись имени файла в DOSе. Шаблоны. Структура каталога.

    лабораторная работа [15,2 K], добавлен 30.09.2008

  • Характеристика форматов файлов wav и mp3. Построение диаграмм прецедентов, разработка графического интерфейса и архитектуры приложения. Разработка алгоритмов работы программы: метод TrimWavFile, TrimMp3, ChangeVolume, speedUpX1_2, speedDownX1_2.

    курсовая работа [2,7 M], добавлен 20.12.2013

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.