Компрессия данных

Архивация файлов путем сжатия хранимой в них информации, характеризующийся процессом преобразования информации, хранящейся в файле, к виду, при котором уменьшается избыточность в ее представлении и требуется меньший объем памяти для ее хранения.

Рубрика Программирование, компьютеры и кибернетика
Вид курсовая работа
Язык русский
Дата добавления 28.05.2009
Размер файла 30,7 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Содержание

Понятие процесса архивации файлов.

Способы управления программой-архиватором.

Общие алгоритмы компрессии данных.

Назначение компрессии данных.

Компрессия 1С-Битрикс.

Программы для компрессирования (сжатия) данных bzip2 и gzip.

Характеристика наиболее распространенных архиваторов.

Тест наиболее популярных архиваторов.

Понятие процесса архивации файлов

Одним из наиболее широко распространенных видов сервисных программ являются программы-архиваторы, предназначенные для архивации, упаковки файлов путем сжатия хранимой в них информации.

Сжатие информации - это процесс преобразования информации, хранящейся в файле, к виду, при котором уменьшается избыточность в ее представлении и соответственно требуется меньший объем памяти для хранения.

Сжатие информации в файлах производится за счет устранения избыточности различными способами, например за счет упрощения кодов, исключения из них постоянных битов или представления повторяющихся символов или повторяющейся последовательности символов в виде коэффициента повторения и соответствующих символов. Применяются различные алгоритмы подобного сжатия информации.

Сжиматься могут как один, так и несколько файлов, которые в сжатом виде помещаются в так называемый архивный файл или архив.

Архивный файл - это специальным образом организованный файл, содержащий в себе один или несколько файлов в сжатом или несжатом виде и служебную информацию об именах файлов, дате и времени их создания или модификации, размерах и т.п.

Целью упаковки файлов обычно являются обеспечение более компактного размещения информации на диске, сокращение времени и соответственно стоимости передачи информации по каналам связи в компьютерных сетях. Кроме того, упаковка в один архивный файл группы файлов существенно упрощает их перенос с одного компьютера на другой, сокращает время копирования файлов на диски, позволяет защитить информацию от несанкционированного доступа, способствует защите от заражения компьютерными вирусами.

Степень сжатия файлов характеризуется коэффициентом Кс, определяемым как отношение объема сжатого файла Vc к объему исходного файла Vо, выраженное в процентах:

Кс=(Vc/Vo)*100%

Степень сжатия зависит от используемой программы, метода сжатия и типа исходного файла. Наиболее хорошо сжимаются файлы графических образов, текстовые файлы и файлы данных, для которых степень сжатия может достигать 5 - 40%, меньше сжимаются файлы исполняемых программ и загрузочных модулей - 60 - 90%. Почти не сжимаются архивные файлы. Программы для архивации отличаются используемыми методами сжатия, что соответственно влияет на степень сжатия.

Архивация (упаковка) - помещение (загрузка) исходных файлов в архивный файл в сжатом или несжатом виде.

Разархивация (распаковка) - процесс восстановления файлов из архива точно в таком виде, какой они имели до загрузки в архив. При распаковке файлы извлекаются из архива и помещаются на диск или в оперативную память;

Программы, осуществляющие упаковку и распаковку файлов, называются программами - архиваторами.

Большие по объему архивные файлы могут быть размещены на нескольких дисках (томах). Такие архивы называются многотомными. Том - это составная часть многотомного архива. Создавая архив из нескольких частей, можно записать его части на несколько дискет.

Способы управления программой-архиватором

Управление программой-архиватором осуществляется одним из двух способов:

· с помощью командной строки MS DOS, в которой формируется команда запуска, содержащая имя программы - архиватора, команду управления и ключи ее настройки, а также имена архивного и исходного файлов; подобное управление характерно для архиваторов ARJ, AIN, ZIP, РАК, LHA и др.;

· с помощью встроенной оболочки и диалоговых панелей, появляющихся после запуска программы и позволяющих вести управление с использованием меню и функциональных клавиш, что создает для пользователя более комфортные условия работы. Такое управление имеет программа - архиватор RAR.

Выполняя предписанные ей действия, программа-архиватор, как правило, выводит на экран протокол своей работы. Все современные программы - архиваторы оснащены экранами помощи, которые вызываются при вводе в командной строке только одного имени программы или имени с ключом. Помощь может быть краткой - на одном экране или развернутой - на нескольких. Многие архиваторы имеют экраны помощи с примерами составления команд для выполнения различных операций. Информация помощи обычно выводится на английском или другом международном языке.

Учитывая схожесть принципов управления большинством программ - архиваторов, рассмотрим главные особенности программы ARJ (версия 2.42), которая известна как одна из лучших по набору функций, предоставляемых пользователю, степени сжатия и скорости работы. Особенно эффективна программа ARJ при работе с файлами баз данных и текстовыми файлами.

Общие алгоритмы компрессии данных

Компрессия (сжатие) данных применяется для сокращения времени их передачи. Так как на компрессию данных передающая сторона тратит дополнительное время, к которому нужно еще прибавить аналогичные затраты времени на декомпрессию этих данных принимающей стороной, то выгоды от сокращения времени на передачу сжатых данных обычно бывают заметны только для низкоскоростных каналов. Этот порог скорости для современной аппаратуры составляет около 64 Кбит/с. Многие программные и аппаратные средства сети способны выполнять динамическую компрессию данных в отличие от статической, когда данные предварительно компрессируются (например, с помощью популярных архиваторов типа WinZip), а уже затем отсылаются в сеть.

На практике может использоваться ряд алгоритмов компрессии, каждый из которых применим к определенному типу данных. Некоторые модемы (называемые интеллектуальными) предлагают адаптивную компрессию, при которой в зависимости от передаваемых данных выбирается определенный алгоритм компрессии. Рассмотрим некоторые из общих алгоритмов компрессии данных.

Десятичная упаковка. Когда данные состоят только из чисел, значительную экономию можно получить путем уменьшения количества используемых на цифру бит с 7 до 4, используя простое двоичное кодирование десятичных цифр вместо кода ASCII. Просмотр таблицы ASCII показывает, что старшие три бита всех кодов десятичных цифр содержат комбинацию 011. Если все данные в кадре информации состоят из десятичных цифр, то, поместив в заголовок кадра соответствующий управляющий символ, можно существенно сократить длину кадра.

Относительное кодирование. Альтернативой десятичной упаковке при передаче числовых данных с небольшими отклонениями между последовательными цифрами является передача только этих отклонений вместе с известным опорным значением. Такой метод используется, в частности, в рассмотренном выше методе цифрового кодирования голоса ADPCM, передающем в каждом такте только разницу между соседними замерами голоса.

Символьное подавление. Часто передаваемые данные содержат большое количество повторяющихся байт. Например, при передаче черно-белого изображения черные поверхности будут порождать большое количество нулевых значений, а максимально освещенные участки изображения - большое количество байт, состоящих из всех единиц. Передатчик сканирует последовательность передаваемых байт и, если обнаруживает последовательность из трех или более одинаковых байт, заменяет ее специальной трехбайтовой последовательностью, в которой указывает значение байта, количество его повторений, а также отмечает начало этой последовательности специальным управляющим символом.

Коды переменной длины. В этом методе кодирования используется тот факт, что не все символы в передаваемом кадре встречаются с одинаковой частотой. Поэтому во многих схемах кодирования коды часто встречающихся символов заменяют кодами меньшей длины, а редко встречающихся - кодами большей длины. Такое кодирование называется также статистическим кодированием. Из-за того, что символы имеют различную длину, для передачи кадра возможна только бит-ориентированная передача.

При статистическом кодировании коды выбираются таким образом, чтобы при анализе последовательности бит можно было бы однозначно определить соответствие определенной порции бит тому или иному символу или же запрещенной комбинации бит. Если данная последовательность бит представляет собой запрещенную комбинацию, то необходимо к ней добавить еще один бит и повторить анализ. Например, если при неравномерном кодировании для наиболее часто встречающегося символа «Р» выбран код 1, состоящий из одного бита, то значение 0 однобитного кода будет запрещенным. Иначе мы сможем закодировать только два символа. Для другого часто встречающегося символа «О» можно использовать код 01, а код 00 оставить как запрещенный. Тогда для символа «А» можно выбрать код 001, для символа «П» - код 0001 и т. п.

Вообще, неравномерное кодирование наиболее эффективно, когда неравномерность распределения частот передаваемых символов достаточна велика, как при передаче длинных текстовых строк. Напротив, при передаче двоичных данных, например кодов программ, оно малоэффективно, так как 8-битовые коды при этом распределены почти равномерно.

Одним из наиболее распространенных алгоритмов, на основе которых строятся неравномерные коды, является алгоритм Хафмана, позволяющий строить коды автоматически, на основании известных частот символов. Существуют адаптивные модификации метода Хафмана, которые позволяют строить дерево кодов «на ходу», по мере поступления данных от источника.

Многие модели коммуникационного оборудования, такие как модемы, мосты, коммутаторы и маршрутизаторы, поддерживают протоколы динамической компрессии, позволяющие сократить объем передаваемой информации в 4, а иногда и в 8 раз. В таких случаях говорят, что протокол обеспечивает коэффициент сжатия 1:4 или 1:8. Существуют стандартные протоколы компрессии, например V.42bis, a также большое количество нестандартных, фирменных протоколов. Реальный коэффициент компрессии зависит от типа передаваемых данных, так, графические и текстовые данные обычно сжимаются хорошо, а коды программ - хуже.

Для повышения полезной скорости передачи данных в сетях применяется динамическая компрессия данных на основе различных алгоритмов. Коэффициент сжатия зависит от типа данных и применяемого алгоритма и может колебаться в пределах от 1:2 до 1:8.

Назначение компрессии данных

Всего несколько лет назад объем жесткого диска персонального компьютера обычно не превышал 20-40 Мбайт. Так как все файлы не помещались на таком маленьком диске, приходилось прибегать к разным ухищрениям, таким как удаление "лишних" файлов операционной системы MS-DOS и справочных файлов прикладных программ, применение программ-архиваторов и компрессованных логических дисков.

Сегодня вы с трудом найдете в продаже новый диск размером меньше, чем 1 Гбайт, а новые компьютеры комплектуются дисками еще большего объема. Всего за 300-400 долларов можно приобрести диск объемом 4-6 Гбайт, которого хватит надолго. Казалось бы, проблема с недостатком свободного дискового пространства исчезла и программы компрессии данных теперь не нужны. Однако такие программы не только не вышли из употребления, но и пользуются неослабевающей популярностью. Постоянно мы слышим о появлении новых средств, предназначенных для сжатия данных и рассчитанных на работу в самых современных операционных системах, таких как Microsoft Windows 95 и Microsoft Windows NT.

Для чего же нужно сжимать файлы, когда свободного места на диске вполне достаточно?

Чаще всего сжимаются те файлы, которые предназначены для передачи через сеть Internet по электронной почте, для размещения на серверах Web, FTP и серверах новостей. Дистрибутивы программ, поставляемые на дискетах, также обычно содержат сжатые файлы - просто для того чтобы дистрибутив занимал меньше дискет.

Существует достаточно веская причина, по которой информацию стараются передавать через Internet в сжатом виде. Это ограниченная скорость передачи данных, которая в случае модемного соединения редко превышает 2-3 Кбайт в секунду. Чем дольше передаются данные, тем больше вы заплатите своему поставщику услуг Internet за время работы в сети. Сэкономив десятки секунд на сжатии файла размером 3-5 Мбайт, вы потеряете в худшем случае десятки минут на передачу этого файла без компрессии. И это несмотря на то, что современный модем выполняет некоторое, не очень эффективное, сжатие данных.

К настоящему времени разработано несколько алгоритмов компрессии данных и выпущены десятки программ-архиваторов, предназначенных для уплотнения файлов. Работа всех этих программ основана на исключении избыточности информации, присущей почти всем файлам, хотя применяемые алгоритмы существенно различаются. В зависимости от использованного алгоритма сжатия и содержимого файла последний может "похудеть" при компрессии в несколько раз. Дополнительно программы-архиваторы могут зашифровать данные, что весьма полезно, если вам нужно передать через Internet конфиденциальную информацию.

Выбирая для себя программу-архиватор, вы должны учесть, что сейчас в мире наибольшей популярностью пользуются несколько форматов архива. Эти форматы обычно различаются по расширению имени файла архива. Ваш архиватор обязательно должен "понимать" архивы ZIP. Другой очень важный тип архива - ARJ. В сети Internet вам также могут встретиться архивы LHA, ICE, RAR и некоторые другие. Пользователи операционной системы UNIX применяют архивы TAR.

Хотя вы можете приобрести несколько программ архивации (по одной для каждого формата архива), удобнее работать с одной программой, способной распаковывать и упаковывать архивы всех или большинства из перечисленных выше форматов. В качестве примера можно привести такие приложения, как WinZip, разработанный компанией Niko Mak Computing Inc. (http://www.winzip.com/winzip) и Zip-IT компании Vertisoft Systems Inc. (http://www.quarterdeck.com). Первая из них может выступать в роли оболочки для архиваторов нескольких типов и очень удобна в работе. Особенностью второго приложения является то, что оно способно создавать самораспаковывающиеся архивы в виде программ для MS-DOS, Microsoft Windows 95 и Microsoft Windows NT. Архиваторы WinZip и Zip-IT способны встраиваться в графическую оболочку Windows, что дополнительно увеличивает их привлекательность, особенно для начинающих пользователей.

Отметим также программу LHA.EXE, предназначенную для создания архивов типа LHA в среде MS-DOS. При очень хороших характеристиках, эта программа абсолютно бесплатна и может свободно распространяться. По этой причине ее часто применяют для создания дистрибутивов коммерческих программных продуктов.

Что же касается средств компрессии данных, встроенных в операционные системы Microsoft Windows 95 и Microsoft Windows NT, то хотя они и удобны, едва ли их стоит использовать без крайней необходимости. Эти средства практически не замедляют работу современного компьютера, оснащенного быстродействующим процессором, однако восстановление данных в поврежденных компрессованных разделах диска представляет собой весьма сложную задачу.

Компрессия 1С-Битрикс

Современные технологии непрерывно развиваются и предоставляют все новые и новые средства коммуникации. На смену простым низкоскоростным устройствам, передающим информацию посредством телефонных линий (аналоговым модемам), приходят новые наукоемкие решения, позволяющие в считанные секунды отсылать большие объемы информации: цифровые асинхронные каналы на базе тех же телефонных линий, оптоволоконные и спутниковые сети. Вместе с тем, большая часть конечных получателей информации в интернете до сих пор использует низкоскоростные модемные линии в силу их дешевизны и простоты использования. Компания "1С-Битрикс" позаботилась о ваших клиентах, введя в систему "1С-Битрикс: Управление сайтом" сжатие страниц, позволяющее существенно сократить объем передаваемой информации. Сжатие реализуется модулем компрессии.

Модуль компрессирует страницы для ускорения вывода содержания сайта пользователям. Модуль в несколько раз (от 4 до 20!) уменьшает объем передаваемых HTML-данных между сайтом и браузером клиента, что существенно увеличивает скорость работы как для посетителей, так и для администраторов сайта.

Модуль не нуждается в каких-либо настройках. Эффективность работы модуля компрессии можно оценить, добавив в строке браузера параметр compress=Y. Например:

http://ourcompany.com/ru/partners/catalog.php?BID=10&compress=Y

При этом параметре внизу всех страниц будет выводиться таблица следующего вида: Библиотека компрессии

Размер страницы 38695

После сжатия 7375

Коэффициент сжатия 5.25

Примечание для разработчиков

Для оценки времени отгрузки страницы можно воспользоваться параметром show_page_exec_time=Y, при использовании которого в нижнем левом углу страницы отобразится время, затраченное на генерацию страницы (в отличие от времени, затраченного на передачу).

Программы для компрессирования (сжатия) данных bzip2 и gzip

Как вы наверно заметили, мы уже говорили об этих двух программах когда рассматривали tar. В отличии от winzip для Windows, архивирование и компрессия осуществляется двумя различными утилитами -: tar для архивации, и двумя программами для сжатия bzip2 и gzip. Рассмотрением этих двух программ мы сейчас и займемся. Кстати, возможно использование и других утилит для сжатия данных, таких как zip, arj, rar и прочих. Они также существуют для GNU/Linux, но весьма редко используются.

Программа bzip2 была написана для замены программы gzip. Она действительно показывает лучшие характеристики по степени сжатия данных, но, с другой стороны она потребляет значительно больше памяти при работе. По этой причине программа gzip все еще более широко используется, чем bzip2.

Обе эти команды имеют подобный синтаксис:

gzip [options] [file(s)]

В случае, когда не указывается filename, обе программы gzip и bzip2 будут ожидать данных со стандартного потока ввода или посылать результаты в стандартный поток вывода. Поэтому вы можете использовать обе эти программы в каналах. Они также имеют общий набор опций:

-1, ..., -9: устанавливает степень сжатия. Большее число - большая степень сжатия, но, соответственно и медленнее.

-d: разжать файл(ы). Это эквивалентно использованию программ gunzip или bunzip2;

-c: выбросить результаты компрессии/декомпрессии файлов, имена которых получены как параметры, в стандартный вывод.

Внимание

По умолчанию, обе программы gzip и bzip2 удаляют файлы, которые были компрессированы/декомпрессированы, если вы не используете опцию -c. В программе bzip2 вы можете избежать этого, используя опцию -k, но программа gzip не имеет подобной опции!

Теперь приведем несколько примеров. Допустим, мы желаем скомпрессировать все файлы в текущем каталоге, названия которых заканчиваются на .txt, используя программу bzip2. Вы можете сделать это так:

$ bzip2 -9 *.txt

Допустим, вы хотите дать попользоваться кому-то своими картинками, но у этого человека есть только gzip, а bzip2 напрочь отсутствует. Вам не прийдется декомпрессировать архив, а потом компрессировать его снова. Вы можете декомпрессировать его в стандартный вывод, использовать канал, скомпрессировать со стандартного ввода и перенаправить вывод в новый архив:

bzip2 -dc images.tar.bz2 | gzip -9 >images.tar.gz

Вот все и получилось. Кстати, вы можете вызвать bzcat вместо bzip2 -dc. Это работает и для программы gzip, но её имя zcat, но не gzcat. Также вы располагаете bzless (и по аналогии zless), которая предназначена для просмотра компрессированных файлов без предварительной декомпрессии. В качестве упражнения попробуйте найти команды, которые нужно ввести для просмотра сжатого файла без использования утилит bzless или zless.

Характеристика наиболее распространенных архиваторов

ZipGenius 6.0.3.1140

Новая версия достаточно известного архиватора. ZipGenius представляет собой мощное средство для архивирования данных. Данное программное обеспечение позволяет работать более чем с 20 различными форматами (rar, zip, ace, cab, 7zip, zip64 и другие). Также следует отметить, что этот архиватор позволяет создавать самораспаковывающиеся архивы. Отличительными особенностями представленной программы являются: возможность передачи файлов по протоколу FTP, работа с архивами по протоколу FTP, синхронизация данных с КПК, поддержка скинов. Данное программное обеспечение обладает достаточно удобным пользовательским интерфейсом, который обеспечит комфорт и простоту использования данного продукта.

KGB Archiver

Архиватор с невероятно высокой степенью сжатия. Обеспечивает более качественное сжатие информации, чем всем известные RAR, UHARC или 7zip. Использует один из самых надежных алгоритмов AES-256 для шифрования архивов. При этом, следует отметить повышенные требования к аппаратной части компьютера, в особенности к количеству оперативной памяти. В зависимости от уровня сжатия требуется от 9Mb до 1.6Gb ОЗУ. Поддерживается собственный формат KGB, а так же ZIP.

7-Zip 4.44а1

7-Zip -- это файловый архиватор с высокой степенью сжатия. Программа свободно распространяется на условиях лицензии GNU LGPL. Версия для командной строки была портирована для систем стандарта POSIX под названием p7zip.

Степень сжатия:

Результаты по степени сжатия сильно зависят от сжимаемых данных. Обычно 7-Zip сжимает в формат 7z на 30--50 % лучше, чем в формат zip, а в формат zip -- на 2--10 % лучше, чем другие zip-совместимые архиваторы.

В большинстве случаев степень сжатия выше, чем у Rar, за исключением некоторых мультимедиа-данных. Скорость сжатия при этом ниже, но не критично (как правило, не более чем на 30%).Более того, считается, что по степени сжатия 7-Zip уступает только архиваторам PAQ и его GUI-модификации KGB, которые, однако, имеют на порядок большее время сжатия.

Достоинства:

Ш свободное ПО (распространяется по лицензии GNU LGPL);

Ш бесплатность;

Ш высокая степень сжатия;

Ш высокая скорость распаковки;

Ш многопоточное сжатие.

Недостатки:

Ш в программе имеется множество точных настроек алгоритмов сжатия, в связи с чем, возможны трудности для начинающих пользователей;

Ш сжатие данных происходит на треть медленнее чем во многих популярных архиваторах при сжатии некоторых мультимедиа-данных уступает Rar'у;

Ш справка на русском языке отсутствует.

Размер файла 0,8МВ

ALZip

ALZip - это простая в работе и очень мощная утилита для компрессии файлов, бесплатная программа для домашнего использования.

Характеристики:

Ш без ограничений по времени работы;

Ш 100% полная функциональность;

Ш открывает 36 типов архивов и форматов сжатых файлов (более 36 расширений файлов);

Ш открывает файлы в форматах для записи CD: ISO и BIN;

Ш создает самораспаковывающиеся архивы SFX (EXE) и неограниченные по размеру архивы;

Ш создаёт ALZ, BH, CAB, TGZ, JAR, LZH, TAR, и ZIP архивы, это вдвое превышает возможности других утилит для компрессии;

Ш разделяет большие архивы на множество малых;

Ш Защита паролем обезопасит ваши данные.

Ш функция восстановления паролей поможет получить забытый пароль;

Ш простая в работе, даже маленькие дети смогут работать с программой.

Язык английский, но есть и русский перевод. Платформа ОС Windows 98, Me, NT, 2000, XP, 2003, Vista.

Размер файла 6 МВ.

PowerArchiver 9.64.03

Этот мощный архиватор полностью поддерживает работу со следующими форматами: ZIP ( в том числе Quake III Pk3, JAR - JavaARchiver, OWK, REP), CAB, 7-zip, LHA, LZH, TAR, TAR.GZ, TAR.BZ2 и BH (BlakHole), а также позволяет просматривать и извлекать файлы из архивов RAR (включая v.3), ACE (в т.ч. v.2.0), ARJ, CAB, LHA, TAR, GZIP, BZIP2, ARC, ZOO, BH. Кроме этого, поддерживается чтение и извлечение файлов из образов ISO, BIN, IMG и NRG.

Не являются лишними и встроенная в программу поддержка просмотра файлов очень многих форматов - TXT, RTF, ICO, WMF, EMF и 18 графических, а также опции быcтрой загрузки сжатых файлов на FTP-сервер или их отправки по e-mail.

Кроме стандартного интерфейса, программа допускает работу и в "проводниковоподобном" виде - с двумя окнами, при этом в левом окне будут располагаться папки-архивы в виде древовидной структуры, а в правом - их содержание.

Размер файла 4 МВ.

WinRAR 3.62

WinRAR - один из самых известных архиваторов. Поддерживается работа с архивами RAR, ZIP, CAB, ARJ, 7Z, GZ, LZH, BZIP2, JAR, ACE, TAR, UUE и ISO. Программа обеспечивает полное управление файлами в архивах, восстановление поврежденных архивов, шифрование, создание самораспаковывающихся и многотомных архивов и многое другое.

WinRAR очень прост в освоении и имеет удобный интерфейс.

Размер файла 1 МВ.

WinZip 11.7291

WinZip - одна из самых популярных утилит для сжатия данных. WinZip позволяет быстро сжимать и разжимать ваши файла в целях экономии дискового пространства и экономии времени при передачи их по сети. WinZip предлагает предварительный просмотр сжатых картинок плюс улучшенную компрессию для аудио файлов (WAV). Кроме .ZIP файлой WinZip работает с .BZ2 и .RAR файлами.

Тест наиболее популярных архиваторов

Программы для архивирования будут существовать еще немало времени, независимо от того, как велик объем используемого носителя достоверной информации. Же в случае, если можно разместить на диске побольше данных, то почему бы данного не сделать? Пересылая сжатые файлы по сети, можно увеличить скорость передачи достоверной информации.

Увеличение вычислительной мощности компьютеров способствует возникновению более сложных алгоритмов упаковки данных, при помощи которых можно получать файлы меньшего размера. В то же время совершенствуются, а также уже существующие алгоритмы. По этой причине вопрос "какой архиватор выбрать для сжатия?" не теряет актуальности. Именно по этой причине мы решили провести маленький тест, а также проверить, как распространеннейшие архиваторы справляются с компрессией файлов различных типов. При этом, мы обращали особое внимание, а также на скорость сжатия, же в некоторых случаях пользователь готов пожертвовать объемом, только бы архив был создан быстрее.

Прежде чем перейти напрямую к тестам, коротко остановимся на главных факторах, которые влияют на то, как сильно сжимаются данные:

Тип файлов. В случае, если файл, который нужно заархивировать, уже подвергался компрессии, его повторное сжатие маловероятно, что даст отличные результаты. Это относится, к примеру, к видеофайлам в формате DivX, к графическим файлам в формате JPEG, к файлам исполняемых программ.

Степень сжатия. В настройках каждого архиватора можно выбрать настройки сжатия. В случае, если целью является получить файлы как можно меньшего размера, выбирается наибольшая степень сжатия либо даже создание непрерывного архива (solid archive). А если имеет значение скорость, выбирается наименьшая степень сжатия.

Формат сжатия. Так как различные программы применяют различные алгоритмы сжатия, формат имеет довольно немаленькое значение. В данном обзоре мы остановимся на таких распространенных форматах как Zip, а также RAR.

Дать объективную оценку каждому из архиваторов чрезвычайно сложно, как минимум потому, что результаты архивирования чрезвычайно сильно отличаются, в зависимости от выбранных файлов. По этой причине, чтобы более достаточно точно оценить возможности любой из программ, мы решили провести серию пробных сжатий.

Для проведения теста мы создали несколько папок, в каждую из которых поместили файлы различных типов:

Графические файлы в формате Tif. Общее число файлов - 112 штук. Общий размер до архивации 200 520 282 байт;

Любительское видео с параметрами MJPG 320x240 30.00 fps 4535 Кб/c с настройками аудио PCM 11024 Году моно 88 Кб/c. Размер файла до архивации 203 396 754 байт;

Аудиофайлы в формате MP3 с различными настройками сжатия. Общее число файлов - 33. Общий размер до архивации 200 685 630 байт;

Файлы в формате DOC. Общее число файлов - 150. Общий размер до архивации 100 009 472 байт.

Каждая из 4 папок была заархивирована с наименьшими настройками сжатия (высокая скорость - немаленький размер файла), а также с наибольшими настройками сжатия (невысокая скорость - небольшой размер файла) в форматы Zip, Rar, а также Ace. Так как кое-какие из программ, которые мы отобрали для тестирования, поддерживают создание файлов в нескольких форматах, такие архиваторы как WinRar, а также Winace фигурировали в тесте дважды.

Для архивации использовались программы:

WinRar 3.51. Данный архиватор дает возможность появления архивов в форматах Zip, а также Rar, по этой причине тесты в программе были проведены для каждого из данных форматов сжатия. Независимо от того, что сегодня почти все архиваторы поддерживают раcпаковку файлов данного формата, архивировать в RAR можно только с помощью WinRar;

Winace 2.6. Программа разрешает создавать архивы в формате Zip, а также собственном формате Ace. Тесты были проведены для обоих форматов;

7-zip 4.31. Архиватор сжимает файлы в формат Zip, а также собственный формат 7z. Впрочем из-за специфики формата 7z он не был включен в тест. Эксплуатировать данный формат для сжатия данных немаленького размера не имеет смысла, так как он успешно работает чрезвычайно неспешно;

Power Archiver 2006 9.51. С помощью программы можно сжимать файлы в формат Zip;

Winzip 10. Программа производит сжатие в формат Zip.

Результаты тестов:

Результаты, которые получены для всех типов файлов после сжатия в формат Zip архиватором WinAce с наименьшими настройками, нас озадачили, так как они чрезвычайно сильно отличались от результатов, которые показали для формата Zip иные программы. Файлы, сжатые в формат Zip программой WinAce, были в значительной мере побольше, чем ZIP-архивы, которые получены с помощью иных утилит. По этой причине мы провели дополнительный тест - заархивировали все 4 папки с помощью WinAce, выбрав в настройках формата Zip опцию Store, то есть, "без компрессии". Размер полученных архивов по байтам совпал с размерами архивов, которые были получены при выборе наименьшей степени сжатия. Поэтому, возможно, создатели архиватора WinAce допустили ошибку в программе, вместо компрессии с наименьшей степенью сжатия в формат Zip программа файлы не сжимает.

В общем же, можно сказать, что стабильно отличные результаты показывает формат RAR. Приятно поразила степень сжатия MP3, а также видеофайлов, которые как правило практически не сжимаются. Последняя версия WinZip вдобавок дает неплохие результаты. В случае, если до выхода десятой версии программы альтернативные архиваторы сжимали файлы в формат Zip лучше WinZip, то сейчас высокейшая степень сжатия достигается именно при использовании данной программы.

Каждый, кто пробовал архивировать файлы различных типов несколькими архиваторами, знает, что предугадать заранее, какой результат планируется быть получен, зачастую бывает нельзя. Даже когда вы опытным путем выяснили, что графические файлы лучше всего сжимает архиватор 1, не исключено, что найдется такая картинка, которую лучше заархивирует архиватор 2. Именно по этой причине наши тесты нацелены, скорее, на отображение общих тенденций, их результаты не могут восприниматься как такие, которые действительны для всех файлов, которые вы будете сжимать.

Тем более, лидеры теста очевидны. Это Winrar, а также WinZip.Именно данные программы стоит эксплуатировать при сжатии немаленьких объемов файлов (по отношению к Winrar речь идет о сжатии в формат RAR, а не Zip). Когда вы архивируете немаленькие объемы данных для долгосрочного сохранения, имеет смысл потратить время, а также сжать файлы в оба формата, а после этого выбрать архив меньшего размера. А если такой возможности нет, лучше эксплуатировать формат RAR, т.к он в большинстве случаев дает лучшие результаты.


Подобные документы

  • Основные понятия и методы сжатия данных. Преобразование информации, хранящейся в файле, к виду, при котором уменьшается избыточность в ее представлении. Статистический и словарный способы сжатия. Программы-архиваторы, основные возможности WinRAR.

    контрольная работа [27,5 K], добавлен 12.03.2011

  • Архивация и компрессия как методы сжатия изображений. Алгоритмы сжатия данных. Вспомогательные средства, которые используются для понижения объемов файлов: изменение цветовой модели изображения, изменение разрешения растрового файла, ресемплирование.

    презентация [45,3 K], добавлен 06.01.2014

  • Архивация данных как сжатие одного или более файлов с целью экономии памяти. Степень сжатия разных файлов. Названия программ-архиваторов и их возможности. Формирование таблицы "Ведомость расчета заработной платы" в Microsoft Excel. Фильтрация записей.

    контрольная работа [1,7 M], добавлен 12.02.2013

  • Изучение понятия архивации, сжатия файлов с целью экономии памяти и размещения сжатых данных в одном архивном файле. Описания программ, выполняющих сжатие и восстановление сжатых файлов в первоначальном виде. Основные преимущества программ-упаковщиков.

    контрольная работа [534,7 K], добавлен 11.01.2015

  • Понятие процесса архивации файлов. Программы, осуществляющие упаковку и распаковку файлов. Защита информации от несанкционированного доступа. Самораспаковывающиеся архивы. Основные характеристики программ-архиваторов. Распространенные алгоритмы сжатия.

    презентация [801,6 K], добавлен 23.10.2013

  • Приобретение практических навыков по определению объема памяти, отводимого на внешнем запоминающем устройстве под файл данных. Расчет производительности поиска информации, хранящейся в файле на ВЗУ. Вычисление использованных кластеров и байт памяти.

    лабораторная работа [31,2 K], добавлен 26.11.2011

  • Общее понятие архивации. Особенности программ архиваторов. Основные методы сжатия информации. Методические основы изучения темы "Архивация данных и сжатие информации" на уроках информатики в базовом курсе. Разработка блока уроков по сжатию информации.

    курсовая работа [3,0 M], добавлен 03.06.2012

  • Утилиты архивации для создания резервных копий файлов путем помещения их в архив в сжатом виде. Операции над архивами. Алгоритмы архивации. Универсальные алгоритмы уплотнения. Формат задания команд. Степень сжатия файлов. Основные виды архиваторов.

    презентация [241,0 K], добавлен 13.08.2013

  • Основные действия при работе с архивами. Архиваторы как программы, осуществляющие сжатие (упаковку файлов). Понятие избыточности информации. Архивация с помощью оболочки WinRAR. Кодирование информации наиболее естественным, но не экономичным способом.

    презентация [416,5 K], добавлен 14.03.2015

  • Задачи обработки и хранения информации при помощи ЭВМ. Сжатие и кодирование информации в информационно-вычислительных комплексах. Метод Лавинского как простейший метод сжатия информации (числовых массивов) путем уменьшения разрядности исходного числа.

    курсовая работа [66,0 K], добавлен 09.03.2009

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.