Символы и алфавиты для кодирования информации
Сущность процесса кодирования. Способы и примеры кодирования информации. Кодирование текстовой и графической информации, векторное изображение графической информации. Формы кодирования звуковой информации. Особенности кодирования числовой информации.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | реферат |
Язык | русский |
Дата добавления | 05.05.2015 |
Размер файла | 873,4 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru
Школа N277
РЕФЕРАТ
Символы и алфавиты для кодирования информации
Выполнил
ученик 7 класса,
Тихомиров Илья
Санкт-Петербург 2015 г.
Введение
С древних времен знаки используются человеком для долговременного хранения информации и ее передачи на большие расстояния.
Основу любого языка составляет алфавит - конечный набор различных знаков (символов) любой природы, из которых складывается сообщение на данном языке.
Генетический алфавит является «азбукой», на которой строится единая система хранения и передачи наследственной информации живыми организмами. Как слова в языках образуются из букв, так и гены состоят из знаков генетического алфавита.
В процессе хранения, обработки и передачи информации в компьютере используется двоичная знаковая система, алфавит которой состоит всего из двух знаков. кодирование информация текстовый графический
В процессах восприятия, передачи, хранения информации живыми организмами, человеком, техническими устройствами происходит ее кодирование.
Системы счисления делятся на позиционные и непозиционные. Пример непозиционной системы счисления - римская: несколько чисел приняты за основные (например, I, V, X, L, C, D, M), а остальные получаются из основных путем сложения (как VI, VII) или вычитания (как IV, IX).
В непозиционных системах счисления от положения цифры в записи числа не зависит величина, которую она обозначает.
Пример 1. Число CCXXXII складывается из двух сотен, трех десятков и двух единиц и равно двумстам тридцати двум.
В позиционных системах счисления величина, обозначаемая цифрой в записи числа, зависит от позиции.
Здесь любое число записывается последовательностью цифр соответствующего алфавита, причем значение каждой цифры зависит от места (позиции), которое она занимает в этой последовательности. Например, в записи 555, сделанной в десятичной системе счисления, использована одна цифра 5, но в зависимости от занимаемого ею места она имеет разное количественное значение - 5 единиц, 5 десятков или 5 сотен.
В современных компьютерах применяются позиционные системы счисления, в основном двоичная система.
Форма представления данных, содержащая всего две цифры - 0 и 1 позволяет создавать достаточно простые технические устройства для представления (кодирования) и распознавания (дешифровки) информации.
Двоичное кодирование выбрали для того, чтобы максимально упростить конструкцию декодирующей машины, ведь дешифратор должен уметь различать всего два состояния (например, 1 - есть ток в цепи, 0 - тока в цепи нет). По этой причине двоичная система и нашла такое широкое применение.
Перевод числа из десятичной системы счисления в двоичную (1-й способ).
Этот способ перехода от записи числа в десятичною системе счисления к записи его в двоичной системе состоит в представлении числа в виде суммы степеней двойки и последующем выделении коэффициентов такого представления.
Код - набор условных обозначений для представления информации.
Кодирование - процесс представления информации в виде кода (представление символов одного алфавита символами другого; переход от одной формы представления информации к другой, более удобной для хранения, передачи или обработки).
Обратное преобразование называется декодированием.
Для общения друг с другом мы используем код - русский язык.
При разговоре этот код передается звуками, при письме - буквами.
Водитель передает сигнал с помощью гудка или миганием фар.
Мы встречаемся с кодированием информации при переходе дороги в виде сигналов светофора.
Таким образом, кодирование сводиться к использованию совокупности символов по строго определенным правилам.
Способ кодирования зависит от цели, ради которой оно осуществляется:
· сокращение записи;
· засекречивание (шифровка) информации;
· удобство обработки;
· и т. п.
Существуют три основных способа кодирования текста:
· графический - с помощью специальных рисунков или значков;
· числовой - с помощью чисел;
· символьный - с помощью символов того же алфавита, что и исходный текст.
Наиболее значимым для развития техники оказался способ представления информации с помощью кода, состоящего всего из двух символов: 0 и 1.
Для удобства использования такого алфавита договорились называть любой из его знаков «бит» (от английского «binary digit» -двоичный знак).
Одним битом могут быть выражены два понятия: 0 или 1 (да или нет, черное или белое, истина или ложь и т.п.).
Двоичные числа очень удобно хранить и передавать с помощью электронных устройств.
Поэтому данные в компьютере на физическом уровне хранятся, обрабатываются и передаются именно в двоичном коде.
Последовательностью битов можно закодировать текст, изображение, звук или какую-либо другую информацию.
Таким образом, двоичный код является универсальным средством кодирования информации.
Кодирование текстовой информации
Если каждому символу алфавита сопоставить определенное целое число (например, порядковый номер), то с помощью двоичного кода можно кодировать и текстовую информацию. Для хранения двоичного кода одного символа выделен 1 байт = 8 бит.
Учитывая, что каждый бит принимает значение 0 или 1, количество их возможных сочетаний в байте равно:
= 256
Значит, с помощью 1 байта можно получить 256 разных двоичных кодовых комбинаций и отобразить с их помощью 256 различных символов.
Такое количество символов вполне достаточно для представления текстовой информации, включая прописные и заглавные буквы русского и латинского алфавита, цифры, знаки, графические символы и т.д.
Кодирование заключается в том, что каждому символу ставится в соответствие уникальный десятичный код от 0 до 255 или соответствующий ему двоичный код от 00000000 до 11111111.
Важно, что присвоение символу конкретного кода - это вопрос соглашения, которое фиксируется в кодовой таблице.
Кодирование текстовой информации с помощью байтов опирается на несколько различных стандартов, но первоосновой для всех стал стандарт ASCII (American Standart Code for Information Interchange), разработанный в США в Национальном институте ANSI (American National Standarts Institute).
С распространением современных информационных технологий в мире возникла необходимость кодировать символы алфавитов других языков: японского, корейского, арабского, хинди, а также других специальных символов.
На смену старой системе пришла новая универсальная - UNICODE, в которой один символ кодируется не одним, а двумя байтами.
В настоящее время существует много различных кодовых таблиц (DOS, ISO, WINDOWS, KOI8-R, KOI8-U, UNICODE и др.), поэтому тексты, созданные в одной кодировке, могут не правильно отображаться в другой.
Кодирование графической информации
Графическая информация на экране монитора представляется в виде растрового изображения, которое формируется из определенного количества строк, которые, в свою очередь, содержат определенное количество точек.
Если посмотреть на экран компьютера через увелечительное стекло, то в зависимости от марки и модели техники мы увидим либо множество разноцветных прямоугольничков, либо множество разноцветных кружочков.
И те, и другие группируются по три штуки, причем одного цвета, но разных оттенков.
Они называются ПИКСЕЛЯМИ (от английского PICture's ELement).
Пиксели бывают только трех цветов - зеленого, синего и красного.
Рассмотрим самый простой случай - каждый кусочек пикселя может либо гореть (1), либо не гореть (0). Тогда мы получаем следующий набор цветов:
Число цветов, воспроизводимых на экране монитора (N), и число бит, отводимых в видеопамяти на каждый пиксель (I), связаны формулой:
Величину I называют битовой глубиной или глубиной цвета.
Чем больше битов используется, тем больше оттенков цветов можно получить.
Итак, любое графическое изображение на экране можно закодировать c помощью чисел, сообщив, сколько в каждом пикселе долей красного, сколько - зеленого, а сколько - синего цветов.
Также графическая информация может быть представлена в виде векторного изображения.
Векторное изображение представляет собой графический объект, состоящий из элементарных отрезков и дуг.
Положение этих элементарных объектов определяется координатами точек и длиной радиуса.
Информация о векторном изображении кодируется как обычная буквенно-цифровая и обрабатывается специальными программами.
Качество изображения определяется разрешающей способностью монитора, т.е. количеством точек, из которых оно складывается.
Графическую информацию можно представлять в двух формах: аналоговой или дискретной. Живописное полотно, цвет которого изменяется непрерывно - это пример аналогового представления, а изображение, напечатанное при помощи струйного принтера и состоящее из отдельных точек разного цвета - это дискретное представление. Путем разбиения графического изображения (дискредитации) происходит преобразование графической информации из аналоговой формы в дискретную. Ее можно сравнить с построением изображения из большого количества маленьких цветных фрагментов (метод мозаики). Все изображение разбивается на отдельные точки, каждому элементу ставится в соответствие код его цвета. При этом качество кодирования будет зависеть от следующих параметров: размера точки и количества используемых цветов. Чем меньше размер точки, а, значит, изображение составляется из большего количества точек, тем выше качество кодирования.
Чем большее количество цветов используется (т. е. точка изображения может принимать больше возможных состояний), тем больше информации несет каждая точка, а, значит, увеличивается качество кодирования. Создание и хранение графических объектов возможно в нескольких видах - в виде векторного, фрактального или растрового изображения. Отдельным предметом считается 3D (трехмерная) графика, в которой сочетаются векторный и растровый способы формирования изображений. Она изучает методы и приемы построения объемных моделей объектов в виртуальном пространстве. Для каждого вида используется свой способ кодирования графической информации. Векторное изображение представляет собой графический объект, состоящий из элементарных геометрических фигур.
Растровое изображение представляет собой совокупность точек (пикселей), полученных в результате дискретизации изображения в соответствии с матричным принципом.
Матричный принцип кодирования графических изображений заключается в том, что изображение разбивается на заданное количество строк и столбцов. Затем каждый элемент полученной сетки кодируется по выбранному правилу.
При помощи увеличительного стекла можно увидеть, что черно-белое графическое изображение, например из газеты, состоит из мельчайших точек, составляющих определенный узор - растр.
Во Франции в 19 веке возникло новое направление в живописи - пуантилизм. Его техника заключалась в том, что на холст рисунок наносился кистью в виде разноцветных точек. Также этот метод издавна применяется в полиграфии для кодирования графической информации. Точность передачи рисунка зависит от количества точек и их размера.
Объем растрового изображения определяется умножением количества пикселей (на информационный объем одной точки, который зависит от количества возможных цветов. Качество изображения определяется разрешающей способностью монитора. Чем она выше, то есть больше количество строк растра и точек в строке, тем выше качество изображения. В современных ПК в основном используют следующие разрешающие способности экрана: 640 на 480, 800 на 600, 1024 на 768 и 1280 на 1024 точки.
Если говорить о черно-белых иллюстрациях, то, если не использовать полутона, то пиксель будет принимать одно из двух состояний: светится (белый) и не светится (черный). А так как информация о цвете пикселя называется кодом пикселя, то для его кодирования достаточно одного бита памяти: 0 - черный, 1 - белый. Если же рассматриваются иллюстрации в виде комбинации точек с 256 градациями серого цвета, то достаточно восьмиразрядного двоичного числа для того чтобы закодировать яркость любой точки. В компьютерной графике чрезвычайно важен цвет. Он выступает как средство усиления зрительного впечатления и повышения информационной насыщенности изображения.
Цветовые модели. Применяют несколько систем кодирования: HSB, RGB и CMYK. Первая цветовая модель проста и интуитивно понятна, т. е. удобна для человека, вторая наиболее удобна для компьютера, а последняя модель CMYK-для типографий.
1) Модель HSB характеризуется тремя компонентами: оттенок цвета (Hue), насыщенность цвета (Saturation) и яркость цвета (Brightness). Можно получить большое количество произвольных цветов, регулируя эти компоненты.
Эту цветовую модель лучше применять в тех графических редакторах, в которых изображения создают сами, а не обрабатывают уже готовые.
Затем созданное свое произведение можно преобразовать в цветовую модель RGB, если ее планируется использовать в качестве экранной иллюстрации, или CMYK, в качестве печатной.
2) Принцип метода RGB заключается в следующем: известно, что любой цвет можно представить в виде комбинации трех цветов: красного (Red, R), зеленого (Green, G), синего (Blue, B). Другие цвета и их оттенки получаются за счет наличия или отсутствия этих составляющих. По первым буквам основных цветов система и получила свое название - RGB.
Данная цветовая модель является аддитивной, то есть любой цвет можно получить сочетание основных цветов в различных пропорциях. При наложении одного компонента основного цвета на другой яркость суммарного излучения увеличивается. Если совместить все три компоненты, то получим ахроматический серый цвет, при увеличении яркости которого происходит приближение к белому цвету.
3) Принцип метода CMYK. Эта цветовая модель используется при подготовке публикаций к печати. Каждому из основных цветов ставится в соответствие дополнительный цвет (дополняющий основной до белого). Получают дополнительный цвет за счет суммирования пары остальных основных цветов. Значит, дополнительными цветами для красного является голубой (Cyan,C) = зеленый + синий = белый - красный, для зеленого - пурпурный (Magenta, M) = красный + синий = белый - зеленый, для синего - желтый (Yellow, Y) = красный + зеленый = белый - синий. Причем принцип декомпозиции произвольного цвета на составляющие можно применять как для основных, так и для дополнительных, то есть любой цвет можно представить или в виде суммы красной, зеленой, синей составляющей или же в виде суммы голубой, пурупурной, желтой составляющей. В основном такой метод принят в полиграфии. Но там еще используют черный цвет (BlacК, так как буква В уже занята синим цветом, то обозначают буквой K). Это связано с тем, что наложение друг на друга дополнительных цветов не дает чистого черного цвета.
Векторное и фрактальное изображения. К программным средствам создания и обработки векторной графики относятся следующие ГР: CorelDraw, Adobe Illustrator, а также векторизаторы (трассировщики) - специализированные пакеты преобразования растровых изображений в векторные. Фрактальная графика основывается на математических вычислениях, как и векторная. Но в отличии от векторной ее базовым элементом является сама математическая формула.
Кодирование звуковой информации
С начала 90-х годов персональные компьютеры получили возможность работать со звуковой информацией. Каждый компьютер, имеющий звуковую плату, микрофон и колонки, может записывать, сохранять и воспроизводить звуковую информацию. Звук представляет собой звуковую волну с непрерывно меняющейся амплитудой и частотой. Звук, в широком смысле -- упругие волны, распространяющиеся в какой-либо упругой среде и создающие в ней механические колебания. Всякий реальный звук, будь то игра музыкальных инструментов или голос человека, - это своеобразная смесь многих гармонических колебаний с определенным набором частот.
Звуковую информацию можно представить в дискретной или аналоговой форме.
Виниловая пластинка является примером аналогового хранения звуковой информации, так как звуковая дорожка свою форму изменяет непрерывно.
Но у аналоговых записей на магнитную ленту есть большой недостаток - старение носителя. Поэтом Интерпретация, то есть истолкование смысла одного и того же машинного кода, может быть самой разной. Один и тот же код разными программами может рассматриваться и как число, и как текст, и как изображение, и как звук. Другими словами, как именно трактуется тот или иной машинный код, определяется обрабатывающей этот код программой у преимущество отдают цифровой записи.
Кодирование видеоинформации еще более сложная проблема, чем кодирование звуковой информации, так как нужно позаботиться не только о дискретизации непрерывных движений, но и о синхронизации изображения со звуковым сопровождением.
В настоящее время для этого используется формат, которой называется AVI- чередующееся аудио и видео. Основные мультимедийные форматы очень требовательны к памяти. Поэтому на практике применяются различные способы компрессии, то есть сжатия звуковых и видео- кодов.
Процесс преобразования звуковых волн в двоичный код в памяти компьютера:
Процесс воспроизведения звуковой информации, сохраненной в памяти компьютера:
Аудиоадаптер (звуковая плата) - специальное устройство, подключаемое к компьютеру, предназначенное для преобразования электрических колебаний звуковой частоты в числовой двоичный код при вводе звука и для обратного преобразования (из числового кода в электрические колебания) при воспроизведении звука. В процессе записи звука аудиоадаптер с определенным периодом измеряет амплитуду электрического тока и заносит в регистр двоичный код полученной величины.
Затем полученный код из регистра переписывается в оперативную память компьютера.
Частота дискретизации - это количество измерений входного сигнала за 1 секунду.
Частота измеряется в герцах (Гц).
Одно измерение за одну секунду соответствует частоте 1 Гц.
1000 измерений за 1 секунду - 1 килогерц (кГц).
Звуковой файл - файл, хранящий звуковую информацию в числовой двоичной форме.
Кодирование числовой информации
Сходство в кодировании числовой и текстовой информации состоит в следующем: чтобы можно было сравнивать данные этого типа, у разных чисел (как и у разных символов) должен быть различный код. Основное отличие числовых данных от символьных заключается в том, что над числами кроме операции сравнения производятся разнообразные математические операции: сложение, умножение, извлечение корня, вычисление логарифма и пр. Многовековая история развития математики показывает, что именно позиционный принцип позволяет использовать эти правила как универсальные алгоритмы, справедливые для системы счисления с любым основанием: 2,3, 8, 10, 16, 60 и пр.
Система счисления - совокупность приемов обозначения чисел, способ записи чисел.
Все системы счисления делятся на позиционные и непозиционные.
Непозиционными системами являются такие системы счисления, в которых каждый символ сохраняет свое значение независимо от места его положения в числе.
Примером непозиционной системы счисления является римская система. К недостаткам таких систем относятся наличие большого количества знаков и сложность выполнения арифметических операций. Система счисления называется позиционной, если одна и та же цифра имеет различное значение, определяющееся позицией цифры в последовательности цифр, изображающей число. Это значение меняется в однозначной зависимости от позиции, занимаемой цифрой, по некоторому закону.
Примером позиционной системы счисления является десятичная система, используемая в повседневной жизни.
В десятичной системе используются десять цифр: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9; эта система имеет основанием число десять.
Двоичная система счисления. Используется две цифры: 0 и 1.
Восьмеричная система счисления.
Используется восемь цифр: 0, 1, 2, 3, 4, 5, 6, 7. Употребляется в ЭВМ как вспомогательная для записи информации в сокращенном виде. Для представления одной цифры восьмеричной системы используется три двоичных разряда (триада).
Шестнадцатеричная система счисления. Для изображения чисел употребляются 16 цифр. Первые десять цифр этой системы обозначаются цифрами от 0 до 9, а старшие шесть цифр - латинскими буквами: 10-A, 11-B, 12-C, 13-D, 14-E, 15-F. Шестнадцатеричная система используется для записи информации в сокращенном виде.
Для представления одной цифры шестнадцатеричной системы счисления используется четыре двоичных разряда (тетрада)
Азбука Брайля -- специальная азбука, созданная Брайлем для воспроизведения текста в изданиях для слепых. Каждый знак в тексте печатают в виде комбинации одной -шести выпуклых точек, расположенных на площади прямоугольника. Чтение текста, напечатанного А. Б., основано на осязании рельефных точек и восприятии их комбинаций.
Шрифт Брайля -- рельефно-точечный шрифт, предназначенный для письма и чтения незрячими людьми. Он был разработан в 1821 году французом Луи Брайлем (фр. Louis Braille), сыном сапожника. Луи в возрасте трёх лет потерял зрение, в результате воспаления глаз, начавшегося от того, что мальчик поранился шорным ножом (подобие шила) в мастерской отца. В возрасте 15 лет он создал свой рельефно-точечный шрифт (в противоположность рельефно-линейному шрифту Валентина Гаюи)
Для изображения букв в шрифте Брайля используются 6 точек, расположенных в два столбца, по 3 в каждом. Одной из особенностей шрифта Брайля является то, что пишется текст справа налево, затем страница переворачивается, и текст читается слева направо. При письме прокалываются точки, и поскольку читать можно только по выпуклым точкам, «писать» текст приходится с обратной стороны листа. В этом заключается одна из сложностей при обучении этому шрифту.
Нумерация точек идёт сверху вниз по столбцам. Нумерация точек при записи идёт в обратном порядке -- сначала по правому столбцу, затем по левому: точка 1 находится в верхнем правом углу, под ней -- точка 2, в нижнем правом углу -- точка 3. В левом верхнем углу находится точка 4, под ней -- точка 5, в левом нижнем -- точка 6. Наличие или отсутствие точек (проколов) в ячейке дает определенный символ. Высоты точки в 0,5 мм достаточно для ее распознавания на ощупь.
Расстояние между точками занимает около 2,5 мм, расстояние между ячейками -- 3,75 мм по горизонтали и 5 мм по вертикали. Стандартная страница с текстом Брайля вмещает до 25 строк по 40--43 ячейки.
Существует всего 63 различных символа.
Вследствие такой ограниченности общего числа различных комбинаций точек, часто используются двуклеточные знаки (состоящие из двух знаков, по отдельности имеющих свои функции), дополнительные знаки (большие и малые буквы разных алфавитов, цифровой знак и т. д.).
Каждая комбинация имеет несколько значений, порой доходящих почти до десятка.
Вывод:
Интерпретация, то есть истолкование смысла одного и того же машинного кода, может быть самой разной. Один и тот же код разными программами может рассматриваться и как число, и как текст, и как изображение, и как звук. Другими словами, как именно трактуется тот или иной машинный код, определяется обрабатывающей этот код программой.
Список использованных источников
1) http://ru.wikipedia.org
2) http://www.coolreferat.com
3) http://www.mylect.ru
4) http://www.informlic.ru
5) http://images.yandex.ru
Размещено на Allbest.ru
Подобные документы
Понятие информации и основные принципы ее кодирования, используемые методы и приемы, инструментарий и задачи. Специфические особенности процессов кодирования цифровой и текстовой, графической и звуковой информации. Логические основы работы компьютера.
курсовая работа [55,8 K], добавлен 23.04.2014Представление информации в двоичной системе. Необходимость кодирования в программировании. Кодирование графической информации, чисел, текста, звука. Разница между кодированием и шифрованием. Двоичное кодирование символьной (текстовой) информации.
реферат [31,7 K], добавлен 27.03.2010Понятие и отличительные черты аналоговой и цифровой информации. Изучение единиц измерения цифровой информации: бит (двоичная цифра) и байт. Особенности передачи, методы кодирования и декодирования текстовой, звуковой и графической цифровой информации.
реферат [479,4 K], добавлен 22.03.2010Знакомство с идеей векторного способа представления изображений в цифровом виде. Разработка последовательности команд для кодирования графического объекта. Основные команды; двоичное кодирование графической информации, растровый и векторный варианты.
презентация [128,5 K], добавлен 05.01.2012Сущность линейного и двухмерного кодирования. Схема проверки подлинности штрих-кода. Анализ способов кодирования информации. Расчет контрольной цифры. Штриховое кодирование как эффективное направление автоматизации процесса ввода и обработки информации.
презентация [1,1 M], добавлен 05.10.2014Методы компрессии информации. Обзор и характеристика существующих методов сжатия информации, основанных на процедуре кодирования Хаффмена. Алгоритмы динамического кодирования методом FGK и Виттера. Программная реализация и руководство пользователя.
курсовая работа [33,2 K], добавлен 09.03.2009Анализ способов кодирования информации. Разработка устройства кодирования (кодера) информации методом Хемминга. Реализация кодера–декодера на базе ИМС К555ВЖ1. Разработка стенда контроля передаваемой информации, принципиальная схема устройства.
дипломная работа [602,9 K], добавлен 30.08.2010Методы арифметического кодирования. Основные функции программ, реализующие алгоритмы кодирования по методам Хаффмана, Голомба, Фибоначчи и Элиаса. Разработка программно-аппаратных средств оптимального арифметического кодирования и их экономический расчет.
дипломная работа [1,1 M], добавлен 26.05.2012Быстрый и надёжный ввод информации о товаре в ЭВМ. Внедрение системы штрихового кодирования в торговле, банковском деле, на транспорте, в медицине и других сферах народного хозяйства. Способы кодирования информации. Регулирование и стандартизация.
реферат [36,0 K], добавлен 07.05.2009Описание устройств ввода графической, звуковой информации, их назначение, классификация, конструкция, характеристики. Графические планшеты, сканнеры. Анализ способов представления и кодирования информации. Программные средства для архивации данных.
контрольная работа [31,2 K], добавлен 22.11.2013