Технологии обработки текстовой информации

Краткая история развития кодировок, разновидности программ, позволяющих осуществлять обработку текстовой информации. Исследование программы Microsoft Word как наиболее распространенного редактора документов, использующего технологии обработки информации.

Рубрика Программирование, компьютеры и кибернетика
Вид реферат
Язык русский
Дата добавления 19.06.2013
Размер файла 21,3 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

РЕФЕРАТ

Технологии обработки текстовой информации

Введение

Каждый пользователь компьютера встречается с необходимостью подготовки, редактирования, той или иной текстовой информации. Одними из первых программ, созданных для компьютера, были системы обработки текстов или, как их стали называть, текстовые редакторы.

1. Представление информации в компьютере

Первой проблемой, с которой столкнулись разработчики, оказалось представление текстовой информации на понятном для компьютера языке.

Компьютер - это электронная машина, которая работает с сигналами. [1] Вся информация, содержащаяся в компьютере, представлена в виде числовой последовательности. Последовательность представлена «двоичным кодом», то есть вся информация закодирована с помощью всего двух символов 1 и 0, которые легко представляются сигналами.

Вся информация, с которой работает компьютер, кодируется числами. Независимо от того, графическая, текстовая или звуковая эта информация, что бы ее мог обрабатывать центральный процессор она должна тем или иным образом быть представлена числами.

Текстовая информация, как и любая другая, хранится в памяти компьютера в двоичном виде. Для этого каждому символу ставится в соответствие некоторое неотрицательное число, называемое кодом символа, и это число записывается в память ЭВМ в двоичном виде. Конкретное соответствие между символами и их кодами называется системой кодировки.

В современных ЭВМ, в зависимости от типа операционной системы и конкретных прикладных программ, используются 8-разрядные и 16-разрядные (Windows 95, 98, NT) коды символов. Использование 8-разрядных кодов позволяет закодировать 256 различных знаков, этого вполне достаточно для представления многих символов, используемых на практике. При такой кодировке для кода символа достаточно выделить в памяти один байт. Так и делают: каждый символ представляют своим кодом, который записывают в один байт памяти.

персональных компьютерах обычно используется система кодировки ASCII (American Standard Code for Information Interchange - американский стандартный код для обмена информации). Он введен в 1963 г. и ставит в соответствие каждому символу семиразрядный двоичный код. Легко определить, что в коде ASCII можно представить 128 символов.

В системе ASCII закреплены две таблицы кодирования базовая и расширенная. Базовая таблица закрепляет значения кодов от 0 до 127, а расширенная относится к символам с номерами от 128 до 255.

Первые 32 кода базовой таблицы, начиная с нулевого, отданы производителям аппаратных средств. В этой области размещаются управляющие коды, которым не соответствуют ни какие символы языков. Начиная с 32 по 127 код размещены коды символов английского алфавита, знаков препинания, арифметических действий и некоторых вспомогательных символов.

Кодировка символов русского языка, известная как кодировка Windows-1251, была введена «извне» - компанией Microsoft, но, учитывая широкое распространение операционных систем и других продуктов этой компании в России, она глубоко закрепилась и нашла широкое распространение.

Другая распространённая кодировка носит название КОИ-8 (код обмена информацией, восьмизначный) - её происхождение относится к временам действия Совета Экономической Взаимопомощи государств Восточной Европы. Сегодня кодировка КОИ - 8 имеет широкое распространение в компьютерных сетях на территории России и в российском секторе Интернета.

Международный стандарт, в котором предусмотрена кодировка символов русского языка, носит название ISO (International Standard Organization - Международный институт стандартизации). На практике данная кодировка используется редко.

Универсальная система кодирования текстовых данных.

Если проанализировать организационные трудности, связанные с созданием единой системы кодирования текстовых данных, то можно прийти к выводу, что они вызваны ограниченным набором кодов (256). В то же время, очевидно, что если, кодировать символы не восьмиразрядными двоичными числами, а числами с большим разрядом то и диапазон возможных значений кодов станет на много больше. Такая система, основанная на 16-разрядном кодировании символов, получила название универсальной - UNICODE. Шестнадцать разрядов позволяют обеспечить уникальные коды для 65 536 различных символов - этого поля вполне достаточно для размещения в одной таблице символов большинства языков планеты.

Несмотря на тривиальную очевидность такого подхода, простой механический переход на данную систему долгое время сдерживался из-за недостатков ресурсов средств вычислительной техники (в системе кодирования UNICODE все текстовые документы становятся автоматически вдвое длиннее). Во второй половине 90-х годов технические средства достигли необходимого уровня обеспечения ресурсами, и сегодня мы наблюдаем постепенный перевод документов и программных средств на универсальную систему кодирования.

2. Отличия текстовых редакторов от редакторов документов

кодировка текстовый word редактор

Текстовая информация может возникать из различных источников и иметь различную степень сложности по форме представления. В зависимости от формы представления для обработки текстовых сообщений используют разнообразные информационные технологии. Чаще всего в качестве инструментального средства обработки текстовой электронной информации применяют текстовые редакторы или процессоры. Они представляют программный продукт, обеспечивающий пользователя специальными средствами, предназначенными для создания, обработки и хранения текстовой информации. Текстовые редакторы и процессоры используются для составления, редактирования и обработки различных видов информации. Отличие текстовых редакторов от процессоров заключается в том, что редакторы, как правило, предназначены для работы только с определенным видом информации (тексты, формулы и др.), а процессоры позволяют использовать и другие виды информации.

Редакторы, предназначенные для подготовки текстов условно можно разделить на обычные (подготовка писем и других простых документов) и сложные (оформление документов с разными шрифтами, включающие графики, рисунки и др.). Редакторы, используемые для автоматизированной работы с текстом, можно разделить на несколько типов: простейшие, интегрированные, гипертекстовые редакторы, распознаватели текстов, редакторы научных текстов, издательские системы.

В простейших редакторах-форматерах (например, «Блокнот») для внутреннего представления текста дополнительные коды не используются, тексты же обычно формируются на основе знаков кодовой таблицы ASCII.

Большинство текстовых процессоров поддерживает концепцию составного документа - контейнера, включающего различные объекты. Она позволяет вставлять в текст документа рисунки, таблицы, графические изображения, подготовленные в других программных средах. Используемая при этом технология связи и внедрения объектов называется OLE.

В связи с различием технологий, которые используются при обработке документов, текстовые редакторы и редакторы документов отличаются так же и набором функций, доступных пользователю.

Редакторы текстов - рассчитаны на редактирование программ на том или ином языке программирования.

Ш диалоговый просмотр текста;

Ш редактирование строк программы;

Ш копирование и перенос блоков текста из одного места в другое;

Ш копирование одной программы или её части в указанное место другой программы;

Ш контекстный поиск и замену подстрок текста;

Редакторы документов - программы для обработки документов, ориентированные на работу с текстами, имеющие структуру документа, т.е. состоящими из разделов, страниц, абзацев, предложений, слов и т.д.

Ш возможность использования различных шрифтов символов;

Ш задание произвольных межстрочных промежутков;

Ш автоматический перенос слов на следующую строку;

Ш автоматическую нумерацию страниц.

3. Общий вид окна Word и основные приемы работы с документами

Первая строка основного окна, являющаяся строкой заголовка, содержит название пакета - Microsoft Word. [2]

Строка меню, начинающаяся со слова «Файл», содержит названия главных режимов меню, каждый из которых в свою очередь раскрывается в список команд. По умолчанию при создании нового документа панель инструментов всегда изображается на экране, но при желании панель инструментов можно убрать с экрана. На экране можно отразить ту или иную панель в зависимости от потребности.

Ниже панели инструментов располагается окно документа. В строке заголовок документа выводится имя документа, точнее, имя файла, в котором он находится. По умолчанию новым документам присваиваются имена. При дальнейшей работе имена документов можно изменить.

Следующая строка называется линейкой. Эта строка позволяет увидеть и изменить положение отступов и табуляторов для текущего абзаца текста. Ниже линейки форматирования располагается рабочая зона, в которую вводятся текст, формулы, иллюстрации и другие объекты документа.

Предпоследняя строка экрана содержит линейку горизонтальной прокрутки. Она позволяет просматривать правую часть широкого документа, не поместившуюся в окне. Перемещение окна по горизонтали вдоль страницы документа осуществляется с помощью кнопок со стрелками и движка. Справа от этой линейки в той же строке экрана расположены кнопки для перелистывания страниц большого документа в обе стороны и установки первой или последней страницы.

В правой части экрана расположена линейка вертикальной прокрутки для просмотра длинных документов.

В последнюю строку экрана - строку состояния выводится вспомогательная информация об активном документе (номер текущей страницы и их общее количество).

Для запуска необходимо щелкнуть по пиктограмме данного приложения. Сразу после запуска на экране откроется окно с пустым документом. При создании нового документа в Word мы видим пустое окно для ввода.

Для ввода текста достаточно подвести курсор к нужному месту документа и набрать текст.

В Word можно работать с несколькими документами одновременно. Каждый создаваемый или открываемый документ размещается на экране в своем собственном окне.

Одно из преимуществ работы с несколькими документами одновременно заключается в легкости копирования или перемещения текста из одного в другое, что упрощает создание двух различных версии одного базового документа или заимствовании из существующего документа при построении нового.

Сочетания горячих клавиш в Microsoft word

Ctrl+N

Создание нового документа

Ctrl+S

Сохранение документа

Ctrl+C

Копирование выделенного текста

Ctrl+V

Вставка скопированного текста

Alt+Shift+D

Вставка текущего числа, месяца, года.

Заключение

В наш век, именуемый «информационным», обработка информации является одной из важнейших задач. Без технологий, позволяющих обрабатывать и изменять информацию, технический прогресс общества существенно замедлится.

Библиографический список

1. IBM PC для пользователя. Под редакцией В.Э. Фигурнов, Москва, 2007 г.

2. Современный редактор текстов. Под редакцией А.Н. Лучника Москва 2004 г.

Размещено на Allbest.ru


Подобные документы

  • Программы работы с текстами: MS-DOS Editor, Word Pad, блокнот, word, текстовый процессор. Редакторы для обработки документов. Стили форматирования. Двоичное кодирование текстовой информации в компьютере. Операции технологического процесса ее обработки.

    курсовая работа [324,0 K], добавлен 25.04.2013

  • Наиболее значимые операции и функции распространенного текстового редактора Microsoft Word. Область применения, интерфейс, форматирование и редактирование в нем текста. Начисления за услуги предоставления доступа к Интернету ООО "Сигмаком" в MS Excel.

    курсовая работа [1,2 M], добавлен 23.10.2013

  • Средства и технологии обработки текстовой информации: MS-DOS Editor, Word Pad, Блокнот, Microsoft Word. Двоичное кодирование текстовой информации в компьютере. Рассмотрение разновидностей кодовых таблиц для русских букв: Windows, MS-DOS, КОИ-8, Мас, ISO.

    курсовая работа [644,5 K], добавлен 27.04.2013

  • Характеристика средств обработки текстовой информации, способы редактирования и форматирования документов. Порядок создания списков и таблиц, проверка орфографии и синтаксиса текста. Выбор формата файла. Работа в табличном процессоре Microsoft Excel.

    курсовая работа [411,1 K], добавлен 27.04.2013

  • Обработка текстовой информации на компьютере. Знакомство с текстовым процессором Microsoft Word. Создание, форматирование текстовых документов, выполнение операций с фрагментами текста. Копирование, перемещение, удаление. Создание и редактирование таблиц.

    лабораторная работа [672,8 K], добавлен 19.12.2013

  • Основные средства и технологии обработки и редактирования текстовых документов, принципы их использования. Характеристика функциональных возможностей текстового процессора Ms. Word. Описание дополнительных возможностей текстового редактора Word 2003.

    курсовая работа [1,4 M], добавлен 19.03.2011

  • Понятие и функциональные особенности, классификация и разновидности текстовых редакторов и процессоров, характеристика некоторых из них: Блокнот, Microsoft Word. Оценка их возможностей по созданию и форматированию документов. Расчет и оформление баланса.

    контрольная работа [100,1 K], добавлен 27.04.2013

  • Классификация и возможности текстовых редакторов. Среда текстового редактора Microsoft Word 2003. Процесс редактирования текста, его копирование и перемещение. Проверка орфографии и синтаксиса, автотекст и автозамена. Пример гипертекстового документа.

    курсовая работа [2,4 M], добавлен 25.04.2013

  • Применение текстового редактора Microsoft Word для обработки текстовой информации на компьютере. Создание документа, его редактирование и форматирование. Инструмент редактирования текста. Границы и заливка, выделение фрагментов. Стиль написания документа.

    реферат [1,4 M], добавлен 28.12.2010

  • Основные допечатные процессы подготовки издания. Технологическая схема компьютерной подготовки текстовой информации. Выбор варианта оформления, формата, гарнитуры и кегля. Основные правила компьютерного набора. Верстка в программе Adobe InDesig.

    курсовая работа [250,5 K], добавлен 22.01.2015

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.