Технологии и средства сканирования и распознавания графических и текстовых печатных материалов

Сканеры, принцип действия, классификация. Фотодатчики, применяемые в сканерах. Характеристики, типы сканеров, аппаратный и программный интерфейсы. OCR-системы, FineReader, CuineForm, OmniPage, ReadIris, OCRopus, Аналитический обзор наиболее известных OCR.

Рубрика Производство и технологии
Вид курсовая работа
Язык русский
Дата добавления 22.10.2009
Размер файла 309,5 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Санкт-Петербургский

Гуманитарный университет Профсоюзов

Курсовая работа

По дисциплине: Программные средства в туристической деятельности.

На тему: «Технологии и средства сканирования и распознавания графических и текстовых печатных материалов».

Выполнила:

Студентка 5 курса, факультета культуры

Специальности:

«Прикладная информатика (в СКС)»

Шашлова М.А.

Проверил:

Спицын А.В.

Санкт-Петербург 2009

Содержание

Введение

1. Сканеры

1.1 Принцип действия и классификация сканеров

1.2 Фотодатчики, применяемые в сканерах

1.3 Типы сканеров

1.4 Цветные сканеры

1.5 Характеристики сканеров

1.6 Аппаратный и программный интерфейсы сканеров

2. OCR-системы

2.1 История возникновения

2.2 Типы пакетов OCR

2.2.1 Обучаемые пакеты

2.2.2 Интеллектуальные пакеты

2.3 OCR сегодня

3. FineReader

4. CuineForm

5. OmniPage

6. ReadIris

7. OCRopus

8. Аналитический обзор наиболее известных OCR

8.1 Отбор значимых факторов

8.2 Оцифровка факторов

Заключение

Список используемых источников

Введение

В процессе своего развития человеческое общество прошло этапы проникновения в тайны материи, научилось управлять различными видами энергии и, наконец, вступило в эпоху информатизации.

Информатизация - одна из наиболее ярких черт системы общественных отношений развитых стран. Она играет определяющую роль во всех сферах деятельности людей. При этом информация становится в современном обществе важнейшим фактором экономического роста.

Информационные процессы (сбор, обмен, накопление, хранение, обработка и выдача информации) осуществляются на базе технических средств информатизации.

До середины XIX в., когда доминирующими были процессы сбора и накопления информации, средства информатизации представляли собой перо, чернильницу и бумагу. На смену примитивным средствам информационной техники в конце XIX в. пришли механические: пишущая машинка, телефон, телеграф, что послужило базой для принципиальных изменений в технологии обработки информации. Лишь спустя много лет информационные процессы запоминания и передачи информации были дополнены процессами ее обработки. Это стало возможным с появлением во второй половине XX в. такой информационной техники, как электронные вычислительные машины (ЭВМ), положившие начало информационным технологиям (ИТ).

Технологический прогресс является сегодня не только главным фактором обеспечения благосостояния нации, но и важнейшим условием процесса ее устойчивого развития. При этом приоритетное внимание должно быть уделено именно информационным технологиям, которые благодаря их особым свойствам катализатора будут активно содействовать технологическому прорыву страны не только в информационной сфере, но и во многих других не менее важных направлениях.

ИТ базируются на следующих технических достижениях:

- новые средства накопления информации на машиночитаемых носителях (магнитные ленты, кинофильмы, магнитные и лазерные диски и т.п.);

- системы дистанционной передачи информации (локальные вычислительные сети (ЛВС), сети передачи данных, телефонная сеть, радиосвязь, спутниковая связь и др.);

- автоматизированная обработка информации с помощью компьютера по заданным алгоритмам.

Естественно, что информационные технологии строятся на сочетании аппаратных средств, программных средств и творческой мысли создателей, как этих средств, так и компьютерных технологий.

Специалисты называют аппаратные средства компьютерной техники Hardware (скобяные товары или жесткая проволока), а программное обеспечение - Software (мягкая проволока). Сочетание «Hardware & Software», переводимое как «твердый и мягкий», - профессиональный термин. В России программы на профессиональном сленге иногда называют новым словом «софтвер», а компьютер и периферию - «железом». Приоритетность роли программных или аппаратных средств в информационных технологиях не подлежит обсуждению, поскольку без программного обеспечениялюбой самый совершенный компьютер представляет собой набор электронных плат.

Компьютеры и оргтехника коренным образом изменили облик организаций, стиль их работы, обеспечилимобильность и эффективность деятельности. В настоящее время невозможно представить повседневную жизнь без информационных технологий, которые открыли новые возможности для развития производства, в том числе и проектирования.

Громадное количество всевозможных компонентов компьютерных комплексов, предлагаемых на рынке, создаёт значительные проблемы в их правильном применении и интегрировании.

Комплекс офисного оборудования должен быть не только технически современным, но и оптимальным по составу, чётко ориентированным на решение производственных задач и подкреплённым мощной сервисной поддержкой.

1. Сканеры

Сканер (Scanner) -устройство ввода в ЭВМ информации в виде текстов, рисунков, слайдов, фотографий на плоских носителях, а также изображения объемных объектов небольших размеров. Сканер представляет собой периферийное устройство, основным элементом которого является фотодатчик, предназначенный для фиксирования количества отраженного света в каждой области оригинала.

Метод, на котором основаны современные сканеры, заключается в последовательном, точка за точкой, фиксировании изображения и преобразовании его в электрический сигнал. Этот метод использовалсяпри передаче фотографических изображений по телеграфу еще в 1850 г. Первый черно-белый сканер был создан в 1863 г., а цветной - в 1937 г.

Сканирование представляет собой цифровое кодирование изображения, заключающееся в преобразовании аналогового сигнала яркости в цифровую форму. Такое получение цифрового изображения оригинала для ввода в компьютер называют оцифровкой (Digitizing). В процессе оцифровки изображение разбивается на элементарные частицы - пиксели, каждому из которых соответствует определенный код яркости и цветового оттенка.

1.1 Принцип деятельности и классификация сканеров

Сканер как оптоэлектронный прибор включает следующие функциональные компоненты: датчик, содержащий источник света, оптическую систему, фотоприемник, механизм перемещения датчика (или оптической системы) относительно оригинала. Электронное устройство обеспечивает преобразование информации в цифровую форму.

В процессе сканирования оригинал освещается источником света. Светлые области оригинала отражают больше света, чем темные.

Отраженный (или преломленный) свет оптической системой направляется на фотоприемник, который преобразует интенсивность принимаемого света в соответствующее значение напряжения. Аналоговый сигнал преобразуется в цифровой для дальнейшей обработки с помощью ПК.

Сканеры весьма разнообразны, и их можно классифицировать по целому ряду признаков. В основе классификации могут быть следующие признаки:

способ формирования изображения (линейный, матричный);

конструкция кинематического механизма (ручной, настольный, комбинированный);

тип вводимого изображения (черно-белый, полутоновый, цветной);

степень прозрачности оригинала (отражающий, прозрачный);

аппаратный интерфейс (специализированный, стандартный);

программный интерфейс (специализированный, TWAIN-совместимый).

1.2 Фотодатчики, применяемые в сканерах

В современных сканерах применяют фотодатчики двух типов: фотоэлектронные умножители - ФЭУ (РМТ - Photomulti Plier Tube) или приборы с зарядовой связью - ПЗС (ССО - Charge-Coupled Device).

Фотоэлектронный умножитель изобретен советским инженером Л.А.Кубецким в 1930 г. ФЭУ, представляет собой электровакуумный прибор, внутри которого расположены электроды - катод, анод и диноды. Световой поток от обьекта сканирования вызывает эмиссию электронов из катода. В соответствии с законом фотоэффекта фототок эмиссии прямо пропорционален интенсивности падающего на него светового потока. Вылетающие из катода электроны под действием разности потенциалов между катодом и ближайшим к нему электродом - динодом притягиваются к последнему и выбивают с его поверхности вторичные электроны, число которых многократно превышает первичный электронный поток с катода. Это обеспечивается благодаря тому, что диноды выполнены из материалов, имеющих высокий коэффициент вторичной эмиссии, а между ними приложены потенциалы, обеспечивающие усиление вторичной эмиссии. В результате через сопротивление нагрузки в анодной цепи ФЭУ протекает усиленный ток. Коэффициент усиления фототока в ФЭУ достигает . Такое усиление достигается за счет подачи на ФЭУ напряжения от высоковольтного источника (в зависимости от количества динодов - от 500 до 1500 В), причем потенциалы распределяются между электродами равномерно с помощью делителя напряжения. ФЭУ обладает высокой чувствительностью (1 А/лм), а его спектральный диапазон, определяемый областью длин волн регистрируемого излучения, соответствует задачам сканирования, поскольку перекрывает видимый спектр световых волн.

Прибор с зарядовой связью (ПЗС) - это твердотельный электронный фотоприемник, состоящий из множества миниатюрных фоточувствительных элементов, которые формируют электрический заряд, пропорциональный интенсивности падающего на них света, и конструктивно выполняются в виде матриц или линеек.

Работу ПЗС впервые продемонстрировали В.Бойл и Дж.Смит в 1970 г. Принцип действия ПЗС основан на зависимости проводимости р-n-перехода полупроводникового диода от его освещенности.

ПЗС представляет собой полупроводниковый кристалл (как правило, кремний), на поверхность которого нанесена прозрачная оксидная пленка, выполняющая функцию диэлектрика в микроскопических конденсаторах. Одной из обкладок такого конденсатора является поверхность самого кристалла, а другой - нанесенные на диэлектрик металлизированные электроды толщиной не более 0,6 мкм.

К электродам в определенной последовательности подается низкое напряжение (5-10 В). Это приводит к тому, что под электродами образуется так называемые потенциальные ямы в виде скоплений электронов. Под воздействием света в результате внутреннего фотоэффекта появляются свободные электроны. Количество электронов, скапливающихся под чувствительной площадкой каждого электрода, пропорционально интенсивности светового потока, падающего на чувствительную площадку данного электрода. Электроны образуют зарядовый пакет. Если ПЗС выполнен в виде линейки, зарядовые пакеты передаются из одной потенциально ямы в соседнюю, достигая последней ячейки, откуда поступают на предварительный усилитель. ПЗС-линейка может содержать до нескольких тысяч фоточувствительных ячеек. Размер элементарной ячейки ПЗС определяет разрешающую способность сканера. Область спектральной чувствительности ПЗС расположена в видимой части спектра, причем наибольшая чувствительность наблюдается ближе к красной области.

1.3 Типы сканеров

В зависимости от способа перемещения фоточувствительного элемента сканера и носителя изображения относительно друг друга сканеры подразделяются на две основных группы - настольные (Desktop)и ручные (Hand-held).

К числу настольных сканеров относятся планшетные (Flatbed), роликовые (Sheet-feed), барабанные (Drum) и проекционные (Overhead/Camera) сканеры.

Планшетные сканеры, или сканеры плоскостного типа, используются для ввода графики и текста с носителей формата А4 или А3.

В планшетных сканерах оригинал располагается на его рабочей поверхности неподвижно. Освещение оригинала производится стабилизированным по интенсивности источником, в качестве которого используются лампы с холодным катодом или флуоресцентные лампы. В качестве фотоприемника обычно используется ПЗС-линейки. Лампа, ПЗС и оптическая система, направляющая на ПЗС световой поток, отраженный от оригинала, находятся на одной каретке и с помощью шагового механизма перемещаются вдоль оригинала. В основном все планшетные сканеры рассчитаны на получение копии с одного оригинала, однако к некоторым моделям сканеров прилагаются дополнительные приспособления для последовательной подачи и сканирования нескольких оригиналов.

При использовании в качестве оригиналов книг или сброшюрованных документов имеется возможность обеспечить их прижим к стеклянной поверхности сканера специальной крышкой на петлях.

К преимуществам планшетных сканеров следует отнести простоту использования, возможность сканирования как плоских оригиналов в широком диапазоне размеров, так и небольших трехмерных объектов. При необходимости сканирования оригиналов нестандартного большого формата имеется возможность сканирования по частям с последующим объединением с помощью какого-либо графического редактора.

Недостатками этого типа сканеров являются большая занимаемая площадь, сложность выравнивания оригинала с неровно размещенным на носителе изображением, невозможность сканирования прозрачных оригиналов.

Однако при всем этом, планшетные сканеры - наиболее популярные устройства ввода текстовой и графической информации. Они обеспечиваютнеобходимое качество изображений, используемых как в деловой корреспонденции, так и в высокохудожественных изданиях.

Роликовые сканеры осуществляют сканирование оригинала при его перемещении по специальным направляющим посредством роликового механизма подачи бумаги относительно неподвижных осветителя и ПЗС-линейки. Сканирование в роликовом сканере, как и в планшетном, производится в отраженном свете. Этот принцип заложен в конструкции многих факсимильных аппаратов. Сканеры, работающие в двух режимах - сканирования изображения и его факсимильной передачи, называют факс - сканерами (Fax Scanner).

В отдельных моделях роликовых сканеров имеется устройство для подачи листов, которое позволяет сканировать в автоматическом режиме.

Большинство роликовых сканеров офисного применения предназначены для работы с оригиналами формата А4. Однако существуют широкоформатные роликовые сканеры, обеспечивающие сканирование оригиналов форматов А1 и А0.

Преимущества роликовых сканеров определяются их компактностью, удобством подключения и пользования, автоматической подачей листов оригинала, удовлетворительной скоростью сканирования и низкой стоимостью. В тоже время эти сканеры имеют ряд недостатков, связанных с невозможностью без специальных приспособлений осуществлять сканирование сброшюрованных документов, книг, а так же с опасностью повреждения оригинала.

Барабанные сканеры позволяют получать изображения прозрачных или отражающих оригиналов с высокой степенью детализации.

Прозрачный оригинал в барабанных сканерах закрепляется с помощью специальной ленты или масла на поверхности прозрачного цилиндра из органического стекла (барабана), который для обеспечения устойчивости укреплен на массивном основании. При вращении барабана с большой скоростью (от 300 до 1350 об/мин) фотоприемник считывает изображение с высокой точностью. В большинстве барабанных сканеров в качестве фотоприемника используется ФЭУ, который перемещается с помощью винтовой пары вдоль барабана. Для освещения оригинала применяется мощный стабилизированный по интенсивности излучения ксеноновый или галогены источник света. При сканировании отражающих оригиналов применяется источник света, расположенный вне барабана рядом с приемником излучения.

За счет высокой скорости вращения барабана имеется возможность фокусировать на оригинале достаточно мощный поток света без риска повреждения оригинала. В связи с этим отличительной особенностью барабанных сканеров является возможность сканировать с высоким разрешением оригиналы, имеющие высокую оптическую плотность (печатные издания, художественные работы, слайды, диапозитивы, негативные пленки), как в отраженном, так и в проходящем свете.

В отдельных моделях барабанных сканеров в качестве фотоприемника изображения используется набор ПЗС-линеек, неподвижно установленных на всю ширину барабана и построчно сканирующих оригинал в отраженном свете. В этих сканерах, как правило широкоформатных, барабан совершает только один оборот за все время сканирования. Сканеры, в которых реализована эта технология, выгодно отличаются от сканеров с ФЭУ, поскольку исключается необходимость решать проблему стабилизации конструктивных элементов, обусловленную высокой скоростью вращения барабана. Для гашения возникающих при этом вибраций применяются специальные амортизаторы, увеличивающие массу сканера до 250 кг и более.

Барабанные сканеры позволяют сканировать прозрачные или отражающие оригиналы типа высокохудожественных работ в полиграфии и картографии. При этом автоматическая корректировка освещенности, настройка фокусного расстояния и высокая производительность достигаются за счет обработки изображения встроенным компьютером.

Значительные габариты, необходимость предварительной подготовки обслуживающего персонала и высокая стоимость барабанных сканеров обусловливают ограничение их области применения профессиональной полиграфией и картографией.

Проекционные сканеры работают по принципу фотографической камеры и конструктивно напоминают фотоувеличитель.

Оригинал располагается на подставке под сканирующей головкой изображением вверх. Сканирующая головка, содержащая ПЗС-датчик и перемещающий его в фокальной плоскости линзы двигатель, закрепляется на вертикальном штативе и может перемещаться по стойке или по вертикальным направляющим. Перед началом сканирования камеру устанавливают в положение, соответствующее требуемому разрешению и размеру изображения. Точная настройка (фокусировка), определяющая разрешение сканирования, осуществляется специальной редуцирующей линзой. Обычно в проекционных сканерах внутренний источник освещения не используется. Освещение оригинала производится за счет естественного комнатного света. В некоторых моделях проекционных сканеров свет через линзу освещает оригинал, а отраженный свет фиксируется ПЗС-матрицей. Такая конструкция сканера позволяет избежать влияния внешних засветок и получить высокое качество сканируемых изображений.

Особенностью проекционных сканеров является возможность сканирования трехмерных объектов. При этом конструкция сканеров обеспечивает переменное расширение сканирования: небольшие объекты можно сканировать с высоким разрешением; большие нестандартные объекты, изображения которых нельзя ввести с помощью других сканеров, также могут быть сканированы, хотя и с низким разрешением. Простота конструкции и удобство применения, невысокая стоимость и возможность комбинирования при сканировании плоских и небольших трехмерных объектов обусловливают достаточно широкое применение проекционных сканеров как средств ввода информации.

Ручные сканеры применяются для сканирования малоформатных оригиналов или фрагментов большого изображения. Перемещение окна сканирования относительно оригинала производится за счет мускульнойсилы человека.

В небольшом корпусе шириной обычно чуть более 10 см размещаются лишь датчик, линза и источник света. Ширина области сканирования в зависимости от модели устройства варьируется от 60 до 280 мм. Длина области сканирования ограничена лишь объемом доступной оперативной памяти компьютера. Устанавливаемая в компьютере карта интерфейса преобразует поступающую информацию в цифровую форму и передает ее для последующей обработки специальной программе. Принципы работы ручного и роликового сканеров во многом похожи.

Отличительно особенностью ручного сканера является то, что он использует источник питания компьютера, к которому подключен. Как правило, ручные сканеры подключаются к параллельному порту компьютера без каких-либо адаптеров. Низкая цена ручных сканеров обусловлена простотой их конструкции.

В некоторых моделях ручных сканеров предусматривается возможность сканирования больших изображений за несколько проходов, т.е. путем последовательного просмотра отдельных его областей. Объединение областей сканирования производится с помощью специального программного обеспечения, позволяющего упростить эту процедуру.

Применение ручных сканеровкак устройств ввода изображений объясняется их компактностью и дешевизной, хотя для профессиональной работы они обычно не используются. Однако применение ручных сканеров для сканирования текста не всегда оправдано, поскольку разработанные специально для ручных сканеров программы допускают довольно много ошибок при распознавании по сравнению со своими аналогами, созданными для других сканеров.

Многофункциональные сканеры - это комбинированные устройства, сочетающие в себе возможности сканеров различных типов, а также других технических средств информатизации, служащих для решения таких задач, как оптическое распознавание символов, архивирование, электронная почта и факсимильная связь.

В комбинированных устройствах all-in-one в одном корпусе обычно объединены роликовый сканер, лазерный или струйный принтер, факс-модем. Эти устройства можно использовать в качестве факсимильного аппарата, принтера, сканера, копировального аппарата и внешнего модема для доступа к сети по линиям телефонной связи. Такое интегрирование является оптимальным решением для SOHO (Small Office/Home Office - небольшой офис/домашний офис), поскольку позволяет освободить площадь и сэкономить на приобретении компонентов в комплексе, которые по отдельности стоят дороже. Основные недостатки таких комбинированных систем - невысокое качество и сравнительно высокая стоимость копирования страницы.

В некоторых моделях планшетных сканеров фирмы Agfa реализована технология Twin Plate - новый способ размещения прозрачных и непрозрачных оригиналов в одном устройстве. Прозрачные и отражающие оригиналы располагаются в разных плоскостях, освещаются различными источниками, но регистрация производится одним и тем же приемником изображения.

1.4 Цветные сканеры

Современные сканеры в основном предназначены для сканирования цветных оригиналов, но имеют режимы сканирования черно-белых и полутоновых изображений.

Задача цветного сканера сводится к различению основных цветов: красного (Red), зеленого (Green) и синего (Blue) - RGB. Для этого применяются различные технологии.

Например, в цветном сканере с одним источником света сканирование оригинала может осуществляться в три прохода с последовательным применением различных фильтров: красного (R), зеленого (G), синего (B), поочередно размещаемых между источником света и оригиналом. Сканируемое изображение освещается белым светом не непосредственно, а через вращающийся RGB - светофильтром. Для каждого из основных цветов последовательность операций практически не отличается от последовательности операций при сканировании полутонового изображения. Существенными недостатками данного метода являются увеличение времени сканирования в три раза и необходимость точного совмещения цветовых слоев, чтобы не допустить размывания отдельных деталей изображения.

В сканерах другого типа используются три источника света: красный, зеленый, синий, действующие поочередно для кратковременного освещения оригинала. Сканирование при этом производится однократно, что позволяет избежать несовмещения цветов, но требует подбора источников света со стабильными характеристиками.

В некоторых конструктивных решениях цветных сканеров используется один источник света, но сканирование цветных оригиналов осуществляется за один проход благодаря тому, что фотоприемник выполнен в виде фототранзисторов, размещенных в три линейки, а три цветных фильтра расположены перед ними так, что каждая линейка фототранзисторов освещается только своим цветом.

Однако наибольшее распространение получили цветные сканеры, оборудованные системой,состоящей из трех независимых фотодатчиков для каждого цвета. Оригинал освещается белым светом, а отраженный оригиналом свет попадает на фотоприемники через систему специальных фильтров, которые и разделяют белый свет на три составляющие. Принцип работы таких фильтров основан на использовании явления дихроизма, заключающегося в изменении окраски кристаллов в проходящем белом свете в зависимости от положения их оптической оси. После прохождения системы фильтров, разделенные красный, зеленый и синий свет попадают каждый на свой фотоприемник, например ФЭУ. Путем последовательно выполняемых операций считывания тонового распределения по основным цветам получают информацию, необходимую для воспроизведения цветов изображения.

1.5 Характеристики сканеров

Разрешающая способность определяется плотностью расположения распознаваемых точек и выражается в точках на дюйм (dpi - dot per inch). Сканеры имеют два параметра разрешающей способности: оптическое разрешение и программное. Оптическое разрешение - показатель первичного сканирования. Программными методами можно в дальнейшем повысить разрешение. Например, оптическое разрешение сканера может быть 300х600 dpi, а программное - до 4800х4800 dpi. Оптическое разрешение имеет более важное значение для пользователя.

Оптическое разрешение зависит от размера элемента ПЗС-датчика и характеризует плотность, с которой производится выборка информации в заданной области оригинала.

Разрешение сканера имеет два показателя: по горизонтали и вертикали. Например, 600х300;600х600; 800х800. Однако чаще всего употребляют первое значение: 600, 800 dpi.

Выбор разрешения при сканировании:

100 точек на дюйм позволяет подготовить графическое изображение для WEB;

200 точек на дюйм применяют для печати копии документа;

300 точек на дюйм используется для фотографий;

600 точек на дюйм дает высококачественное изображение.

Увеличение значения разрешения приводит к увеличению занимаемого места на диске при сохранении отсканированного изображения.

Область сканирования - максимальны размер оригинала для данного сканера.

Метод сканирования определяет одно- или трехпроходный способ считывания информации в цветных сканерах.

Скорость сканирования - количество страниц черно-белого оригинала, сканируемых в минуту с максимальным оптическим расширением сканера.

Разрядность сканера измеряется в бит и определяет то количество информации,которое необходимо для оцифровки каждой точки изображения, а также количество цветов, которое способен распознать сканер. 24 бит соответствуют 16,7 миллионам цветов, а 30 бит - миллиарду. Несмотря на то, что человеческий глаз уже не в состоянии отличить 16-битный цвет от 24-битного, в новейших моделях сканера заявлена 48-битная разрядность.

Совокупность характеристик модели сканера определяет его принадлежность к одному из трех классов, на которые условно можно подразделить все модели сканеров.

Сканеры простых моделей используются для подготовки деловой документации, создания прайс-листов и рекламных объявлений, а также для подготовки электронных публикаций (WEB-страниц, графических баз данных). Обычно такие сканеры обеспечивают оптическое разрешение в диапазоне 300-600 dpi, передачу 256 оттенков серого цвета для полутоновых изображений.

Сканеры промежуточного класса планшетного типа обладают оптическим разрешением 600-1800 dpi, высоким динамическим диапазоном, имеют возможность работы с прозрачными оригиналами и применяются в издательской деятельности.

Сканеры высокого класса обеспечивают разрешение свыше 4000 dpi, используются при необходимости оцифровки большого объема информации с высоким качеством и производительностью.

Лидером на российском рынке сканеров является Hewlett-Packard, однако недорогие модели Mustek Paragon, KYE также пользуются спросом. Для профессионального применения используют сканеры UMAX или Agfa.

1.6 Аппаратный и программный интерфейс сканеров

Сканеры с интерфейсом SCSI требуют установки в компьютер дополнительной платы SCSI-адаптера, которая поставляется в комплекте со сканером. Преимуществом интерфейса SCSI является обеспечение высокой скорости сканирования.

К компьютерам, оснащенным USB-портом, лучше подключать сканер с USB-интерфейсом. Скорость при этом несколько уступает интерфейсу SCSI, однако простота подключения сканера искупает этот недостаток.

Сканеры с интерфейсом параллельного порта подключаются к уже имеющемуся параллельному порту. Пропускная способность параллельного порта значительно меньше по сравнению с интерфейсом SCSI. Однако при этом нет необходимости устанавливать дополнительную плату.

В комплект поставки сканера входит специальная программа - драйвер, предназначенная для управления процедурой сканирования и настройки основных параметров сканера. Ведущие производители аппаратных и программных средств - компании Aldus, Caere, Eastman Kodak, Hewlett-Packard и Logitech - объединили свои усилия для создания собственного формата драйвера TWAIN.

TWAIN-драйвер - единственный международный стандарт, введенный в 1992 г. для унификации взаимодействия устройств для ввода изображений в компьютер с внешними приложениями.

Стандарт TWAIN определяет порядок обмена данными между прикладной программой и драйвером сканера, что позволило решить проблему совместимости различных компьютерных платформ, сканеров различных моделей и форматов представления данных. С помощью TWAIN-совместимого сканера можно сканировать изображения из любой программы, например Photoshop, CorelDRAW, PageMaker, PhotoStyler и др.

2. OCR-системы

Для организации процесса сканирования помимо непосредственно сканера требуется одна из специальных программ оптического распознавания информации - OCR-система (Optical Character Recognition).

Оптическое распознавание информации -- механическая или электронная конвертация изображений и символов, редактируемая на компьютере. Перевод осуществляется программным путём, после получения образа со сканера или другого источника (рис. 1).

Рис. 1«Источники информации»

Ввод информации с бумаги в компьютер является в настоящее время часто выполняемой задачей. До недавнего времени эта задача решалась исключительно путем кодирования с клавиатуры компьютера. Большинство документов, подлежащих обработке, представлены в оригиналах на бумажном носителе. Поэтому неотъемлемой частью любой системы автоматизации являются компьютерные системы, включающие программы сканирования и оптического распознавания образов. Задача распознавания состоит в том, чтобы преобразовать входное (отсканированное) изображение в текст из подвижных символов. Иными словами графическое изображение каждого входного символа заменяется обозначением этого символа, используемым в компьютере (т.е. кодом, понятным компьютерной системе).

Системы оптического распознавания символов стали неотъемлемой частью интегрированных пакетов, поддерживающих ввод в компьютер, хранение и обработку бумажных и электронных документов. Система включает в свой состав сканер для ввода информации.

Работа сканеров основана на принципах функционирования фотомножительных устройств:

изображение, считываемое сканером, хранится в электронном виде;

сканер не может отличать текст от рисунков и представляет их в виде отдельных

графических фрагментов из черных и белых элементов.

Если созданное сканером изображение содержит текст и рисунки, то при помощи OCR можно:

отделить текст от рисунков;

записать этот текст в формате файла текстового процессора.

Программное обеспечение в современных системах OCR выполняет анализ форм букв и создание текстового файла, в который распознаваемый текст записывается посимвольно с последовательным формированием слов и предложений.

2.1 История развития OCR-систем

Попытки автоматического распознавания предпринимались, начиная с 30-х годов XX века, однако первый OCR-аппарат от американской компании Intelligent Machines Research Corporation появился только в 1952 году. Естественно, ни о каком искусственном интеллекте речь тогда не шла. Первые OCR-аппараты не имели ничего общего даже с компьютерной техникой. В них свет, отраженный от подсвеченного участка оригинала, проходил через сложную систему зеркал, причем некоторые из них были расположены на вращающихся дисках. В результате из общего потока поочередно выделялись узкие световые пучки, соответствующие небольшим участкам оригинала -- аналогам пикселей электронного изображения. Эти «квазипиксели» поступали на вход фотоэлектронного умножителя -- оптико-электронного преобразователя с большим коэффициентом усиления. Полученные сигналы обрабатывались электронной схемой. В ходе обработки устанавливалось, является подсвеченная точка оригинала белой или черной. На основе полученной информации OCR-аппарат воспроизводил образ подсвеченного знака.

Возможности этих машин были ограничены рядом условий. Для сколько-нибудь уверенного распознавания требовались исключительно хорошее качество, высокая контрастность и отсутствие каких-либо повреждений оригиналов. Кроме того, распознавать можно было далеко не все надписи, а только набранные определенными шрифтами. Именно с этой целью в 60-х годах были разработаны и стандартизованы специальные шрифты -- OCR-A (в США) и OCR-B (в Европе).

В 70-х годах компания Kurzweil Computer Products предприняла качественно новый шаг в развитии OCR, создав систему, способную учиться распознавать шрифты. Результаты обучения, продолжавшегося обычно несколько часов, записывались на диск, и система приобретала способность распознавать тексты, набранные выученным шрифтом. В то же время в отечественном Научно-исследовательском центре электронной и вычислительной техники (НИЦЭВТ CCCР) группой под руководством Александра Шамиса велись исследования по распознаванию «рукопечатных» (сделанных от руки печатными буквами) надписей. Впоследствии результаты деятельности группы неоднократно находили воплощение в программном коде.

В 1986 году компания Calera Recognition Systems разработала систему, позволяющую работать с неизвестными ей шрифтами без предварительного многочасового обучения. Это была первая OCR-система, обладавшая искусственным интеллектом. Вместо применявшейся ранее методики посимвольного сравнения с шаблонами она действовала по методу обобщения, ныне более известному как принцип нейронной сети. Разработчики предоставили в распоряжение программы свыше 10 тыс. образцов начертания каждой буквы; обобщая их, система получала представление об основных закономерностях начертания знака, что и позволяло обходиться без длительного обучения. Впрочем, некоторое обучение требуется и современным OCR-программам. Например, иногда приходится проводить «ликбез» при распознавании редких и декоративных шрифтов.

В конце прошлого века на практике был реализован новый подход к OCR с использованием нечеткой логики. Программа выдвигала не одну, а несколько гипотез относительно каждого символа, причем каждой из них присваивала рейтинг, отражающий степень уверенности в данной гипотезе. При обработке списков гипотез во внимание принимались различные обстоятельства, например наличие или отсутствие получающегося слова в словаре, при этом соответственно менялся рейтинг каждой гипотезы. В конечном счете, списки поступали в распоряжение так называемого эксперта -- алгоритма выбора, за которым и оставалось решающее слово. Как правило, в таких системах правильным считается символ, чья гипотеза набрала максимальный суммарный рейтинг.

Следует отметить, что современные OCR-системы решают намного более сложные задачи, нежели их предшественницы. Простым распознаванием текста теперь никого не удивишь. Потребности пользователей возросли, и подлежащий распознаванию документ часто выглядит намного сложнее, чем белая страница с черным текстом -- иллюстрации, таблицы, колонтитулы, фоновые изображения и прочие элементы усложняют ее структуру. Для того чтобы корректно воспроизводить в электронном виде такие документы, все современные OCR-программы начинают распознавание именно с анализа структуры. Как правило, при этом выделяют несколько иерархически организованных логических уровней. Объект наивысшего уровня только один -- собственно страница, на следующей ступени иерархии располагаются таблица и текстовый блок, затем ячейка таблицы, абзац или картинка, за ними следует строка, потом слово или картинка внутри строки и, наконец, нижний уровень -- символ.

Любой высокоуровневый объект может быть представлен как набор объектов более низкого уровня: буквы образуют слова, слова -- строки и т.д. Поэтому анализ всегда начинается в направлении сверху вниз. Программа делит страницу на объекты, их, в свою очередь, на объекты низших уровней и т.д., вплоть до символов. Когда символы выделены и распознаны, начинается обратный процесс -- сборка объектов высших уровней, которая завершается формированием целой страницы. Такая процедура называется многоуровневым анализом документа, или MDA (Мultilevel document Analysis).

Таким образом, задача распознавания отдельного символа, над которой работали последние полвека множество специалистов, хотя и не имеет идеального решения, но близка к нему, а потому несколько отошла на задний план, став лишь одной из множества ступеней логической лестницы, ведущей пользователя от бумажной страницы к ее электронной копии.

К наиболее важным аспектам работы систем распознавания пользователи относят следующие:

точность распознавания -- 95%;

точность сохранения оформления в документах для текстовых процессоров (в форматах MS Word, MS Excel, Word Pro, Word Perfect) -- 89%;

точность сохранения оформления для последующей электронной публикации (в форматах PDF, HTML) -- 87%;

работа с таблицами и многоколоночными текстами -- 87%;

простота использования -- 85%;

надежность работы -- 82%;

удобный поиск ошибок и сверка с оригиналом -- 80%;

работа с цветом (сохранение цветных картинок, цвета шрифта и фона) -- 63%;

прямой экспорт в другие приложения -- 61%;

скорость -- 55%;

многоязычное распознавание -- 25%.

Экспорт в Web-форматы сочли необходимым параметром 87% пользователей. Таким образом, возможность выкладывания результатов распознавания в Интернет становится даже более приоритетной, чем такие важные требования к OCR и вообще к программным продуктам, как удобство и простота интерфейса и надежность работы. Похоже, что сетевой фактор становится все более актуальным даже в областях, непосредственно с Интернетом не связанных. В данном случае привязанность OCR к Сети во многом можно объяснить появлением в Интернете многочисленных библиотек самой разной тематической направленности, содержащих электронные копии документов и изданий.

2.2 Типы пакетов OCR

Первые пакеты оптического распознавания символов имели четкое разделение по типу.

Пакеты OCR

Обучаемые Интеллектуальные

В последнее время наблюдается тенденция к объединению этих двух типов в одном пакете, что перекликается с попытками разработать принципиально новые алгоритмы распознавания.

В случае обучаемых систем происходит поточечное сравнение оцифрованного символа с образцом в справочной таблице. Оно осуществляется путем наложения масок символов на символ из считанного документа и проверки на полное совпадение. Как только совпадение достигается, символ добавляется в файл. В процессе распознавания символа при наложении маски размеры шрифта документа и маски должны быть одинаковыми. Это означает, что необходимо иметь маски для каждого размера шрифта и что система оказывается более эффективной в случае однотипного текста. С учетом этих ограничений, при разрешающей способности сканера 300 dpi обеспечивается достаточная точность обработки для того ограниченного набора шрифтов, который система “знает”.

Число известных системе шрифтов обычно невелико -- около десятка. Однако достоинство подобных систем в том, что они предоставляют пользователю возможность обучать их новым гарнитурам. Обучение -- довольно длительный процесс, а, кроме того, впоследствии при сравнении шрифтов возможна путаница, вызванная наличием у некоторых символов дополнительных графических элементов типа умляутов, трема и седилей.

В случае интеллектуальной системы -- более мощном методе преобразования считанного документа в текстовый файл -- программа самостоятельно идентифицирует каждый оцифрованный символ. Здесь маска символа заменяется на его контур. Такой эталонный контур может быть использован для любых размеров шрифтов. Стандартная система, основанная на этом методе, может распознавать несколько тысяч шрифтов. Поскольку такие системы не пользуются фиксированными масками, не возникает проблем, связанных с совпадением одной маски с несколькими разными символами. Кроме определения символа по контуру система выполняет ряд перекрестных проверок полученного текста.

Среди многих методов наиболее распространенными являются следующие два. Первый метод заключается в частотном анализе текста. Сравнивается частота появления символа в тексте с его частотой в языке оригинала. Второй метод позволяет обнаружить неправильное сочетание символов, исходя из правил орфографии. Очевидно, что для эффективной реализации этого необходимо настроить систему на конкретный язык, на котором написан документ.

2.2.1 Обучаемые пакеты

Обучаемые пакеты программ OCR составляли большинство первых разработок. Такие пакеты теоретически способны обучаться распознаванию любых символов любых гарнитур. Для обучения программы конкретной гарнитуре нужно отсканировать эталонное изображение с последующим обучением каждому конкретному символу. Это довольно длительная процедура, однако, если данная гарнитура будет затем регулярно использоваться, стоит потратить пару часов на обучение. Программы такого типа сравнивают каждый отдельный символ страницы с символами в справочных таблицах, созданных в процессе обучения, составляя при этом текстовый файл. Это означает, что можно улучшить работу такой программы, обучив ее всему набору символов используемых в документе гарнитур. Поскольку программа теперь будет знать форму каждого символа, уменьшается вероятность ошибки из-за минимальной работы по угадыванию формы.

2.2.2 Интеллектуальные пакеты

Интеллектуальные пакеты OCR не нуждаются в обучении и могут интерпретировать формы символов независимо от используемой гарнитуры. Работа этих программ производит большое впечатление: документ пропускается через сканер, результат обрабатывается интеллектуальной программой OCR с выдачей текстового файла. Для страницы формата А4 вся процедура занимает немногим более одной минуты. При высокой точности это значительно быстрее ручного ввода.

Интеллектуальный пакет за одну минуту позволяет отсканировать и распознать текст объемом 1200 символов. При этом созданный текстовый файл содержит обычно не более двух неверных символов -- достоверность распознавания порядка 99.83%.

Среди недостатков таких пакетов следует отметить следующее. Поскольку некоторые из них не могут обучаться чтению конкретных гарнитур, отсутствие надлежащей гибкости может не позволить им распознать гарнитуры необычного вида.

Конечный результат работы пакета OCR независимо от его типа представляет собой файл формата ASCII (или ANSI), а в ряде случаев даже отформатированный файл для таких популярных текстовых процессоров, как Microsoft Word (рис. 2).

Рис. 2 «Процесс получения файла»

Новейшие программы позволяют сэкономить время, записывая текст нескольких последовательных страниц в один файл. Кроме того, использование сканера с механизмом автоматической подачи отдельных листов позволяет организовать непрерывный ввод многостраничного документа.

Программа распознавания текста увеличивает удобство работы с информацией. Эта функция позволяет преобразовать текст на отсканированном изображении в удобные форматы текстовых редакторов (doc, pdf и.т.д.). Появляется возможность для модификации полученного текста, использования его в документах, в печати, а также использовать контекстный поиск.

Современные средства Microsoft Office также предоставляют возможности сканирования. В этот пакет входит программа Microsoft Office Document Imaging. Ее составляют два компонента: Microsoft Office Document Scanning и Microsoft Office Document Imaging.

Document Scanning - позволяет управлять сканированием документа с применением любого установленного сканера, а Document Imaging - позволяет производить просмотр результатов на экране, осуществлять перекомпоновку многостраничных документов, выделять и обрабатывать распознанный текст, отправлять документы по электронной почте.

Программа AfterScan Lite предназначена для выполнения коррекции и исправления ошибок. В ее основе заложен опыт корректоров и уникальность алгоритмов. После того как текст распознан такими программами как: CuneiForm, OmniPage или FineReader, для его проверки можно запускать AfterScan. Эта программа проверяет буквы, слова и знаки препинания с высокой скоростью и точностью.

SimpleOCR (ранее известная как Wocar) -средство оптического распознавания отсканированного текста. Эта программа совместима со всеми моделями сканеров, поддерживающих интерфейс TWAIN. SimpleOCR преобразует растровую картинку в стандартный вариант текста. Не смотря на то, что она не поддерживает кириллицу, эта программа имеет достоинства: бесплатность и простота интерфейса. SimpleOCR распознает текст форматов bmp, tiff, jpeg. Функциональные возможности позволяют извлекать из документа образцы изображений и шрифтов, удалять шумы из отсканированного варианта и производить пополнение интегрированных словарей.

2.3 OCR сегодня

В настоящее время на рынке систем распознавания существует ряд разработок, ориентированных как на различные сферы деятельности пользователя, так и на разные платформы.

Название

Лицензия

Поддерживаемые ОС

Заметки

FineReaderOnline.ru

Коммерческая

Online

Online OCR сервис, позволяющий распознатьмногоязычный текст из отсканированного документа или фотографии. Конвертирует результат в редактируемые форматы (PDF, PDF/A, DOC, RTF, XLS, TXT).

На данный момент до 10 страниц в день можно распознавать бесплатно.

OnlineOCR.ru

Коммерческая

Online

Online OCR сервис позволяет распознать многоязыковой текст из сканированного документа или фотографии. Конвертирует результат в редактируемые форматы (PDF, DOC, XLS, TXT, HTML)

ExperVision TypeReader & RTK

Коммерческая

Windows,Mac OS X,Unix,Linux,OS/2

Получала высокие оценки в начале 1990-х.

ABBYY FineReader

Коммерческая и собственническая

Windows; Linux, Mac OS (не для конечного потребителя)

Для работы с различными языками требуется поддержка соответствующего языка.

OmniPage

Коммерческая (Nuance EULA)

Windows, Mac OS

Производство Nuance Communications

Readiris

Коммерческая и собственническая

Windows, Mac OS

Производство бельгийской фирмы - I.R.I.S. Group. Содержит региональные пакеты для распознавания азиатских языков и языков среднего востока.

Persian Reader

Коммерческая и собственническая

Windows

Специализируется на персидском языке (фарси).

Kirtas Technologies Arabic OCR

Коммерческая

Windows

Может распознавать арабские и английские символы на одной странице.

Zonal OCR

Коммерческая и собственническая

Windows

Zonal OCR помогает автоматизировать извлечение данных из компьютерных изображений.

ViewWise компании Computhink

Коммерческая и собственническая

Windows

Система управления документами

GOCR

GPL

Кросс-платформенная

В начальной стадии разработки

CuneiForm

BSD

Windows (с GUI), Linux, Mac OS, FreeBSD (CLI)

Промышленная, многоязычная система, умеет сохранять форматирование текста и распознаёт запутанные таблицы произвольной структуры

NovoDynamics VERUS

Коммерческая и собственническая

_______

Специализируется на языках среднего востока

Microsoft Office Document Imaging

Коммерческая

Windows, Mac OS X

Современные средства Microsoft Office предоставляют возможности сканирования. Document Scanning - позволяет управлять сканированием документа с применением любого установленного сканера, а Document Imaging - позволяет производить просмотр результатов на экране, осуществлять перекомпоновку многостраничных документов, выделять и обрабатывать распознанный текст, отправлять документы по электронной почте.

Microsoft Office OneNote 2007

Коммерческая

Windows

Brainware

Коммерческая и собственническая

Windows

Извлечение данных из документов и их обработка; например счета, извещения, накладные и платёжки

HOCR

GPL

Linux

Распознавание текстов на иврите

OCRopus

Apache

Linux

Расширяемая система распознавания, которая может использовать Tesseract

ReadSoft

Коммерческая и собственническая

Windows

Сканирование, распознавание и классификация деловых бумаг, например договоров, счетов и платёжных поручений.

Scantron Cognition

Коммерческая и

собственническая

Windows

Для работы с различными языками требуется поддержка соответствующего языка.

RelayFax Network Fax Managerкомпании Alt-N Technologies

Коммерческая и собственническая

Windows

Многоязычная система используется для преобразования факсов в доступные для правки форматы документов (doc, pdf, и т.д…).

SILVERCODERS OCR Server

Коммерческая и собственническая

Linux

Серверная многоязыковая система, имеет высокое качество распознавания, может сохранять форматирование текста и распознаёт запутанные таблицы произвольной структуры

SmartScore

Коммерческая и собственническая

Windows, Mac OS

Для распознавания нотной записи

Tesseract

Apache

Windows, Mac OS X, Linux, OS/2

Разрабатывается компанией Google

WeOCR

MIT/X Consortium

Интерфейс: Браузер; Сервер: POSIX, Unix

Платформа для браузерных систем распознавания символов. Страница проекта: WeOCR

* краткий обзор существующих систем оптического распознавания информации.

3. FineReader

FineReader - это система оптического распознавания текстов (OCR), которая преобразует полученное с помощью сканера графическое изображение (картинку) в текст (т.е. в коды букв, «понятные» системе), разработанная российской компанией ABBYY Software House.

23 июля 2009 года ABBYY представила специальную версию FineReader для операционной системы Mac OS X - ABBYY FineReader Express Edition for Mac. По словам генерального директора ABBYY Россия Григория Липича выход специальной версии FineReader для Mac OS X продиктован временем. К релизу данной версии Mac-сообщество в России насчитывало более полумиллиона частных и корпоративных пользователей.

Особенности программы:

адаптивное распознавание многостраничных документов - документ анализируется как единое целое, автоматически определяются колонтитулы, нумерация страниц, шрифты, названия таблиц и рисунков;

поддерживает распознавание текста на 184 языках и имеет встроенную проверку орфографии для 38 из них;

интеграция с проводником Windows и с популярными офисными приложениями;

работа со всеми распространенными моделями сканеров и МФУ, режимы работы с автоподатчиком сканера;

инструменты для предварительной обработки изображений, в том числе для очистки изображения от мусора, устранения перекосов строк и другие;

автоматическое определение языка документа, распознавание многоязычных документов;

распознавание цифровых фотографий;

в комплекте идет программа ABBYY Screenshot Reader, предназначенная для распознавания любой области экрана;

использование сценариев обработки позволяет автоматизировать повторяющиеся операции;

использование многопоточного распознавания, оптимизация под современные многоядерные процессоры;

сохранение документов в большинстве распространенных форматах (RTF, DOC, XLS, ODTдр.);

сохранение в DOCX и XLSX форматах, внедрённых в MS Office 2007, сохранение в PDF и PDF/A (Professional);

поддержка XML Paper Specification (XPS)- открытого графического формата электронных документов на основе XML, разработанного Microsoft (Professional);

создание пользовательских сценариев сканирования и распознавания текста (Professional)


Подобные документы

  • Конструкторско-технологическое обеспечение производства ЭВМ. Характеристики печатных плат, экономические показатели их производства и выбор материалов. Основные виды печатных плат, требования к их качеству. Типы материалов оснований для печатных плат.

    курсовая работа [1,7 M], добавлен 20.12.2013

  • Область применения оборудования, обеспечивающего измельчение материалов. Мельницы, применяемые при производстве строительных материалов, их устройство, принцип действия и классификация. Характеристика помольного оборудования разных производителей.

    реферат [484,2 K], добавлен 07.05.2011

  • Оценка качества полиграфического исполнения издания-образца по группе печатных процессов. Выбор основных и вспомогательных печатных материалов и их входной контроль. Определение конструкции проектируемого издания. Обоснование печатного оборудования.

    курсовая работа [384,6 K], добавлен 18.09.2019

  • Основные типы насосов и гидродвигателей, их назначение, классификация и область применения. Параметры гидромашин. Устройство, принцип действия шестеренного насоса. Классификация гидродвигателей. Пластинчатые насосы однократного и двукратного действия.

    презентация [344,2 K], добавлен 22.09.2009

  • Понятие технологии как науки о производстве, способах переработки сырья и материалов в средства производства и предметы потребления. Экономическая природа технологий. Виды и классификация технологий. Классификация отраслей по технологическому уровню.

    презентация [161,0 K], добавлен 18.04.2010

  • Внедрение технологии Computer-to-Plate. Образование печатных элементов на формных пластинах с помощью засветки пластин лазерным лучом и химической обработки. Формовыводные устройства для лазерной записи офсетных печатных форм, их характеристики.

    реферат [4,4 M], добавлен 21.01.2010

  • Измерительные и регулирующие устройства, применяемые в функциональных схемах автоматизации. Измерение влажности электролитическим методом. Расходомеры постоянного перепада давления. Анализ дисковой диаграммы самопишущего прибора, принцип его действия.

    реферат [1,0 M], добавлен 01.12.2012

  • Принцип действия манипулятора "мышь". Описание технологичности изделия. Характеристика типового технологического процесса монтажа печатных плат с применением SMD-компонентов. Сетевой граф сборочного процесса. Инструменты, необходимые для его обеспечения.

    курсовая работа [1,8 M], добавлен 10.01.2015

  • Технические характеристики и показатели оформления издания. Основные понятия о плоской офсетной печати. Разновидности ее форм. Классификация формных пластин для технологии Computer-to-Plate. Выбор оборудования и контрольно-измерительной аппаратуры.

    курсовая работа [219,4 K], добавлен 21.11.2014

  • Понятие сыпучих материалов. Классификация методов сепарирования сыпучих сред. Виды сепараторов. Основные характеристики, конструкция и принцип работы устройства для разделения зерен по длине - цилиндрического триера. Расчет его конструктивных размеров.

    курсовая работа [1,6 M], добавлен 24.10.2014

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.