Языки для создания файлов PPF, PJTF, JDF
Разметка правильно построенных и действительных документы XML. Наиболее распространенные способы преобразования XML-документа в отображаемый пользователю вид: применение стилей CSS, применение преобразования XSLT, написание обработчика XML-документа.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 16.12.2010 |
Размер файла | 40,5 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Язык разметки XML
XML (англ. eXtensible Markup Language -- расширяемый язык разметки; произносится [экс-эм-эмл]) -- рекомендованный Консорциумом Всемирной паутины язык разметки, фактически представляющий собой свод общих синтаксических правил. XML -- текстовый формат, предназначенный для хранения структурированных данных (взамен существующих файлов баз данных), для обмена информацией между программами, а также для создания на его основе более специализированных языков разметки (например, XHTML), иногда называемых словарями. XML является упрощённым подмножеством языка SGML.
Правильно построенные и действительные документы XML
разметка документ стиль обработчик
Стандартом определены два уровня правильности документа XML:
Правильно построенный (Well-formed). Правильно построенный документ соответствует всем общим правилам синтаксиса XML, применимым к любому XML-документу. И если, например, начальный тег не имеет соответствующего ему конечного тега, то это неправильно построенный документ XML. Документ, который неправильно построен, не может считаться документом XML; XML-процессор (парсер) не должен обрабатывать его обычным образом и обязан классифицировать ситуацию как фатальная ошибка.
Действительный (Valid). Действительный документ дополнительно соответствует некоторым семантическим правилам. Это более строгая дополнительная проверка корректности документа на соответствие заранее определённым, но уже внешним правилам, в целях минимизации количества ошибок, например, структуры и состава данного, конкретного документа или семейства документов. Эти правила могут быть разработаны как самим пользователем, так и сторонними разработчиками, например, разработчиками словарей или стандартов обмена данными. Обычно такие правила хранятся в специальных файлах -- схемах, где самым подробным образом описана структура документа, все допустимые названия элементов, атрибутов и многое другое. И если документ, например, содержит не определённое заранее в схемах название элемента, то XML-документ считается недействительным; проверяющий XML-процессор (валидатор) при проверке на соответствие правилам и схемам обязан (по выбору пользователя) сообщить об ошибке.
Данные два понятия не имеют достаточно устоявшегося стандартизированного перевода на русский язык, особенно понятие valid, которое можно также перевести, как имеющий силу, правомерный, надёжный, годный, или даже проверенный на соответствие правилам, стандартам, законам. Некоторые программисты применяют в обиходе устоявшуюся кальку «Валидный».
Синтаксис XML
В этом разделе рассматривается лишь правильное построение документов XML, то есть их синтаксис.
XML -- это иерархическая структура, предназначенная для хранения любых данных, визуально структура может быть представлена как дерево. Важнейшее обязательное синтаксическое требование заключается в том, что документ имеет только один корневой элемент (англ. root element) (альтернативно называемый элементом документа (англ. document element)). Это означает, что текст или другие данные всего документа должны быть расположены между единственным начальным корневым тегом и соответствующим ему конечным тегом.
Первая строка XML-документа называется объявлением XML (англ. XML declaration) -- это необязательная строка, указывающая версию стандарта XML (обычно это 1.0), также здесь может быть указана кодировка символов и внешние зависимости.
<?xml version="1.0" encoding="UTF-8"?>
Спецификация требует, чтобы процессоры XML обязательно поддерживали Юникод-кодировки UTF-8 и UTF-16 (UTF-32 не обязателен). Признаются допустимыми, поддерживаются и широко используются (но не обязательны) другие кодировки, основанные на стандарте ISO/IEC 8859, также допустимы другие кодировки, например, русские Windows-1251, KOI-8.
Комментарий может быть размещен в любом месте дерева. XML комментарии размещаются внутри пары тегов <!-- и -->. Два знака дефис (--) не могут быть применены ни в какой части внутри комментария.
<!-- Это комментарий. >
Ниже приведён пример простого кулинарного рецепта, размеченного с помощью XML:
<?xml version="1.0" encoding="UTF-8"?>
<recipe name="хлеб" preptime="5" cooktime="180">
<title>Простой хлеб</title>
<ingredient amount="3" unit="стакан">Мука</ingredient>
<ingredient amount="0.25" unit="грамм">Дрожжи</ingredient>
<ingredient amount="1.5" unit="стакан">Тёплая вода</ingredient>
<ingredient amount="1" unit="чайная ложка">Соль</ingredient>
<instructions>
<step>Смешать все ингредиенты и тщательно замесить.</step>
<step>Закрыть тканью и оставить на один час в тёплом помещении.</step>
<step>Замесить ещё раз, положить на противень и поставить в духовку.</step>
</instructions>
</recipe>
Остальная часть этого XML-документа состоит из вложенных элементов, некоторые из которых имеют атрибуты и содержимое. Элемент обычно состоит из открывающего и закрывающего тегов, обрамляющих текст и другие элементы. Открывающий тег состоит из имени элемента в угловых скобках, например, «<step>»; закрывающий тег состоит из того же имени в угловых скобках, но перед именем ещё добавляется косая черта, например, «</step>». Содержимым элемента (англ. content) называется всё, что расположено между открывающим и закрывающим тегами, включая текст и другие (вложенные) элементы. Ниже приведён пример XML-элемента, который содержит открывающий тег, закрывающий тег и содержимое элемента:
Кроме содержания у элемента могут быть атрибуты -- пары имя-значение, добавляемые в открывающий тег после названия элемента. Значения атрибутов всегда заключаются в кавычки (одинарные или двойные), одно и то же имя атрибута не может встречаться дважды в одном элементе. Не рекомендуется использовать разные типы кавычек для значений атрибутов одного тега.
<ingredient amount="3" unit="стакан">Мука</ingredient>
В приведённом примере у элемента «ingredient» есть два атрибута: «amount», имеющий значение «3», и «unit», имеющий значение «стакан». С точки зрения XML-разметки, приведённые атрибуты не несут никакого смысла, а являются просто набором символов.
Кроме текста, элемент может содержать другие элементы:
<instructions>
<step>Смешать все ингредиенты и тщательно замесить.</step>
<step>Закрыть тканью и оставить на один час в тёплом помещении.</step>
<step>Замесить ещё раз, положить на противень и поставить в духовку.</step>
</instructions>
В данном случае элемент «instructions» содержит три элемента «step». XML не допускает перекрывающихся элементов. Например, приведённый ниже фрагмент некорректен, так как элементы «em» и «strong» перекрываются.
<!-- ВНИМАНИЕ! Некорректный XML! -->
<p>Обычный <em>акцентированный <strong>выделенный и акцентированный</em> выделенный</strong></p>
В XML определены два метода записи специальных символов: ссылка на сущность и ссылка по номеру символа. Сущностью (англ. entity) в XML называются именованные данные, обычно текстовые, в частности, спецсимволы. Ссылка на сущность (англ. entity references) указывается в том месте, где должна быть сущность и состоит из амперсанда («&»), имени сущности и точки с запятой («;»). В XML есть несколько предопределённых сущностей, таких как «lt» (ссылаться на неё можно написав «<») для левой угловой скобки и «amp» (ссылка -- «&») для амперсанда, возможно также определять собственные сущности. Помимо записи с помощью сущностей отдельных символов, их можно использовать для записи часто встречающихся текстовых блоков. Ниже приведён пример использования предопределённой сущности для избежания использования знака амперсанда в названии:
<company-name>AT&T</company-name>
Полный список предопределённых сущностей состоит из & («&»), < («<»), > («>»), ' («'»), и " («"») -- последние две полезны для записи разделителей внутри значений атрибутов. Определить свои сущности можно в DTD-документе.
Иногда бывает необходимо определить неразрывный пробел, который очень часто используется в HTML и обозначается как в XML такой предопределённой сущности нет, его записывают  , а использование вызывает ошибку. Отсутствие этой весьма распространённой сущности у множества программистов зачастую вызывает удивление и это создаёт некоторые трудности при миграции своих HTML-разработок в XML.
Ссылка по номеру символа (англ. numeric character reference) выглядит как ссылка на сущность, но вместо имени сущности указывается символ # и число (в десятичной или шестнадцатеричной записи), являющееся номером символа в кодовой таблице Юникод. Это обычно символы, которые невозможно закодировать напрямую, например, буква арабского алфавита в ASCII-кодированном документе. Амперсанд может быть представлен следующим образом:
<company-name>AT&T</company-name>
Существует ещё множество правил, касающихся составления корректного XML-документа, но целью данного краткого обзора было лишь показать основы, необходимые для понимания структуры XML-документа.
Годом рождения XML можно считать 1996 год, в конце которого появился черновой вариант спецификации языка, или 1998, когда эта спецификация была утверждена. А началось всё с появления в 1986 году языка SGML.
SGML (англ. Standard Generalized Markup Language -- стандартный обобщённый язык разметки) заявил о себе как гибкий, комплексный и всеохватывающий мета-язык для создания языков разметки. Несмотря на то, что понятие гипертекста появилось в 1965 году (а основополагающие принципы сформулированы в 1945 году[1]), SGML не имеет гипертекстовой модели. Создание SGML можно с уверенностью назвать попыткой объять необъятное, так как он объединяет в себе такие возможности, которые крайне редко используются все вместе. В этом и состоит его главный недостаток -- сложность и, как следствие, дороговизна этого языка ограничивает его использование только крупными компаниями, которые могут позволить себе купить соответствующее программное обеспечение и нанять высокооплачиваемых специалистов. Кроме того, у небольших компаний редко возникают настолько сложные задачи, чтобы привлекать к их решению SGML.
Наиболее широко SGML применяется для создания других языков разметки, именно с его помощью был создан язык разметки гипертекстовых документов -- HTML, спецификация которого была утверждена в 1992 году. Его появление было связано с необходимостью организации стремительно увеличивающегося массива документов в сети Интернет. Бурный рост количества подключений к Интернету и, соответственно, Web-серверов повлек за собой такую потребность в кодировке электронных документов, с которой не мог справиться SGML вследствие высокой трудности освоения. Появление HTML -- очень простого языка разметки -- быстро решило эту проблему: лёгкость в изучении и богатство средств оформления документов сделали его самым популярным языком для пользователей Интернет. Но, по мере роста количества и изменения качества документов в Сети, росли и предъявляемые к ним требования, и простота HTML превратилась в его главный недостаток. Ограниченность количества тегов и полное безразличие к структуре документа побудили разработчиков в лице консорциума W3C к созданию такого языка разметки, который был бы не столь сложен, как SGML, и не настолько примитивен, как HTML. В результате, сочетая в себе простоту HTML, логику разметки SGML и удовлетворяя требованиям Интернет, появился на свет язык XML.
Сильные и слабые стороны
Достоинства
· XML -- язык разметки, позволяющий отобразить двоичные данные в текст, читаемый человеком и анализируемый компьютером;
· XML поддерживает Юникод;
· в формате XML могут быть описаны такие структуры данных как записи, списки и деревья;
· XML -- это самодокументируемый формат, который описывает структуру и имена полей так же как и значения полей;
· XML имеет строго определённый синтаксис и требования к анализу, что позволяет ему оставаться простым, эффективным и непротиворечивым. Одновременно с этим, разные разработчики не ограничены в выборе экспрессивных методов (например, можно моделировать данные, помещая значения в параметры тегов или в тело тегов, можно использовать различные языки и нотации для именования тегов и т. д.);
· XML -- формат, основанный на международных стандартах;
· Иерархическая структура XML подходит для описания практически любых типов документов, кроме аудио и видео мультимедийных потоков, растровых изображений, сетевых структур данных и двоичных данных;
· XML представляет собой простой текст, свободный от лицензирования и каких-либо ограничений;
· XML не зависит от платформы;
· XML является подмножеством SGML (который используется с 1986 года). Уже накоплен большой опыт работы с языком и созданы специализированные приложения;
· XML не накладывает требований на расположение символов в строке;
· В отличие от бинарных форматов, XML содержит метаданные об именах, типах и классах описываемых объектов, по которым приложение может обработать документ неизвестной структуры (например, для динамического построения интерфейсов);
· XML имеет реализации парсеров для всех современных языков программирования;
· XML поддерживается на низком аппаратном, микропрограммном и программном уровнях в современных аппаратных решениях.
Недостатки
Синтаксис XML избыточен.
Размер XML документа существенно больше бинарного представления тех же данных. В грубых оценках величину этого фактора принимают за 1 порядок (в 10 раз).
Размер XML документа существенно больше, чем документа в альтернативных текстовых форматах передачи данных (например JSON, YAML) и особенно в форматах данных, оптимизированных для конкретного случая использования.
Избыточность XML может повлиять на эффективность приложения. Возрастает стоимость хранения, обработки и передачи данных.
XML содержит мета-данные (об именах полей, классов, вложенности структур), и одновременно XML позиционируется как язык взаимодействия открытых систем. При передаче между системами большого количества объектов одного типа (одной структуры), передавать метаданные повторно нет смысла, хотя они содержатся в каждом экземпляре XML описания.
Для большого количества задач не нужна вся мощь синтаксиса XML и можно использовать значительно более простые и производительные решения.
Неоднозначность моделирования.
Нет общепринятой методологии для моделирования данных в XML, в то время как для реляционной модели и объектно-ориентированной такие средства разработаны и базируются на реляционной алгебре, системном подходе и системном анализе.
В природе есть множество объектов и явлений, для описания которых разные структуры данных (сетевая, реляционная, иерархическая) являются естественными, и отображение объекта в неестественную для него модель является болезненным для его сути. В случае с реляционной и иерархической моделями определены процедуры декомпозиции, обеспечивающие относительную однозначность, чего нельзя сказать о сетевой модели.
В результате большой гибкости языка и отсутствия строгих ограничений, одна и та же структура может быть представлена множеством способов (различными разработчиками), например, значение может быть записано как атрибут тега или как тело тега и т. д. Например: <a b="1" c="1"/> или <a b="1" c="1"></a> или <a><b>1</b><c>1</c></a> или <a><c value="1"/></a> или <a><fields b="1" c="1"/></a> и т. д.
Поддержка многих языков в именовании тегов дает возможность назвать, например вес русским словом, в таком случае компьютер никак не сможет установить соответствия этого поля с полем weight в англоязычной версии программы и с полями в версиях модели объекта на множестве других языков.
Иерархическая модель данных, предлагаемая XML, ограничена по сравнению с реляционной моделью и объектно-ориентированными графами и сетевой моделью данных.
Выражение неиерархических данных (например графов) требует дополнительных усилий
Кристофер Дейт, специалист в области реляционных баз данных, автор классического учебника «An Introduction to Database Systems», отмечал, что «…XML является попыткой заново изобрести иерархические базы данных…» (в 1980-е года иерархические базы данных были вытеснены реляционными базами данных).
Пространства имён XML сложно использовать и их сложно реализовывать в XML парсерах.
Существуют другие, обладающие сходными с XML возможностями, текстовые форматы данных, которые обладают более высоким удобством чтения человеком (YAML, JSON, SweetXML, XF).
Отображение XML во Всемирной паутине
Наиболее распространены три способа преобразования XML-документа в отображаемый пользователю вид:
1. Применение стилей CSS;
2. Применение преобразования XSLT;
3. Написание на каком-либо языке программирования обработчика XML-документа.
Без использования CSS или XSL XML-документ отображается как простой текст в большинстве Web-браузеров. Некоторые браузеры, такие как Internet Explorer, Mozilla и Mozilla Firefox отображают структуру документа в виде дерева, позволяя сворачивать и разворачивать узлы с помощью нажатий клавиши мыши.
Применение стилей CSS
Процесс аналогичен применению CSS к HTML документу для отображения.
Для применения CSS при отображении в браузере, XML документ должен содержать специальную ссылку на таблицу стилей. Например:
<?xml-stylesheet type="text/css" href="myStyleSheet.css"?>
Это отличается от подхода HTML, где используется элемент <link>.
Применение преобразования XSLT
XSL является технологией, описывающей как форматировать или преобразовывать данные XML-документа. Документ трансформируется в формат, подходящий для отображения в браузере. Браузер -- это наиболее частое использование XSL, но не стоит забывать, что с помощью XSL можно трансформировать XML в любой формат, например VRML, PDF, текст.
Для задания XSL трансформации (XSLT) на стороне клиента требуется наличие следующей инструкции в XML:
<?xml-stylesheet type="text/xsl" href="transform.xsl"?>
Словари XML
Так как XML является достаточно абстрактным языком, были разработаны словари XML.
Словарь позволяет разработчикам договориться о некотором конечном наборе имен тегов и атрибутов этих тегов. Одним из первых словарей появился XHTML, который понимают большинство браузеров. XHTML часто используют для хранения и редактирования контента в CMS.
Были созданы более специализированные словари, например протокол передачи данных SOAP, который не является человеко-ориентированным и достаточно трудно читаем. Есть коммерческие словари, такие как CommerceML, xCBL и cXML которые используются для передачи данных, ориентированных на торговую деятельность, эти словари включают в себя описание системы заказов, поставщиков, продуктов и прочее.
Обычно, описывая какой-либо документ, человек для себя придумывает некоторый словарь, который потом описывается посредством DTD или просто объясняется «на пальцах» заинтересованным лицам.
Одним из интересных словарей, получивших широкое распространение, является FB2 -- словарь, описывающий формат книги, со всевозможными сносками, цитатами, даже картинками.
Версии XML
· XML 1.0
· XML 1.1
PostScript
PostScript (Постскрипт) -- язык описания страниц, в основном используемый в настольных издательских системах.
Идеология
Postscript был разработан Джоном Уорноком и Чаком Гешке из Adobe Systems в начале 80-х гг. Исходно Postscript использовался как ядро механизма печати компьютеров Apple, но вскоре стал широко распространенным стандартом для большинства компьютерных систем. Интерпретаторы Postscript (в виде программных или аппаратных компонентов) для печати документов присутствуют практически во всех современных компьютерных системах. В Postscript используется модель изображения текста (или рисунков) на чистой странице. Когда страница готова, она выводится на печать и начинается «прорисовка» изображения очередной страницы. Это есть не что иное, как метод компиляции. Каждый документ Postscript включает в себя программу, которая печатает на принтере (или отображает на экране монитора) следующие друг за другом страницы.
История
Концепция языка PostScript была заложена в 1976 году Джоном Уорноком (John Warnock), сотрудником Evans and Sutherland Computer Corporation. Его коллега Джон Гэфни (John Gaffney), занимавшийся тогда интерпретатором для большой базы данных трёхмерной графики Нью-Йоркского порта, создал язык «Design System» (очень похожий на FORTH). Позже Джон Уорнок перешёл в исследовательский центр Xerox в Пало-Альто (Xerox P.A.R.C.) и вместе с Мартином Ньювелом (Martin Newell) создал на базе Design System новую систему JaM (John and Martin), использовавшуюся в исследованиях печати и развившейся в InterPress, протокол печати Xerox.
В 1982 году Джон Уорнок уволился из Xerox и вместе с Чаком Гешке (Chuck Geschke) основал Adobe Systems Inc. Вначале их целью было создание специализированной рабочей станции для печати, которая должна была называться PostScript, но они вскоре поняли, что лучше сконцентрировать усилия на разработке средств для управления принтерами сторонних производителей.
В 1984 году увидел свет PostScript (позже к названию было добавлено Level 1, чтобы отличать его от Level 2 -- см. ретроним). Postscript имел огромные преимущества перед другими системами того времени:
· Платформонезависимость. Один и тот же файл мог печататься как на лазерном принтере, выдававшем тогда 300 dpi, так и на фотонаборном устройстве с 2400 dpi с наилучшим качеством в каждом случае.
· Любой производитель мог лицензировать интерпретатор PostScript и использовать PostScript со своим устройством.
· Спецификации PostScript были общедоступны, таким образом, любой разработчик мог писать программы, поддерживающие PostScript.
Adobe рисковала, выпуская PostScript, и, возможно, ей не удалось бы убедить рынок в необходимости такого языка, если бы не Стив Джобс из Apple Computer. В 1985 году продажи компьютеров Macintosh начали падать, и Apple нужен был «killer app» -- нечто, что мог бы только её компьютер. Стив Джобс инвестировал 2,5 миллиона долларов в Adobe, которая создала PostScript-контроллер для принтера Apple LaserWriter, и в Aldus, создавшую программу PageMaker, использовавшую все возможности Macintosh и LaserWriter. Появившаяся тогда возможность допечатной подготовки на компьютере спасла Apple и превратила Adobe и Aldus в крупные компании. Другие производители фотонаборной аппаратуры, начиная с Linotype, оценили PostScript и вскоре оснастили свою фотонаборную аппаратуру интерпретаторами PostScript. PostScript стал стандартом в области допечатной подготовки.
В 1991 Adobe выпустила следующую ревизию PostScript -- PostScript Level 2. Это была значительная переработка, давно ожидавшаяся издательским сообществом.
Основными улучшениями были:
· Увеличенная скорость и надёжность (в основном это коснулось управления памятью).
· Поддержка цветоделения в самом контроллере.
· Распаковка сжатых изображений в самом контроллере (JPEG и CCITT group 4)
· Поддержка больших наборов шрифтов (для азиатских стран)
· Кэширование шрифтов и изображений.
· Улучшенные драйверы
· Улучшенные алгоритмы печати изображения (Accurate Screening).
Adobe совершила ошибку, обнародовав спецификации PostScript Level 2 до начала работ по его аппаратной реализации. Конкуренты неожиданно вышли на рынок с эмуляторами PostScript Level 2 раньше самой Adobe. В результате потребовалось очень много времени, прежде чем приложения начали использовать все новые функции PostScript level 2. Такая функция, как цветоделение в контроллере до сих пор не поддерживается XPress 5, хотя с момента выхода Level 2 прошло много лет.
В 1998 году Adobe ввела новый стандарт PostScript 3. Изменения по сравнению с Level 2 незначительны. Это можно понять, учитывая, что множество приложений до сих пор не могут обеспечить полную поддержку PostScript Level 2.
Основные преимущества PostScript 3:
· Поддержка 4096 уровней на один цвет (12-бит на цвет, до того было 256 оттенков -- 8 бит на цвет)
· Поддержка PDF. Контроллеры PS Level 3 могут выводить PDF наряду с файлами PS Level 2.
· Расширенная поддержка цветоделения. Контроллеры PS 3 могут производить цветоделение изображений, заданных в оттенках серого или в шести цветах.
· Добавлена интернет-функциональность (Web-ready printing). Пока что никто из OEM-партнёров Adobe не реализовал её.
Область применения
PostScript соединил в себе лучшие возможности принтеров и плоттеров. Подобно плоттерам, PostScript предоставляет возможность вывода высококачественной векторной графики и единый язык управления, который может быть использован любым производителем принтеров. Подобно матричным принтерам, PostScript предлагает удобные возможности по печати растровой графики и текста. В отличие от тех и других, PostScript может совмещать все эти типы вывода на одной странице, давая намного больше гибкости, чем до этого имел любой принтер или плоттер.
PostScript -- больше, чем типичный язык управления принтером, он является полнофункциональным языком программирования. Многие прикладные программы могут преобразовать документ в PostScript-программу, при выполнении которой будет получен начальный документ. Эта программа может быть послана непосредственно на принтер с поддержкой PostScript или преобразована интерпретатором PostScript в другой формат (для принтеров без поддержки PostScript), или результат её выполнения интепретатором может быть показан на экране. Так как исходная PostScript-программа одна и та же, PostScript называется независимым от устройства.
Большинство высокопроизводительных принтеров и плоттеров имеют встроенный интерпретатор языка PostScript. В то же время, простые принтеры домашнего класса поддерживают только элементарные графические операции, поэтому задача создания растрового изображения возлагается на центральный процессор. Существуют интерпретаторы языка PostScript для различных операционных систем, наиболее известный из них -- свободная программа Ghostscript.
Язык
Постскрипт -- полнофункциональный язык программирования. Хотя программы на Постскрипте и создаются в основном не людьми, а другими программами, в принципе ничто не мешает писать на нём программы для обсчёта графики, реализации численных методов решения математических задач и т. п.
Постскрипт -- интерпретируемый стековый язык, похожий на Форт. Синтаксис языка использует обратную польскую нотацию, что делает ненужным использование скобок, однако требует некоторой практики для чтения текста программы из-за необходимости держать в голове содержимое стека. Большинство операторов берут операнды со стека и помещают результат вычислений на стек. Литералы (строки и числа) помещают свою копию на стек.
В PostScript для рисования используется двумерная прямоугольная система координат, начало которой совпадает с левым нижним углом страницы; ось X по умолчанию направлена горизонтально (т.е. по ширине страницы), ось Y -- вертикально. Единицей измерения линейных координат служит типографский пункт. С помощью операторов языка [6, pp. 517-518] начало системы координат может быть перенесено в любую точку (оператор translate), а сама система -- повернута на произвольный угол в плоскости страницы (оператор rotate); масштаб по каждой из двух осей с помощью оператора scale также может быть изменен. Например, «зеркальный» вывод изображения на пленку (т.н. «Emulsion down») в PostScript-принтерах осуществляется при помощи одного единственного оператора scale, задающего отрицательный масштаб по одной из осей системы координат: например, -1.0 1.0 scale.
PostScript имеет черты метафайла, совмещая поддержку как векторных, так и растровых изображений. Шрифты в PostScript только векторные. Немного особняком стоят т.н. Type3-шрифты, в которых для рисования глифы (процедура /BuildGlyph) м.б. использована любая процедура, сформулированная в терминах языка PostScript [6, pp. 337-342]. После выхода SP4 для Windows NT 4.0 в 1998 году (см. также http://support.microsoft.com/gp/lifesupsps ) при установленном в системе Adobe Type Manager 4.0 и драйвере AdobePS 5 все шрифты в не-roman кодировке, в частности кириллица выгружались в PostScript-файл в виде Type3-шрифтов, где каждая глифа была представлена в виде растрового изображения соответствующего разрешения. Выгрузка шрифта в виде растровых изображений создала много проблем при подготовке к выводу на фотонабор и допечатной подготовке вообще. Эта ошибка была исправлена в AdobePS 5.1 и Adobe Type Manager 4.1, которые затем вошли в дистрибутив Windows 2000.
Структура документа
Структура файла PostScript формируется структурными комментариями [14]. Структурные комментарии начинаются с последовательности символов «%%» в начале строки.
Файл PostScript состоит из четырёх частей: заголовка, пролога, тела и эпилога.
Заголовок начинается строкой «%!PS-Adobe-N.M» где N.M -- версия спецификации, далее идут структурные комментарии с общими свойствами документа, и заканчивается заголовок строкой «%%EndComments».
%!PS-Adobe-2.0
%%Creator: dvips(k) 5.78 Copyright 1998 Radical Eye Software
%%Title: rep.dvi
%%Pages: 9
%%PageOrder: Ascend
%%BoundingBox: 0 0 596 842
%%EndComments
В прологе обычно содержатся описания подпрограмм и данные, необходимые для печати документа -- например, процедуры и шрифты. Пролог заканчивается комментарием «%%EndProlog».
В теле программы содержатся команды, отвечающие за отрисовку каждой страницы, предваряемые строкой «%%Page: <метка> <номер>», где <метка> -- метка страницы, которая не выводится на печать, и <номер> -- порядковый номер страницы в файле, например, %%Page: iii 3
После команд отрисовки всех страниц идёт структурный комментарий «%%Trailer», после чего начинается эпилог.
В эпилоге можно продублировать комментарии из заголовка (это реализовано на случай, если в начале вывода программе ещё не известно, например, число страниц) -- в этом случае вместо числовых значений параметров в заголовке надо писать «(atend)».
Заканчивается файл строкой «%%EOF».
Обзор элементов языка
Стеки
В PostScript для хранения данных разных типов используются четыре стека: стек операндов, стек графических контекстов, стек исполнения, стек словарей.
Типы данных
Основные типы данных языка PostScript: целое число со знаком, вещественное число, логическое выражение (true или false), строка символов ( ( … ) ), массив ( [ … ] ), процедура ( { … } ), словарь, имя.
Операторы
Операторы в PostScript получают операнды (параметры), вынимая их из стека, и записывают результаты действий (если они есть) также в стек. Такой стиль программирования, при котором операнды задаются до операции над ними (оператора), называется постфиксной нотацией. Например, для сложения двух заданных чисел необходимо вначале поместить их в вершину стека операндов, затем выполнить команду add, которая извлечёт из стека два элемента, помещённые последними (то есть заданные числа), сложит их и запишет результат в стек, откуда он сможет быть извлечён другой операцией в качестве операнда. Это записывается так:
4 5 add
Операторы PostScript можно разделить на несколько групп. Это операторы для работы с содержимым стека (независимо от типа), арифметические операции, операторы работы с массивами, работы со словарями, работы со строками, сравнения, управления потоком команд, работы с типом аргументов и преобразования, доступа и работы с файлами, работы с виртуальной памятью, графического состояния и другие.
Краткий обзор механизма рисования изображения
Процесс рисования (растрирования) при выполнении (интерпретации) PostScript-программы заключается в вычислении для каждого пиксела устройства вывода одного (для монохромного) или нескольких (например четырёх для CMYK-устройства или шести для CMYKOrGr) значений параметра (-ов) в диапазоне от 0 до 1.0. Вычисленное значение параметра (-ов) используется в качестве аргумента ещё одной важной функции -- transfer function [6, pp. 478-480] (русскоязычный синоним -- отображение). По умолчанию в подавляющем большинстве случаев эта функция представляет собой простейшую функцию y(x)=x и её значение тождественно равно значению аргумента. Однако в ряде случаев -- например для компенсации растискивания используются достаточно сложные нелинейные зависимости y(x), задаваемые кусочной либо табличной аппроксимацией. Кусочно-линейная аппроксимация transfer function используется например в EPS- и PS-файлах Adobe Photoshop -- для аппроксимации используется разбивка области определения [0;1.0] на сорок участков с шагом 0.025 (2.5% растровой точки); на каждом из сорока участков transfer function имеет вид y(x)=b·x+a. Transfer function вида y(x)=1-x (в терминах PostScript language {1 sub neg} settransfer) обращает изображение, делая из него негатив -- именно таким образом печатают негатив PostScript-принтеры.
Для монохромных устройств -- например для фотонабора, решение о закрашивании (засветке) пикселя может приниматься в результате сравнения вычисленного для данного пиксела значения transfer function и значения т.н. Spot-функции либо двумерного массива Threshold array [6, pp. 484-490], [15]: в случае, если значение transfer function больше значения Spot-функции или элемента Threshold array для этого пиксела последний закрашивается (засвечивается). Специальный подбор transfer function и Spot-функции или Threshold array позволяет получить отношение числа закрашенных и незакрашенных пикселей устройства вывода для каждого пиксела исходного (растрируемого) изображения таким, что на оттиске (отпечатке) средняя яркость соответствующего участка изображения почти пропорциональна значению вычисленного параметра.
Подобным образом формируется точки различного размера, из которых состоит полутоновое изображение на типографских оттисках: в газетах, журналах, книгах.
Пример программы
%!PS-Adobe-1.0
% По умолчанию, постскрипт использует единицу измерения 1 пункт=1/72 дюйма,
% а нам нравятся миллиметры.
72 25.4 div % 1 мм = 72/25.4 пунктов
dup % дублировать значение на вершине стека
scale % растянуть в это количество раз по обеим координатам
100 100 translate % установить начало координат в (100мм, 100мм)
/Times-Roman findfont % взять шрифт Times-Roman
10 scalefont % растянуть до размера 10 (у нас единица измерения - мм!)
setfont % установить выбранный шрифт
0 30 330 { % цикл для углов от 0 до 330 с шагом 30
gsave % запомнить текущее преобразование координат
rotate % повернуть систему координат (угол в градусах берём с вершины стека)
15 0 moveto % перейти в точку (15мм, 0мм)
(PostScript) show % написать слово текущим шрифтом
grestore % вернуть преобразование координат
} for % конец цикла for
showpage % вывести страницу
Тенденции и перспективы
В настоящее время помимо PostScript на рынке лазерных принтеров широкое распространение получил язык управления принтером PCL, разработанный Hewlett-Packard. PCL -- язык управления принтером, он изначально нацеливался на иные задачи, чем PostScript, и не может обеспечивать переносимость. Фактически это язык управления принтером. Однако для офисного использования он в ряде случаев более удобен.
PCL использует стандартные Windows-шрифты TrueType (в отличие от PostScript). Кроме того, последняя его версия (PCL6) разрабатывалась HP в тесном сотрудничестве с Microsoft и потому обеспечивает ускоренный возврат ответа в приложение, быструю печать сложных графических изображений, улучшенное качество печати и повышенную точность при выводе документов.
Кроме того, язык PostScript предполагает лицензирование и выплату лицензионных отчислений Adobe с каждого контроллера RIP (Raster Image Processor), в то время как язык PCL может использоваться сторонними производителями бесплатно. Поэтому в настоящее время лицензированные RIP PostScript 3 для плоттеров производства HP стоят около 500 долларов, в то время как нелицензированные контроллеры -- «эмуляция PS2» производства OKI стоят 30-70 долларов.
В результате, если десять лет назад практически все лазерные принтеры поддерживали PostScript в качестве основного языка, то в настоящее время множество лазерных принтеров класса SOHO не оснащается поддержкой PostScript c целью удешевления. Таким образом, PostScript вытесняется из офисов языком PCL, оставаясь, тем не менее, практически безальтернативным стандартом в области допечатной подготовки.
Блиблиографический список:
1. Дэвид Хантер, Джефф Рафтер и др. XML. Базовый курс = Beginning XML. -- М.: Вильямс, 2009. -- 1344 с. -- ISBN 978-5-8459-1533-7
2. Сергеев А.П. HTML и XML. Профессиональная работа. -- М.: Диалектика, 2004. -- 880 с. -- ISBN 5-8459-0676-8
3. Роберт Тейбор. Реализация XML Web-служб на платформе Microsoft .NET = Microsoft .NET XML Web Services. -- М.: Вильямс, 2002. -- 464 с. -- ISBN 0-672-32088-6
4. PrePressSure [электронный ресурс] - PostScript; Режим доступа: http://www.prepressure.com/
Размещено на Allbest.ru
Подобные документы
Разработка исходного XML-документа, который будет содержать данные варианта. Разработка таблицы стилей XSLT для преобразования исходного XML-документа исходного XML-документ с заданной структурой. Анализ базового класса, содержащего виртуальные методы.
курсовая работа [1,3 M], добавлен 01.05.2019Изучение использования расширяемого языка стилей для преобразований документов. Анализ взаимодействия XML и XSLT в архитектуре клиент-сервера. Обзор набора шаблонных правил, каждое из которых определяет процедуру обработки определенной части документа.
практическая работа [434,3 K], добавлен 13.05.2011Определение понятия гипертекста. Основные части документа SGML. История создания стандартного языка разметки документов HTML. Отличия синтаксиса XHTML от HTML. RSS - семейство XML-форматов для описания лент новостей. Применение языка разметки KML.
презентация [4,3 M], добавлен 15.02.2014Описание технических средств. Описание программного обеспечения. Порядок создания документа. Способы получения справочной информации. Создание нового документа. Загрузка рабочего документа. Рабочая книга, ячейки.
контрольная работа [44,8 K], добавлен 09.04.2004Структура и представление информации с помощью технологий XML-XSL. Применение XSLT-инструкций для разработки шаблона XSL. Алгоритм преобразования XML. Разработка конвертера XML-представлений групповых спецификаций на сборочное изделие в PDF-формат.
дипломная работа [3,6 M], добавлен 09.06.2014Основы работы с Windows: копирование, перемещение, удаление файлов и папок. Word: создание и применение стилей шаблона документа. Excel: поиск и выборка данных в соответствии с назначенным критерием. Глобальная сеть Интернет: поиск информации в сети.
контрольная работа [1,4 M], добавлен 24.07.2010Элементы интерфейса, панели инструментов и быстрого доступа Microsoft Word 2007. Особенности сохранения и преобразования файлов предыдущих версий Word в формате DOCX. Изменение масштаба отображения документа в режиме чтения и форматирования текста.
курсовая работа [2,8 M], добавлен 27.01.2015Принципы создания последовательных и файлов произвольного доступа. Формирование файлов, в одном из которых помещены фамилии пяти знакомых, а в другой номера их телефонов. Составление программы, которая по фамилии знакомого определяет номер его телефона.
контрольная работа [17,9 K], добавлен 25.12.2010Рассмотрение порядка создания объектного документа в Delphi7. Создание стандартного приложения. Выбор свойств компонента. Вызов редактора определения полей. Описание структуры документа. Создание DataSet для компонента ClientDataSet. Представление данных.
реферат [2,0 M], добавлен 22.07.2014Сущность, структура и значение приложения Microsoft Office 2003, его основные возможности. Концепция электронного документа и его обязательные реквизиты. Особенности технологии создания и редактирования текстового документа в Microsoft Word 2003.
реферат [23,0 K], добавлен 23.11.2010