О структуре документов PDF
Для того чтобы файлы Adobe PDF обладали универсальностью и хорошей доступностью, они должны быть хорошо структурированы. С точки зрения структуры, файлы Adobe PDF подразделяются на неструктурированные, структурированные и размеченные. Структурированные файлы PDF обладают некоторой структурой, однако их универсальность и доступность хуже, чем у размеченных файлов PDF. Неструктурированные файлы PDF не имеют структуры, хотя, как показано далее в этом уроке, даже неструктурированные файлы поддаются частичной структуризации. (Файлы PDF, созданные в ранних версиях программы Acrobat, структурой не обладают). Чем выше структурированность файла PDF, тем с большей эффективностью и надежностью можно повторно использовать содержимое этого файла.
Структура встраивается в документ разработчиком документа, когда он, например, определяет в документе заголовки, столбцы, добавляет средства навигации, скажем, закладки, альтернативные текстовые описания для графики и т.п. Во многих случаях логическая структура и теги разметки добавляются в документы PDF автоматически, при преобразовании исходных документов в формат Adobe PDF. Например, когда файл Adobe PDF создается из файлов Microsoft Office (версий 2000 и ХР) или из файлов, созданных в последних версиях программ Adobe FrameMaker, InDesign или PageMaker, либо с помощью средства Web Capture (Web-захват), то в итоге получаются размеченные файлы PDF. Наиболее структурированные документы PDF получаются в том случае, когда разработчик сначала создает четко структурированный документ, а затем преобразует его в размеченный файл PDF.
Связь структуры и универсальности файлов PDF
Основное различие между тремя уровнями структурированности файлов PDF заключается в присутствии или отсутствии в документах древовидной логической структуры, которая поддерживает и доносит до пользователя авторское содержимое.
- Неструктурированные файлы Adobe PDF. He обладают древовидной логической структурой. Все содержимое таких документов интерпретируется как единый блок, не имеющий никакой иерархии или внутренних связей.
Неструктурированные файлы можно сохранять в других форматах, например, в формате RTF, и, как правило, получать хорошие результаты. Получаемые в результате файлы сохраняют авторский текст и исходные абзацы. Все остальное форматирование, в том числе форматирование базового текста, таблицы и списки, исчезает.
- Структурированные файлы Adobe PDF. Обладают древовидной логической структурой, которая позволяет читать авторское содержимое в естественном порядке.
В отличие от неструктурированных файлов, структурированные файлы сохраняют при преобразовании не только весь текст и абзацы, но также и внутреннее форматирование основного текста, например, атрибуты шрифта. Однако при преобразовании структурированных (но не размеченных) файлов списки или таблицы исходного документа не сохраняются. Структурированные файлы PDF можно создать, например, из файлов, подготовленных в приложениях Adobe FrameMakerSGML 6.0 или FrameMaker 7.0, исполняемых в режиме структурирования.
- Размеченные файлы Adobe PDF. Характеризуются логической структурой и набором четких связей между различными элементами, а также содержат дополнительную информацию, которая позволяет выполнять переформатирование текста. Просматривать или редактировать теги разметки в программе Acrobat Standard 6.0 невозможно. Для того чтобы напрямую работать с тегами PDF, необходимо перейти в программу Adobe Acrobat Professional 6.0.
Размеченные файлы способны распознавать таблицы, форматированные списки и оглавления. Кроме того, размеченные файлы распознают, к какому текстовому блоку относятся блоки содержимого. Более того, размеченные файлы содержат информацию о форматировании текста, например, значения Unicode для символов, пробелов между словами, а также мягких и жестких переносов.
Если вам нужно переформатировать документ Adobe PDF, особенно для его использования в карманном устройстве или для создания Web-страницы, вы должны начать с размеченного файла PDF. (Подробности можно найти в теме "Creating new, tagged Adobe PDF documents" (Создание новых размеченных документов Adobe PDF) в онлайновой справке). Кроме того, с размеченным документом проще работать на экране, что, как правило, позволяет добиваться лучших результатов, чем при работе с двумя другими типами файлов.