Сохранение и использование файлов в формате HTML и XML
Если вы работаете на локальном компьютере, то документ, созданный в Microsoft Office, по умолчанию сохраняете в двоичном формате, имеющем расширение.doc,.xls,.ppt и т.п., в зависимости от приложения, в котором он создавался. Документ Word можно сохранить в формате HTML (Hypertext Markup Language) и XML (extensible Markup Language – расширяемый язык разметки) и опубликовать в корпоративной сети или в Интернете, выбрав в меню Файл (File) команду Сохранить как Веб-страницу (Save As Web-Page). Поле Тип файла (Save as type) диалогового окна команды сохранить файл в таких форматах как: Веб-страница (Web Page), Веб-страница с фильтром (Web Page, Filtered) и Веб-архив (Web Archive). Формат Веб-страница (Web Page) сохраняет все возможности редактирования документа в формате HTML. Формат Веб-страница с фильтром (Web Page, Filtered) удаляет часть HTML кода и уменьшает размер файла. Формат Веб-архив (Single file Web Page) позволяет переслать содержимое (текст и графику) в одном файле *.mht, *.mhtml.
При использовании любого из вышеназванных форматов в каждом документе сохраняются все параметры форматирования. Пользователи корпоративной сети или в Интернете, на компьютерах которых не установлен Microsoft Office, могут просматривать файлы, сохраненные в форматах HTML или XML, в обозревателе или в других программах просмотра Интернета.
Office обеспечивает высокую точность воспроизведения в окне обозревателя отформатированного документа, который выглядит точно так же, как в окне приложения. Сохраняются параметры диаграмм и рисунков, например, цвета и характеристики линий. Начинающий пользователь, не умеющий программировать, может создать в Office 2003 веб-страницу и опубликовать ее на веб-сервере без потери качества и функциональных возможностей документа. Автоматическое определение кодировки HTML и XML позволяет увидеть правильные символы в любой языковой среде.
Особенности сохранения файлов в формате HTML
Различают статический и динамический форматы HTML. Статический формат используется в тех случаях, когда данные изменяются редко, динамический – когда необходимо отобразить последние на момент публикации данные. Отметим, что уже Access 2002 поддерживал преобразование объектов в два динамических формата HTML: ASP (Active Server Pages) и IDC/HTX. Файл с расширением asp используется для динамических веб-страниц, с расширением idc содержит запрос в форме инструкции SQL, с расширением htx содержит команды и инструкции по форматированию. Вместо данных в файлы с расширением htx. включены шаблоны, указывающие место вставки данных из запроса в файле с расширением idc.
При сохранении документа в формате HTML Office 2003 создает в заданном каталоге один HTML-файл (например, otchet.htm) и папку с тем же именем, включающую все вспомогательные файлы документа и управляющий основной файл. В отдельный файл помещаются каждый рисунок, Электронная таблица, слайд презентации, набор вспомогательных данных. Все графические изображения в зависимости от содержания автоматически преобразуются в формат.GIF, JPG, JPEG или.PNG. Например, штриховые рисунки сохраняются в формате GIF, а фотографии – в JPEG. При перемещении таких документов необходимо копировать как основной HTML-файл, так и папку со вспомогательными файлами. (Подробнее см. ниже раздел "Типы файлов, используемые для отображения рисунков и графики на веб-странице")
Для облегчения редактирования нерастровой графики с помощью соответствующих программ при преобразовании документа Office 2003 в формат HTML графические изображения сохраняются как во внутреннем формате, так и в формате обозревателя.
В качестве примера приведем порядок преобразования объекта базы данных Access в динамический формат HTML:
- В окне База данных (Database) выделите щелчком мыши требуемый объект и выберите в меню Файл (File) команду Экспорт (Export To).
- В диалоговом окне Экспорт объекта (Export To) в поле Тип файла (Save as type) выделите строку Microsoft IIS 1-2 или Страницы Microsoft ASP (Microsoft Active Server Pages).
- Выберите папку, в которой будет сохранен экспортируемый файл и введите имя файла латинскими буквами в поле Имя файла (File name).
- Нажмите кнопку Экспорт (Export).
- При использовании формата Active Server Pages появится диалоговое окно Настройка вывода файла ASP (Microsoft Active Server Pages Output Options), в котором укажите назовите источник данных ODBC. Он будет использован на веб-сервере для доступа к данным. Введите адрес сервера, на котором будет размещен файл ASP.
Использование ценных в формате XML
Office 2003 поддерживает язык XML (extensible Markup Language – расширяемый язык разметки). Этот язык обеспечивает интуитивно понятные мощные средства коллективной работы и широко используется при обмене информацией в Интернете независимо от применяемой платформы, формата данных. Формат XML разработан на базе HTML как формат универсального представления данных в корпоративных сетях и в Интернете. Он обладает более широкими возможностями, чем HTML. В этом формате можно представить любой документ Office.
XML упрощает выборку данных из документов Office 2003 в другие XML-приложения. Можно разделить содержимое документа и границы его двоичного формата. Содержимое становится доступным для процессов автоматического сбора и анализа данных с последующей корректировкой. Документ XML может состоять из нескольких файлов разных типов, например, файла XML, содержащего данные; файла ASP, содержащего веб-страницу для просмотра документа; файла xsd, содержащего описание структуры данных и т.д. Единый документ можно просмотреть в Internet Explorer версии 5 и выше. Файл, в формате HTML содержит сценарий, который загружает данные из источника в формате XML.
В отличие от универсальных тегов HTML, теги XML могут видоизменяться разработчиками и поэтому должны передаваться тому ПО, которое их использует. Microsoft предполагает использовать XML-формы исключительно на корпоративном рынке. В связи с тем, что некоторые обозреватели не работают с XML, в Word предусмотрена возможность сохранения документа в виде фильтрованной веб-страницы без использования дескрипторов XML. Для использования этой возможности в меню Сервис (Tools) выберите команду Параметры (Options), а затем откройте вкладку Общие (General), нажмите кнопку Параметры веб-документа (Web Options) и перейдите на вкладку Обозреватели (Browsers), установите или снимите флажок Отключение компонентов, не поддерживаемых этим обозревателем. Совокупность XML-тегов, определяющих элементы документа, называется схемой (schema).
Сохранение и открытие файлов XML в Word 2003 может использоваться для интеграции с основными бизнес-данными предприятия. Инструмент графического связывания в Excel обеспечивает связывание заданной пользователем схемы XML с ячейками электронной таблицы Excel.