Формат XML в Microsoft Office 2002
В новой версии Microsoft Office 2002 введена поддержка формата XML как возможного формата для представления всех видов документов Office. В предыдущей версии в формате XML были представлены лишь страницы доступа к данным Access 2000. Microsoft Access 2002 поддерживает возможность экспорта в формат XML всех типов объектов баз данных, относящихся к работе с данными.
XML (Extensible Markup Language) – это расширяемый язык разметки гипертекста, разработанный на базе HTML как формат универсального представления данных в глобальных сетях. Этот формат позволяет обмениваться данными через Интернет в едином виде между совершенно различными приложениями. XML расширяет возможности HTML, т. к. позволяет создавать дополнительные элементы, с помощью которых можно описывать и определять новые данные, объекты и свойства, отделяя данные от их представления в виде HTML, благодаря чему удается преодолеть ограничения HTML в возможности описания нестандартных объектов. XML официально принят консорциумом W3C (World Wide Web Consortium), который занимается стандартами, относящимися к World Wide Web.
Для представления документов Office в виде документов XML используется комбинация форматов XML, VML и CSS в дополнение к HTML. Благодаря этому удалось сделать HTML полноценным форматом документов Office 2002 (определения терминов XML, VML и CSS см. в приложении 1). Теперь поговорим о структуре документа XML. Дело в том, что такой документ может состоять не из одного файла XML, а из нескольких файлов разных типов. Это могут быть файлы следующих типов:
- Web-страница для просмотра полученного документа (в формате HTML или ASP);
- файл XSL, содержащий описание структуры внешнего представления документа;
- файл XML, включающий в себя данные, являющиеся источником для заполнения документа;
- файл XSD, содержащий описание структуры данных, обычно его называют схемой данных.
Это обусловлено логическим разделением документа XML на отдельные части: данные (XML), структуру данных (XSD) и представление данных (HTML или ASP, XSL).
Подчеркнем, что все эти файлы вместе образуют единый документ Web, который можно просмотреть с помощью обозревателя Internet Explorer 5 и выше. Они лишь описывают разные его части. Однако файл XML (возможно, вместе с файлом XSD) может быть использован независимо от других частей такого представления Web-документа приложениями, распознающими этот формат данных. Файл в формате HTML или ASP содержит лишь сценарий, который активизируется при загрузке страницы и загружает данные на страницу из источника в формате XML.
Отделение самих данных от их представления (в формате HTML) и помещение их в отдельный файл в формате XML открывает возможность другим приложением, воспринимающим этот специально разработанный универсальный формат, получать и обрабатывать данные (независимо от их представления) из такого документа. Например, Access 2002 позволяет импортировать данные в формате XML в базу данных. Еще отделение данных от их представления позволяет различным приложениям применять разнообразные способы для отображения одних и тех же данных XML с помощью нескольких различных файлов представления данных (см. разд. "Импорт данных из документов и схем XML" гл. 3).
Файл XSD называется схемой XML. Его содержание удовлетворяет стандарту XML Schema standard (XSD), официально принятому концорциумом W3C. Файл схемы XML описывает структуру данных в универсальном виде, включая информацию о названиях элементов, типах данных, комбинациях элементов, об атрибутах элементов. Схема XML определяет модель представления данных в формате XML: задает правила для тэгов и текста. Применение схемы XML гарантирует правильное восприятие данных в формате XML другими приложениями и правильное преобразование этих данных в другие форматы данных.
Файл XML содержит описание данных, но не содержит описание того, как они должны быть отображены в программе просмотра. Эта информация предоставляется отдельно, в файлах CSS на языке описания стилей Cascading Style Sheet. Однако это не слишком удобно, т. к. разработчику приходится изучать еще и язык CSS в дополнение к XML, к тому же CSS предоставляет недостаточно средств для контроля над выводом данных. В современных приложениях чаще применяется более гибкое средство для описания внешнего представления данных XML – язык XSL (Extensible Stylesheet Language). Он позволяет точно выбрать данные, которые требуется отобразить, задать порядок расположения элементов данных, модифицировать и добавить дополнительную информацию. Кроме того, этот язык похож на XML: в XSL используются XML-подобные тэги и HTML для создания шаблона специфического стиля вывода данных. Заметим, что для отображения данных XML в Internet Explorer 5 или выше необязательно присоединять файлы CSS или XSL, т. к. эта программа просмотра имеет собственное описание стиля, применяющееся по умолчанию. Используйте собственные файлы описания стилей, чтобы обеспечить единообразный внешний вид ваших Web-страниц, основанных на данных XML.
В Access 2002 используется еще разрабатываемый в настоящее время концорциумом W3C язык преобразования стилей XSLfor Transformation (XSLT). Он основан на языке XML и применяется для отображения или преобразования одного документа XML в другой, а именно – для преобразования внешнего вида документа XML из одного формата в другой. Присоединение файла XSLT к документу XML позволяет с помощью дополнительных средств интерпретировать и преобразовать этот документ в другой формат, который может распознать другое приложение.
Access 2002 позволяет экспортировать из объекта данных в формат XML отдельно только данные, только схему данных, данные и схему данных вместе, внешнее представление данных. При необходимости можно использовать файл в формате XSL для преобразования внешнего представления документа XML в другое представление или файл в формате XSLT для преобразования файла данных XML в другой формат.