Импорт текста
Формат – это способ кодирования информации. От формата файла зависит, какую информацию можно хранить в этом файле и каким образом будет осуществляться чтение/запись. В системе Windows судить о формате файла данных можно по его расширению. Все файлы одного формата имеют одинаковое расширение имени.
Каждый разработчик программного обеспечения придумывает свой способ кодирования, свой формат файлов данных, который лучше всего отвечает задачам, выполняемым данной программой. Формат графических файлов TIFF позволяет хранить информацию о цветовых каналах и треппинге, а для файлов, создаваемых в текстовом редакторе, эта информация совершенно не нужна, зато в нем хранятся данные о начертании символов и использованной гарнитуре. Форматы файлов патентованы, например сторонний производитель не может выпустить текстовый редактор, создающий файлы в формате Microsoft Word.
Типы текстовых файлов
Если говорить о форматах текстовых файлов, их можно разделить на два типа. Собственно текстовые файлы, имеющие расширение txt, содержащие только сведения о символах. Каждому символу соответствует стандартный код. Существует несколько таблиц кодировки. В таблице кодировки каждому символу латинского алфавита присвоен уникальный двоичный код. Для символов национальных алфавитов в странах, где они используются (в частности, для кириллицы), применяются расширенные кодовые страницы.
К наиболее распространенным текстовым форматам относятся ASCII (American Standart Code for Information Interchange), ANSI (American National Standart Insitiute) и Unicode-файлы. Они имеют разные кодовые таблицы. Полученный файл будет обладать рядом недостатков. Формат ASCII – это базовый уровень представления текстовой информации, он един для всех программных средств, работающих с текстами. В тексте ASCII нет полужирного и курсивного начертания, отсутствует система гарнитур и кеглей (только один, стандартный). В нем нет отступов, и, как правило, каждая строка в этом документе представляет собой отдельный абзац.
Второй тип, условно относимый к текстовым, – это файлы с форматированием. В формате этих файлов содержится не только информация об их содержании, т. е. о символах, но и о способе представления этих символов, т. е. шрифтах, кеглях, начертаниях, разбивке на абзацы и страницы, размере полосы набора, иногда о стилях абзацев и символов В общем, обо всех элементах форматирования, выполненных в данном тексте. Файлы с форматированием создаются в текстовых процессорах различного класса.
Особое место занимают текстовые файлы со стилевой разметкой – Tagged Format – в них сохраняется стилевая разметка, а полученный файл имеет расширение txt, являясь обычным ASCII-файлом.
Для того чтобы конвертировать файлы из одних форматов в другие, используют фильтры импорта и экспорта.
Фильтры импорта
Фильтр импорта представляет собой программу, осуществляющую перевод файла из формата стороннего приложения во внутреннее представление PageMaker, по возможности сохраняя форматирование, выполненное в исходном процессоре. PageMaker по своей природе предназначен для обработки файлов разных форматов, поэтому у него этих фильтров импорта очень много. Программа выбирает фильтр импорта автоматически, по расширению имени файла с текстом.
Чтобы узнать, какие фильтры импорта установлены на вашем компьютере, выберите команду About PageMaker (О программе PageMaker) меню Help (Помощь), удерживая нажатой клавишу CTRL. На экране появится окно, представленное на рис. 7.9. В начале списка перечислены установленные дополнения PageMaker. Прокрутив список далее, вы увидите перечень всех фильтров импорта для текстовых файлов и для графических материалов.
Рис. 7.9, а) Список установленных фильтров и дополнений PageMaker
Рис. 7.9, б)
В этом списке представлены только установленные фильтры. Чтобы узнать, какие фильтры вообще входят в ваш комплект PageMaker, прочтите текст, расположенный в файле Readme на одном из дистрибутивных дисков. Воспользуйтесь контекстным поиском по словам "формат" или "импорт".