Иллюстрированный самоучитель по Macromedia FreeHand

Текстовые форматы ASCII и RTF

Тексты – это самый распространенный тип данных в компьютерном мире. Текстовую форму имеют не только источники, предназначенные для чтения, дискурсы. Многие компьютерные программы, описания изображений, сценарии работы операционных систем записываются в текстовом виде; и, хотя работать с такими описаниями могут только специалисты или специальные программы – лингвистические процессоры, они имеют все формальные признаки текста: алфавит, синтаксис и семантику.

Можно предположить, что в такой важной области, какой является тестовая форма представления информации, действуют стандарты, имеющие силу физических законов. К сожалению, это предположение ошибочно. Основной причиной "текстовой разноголосицы" является очень большое количество символов, требующихся для поддержки различных языков и сфер человеческой деятельности.

Для кодирования нескольких десятков европейских языков, использующих латинский алфавит, достаточно иметь полторы сотни символов. Каждый язык, базирующийся на собственном национальном алфавите, требует примерно сотни символов. Это славянские языки, греческий, иврит, арабский, санскрит и др. Для китайского, корейского и других языков, основанных на иероглифах, счет идет уже не на сотни, а на тысячи. Если учесть, что во многих областях человеческой деятельности используются специальные символы, например, для записи математических формул или знаки редакторской правки, то количество символов универсального алфавита уверенно приближается к десяти тысячам.

Чем же мы располагаем? В современных персональных компьютерах на один символ отводится восемь двоичных разрядов, т. е. байт. В такой системе кодирования можно записать 256 символов (два в восьмой степени). Исторически ситуация сложилась так, что стандартизованы только 128 символов с номерами (кодами) от 0 до 127. Они называются символами ASCII (American Standard Code for Information Interchange, американский стандартный код обмена информацией) и составляют первую половину кодовой таблицы. В состав ASCII входят важные управляющие символы, прописные и строчные буквы латинского алфавита, цифры, знаки препинания и некоторые спецсимволы.

Вторая половина кодовой таблицы может использоваться для различных целей, например, для кодирования национальных алфавитов или расширенного множества математических символов. Если набор ASCII является общим для большинства компьютерных платформ и операционных систем, то расширенные наборы имеют значительные различия. Существует несколько стандартов, которые определяют содержание всех 256 символов: ANSI, КОИ-8, EBCDIC и др. ANSI – это стандартная кодировка для платформы Windows, КОИ-8 широко используется различными версиями операционной системы Unix, кодировка EBCDIC применяется на машинах класса mainframe.

Самой решительной попыткой преодолеть недостатки систем кодирования, основанных на однобайтовом представлении символов, является сравнительно новый стандарт Unicode (ISO 10646). В этой системе кодирования символы представляются двумя байтами (шестнадцать двоичных разрядов), поэтому диапазон допустимых кодовых значений равен 65536 (два в шестнадцатой степени). Алфавит такой мощности с избытком покрывает все текущие и будущие потребности программистов и компьютерных пользователей.

ASCII

Файлы, в которые входят только символы первой половины кодовой таблицы, называются ASCII-файлами или текстовыми файлами. Текстовый файл представляет собой последовательность литер, которую для удобства чтения делят обычно на слова и строчки. Текстовые файлы намного беднее по оформлению, чем файлы, которые создают специальные текстовые редакторы. В них нельзя включить картинки или поля, они не имеют форматирования и сложной разметки и не обладают аппаратом ссылок и сносок; большинство декоративных элементов форматирования недоступно для текстовых файлов. Зато текстовые файлы являются аппаратно и программно независимыми и их можно использовать для обменов данными между различными программами и компьютерными платформами.

Текстовые файлы экспортируют текстовые редакторы и программы расчета электронных таблиц, в текстовой форме может существовать графика форматов EPS, PDF, DXF и др., любая программа на начальных стадиях разработки является текстовым файлом.

FreeHand может открывать, импортировать и передавать текстовые файлы в другие приложения. Одной из немногих проблем, которая сопровождает импорт текстовых файлов, является засорение данных "странными символами". Это часто происходит в тех случаях, когда FreeHand обменивается информацией с приложениями, работающими на других платформах.

Импорт текста ничем не отличается от импорта графики. Принятый в программу текст заполняет, по умолчанию, новый текстовый блок. Если щелкнуть курсором в любой точке монтажного стола, то размеры блока будут выбраны автоматически и подогнаны под объем текста. При помощи буксировки курсора можно задать собственные размеры блока для импортированного текста. Текст, не вошедший в блок, не теряется, а становится избыточным и загружается в буфер блока.

RTF

RTF (Rich Text Format) – это формат, разработанный фирмой Microsoft, для обменов форматированным текстом между программами и платформами. Документ в формате RTF состоит из информационной и управляющей частей, каждая из которых записывается в текстовом виде. Информационная часть передает содержательную сторону документа, управляющий раздел документа хранит сведения о его оформлении.

Для описания признаков форматирования и декоративных элементов документа используется специальный командный язык. Каждая управляющая конструкция языка представляет собой последовательность букв нижнего регистра, которая начинается с обратной косой черты (\) и заканчивается специальным разделителем. Разделителями могут быть пробелы, цифры, символы переноса и др.

Фирма Microsoft расширяет стандарт RTF, поэтому выразительные возможности формата постоянно увеличиваются. В настоящее время они примерно равны возможностями формата doc седьмой версии текстового редактора Word. Почти все, что можно создать в этой программе и сохранить в формате doc, можно записать в формате RTF.

FreeHand одинаково хорошо работает с файлами в формате RTF как на прием, так и на передачу. Работа с RTF-файлами имеет несколько особенностей:

  • FreeHand экспортирует RTF-файлы, совместимые с Word 7 и программами пакета Office 97;
  • Со всеми приложениями Windows, которые удовлетворяют спецификации OLE (Object Linking and Embedding), FreeHand может обмениваться файлами RTF при помощи буксировки;
  • В приложении, которое принимает данные от FreeHand, содержимое нескольких текстовых блоков располагается согласно позиции блока в вертикальной "стопке". Символы блока, занимающего самую верхнюю позицию, будут помещены в самый конец текстового массива;
  • В формате RTF применяется специальная единица измерения "twips", равная одной двенадцатой части пункта. Поэтому метрические параметры текста, которые не кратны одной двенадцатой части пункта, могут меняться из-за округления, вызванного переводом в единицу измерения RTF;
  • При экспорте в формат RTF будут потеряны следующие элементы оформления текста: сдвиг относительно базовой линии (Baseline SHIFT), табуляторы обрыва колонок (Wrapping Tab) и внедренная графика (Inline Graphics).
Если Вы заметили ошибку, выделите, пожалуйста, необходимый текст и нажмите CTRL + Enter, чтобы сообщить об этом редактору.