Константы
Символы
Для записи одиночных символов используются следующие формы.
- Печатные символы можно записать в апострофах: ' а ', ' N ', '? '.
- Управляющие символы записываются в апострофах с обратной наклонной чертой:
- ' \n ' – символ перевода строки newline с кодом ASCII 10;
- ' \r ' – символ возврата каретки CR с кодом 13;
- ' \f ' – символ перевода страницы FF с кодом 12;
- ' \b ' – символ возврата на шаг BS с кодом 8;
- ' \t ' – символ горизонтальной табуляции НТ с кодом 9;
- ' \\ ' – обратная наклонная черта;
- ' \" ' – кавычка;
- ' \' ' – апостроф.
- Код любого символа с десятичной кодировкой от 0 до 255 можно задать, записав его не более чем тремя цифрами в восьмеричной системе счисления в апострофах после обратной наклонной черты: ' \123 ' – буква S, ' \346 ' – буква Ж в кодировке СР1251. Не рекомендуется использовать эту форму записи для печатных и управляющих символов, перечисленных в предыдущем пункте, поскольку компилятор сразу же переведет восьмеричную запись в указанную выше форму. Наибольший код ' \377 ' – десятичное число 255.
- Код любого символа в кодировке Unicode набирается в апострофах после обратной наклонной черты и латинской буквы u ровно четырьмя шестнадцатеричными цифрами: ' \u0053 ' – буква S, ' \u0416 ' – буква Ж.
Символы хранятся в формате типа char (см. ниже).
Примечание
Прописные русские буквы в кодировке Unicode занимают диапазон от ' \u0410 ' – заглавная буква А, до ' \u042F ' – заглавная Я, строчные буквы от ' \u0430 ' – а, до ' \044F ' – я.
В какой бы форме ни записывались символы, компилятор переводит их в Unicode, включая и исходный текст программы.
Замечание
Компилятор и исполняющая система Java работают только с кодировкой Unicode.