Наборы символов, используемые шрифтами
Все шрифты используют набор символов. Набор символов содержит знаки препинания, цифры, прописные и строчные буквы, а также все остальные печатные символы. Каждый элемент набора символов идентифицируется числом.
Большинство используемых наборов символов являются надмножествами набора символов ASCII для США, который определяет символы для 96 числовых значений от 32 до 127. Существует пять основных групп наборов символов:
- Windows
- Юникод
- OEM (изготовитель оборудования)
- Символ
- Для конкретного поставщика
Набор символов Windows
Набор символов Windows является наиболее часто используемым набором символов. По сути, это эквивалентно набору символов ANSI. Пустой символ является первым символом в наборе символов Windows. Он имеет шестнадцатеричное значение 0x20 (десятичное число 32). Последний символ в наборе символов Windows имеет шестнадцатеричное значение 0xFF (десятичное число 255).
Многие шрифты задают символ по умолчанию. Всякий раз, когда выполняется запрос на символ, не указанный в шрифте, система предоставляет этот символ по умолчанию. Многие шрифты, использующие набор символов Windows, указывают точку (.) в качестве символа по умолчанию. Шрифты TrueType и OpenType обычно используют открытое поле в качестве символа по умолчанию.
Шрифты используют символ разрыва, называемый четырехугольник, чтобы разделять слова и обосновать текст. Большинство шрифтов, использующих набор символов Windows, указывают, что пустой символ будет служить символом разрыва.
Набор символов Юникода
Набор символов Windows использует 8 бит для представления каждого символа; таким образом, максимальное число символов, которое может быть выражено с помощью 8 битов, составляет 256 (2^8). Обычно этого достаточно для западных языков, включая диакритические знаки, используемые на французском, немецком, испанском и других языках. Однако в восточных языках используются тысячи отдельных символов, которые не могут быть закодированы с помощью однобайтовой схемы кодирования. С распространением компьютерной коммерции были разработаны двухбайтовые схемы кодирования, чтобы символы можно было представить в 8-разрядной, 16-разрядной, 24-разрядной или 32-разрядной последовательности. Для этого требуются сложные алгоритмы передачи; даже в этом случае использование разных наборов кода может дать совершенно разные результаты на двух разных компьютерах.
Для решения проблемы с несколькими схемами кодирования был разработан стандарт Юникода для представления данных. 16-битовая схема кодирования символов Юникод может представлять 65 536 (2^16) символов, что достаточно для включения всех языков в компьютерной коммерции сегодня, а также знаков препинания, математических символов и пространства для расширения. Юникод устанавливает уникальный код для каждого символа, гарантируя, что перевод символов всегда является точным.
Набор символов OEM
Набор символов OEM обычно используется в полноэкранных сеансах MS-DOS для отображения экрана. Символы от 32 до 127 обычно одинаковы в наборах символов OEM, США ASCII и Windows. Другие символы в наборе символов OEM (от 0 до 31 и от 128 до 255) соответствуют символам, которые могут отображаться в полноэкранном сеансе MS-DOS. Эти символы обычно отличаются от символов Windows.
Набор символов
Набор символов содержит специальные символы, которые обычно используются для представления математических и научных формул.
Наборы символов для конкретных поставщиков
Многие принтеры и другие устройства вывода предоставляют шрифты на основе наборов символов, отличающихся от наборов windows и OEM, например, расширенного двоичного кода десятичного обмена (EBCDIC). Чтобы использовать один из этих наборов символов, драйвер принтера преобразует набор символов Windows в набор символов конкретного поставщика.