Национальные особенности

Хотя с текстовыми кодиров­ками мы уже знакомились (стр. 14), теория и практика создания разноязычных HTML-документов — особая тема. Как я уже упоминал, стандартной кодировкой HTML-доку­ментов начиная с версии 4 объявлена кодировка Unicode. Однако это совсем не означает, что все HTML-документы должны создаваться, храниться и передаваться в этой ко­дировке. Стандарт допускает использование автором стра­ницы любых других кодировок (при условии, разумеется, что набор символов выбранной кодировки соответствует потребностям документа); однако «внутри себя», разбирая синтаксис документа, броузер обязан перекодировать его из внешней, заданной автором кодировки в Unicode.

Для дизайнера это требование имеет, пожалуй, только одно практическое следствие: числовые подстановки (стр. 29) должны ссылаться на Unicode-коды нужных символов, а не на их коды в текущей кодировке документа. Это сделано для того, чтобы не только мнемонические, но и числовые под­становки, во-первых, не зависели от кодировки документа, а во-вторых, давали возможность ссылаться на символы за пределами текущей кодировки. К сожалению, поскольку многие версии броузеров до сих пор не подозревают об этом требовании стандарта, с известной гарантией можно пользоваться только числовыми или мнемоническими кода­ми из репертуара Latin-1 (которая является подмножеством Unicode).

 









.