Go to the English language version of this page

Как сделать русскую Интернет-страницу (HTML файл)

Paul Gorodyansky 'Cyrillic (Russian): instructions for Windows and Internet'



Данная страница объясняет, как создать .html файл с русским текстом внутри.

Примечание. Английский алфавит - это особый случай, по сравнению, например, с немецким.
Все кириллические кодировки (да и вообще все кодировки, даже японские) содержат, в дополнение к национальным буквам, так называемый набор символов ASCII. В ASCII входят знаки препинания и т.п, а также буквы английского алфавита.

Поэтому наличие на Интернетовской странице русских и английских букв не означает, что там тексты 2-х разных кодировок.
Нет, это одна, кириллическая кодировка, просто в неё, кроме русских букв, входят и английские.
Такая страница не считается многоязычной (multilingual) в терминах Интернет-кодировок (encoding).

То есть, данная инструкция - о создании HTML файла с текстом кириллической кодировки, а значит, внутри могут быть русские и английские буквы.
Вот если бы надо было русские и немецкие буквы на одной странице иметь, вот тогда это была бы многоязычная страница с технической точки зрения.
Такой вариант рассматривается на другой странице моего сайта:
"Как сделать многоязычную HTML страницу"



Данная статья - о создании кириллической Web-страницы, то есть, страницы, которая анонсирует себя как HTML в одной из кириллических кодировок.
Совсем другой случай, когда человек создаёт НЕ-кириллическую Web-страницу (например, Западно-Европейской кодировки) и хочет там вставить пару русских слов. Этот случай описан в другой статье, уже упомянутой выше -
"Как сделать многоязычную HTML страницу".



Кстати, каждый шрифт тоже сделан под определённую кодировку, а т.к. любая кодировка содержит набор символов ASCII, то любой шрифт всегда содержит английские буквы в дополнение к национальным.



При создании HTML-текста кириллической кодировки (то есть, текст с русскими, и если надо, английскими буквами), разработчик использует кириллический шрифт и соответствующую раскладку клавиатуры.

Как писать по-русски, используя шрифты и клавиатурные средства Windows (даже если это нерусская версия Windows) описано в разделе "Введение. Кириллица под Windows" моего сайта.



В настоящее время подавляющее большинство русскоязычных сайтов делается в кириллической кодировке Windows-1251, называемой в Internet Explorer'е Cyrillic(Windows).
Некоторые, впрочем, делают в кодировке KOI8-R.


Примечание. Кириллица в заголовке страницы, т.е. HTML тэг TITLE
Если разработчик или будущие пользователи работают под нерусской Windows, то не стоит использовать кириллицу в TITLE - не видна она будет во многих случаях.

Под 'русской' Windows я подразумеваю не только локализованную версию, где вместо кнопки "Start" - кнопка "Пуск", но и любую Windows, где кириллица выбрана как системная кодовая страница (system code page), например, путем выбора регион=Россия при инсталляции Windows 98, или же путём выбора русского как языка по умолчанию (Default) в Windows 2000.
Подробно вопрос системной кодовой страницы рассматривается в разделе "Системная русификация" моего сайта.



Например, Internet Explorer (а также Netscape вер. 7.1 и новее, и Mozilla вер. 1.4 и новее)
сможет показать кириллицу в TITLE под нерусской Windows 2000/XP, но не под нерусской Windows 95/98/ME/NT 4.0,
а Netscape 4.x - 7.0x не сможет показать вообще ни под какой нерусской Windows.

У меня есть тестовая страница с русским в TITLE (делалась для моей инструкции по Netscape, чтобы показать, как русский в Bookmarks работает): "Кириллица в TITLE"


Давайте рассмотрим несколько способов создания русского HTML текста.

1. Обычный текстовый редактор - пишем HTML код 'вручную'

Ну, тут всё просто - пишем по-русски, как и в любом другом документе.

Я пишу в редакторе (условно-бесплатном - shareware) UltraEdit, очень удобно!
Выбрал через View/Set Font скажем "Courier New", Script=Cyrillic, и всё.
Этот редактор использует цветовую гамму для тэгов HTML, и кроме того, разрешает создавать макросы. Например, один из сделанных мной - нажал Ctrl/L и на экране появляется HTML list:

 <UL>
      <LI>
      <LI>
      <LI>
 </UL>     



2. WYSIWYG HTML-редакторы - коды HTML создаются редактором

Если Вы работает с таким редактором (который сам генерирует HTML код/тэги), то тут надо быть очень осторожным, научиться настраивать редактор для корректной генерации текстов с кириллицей.
Часто бывает так, что разработчик не настроил редактор, и редактор, 'думая', что страница - в кодировке "Western", генерирует страницу, где кириллица 'испорчена'.

То есть, редактор по умолчанию генерировал страницу кодировки
  charset=windows-1252 или charset=iso-8859-1 или charset=us-ascii
т.к. автор не указал, что создает страницу кодировки "Cyrillic" (например, charset=windows-1251).

Что значит 'испорчена'? Это значит, что в исходном тексте HTML страницы нет нормальных русских букв, а есть одно из следующих:

Если на некоей русской странице в Интернете Вы смотрите на исходный HTML текст через View / Source, и там нет нормальных русских букв, то это обычно из-за подобной ошибки автора страницы - не настроил программу на создание именно кириллической страницы.

Иногда это видно даже из заголовка страницы - в самом верху, в рамках тэга <HEAD> можно увидеть, что страница ошибочно создавалась как "Western", а не "Cyrillic":
  <META http-equiv="content-type" content="text/html; charset=windows-1252">
(или "iso-8859-1" или "us-ascii")



Корректно сделанная русская Интернет-страница (чтобы все смогли прочесть русский там) должна удовлетворять следующим требованиям:

Настройка WYSIWYG HTML-редактора на создание русской страницы обеспечит выполнение вышеизложенных требований. Ниже приведены методы настройки для нескольких редакторов.


Как настроить WYSIWYG HTML редактор для генерации корректного кириллического HTML

Каждый редактор требует своей особой настройки, и разработчик должен отыскать способ настройки до того, как начнёт вводить текст, а иначе его текст может просто-напросто пропасть, одни 'вопросики' будут :-)



Сам я настраивал следующие WYSIWYG HTML редакторы:

Есть ещё пара редакторов, которые я никогда не видел, но нашёл в Интернете, как их настраивать на создание русских страниц:


Итак, вот инструкции по настройке (на примере страницы в кодировке Windows-1251):


Paul Gorodyansky. 'Cyrillic (Russian): instructions for Windows and Internet'