Данная страница объясняет, как создать .html файл с русским текстом внутри.
Примечание. Английский алфавит - это особый случай, по сравнению, например, с немецким.
Все кириллические кодировки (да и вообще все кодировки, даже японские) содержат, в дополнение к национальным буквам, так называемый набор символов ASCII. В ASCII входят знаки препинания и т.п, а также буквы английского алфавита.Поэтому наличие на Интернетовской странице русских и английских букв не означает, что там тексты 2-х разных кодировок.
Нет, это одна, кириллическая кодировка, просто в неё, кроме русских букв, входят и английские.
Такая страница не считаетсямногоязычной (multilingual) в терминахИнтернет-кодировок (encoding). То есть, данная инструкция - о создании HTML файла с текстом кириллической кодировки, а значит, внутри могут быть русские и английские буквы.
Вот если бы надо было русские и немецкие буквы на одной странице иметь, вот тогда это была бы многоязычная страница с технической точки зрения.
Такой вариант рассматривается на другой странице моего сайта:
"Как сделать многоязычную HTML страницу"
Данная статья - о создании кириллической Web-страницы, то есть,
страницы, которая анонсирует себя как HTML в одной из кириллических кодировок.
Совсем другой случай, когда человек создаёт НЕ-кириллическую Web-страницу
(например, Западно-Европейской кодировки) и хочет там
вставить пару русских слов. Этот случай описан в другой статье, уже упомянутой
"Как сделать многоязычную HTML страницу".
Кстати, каждый шрифт тоже сделан под определённую кодировку, а т.к. любая кодировка
содержит набор символов ASCII, то любой шрифт всегда содержит английские буквы в дополнение к национальным.
При создании HTML-текста кириллической кодировки (то есть, текст с русскими, и если надо, английскими буквами),
разработчик использует кириллический шрифт и соответствующую раскладку клавиатуры.
Как писать по-русски, используя шрифты и клавиатурные средства Windows (даже если это нерусская
версия Windows) описано в разделе
В настоящее время подавляющее большинство русскоязычных сайтов делается в кириллической кодировке
Некоторые, впрочем, делают в кодировке
Примечание. Кириллица в заголовке страницы, т.е. HTML тэг TITLE
Если разработчик или будущие пользователи работают под нерусской Windows,
то не стоит использовать кириллицу в
Под 'русской' Windows я подразумеваю не только локализованную версию, где вместо кнопки"Start" - кнопка "Пуск", но и любую Windows, где кириллица выбрана как системная кодовая страница (system code page), например, путем выбора регион=Россия при инсталляцииWindows 98, или же путём выбора русского как языка по умолчанию (Default) вWindows 2000 .
Подробно вопрос системной кодовой страницы рассматривается в разделе"Системная русификация" моего сайта.
Например, Internet Explorer
(а также
сможет показать кириллицу в TITLE под нерусской
а
У меня есть тестовая страница с русским в TITLE (делалась для моей инструкции по Netscape, чтобы показать, как русский в Bookmarks работает): "Кириллица в TITLE"
Давайте рассмотрим несколько способов создания русского HTML текста.
Ну, тут всё просто - пишем по-русски, как и в любом другом документе.
Я пишу в редакторе (условно-бесплатном - shareware)
UltraEdit, очень удобно!
Выбрал через View/Set Font скажем "Courier New", Script=Cyrillic, и всё.
Этот редактор использует цветовую гамму для тэгов HTML, и кроме того, разрешает создавать
макросы. Например, один из сделанных
<UL> <LI> <LI> <LI> </UL>
Если Вы работает с таким редактором (который сам генерирует HTML код/тэги),
то тут надо быть очень осторожным, научиться настраивать редактор для корректной генерации
текстов с кириллицей.
Часто бывает так, что разработчик не настроил редактор, и редактор, 'думая', что
То есть, редактор по умолчанию генерировал страницу кодировки
charset=windows-1252 или charset=iso-8859-1 или charset=us-ascii
т.к. автор не указал, что создает страницу кодировки
Что значит 'испорчена'? Это значит, что в исходном тексте HTML страницы нет нормальных русских букв, а есть одно из следующих:
Если на некоей русской странице в Интернете Вы смотрите на исходный HTML текст через
Иногда это видно даже из заголовка страницы - в самом верху, в рамках тэга
<META http-equiv="content-type" content="text/html; charset=windows-1252">
(или "iso-8859-1" или "us-ascii")
Корректно сделанная русская Интернет-страница (чтобы все смогли прочесть русский там)
должна удовлетворять следующим требованиям:
Настройка WYSIWYG HTML-редактора на создание русской страницы обеспечит выполнение вышеизложенных требований. Ниже приведены методы настройки для нескольких редакторов.
Каждый редактор требует своей особой настройки, и разработчик должен отыскать способ настройки
Сам я настраивал следующие WYSIWYG HTML редакторы:
Есть ещё пара редакторов, которые я никогда не видел, но нашёл в Интернете, как их настраивать на создание русских страниц:
Итак, вот инструкции по настройке (на примере страницы в кодировке
Открыть новый документ и немедленно указать, что будет создаваться именно кириллический HTML текст, а не "Western":
Такая настройка обеспечит создание корректного русского HTML текста, в котором будут нормальные русские буквы, а не их представления в виде, скажем, цифровых кодов.
Кроме того, Front Page 2000 вставит в HTML текст строку с указанием кодировки:
<META http-equiv="content-type" content="text/html; charset=windows-1251">
Там надо выбрать кириллической шрифт через меню
Надо убрать 'галку' в поле
(не знаю точных названий этих пунктов).
Советуют не использовать опцию Design, а то русский текст 'испортится', не будет нормальных русских букв.
Сам я не работал с DW, но собрал информацию (ниже).
Речь идёт о простом HTML документе - ни Flash-кнопок, ни шаблонов ColdFusion.
Но часто правильная настройка на уровне простого HTML очень важна и даже критична.
А для непростых вещей можете пойти на вот эти русские форумы и
Итак, настройка на работу с русским HTML:
Ctrl+U - Category - Fonts/Encoding:
и/или
Ctlr+J - Page Properties: Document Encoding = Cyrillic(Windows1251)
Более подробно - на вот этой странице сайта Macromedia:
Читал, что MX-линия данного продукта требует дополнительной настройки:
Примечание. Я читал, что вроде новые версии DW имеют следующую проблему:
Если есть файл, где не указана кодировка, и Вы попытаетесь открыть его в DW
на нерусской машине, например, на английской,
то в DW получаются только 'кракозябры', текст
В таких случаях можно применить следующее решение (опубликовано
В.Зиновьевым в новостной конференции macromedia.dreamweaver):
Файл заново загрузится, но теперь DW уже будет знать, что за кодировка у этого файла, и всё будет в порядке.
Важно! Если у Вас - НЕрусская Windows, и Вы НЕ вводите текст прямо в DW, а копируете его из
MS Word, то в результате копирования русский текст может преватиться в набор
Если такое происходит, то используйте методы, описанные в
"Проблемы копирования между юникодовой и НЕюникодовой программами".
1. Создание HTML текста 'с нуля'
Созданный HTML файл будет содержать нормальные русские буквы.
Кроме того, Word вставит в файл строку с указанием кодировки (это можно увидеть,
использую опцию
<META http-equiv="content-type" content="text/html; charset=windows-1251">
2. Конвертация обычного документа (.doc) в HTML
Созданный HTML файл будет содержать нормальные русские буквы.
Кроме того, Word вставит в файл строку с указанием кодировки (это можно увидеть,
использую опцию
<META http-equiv="content-type" content="text/html; charset=windows-1251">
Созданный HTML файл будет содержать нормальные русские буквы.
Кроме того, Word вставит в файл строку с указанием кодировки (это можно увидеть,
использую опцию
<META http-equiv="content-type" content="text/html; charset=windows-1251">
Netscape вер. 4 и выше имеет встроенный WYSIWYG HTML
Вот как в нём сделать кириллическую страницу (на примере
Вышеизложенное позволит создать нормальный и беспроблемный кириллический HTML текст.