Reg.ru: домены и хостинг
Крупнейший регистратор и хостинг-провайдер в России.
Более 2 миллионов доменных имен на обслуживании.
Продвижение, почта для домена, решения для бизнеса.
Более 700 тыс. клиентов по всему миру уже сделали свой выбор.
*Наведите курсор мыши для приостановки прокрутки.
Назад Вперед
Кодировки: полезная информация и краткая ретроспектива
Данную статью я решил написать как небольшой обзор, касающийся вопроса кодировок.
Мы разберемся, что такое вообще кодировка и немного коснемся истории того, как они появились в принципе.
Мы поговорим о некоторых их особенностях а также рассмотрим моменты, позволяющие нам работать с кодировками более осознанно и избегать появления на сайте так называемых кракозябров , т.е. нечитаемых символов.
Итак, поехали...
Что такое кодировка?
Упрощенно говоря, кодировка - это таблица сопоставлений символов, которые мы можем видеть на экране, определенным числовым кодам.
Т.е. каждый символ, который мы вводим с клавиатуры, либо видим на экране монитора, закодирован определенной последовательностью битов (нулей и единиц). 8 бит, как вы, наверное, знаете, равны 1 байту информации, но об этом чуть позже.
Внешний вид самих символов определяется файлами шрифтов , которые установлены на вашем компьютере. Поэтому процесс вывода на экран текста можно описать как постоянное сопоставление последовательностей нулей и единиц каким-то конкретным символам, входящим в состав шрифта.
Прародителем всех современных кодировок можно считать ASCII .
Эта аббревиатура расшифровывается как American Standard Code for Information Interchange (американская стандартная кодировочная таблица для печатных символов и некоторых специальных кодов).
Это однобайтовая кодировка , в которую изначально заложено всего 128 символов: буквы латинского алфавита, арабские цифры и т.д.
Позже она была расширена (изначально она не использовала все 8 бит), поэтому появилась возможность использовать уже не 128, а 256 (2 в 8 степени) различных символов, которые можно закодировать в одном байте информации.
Такое усовершенствование позволило добавлять в ASCII символы национальных языков , помимо уже существующей латиницы.
Вариантов расширенной кодировки ASCII существует очень много по причине того, что языков в мире тоже немало. Думаю, что многие из вас слышали о такой кодировке, как KOI8-R - это тоже расширенная кодировка ASCII , предназначенная для работы с символами русского языка.
Следующим шагом в развитии кодировок можно считать появление так называемых ANSI-кодировок .
По сути это были те же расширенные версии ASCII , однако из них были удалены различные псевдографические элементы и добавлены символы типографики, для которых ранее не хватало "свободных мест".
Примером такой ANSI-кодировки является всем известная Windows-1251 . Помимо типографических символов, в эту кодировку также были включены буквы алфавитов языков, близких к русскому (украинский, белорусский, сербский, македонский и болгарский).
ANSI-кодировка - это собирательное название . В действительности, реальная кодировка при использовании ANSI будет определяться тем, что указано в реестре вашей операционной системы Windows. В случае с русским языком это будет Windows-1251, однако, для других языков это будет другая разновидность ANSI.
Как вы понимаете, куча кодировок и отсутствие единого стандарта до добра не довели, что и стало причиной частых встреч с так называемыми кракозябрами - нечитаемым бессмысленным набором символов.
Причина их появления проста - это попытка отобразить символы, закодированные с помощью одной кодировочной таблицы, используя другую кодировочную таблицу .
В контексте веб-разработки, мы можем столкнуться с кракозябрами, когда, к примеру, русский текст по ошибке сохраняется не в той кодировке, которая используется на сервере .
Разумеется, это не единственный случай, когда мы можем получить нечитаемый текст - вариантов тут масса, особенно, если учесть, что есть еще база данных, в которой информация также хранится в определенной кодировке, есть сопоставление соединения с базой данных и т.д.
Возникновение всех этих проблем послужило стимулом для создания чего-то нового. Это должна была быть кодировка, которая могла бы кодировать любой язык в мире (ведь с помощью однобайтовых кодировок при всем желании нельзя описать все символы, скажем, китайского языка, где их явно больше, чем 256), любые дополнительные спецсимволы и типографику.
Одним словом, нужно было создать универсальную кодировку, которая решила бы проблему кракозябров раз и навсегда .
Юникод - универсальная кодировка текста (UTF-32, UTF-16 и UTF-8)
Сам стандарт был предложен в 1991 году некоммерческой организацией «Консорциум Юникода» (Unicode Consortium, Unicode Inc.), и первым результатом его работы стало создание кодировки UTF-32 .
Кстати, сама аббревиатура UTF расшифровывается как Unicode Transformation Format (Формат Преобразования Юникод).
В этой кодировке для кодирования одного символа предполагалось использовать аж 32 бита , т.е. 4 байта информации. Если сравнивать это число с однобайтовыми кодировками, то мы придем к простому выводу: для кодирования 1 символа в этой универсальной кодировке нужно в 4 раза больше битов , что "утяжеляет" файл в 4 раза.
Очевидно также, что количество символов, которое потенциально могло быть описано с помощью данной кодировки, превышает все разумные пределы и технически ограничено числом, равным 2 в 32 степени. Понятно, что это был явный перебор и расточительство с точки зрения веса файлов, поэтому данная кодировка не получила распространения.
На смену ей пришла новая разработка - UTF-16 .
Как очевидно из названия, в этой кодировке один символ кодируют уже не 32 бита, а только 16 (т.е. 2 байта). Очевидно, это делает любой символ вдвое "легче", чем в UTF-32, однако и вдвое "тяжелее" любого символа, закодированного с помощью однобайтовой кодировки.
Количество символов, доступное для кодирования в UTF-16 равно, как минимум, 2 в 16 степени, т.е. 65536 символов. Вроде бы все неплохо, к тому же окончательная величина кодового пространства в UTF-16 была расширена до более, чем 1 миллиона символов.
Однако и данная кодировка до конца не удовлетворяла потребности разработчиков. Скажем, если вы пишете, используя исключительно латинские символы, то после перехода с расширенной версии кодировки ASCII к UTF-16 вес каждого файла увеличивался вдвое.
В результате, была предпринята еще одна попытка создания чего-то универсального , и этим чем-то стала всем нам известная кодировка UTF-8.
UTF-8 - это многобайтовая кодировка с переменной длинной символа . Глядя на название, можно по аналогии с UTF-32 и UTF-16 подумать, что здесь для кодирования одного символа используется 8 бит, однако это не так. Точнее, не совсем так.
Дело в том, что UTF-8 обеспечивает наилучшую совместимость со старыми системами, использовавшими 8-битные символы. Для кодирования одного символа в UTF-8 реально используется от 1 до 4 байт (гипотетически можно и до 6 байт).
В UTF-8 все латинские символы кодируются 8 битами, как и в кодировке ASCII . Иными словами, базовая часть кодировки ASCII (128 символов) перешла в UTF-8, что позволяет "тратить" на их представление всего 1 байт, сохраняя при этом универсальность кодировки, ради которой все и затевалось.
Итак, если первые 128 символов кодируются 1 байтом, то все остальные символы кодируются уже 2 байтами и более. В частности, каждый символ кириллицы кодируется именно 2 байтами.
Таким образом, мы получили универсальную кодировку, позволяющую охватить все возможные символы, которые требуется отобразить, не "утяжеляя" без необходимости файлы.
C BOM или без BOM?
Если вы работали с текстовыми редакторами (редакторами кода), например Notepad++ , phpDesigner , rapid PHP и т.д., то, вероятно, обращали внимание на то, что при задании кодировки, в которой будет создана страница, можно выбрать, как правило, 3 варианта:
ANSI
- UTF-8
- UTF-8 без BOM
Сразу скажу, что выбирать всегда стоит именно последний вариант - UTF-8 без BOM .
Итак, что же такое BOM и почему нам это не нужно?
BOM расшифровывается как Byte Order Mark . Это специальный Unicode-символ, используемый для индикации порядка байтов текстового файла. По спецификации его использование не является обязательным, однако если BOM используется, то он должен быть установлен в начале текстового файла.
Не будем вдаваться в детали работы BOM . Для нас главный вывод следующий: использование этого служебного символа вместе с UTF-8 мешает программам считывать кодировку нормальным образом , в результате чего возникают ошибки в работе скриптов.
Иногда даже достаточно опытный специалист не сразу скажет вам, чему соответствует то или иное значение давления или длины в одной системе значениям в другой системе величин.
Чтобы облегчить вам эту задачу, мы предлагаем таблицы соотношения величин давления и длины в европейской и американской системах с небольшими пояснениями . Но сначала несколько слов о самих стандартах.
DIN - это немецкий стандарт (расшифровывается как Deutsches Institut für Normung , то есть разработанный Германским институтом стандартизации), который разрабатывается строго в рамках положений Международной организации по стандартизации - ISO (International Organization for Standardization).
ANSI – стандарт, принятый в Соединённых Штатах Америки. Расшифровывается как American National Standards Institute , то есть стандарт Американского национального института по стандартизации.
Соответственно, нормы ANSI определяются именно этим институтом, и далеко не всегда между стандартами DIN и ANSI можно проследить точные соответствия в различных сферах.
Перевод единиц давления из ANSI в DIN
Здесь всё просто: если по стандарту ANSI напротив давления стоит цифра 150 - это означает, что номинальное (на которое рассчитана арматура) давление составляет 20 бар, 300 - 50 бар и т.д. Максимальное значение по ANSI Class – 2500 будет равно 420 бар по европейскому стандарту DIN .
Пользуясь этой таблицей, несложно переводить значения давления и обратно: из DIN в ANSI , хотя осуществлять такой перевод нашим инженерам требуется гораздо реже .
Перевод единиц длины из американской системы в европейскую (российскую)
Как известно, американцы всё измеряют дюймами и футами, а мы и европейцы - миллиметрами, сантиметрами и метрами, то есть, как и подавляющее большинство государств мира, мы живём в метрической системе единиц.
Как же переводить дюймы в миллиметры? На самом деле, в этом также нет ничего сложного, достаточно лишь запомнить, что 1 дюйм равняется 25,4 мм. Однако нередко цифрой после запятой пренебрегают и для ровного счёта указывают, что 1 дюйм = 25 мм .
Таким образом, если, например, сечение входного отверстия равно 2 дюймам по американской системе мер, то, переведя по вышеуказанному правилу это значение в нашу систему мер, получаем 50 мм или, что более точно - 51 мм (округлив 50,8 по правилам).
Осталось добавить, что диаметр в технических характеристиках маркируется латинскими буквами DN и нередко указывается именно в дюймах , а давление обозначается при помощи букв PN и указывается чаще всего в барах - во всяком случае, мы используем именно такую маркировку как наиболее удобную .
А следующая таблица поможет вам высчитать не только точное количество миллиметров в одном дюйме (с точностью до тысячной миллиметра), но и поможет узнать, сколько миллиметров содержится, например, в 2,5 дюймах.
Для этого находим колонку 2"" (2 дюйма), а слева ищем значение 1/2. Итого 2,5 дюйма = 63,501 мм, что вполне можно округлить до 64 мм, а, например, 6,25 дюйма (то есть 6 и 1/4) = 158,753 мм или 159 мм.
| Дюймы "" в миллиметрах |
|||||||
| ||||||||
| ||||||||
ANSI является системы Windows 95 и Windows, перед началом установки символов по умолчанию.
ANSI также известен как Windows-1252.
важно
ANSI и ISO-8859-1 очень похожи, единственное различие заключается в 32 символов.
В ANSI, и от 128 до 159 символов для некоторых полезных символов, символы, такие как евро.
В ISO-8859-1, эти символы отображаются в HTML не работает в управляющих символов.
Многие веб-разработчики декларации ISO-8859-1, и использовать эти 32 значения, как если бы они использовали Windows-1252.
Из-за этого распространенное заблуждение, когда ISO-8859-1 объявляется, браузер переходит в Windows-1252. Это относится к следующим типам документов: HTML4, HTML5 и XHTML.
ANSI и ASCII
ANSI первая часть (юридическое лицо номер 0-127) является оригинальный набор ASCII-символов. Он содержит цифры, заглавные буквы и специальные символы.
Для понимания ASCII, пожалуйста, см полную ссылку ASCII руководство .
набор символов ANSI
характер | номер | название объекта | описание |
---|---|---|---|
32 | (Пробел) | ||
! | 33 | Восклицательный знак (восклицательный знак) | |
" | 34 | & | Котировки (кавычки) |
# | 35 | Номер знак (номер знака) | |
$ | 36 | Знак доллара (знак доллара) | |
% | 37 | Знак процента (в процентах знак) | |
& | 38 | & Amp; | Ampersand (амперсанд) |
" | 39 | Апостроф (апостроф) | |
( | 40 | Левая скобка (левая скобка) | |
) | 41 | Правая скобка (правая скобка) | |
* | 42 | Звездочка (звездочка) | |
+ | 43 | Плюс знак (знак плюс) | |
, | 44 | Запятые (запятая) | |
- | 45 | Дефис (дефис-минус) | |
, | 46 | Период (полная остановка) | |
/ | 47 | Рассечение (солидус) | |
0 | 48 | Цифровой 0 (цифра ноль) | |
1 | 49 | Цифровой 1 (цифра один) | |
2 | 50 | Цифровой 2 (цифра два) | |
3 | 51 | Цифровой 3 (три цифры) | |
4 | 52 | Цифровой 4 (четыре цифры) | |
5 | 53 | Цифровой 5 (цифра пять) | |
6 | 54 | Цифровой 6 (шесть цифр) | |
7 | 55 | Цифровой 7 (семь цифр) | |
8 | 56 | Цифровой 8 (цифра восемь) | |
9 | 57 | Цифровой 9 (цифра девять) | |
: | 58 | Colon (двоеточие) | |
; | 59 | Точка с запятой (точкой с запятой) | |
< | 60 | & Lt; | Знак меньше (меньше, чем знак) |
= | 61 | Знак равенства (знак равенства) | |
> | 62 | & Gt; | Больше, чем знак (знак больше) |
? | 63 | Знак вопроса (знак вопроса) | |
@ | 64 | @ Symbol (коммерческий в) | |
65 | Латинская буква А капитал | ||
В | 66 | Латинская заглавная буква B | |
С | 67 | Латинская буква C | |
D | 68 | Латинская буква D | |
Е | 69 | Латинскими буквами E | |
F | 70 | Латинская буква F | |
G | 71 | Латинская буква G | |
H | 72 | Латинская буква H | |
Я | 73 | Латинская заглавная буква I | |
J | 74 | Латинская буква J | |
К | 75 | Латинская буква K | |
L | 76 | Латинская буква L | |
M | 77 | Латинская буква М | |
N | 78 | Латинская буква N | |
О | 79 | Латинская заглавная буква O | |
P | 80 | Латинская буква P | |
Q | 81 | Латинская заглавная буква Q | |
R | 82 | Латинская буква R капитал | |
S | 83 | Латинская буква S | |
T | 84 | Латинская буква T | |
U | 85 | Латинская буква U | |
V | 86 | Латинская буква V капитал | |
W | 87 | Латинская буква W | |
X | 88 | Латинская буква X | |
Y | 89 | Латинская буква Y | |
Z | 90 | Латинская буква Z капитал | |
[ | 91 | Левый кронштейн (левая квадратная скобка) | |
\ | 92 | Backslash (обратная солидус) | |
] | 93 | Правый кронштейн (правая квадратная скобка) | |
^ | 94 | Caret (огибающая акцент) | |
_ | 95 | Подчеркивание (нижняя линия) | |
` | 96 | Акценты (апостроф) | |
97 | Латинская буква а | ||
б | 98 | Латинская строчная б | |
с | 99 | Латинская строчная с | |
d | 100 | Латинская строчная d | |
е | 101 | Латинская буква е | |
е | 102 | Латинская строчная е | |
г | 103 | Латинская строчная г | |
час | 104 | Латинская строчная ч | |
Я | 105 | Буква латинского алфавита в нижнем регистре я | |
J | 106 | Латинская строчная J | |
К | 107 | Латинская строчная к | |
L | 108 | Латинская строчная буква л | |
м | 109 | Латинская строчная м | |
N | 110 | Латинская строчная п | |
о | 111 | Латинская буква O | |
р | 112 | Латинская строчная р | |
Q | 113 | Латинская строчная буква Q | |
R | 114 | Латинская строчная г | |
s | 115 | Латинская строчная s | |
T | 116 | Латинская строчная т | |
U | 117 | Латинская буква U | |
v | 118 | Латинская строчная буква v | |
вес | 119 | Латинская строчная ш | |
х | 120 | Латинская строчная х | |
Y | 121 | Латинская буква Y | |
Z | 122 | Латинская строчная г | |
{ | 123 | Левая скобка (левая фигурная скобка) | |
| | 124 | Вертикальная линия (вертикальная линия) | |
} | 125 | Правая скобка (правая фигурная скобка) | |
~ | 126 | Тильда (тильда) | |
127 | |||
€ | 128 | & Euro; | Символ Евро (знак евро) |
129 | Неиспользованные (не используется) | ||
, | 130 | & Sbquo; | Одиночные кавычки (одиночный с низким 9 КАВЫЧКА) |
ƒ | 131 | & Fnof; | Увлеченные Латинская строчная е |
" | 132 | & Bdquo; | Двойные кавычки (двухспальная низко-9 КАВЫЧКА) |
... | 133 | & Hellip; | Горизонтальное многоточие (горизонтальная троеточие) |
† | 134 | & Dagger; | Кинжал (Кинжал) |
‡ | 135 | & Dagger; | Двойной крестик (двойной крестик) |
136 | & ЦО; | Модифицированный письмо огибающая акцент (Модификатор письмо огибающая акцент) | |
‰ | 137 | & Permil; | Permill символ (промилле знака) |
Š | 138 | & Scaron; | Латинская буква S с Карона |
< | 139 | & Lsaquo; | Левый единый знак угла котировка (одиночный знак левой указывая угол цитата) |
О.Н | 140 | & OElig; | Латиноамериканская лигатуры капитал О.Е. |
141 | Неиспользованные (не используется) | ||
Ž | 142 | & Zcaron; | Латинская заглавная буква Z с кароном |
143 | Неиспользованные (не используется) | ||
144 | Неиспользованные (не используется) | ||
" | 145 | & Lsquo; | Левый сингл кавычки (левая одинарная кавычка) |
" | 146 | & Rsquo; | Право одного кавычка (правая Одинарная кавычка) |
" | 147 | & Ldquo; | Левые двойные кавычки (левая двойные кавычки) |
" | 148 | & Rdquo; | Право двойные кавычки (справа двойные кавычки) |
149 | & Bull; | Пуля (пулевая) | |
- | 150 | & Ndash; | Короткое тире / дефис (короткое тире) |
- | 151 | & Mdash; | Длинное тире (EM тире) |
~ | 152 | & Тильда; | Маленькие волнистые линии (малые тильда) |
™ | 153 | & Trade; | Символ Торговая марка (товарный знак знак) |
š | 154 | & Scaron; | Латинская буква s с Карона |
> | 155 | & Rsaquo; | Правый единый знак угла котировка (одиночный правый угол указывая кавычки) |
œ | 156 | & Oelig; | Латинская лигатуры О.Е. |
157 | Неиспользованные (не используется) | ||
ž | 158 | & Zcaron; | Латинская буква г с Карона |
Ÿ | 159 | & Yuml; | Латинская буква Y с диэрезисом (диэрезисом) из |
160 | & Nbsp; | Неразрывный пространство (без разрывов пространства) | |
161 | & Iexcl; | Перевернутый восклицательный знак (перевернутый восклицательный знак) | |
¢ | 162 | & Cent; | Cent (цент знак) |
£ | 163 | & Фунт; | Знак фунта (знак фунта) |
164 | & Curren; | Символ валюты (знак валюты) | |
¥ | 165 | & Yen; | символ йены (знак иены) |
| | 166 | & Brvbar; | Прерывистая вертикальная полоса (пунктирная бар) |
§ | 167 | & Секта; | Номер раздела (раздел знаком) |
¨ | 168 | & УЯМ; | Диэрезисом (трема) |
© | 169 | & Копировать; | Авторское право (авторское право знак) |
ª | 170 | & Ordf; | Отрицательный знак номера порядковое (женственная порядковое индикатор) |
<< | 171 | & LAQUO; | Левый двойной угол кавычки (слева указывая двойной угол кавычки) |
172 | & Не; | Тильда (не подписывать) | |
173 | & Shy; | Мягкие переносы (мягкие дефис) | |
® | 174 | & Reg; | Зарегистрированный товарный знак (зарегистрированный знак) |
¯ | 175 | & Macr; | Macron (макроном) |
° | 176 | & Deg; | Символ Степень (степень знака) |
± | 177 | & Plusmn; | Знак минус / знак (знак плюс-минус) |
² | 178 | & Sup2; | Надстрочные 2 (верхний индекс два) |
³ | 179 | & Sup3; | Надстрочные 3 (верхний индекс трех) |
" | 180 | И острый; | Акут (острый акцент) |
μ | 181 | & Micro; | M символ (микро знак) |
¶ | 182 | & Para; | Символ Пункт (знак абзаца знак) |
· | 183 | & Мидот; | Промежуточная точка (средняя точка) |
¸ | 184 | & Cedil; | Диакритические знаки (седилем) |
¹ | 185 | & ПОД1; | Надстрочные 1 (верхний индекс один) |
º | 186 | & Ordm; | Мужественный порядковый номер знака (мужской порядковое индикатор) |
» | 187 | & RAQUO; | Правый знак двойной угол котировка (справа указывая двойной угол кавычки) |
¼ | 188 | & Frac14; | 1/4 Score (вульгарные фракция одна четверть) |
½ | 189 | & Frac12; | 1/2 Score (вульгарные фракция половины) |
¾ | 190 | & Frac34; | 3/4 Суммарная оценка (вульгарные фракция три четверти) |
¿ | 191 | & Iquest; | Перевернутый знак вопроса (перевернутый знак вопроса) |
À | 192 | & Agrave; | Латинская заглавная буква А с акцентом (серьезные) из |
Á | 193 | & Aacute; | Латинская заглавная буква А с острым акцентом (острый) из |
 | 194 | & ACIRC; | Латинская заглавная буква А с огибающую акцентом (огибающую) из |
М.Р | 195 | & Atilde; | Латинская заглавная буква А с тильдой |
Ä | 196 | & AUML; | Латинская заглавная буква А с диэрезисом (диэрезисом) из |
Å | 197 | & Aring; | Латинская заглавная буква А с кругом |
Æ | 198 | & AElig; | Латинскими буквами AE |
БЗ | 199 | & Ccedil; | Латинская заглавная буква C с седилем (седилем) из |
È | 200 | & Egrave; | Латинская заглавная буква E с акцентом (серьезные) из |
É | 201 | & Eacute; | Латинская заглавная буква E с острым акцентом (острый) из |
Ê | 202 | & Ecirc; | Латинская заглавная буква E с циркумфлексом (огибающую) из |
Ë | 203 | & Euml; | Латинская заглавная буква E с диэрезисом (диэрезисом) из |
Ì | 204 | & Igrave; | |
Н | 205 | & Iacute; | Латинская буква с острым акцентом (острый) из I |
Î | 206 | & Icirc; | |
Ï | 207 | & Iuml; | Латинская буква с диэрезисом (диэрезисом) из I |
Ð | 208 | & ETH; | Латинская буква Eth |
ЦТС | 209 | & Ntilde; | Латинская заглавная буква N с тильдой |
Т | 210 | & Ograve; | Латинская заглавная буква O с акцентами (серьезные) из |
Ó | 211 | & Oacute; | Латинская заглавная буква O с острым акцентом (острый) из |
Ф | 212 | & Ocirc; | Латинская заглавная буква O с огибающую акцентом (огибающую) из |
Õ | 213 | & Otilde; | Латинская заглавная буква O с тильдой |
Ö | 214 | & Ouml; | Латинская заглавная буква O с диэрезисом (диэрезисом) из |
× | 215 | & Времена; | Умножение (знак умножения) |
Ø | 216 | & Oslash; | Латинская заглавная буква O с зачеркиванием |
Ù | 217 | & Ugrave; | Латинские заглавные буквы с акцентами (серьезные) в U |
Ú | 218 | & Uacute; | Латинская буква с острым акцентом (острый) из U |
Û | 219 | & Ucirc; | Латинская буква с огибающую акцентом (огибающую) из U |
Ü | 220 | & Uuml; | Латинская буква с диэрезисом (диэрезисом) из U |
Ý | 221 | & Yacute; | Латинская заглавная буква Y с острым акцентом (острый) из |
Þ | 222 | & ШИП; | Латиноамериканская Thorn прописной буквы |
ß | 223 | & Szlig; | Латинская буква s резкое |
à | 224 | & Agrave; | Латинская буква а с акцентами (серьезные) из |
á | 225 | & Aacute; | Латинская буква а с острым акцентом (острый) из |
â | 226 | & ACIRC; | Латинская буква а с огибающую акцентом (огибающую) из |
ã | 227 | & Atilde; | Латинская буква а с тильдой |
ä | 228 | & AUML; | Латинская буква а с диэрезисом (диэрезисом) из |
å | 229 | & Aring; | Латинская строчная буква А с кругом на |
æ | 230 | & Aelig; | Латинские буквы нижнего регистра ае |
ç | 231 | & Ccedil; | Латинская буква с с седилем (седилем) из |
è | 232 | & Egrave; | Латинская буква е с акцентами (серьезные) из |
é | 233 | & Eacute; | Латинская буква е с острым акцентом (острый) из |
ê | 234 | & Ecirc; | Латинская буква е с огибающую акцентом (огибающую) из |
Мобайл | 235 | & Euml; | Латинская буква е с диэрезисом (диэрезисом) из |
ì | 236 | & Igrave; | Латинская буква I с акцентами (серьезные) из |
í | 237 | & Iacute; | Латинская буква I с острым акцентом (острый) из |
î | 238 | & Icirc; | Латинская буква I с огибающую акцентом (огибающую) из |
ï | 239 | & Iuml; | Латинская буква I с диэрезисом (диэрезисом) из |
ð | 240 | & Eth; | Латинская буква ETH |
ñ | 241 | & Ntilde; | Латинская буква N с тильдой |
Эквант | 242 | & Ograve; | Латинская буква O с акцентом (серьезные) из |
развития музыкальных способностей | 243 | & Oacute; | Латинская буква O с острым акцентом (острый) из |
Гэндальф | 244 | & Ocirc; | Латинская буква O с огибающую акцентом (огибающую) из |
õ | 245 | & Otilde; | Латинская буква O с тильдой |
ö | 246 | & Ouml; | Латинская буква O с диэрезисом (диэрезисом) из |
÷ | 247 | & Разделить; | Divide (знак деления) |
ø | 248 | & Oslash; | Латинская буква O с зачеркиванием |
ù | 249 | & Ugrave; | Латинские буквы нижнего регистра с акцентом (грубые) от и |
ú | 250 | & Uacute; | Латинская строчная с острым акцентом (острый) от и |
û | 251 | & Ucirc; | Латинские буквы нижнего регистра с метасимвола акцентом (огибающую) от и |
ü | 252 | & Uuml; | Латинские буквы нижнего регистра с диэрезисом (диэрезисом) от и |
ý | 253 | & Yacute; | Латинская строчная с острым акцентом (острый) из у |
þ | 254 | & Thorn; | Латинская буква шипом |
ÿ | 255 | & Yuml; | Латинская буква у с диэрезисом (диэрезисом) из |
управляющие символы ANSI
управляющие символы ANSI (00-31, плюс 127) был первоначально разработан для управления аппаратными устройствами, такими как принтеры и ленточные накопители и тому подобное.
Управляющие символы (за исключением горизонтальной табуляции, перевода строки, каретки снаружи) не имеет никакого эффекта в HTML-документе.
字符 | 编号 | 描述 |
---|---|---|
NUL | 00 | 空字符(null character) |
SOH | 01 | 标题开始(start of header) |
STX | 02 | 正文开始(start of text) |
ETX | 03 | 正文结束(end of text) |
EOT | 04 | 传输结束(end of transmission) |
ENQ | 05 | 请求(enquiry) |
ACK | 06 | 收到通知/响应(acknowledge) |
BEL | 07 | 响铃(bell) |
BS | 08 | 退格(backspace) |
HT | 09 | 水平制表符(horizontal tab) |
LF | 10 | 换行(line feed) |
VT | 11 | 垂直制表符(vertical tab) |
FF | 12 | 换页(form feed) |
CR | 13 | 回车(carriage return) |
SO | 14 | 不用切换(shift out) |
SI | 15 | 启用切换(shift in) |
DLE | 16 | 数据链路转义(data link escape) |
DC1 | 17 | 设备控制 1(device control 1) |
DC2 | 18 | 设备控制 2(device control 2) |
DC3 | 19 | 设备控制 3(device control 3) |
DC4 | 20 | 设备控制 4(device control 4) |
NAK | 21 | 拒绝接收/无响应(negative acknowledge) |
SYN | 22 | 同步空闲(synchronize) |
ETB | 23 | 传输块结束(end transmission block) |
CAN | 24 | 取消(cancel) |
EM | 25 | 已到介质末端/介质存储已满(end of medium) |
SUB | 26 | 替补/替换(substitute) |
ESC | 27 | 溢出/逃离/取消(escape) |
FS | 28 | 文件分隔符(file separator) |
GS | 29 | 组分隔符(group separator) |
RS | 30 | 记录分隔符(record separator) |
US | 31 | 单元分隔符(unit separator) |
DEL | 127 | 删除(delete) |
Кстати, на нашем сайте вы можете перевести любой текст в десятичный, шестнадцатеричный, двоичный код воспользовавшись Калькулятором кодов онлайн .
Таблица ASCII
ASCII (American Standard Code for Information Interchange)
Сводная таблица кодов ASCII
ASCII таблица кодов символов Windows (Win-1251)
|
|
Расширенная таблица кодов ASCII
Символы форматирования.
Backspace (Возврат на один символ). Показывает на движение механизма печати либо курсора дисплея назад на одну позицию. |
|
Horizontal Tabulation (Горизонтальное Табулирование). Показывает движение механизма печати либо курсора дисплея до следующей предписанной "позиции табуляции". |
|
Line Feed (Перевод строки). Показывает движение механизма печати либо курсора дисплея к началу следующей строки (на одну строку вниз). |
|
Vertical Tabulation (Вертикальное Табулирование). Показывает движение механизма печати либо курсора дисплея к следующей группе строк. |
|
Form Feed (Перевод страницы). Показывает движение механизма печати либо курсора дисплея к исходной позиции следующей страницы, формы или экрана. |
|
Carriage Return (Перевод каретки). Показывает движение механизма печати либо курсора дисплея к исходной (крайней левой)позиции текущей строки. |
Передача данных.
Start of Heading (Начало Заголовка). Применяется для определения начала заголовка, который может содержать информацию о маршрутизации или адрес. |
|
Start of Text (Начало Текста). Показывает начало текста и одновременно конец заголовка. |
|
End of Text (Конец Текста). Применяется при завершении текста, который был начат с символа STX. |
|
Enquiry (Запрос). Запрос идентификационных данных (типа "Кто Вы?") от удаленной станции. |
|
Acknowledge (Подтверждение). Приемное устройство передает этот символ отправителю в качестве подтверждения успешного приема данных. |
|
Negative Acknowledgement (Неподтверждение). Приемное устройство передает этот символ отправителю в случае отрицания (неудачи) приема данных. |
|
Synchronous/Idle (Синхронизация). Применяется в синхронизированных системах передачи. В моменты отсутствия передачи данных система непрерывно посылает символы SYN для обеспечения синхронизации. |
|
End of Transmission Block (Конец Блока Передачи). Показывает конец блока данных для коммуникационных целей. Применяется для разбиения на отдельные блоки больших объемов данных. |
Разделительные знаки при передаче информации.
Другие символы.
Null. (No character- нет данных). Применяется для передачи в случае отсутствия данных. |
|
Bell (Звонок). Применяется для управления устройствами сигнализации. |
|
Shift Out. Показывает, что все последующие кодовые комбинации должны интерпретироваться согласно внешнему набору символов до прихода символа SI. |
|
Shift In. Показывает, что последующие кодовые комбинации должны интерпретироваться согласно стандартному набору символов. |
|
Data Link Escape (Переключение). Изменение значения идущих следом символов. Применяется для дополнительного контроля или для передачи произвольной комбинации бит. |
|
DC1, DC2, DC3, DC4 |
Device Controls (Контроль Устройства). Символы для управления вспомогательными устройствами (специальными функциями). |
Cancel (Отмена). Показывает, что данные, которые предшествовали этому символу в сообщении или блоке, должны игнорироваться (обычно в случае обнаружения ошибки). |
|
End of Medium (Конец Носителя). Указывает на физический конец ленты или другого носителя информации |
|
Substitute (Заместитель). Применяется для подмены ошибочного или недопустимого символа. |
|
Escape (Расширение). Применяется для расширения кода, указывая на то, что последующий символ имеет альтернативное значение. |
|
Space (Пробел). Непечатаемый символ для разделения слов или перемещения механизма печати или курсора дисплея вперед на одну позицию. |
|
Delete (Удаление). Применяется для удаления (стирания) предыдущего знака в сообщении |