Les cartes de caractères ISO-8859
BIEN que la norme universelle Unicode et son implémention UTF-8 soient très pratiques pour Internet, elles génèrent des pages plus lourdes pour les langues qui n'utilisent pas les alphabets latins : deux octets au caractère pour le grec, l'arabe, le turc, l'hébreu, le thaï, le cyrillique… alors que les cartes ci-dessous n'utilisent qu'un octet par caractère.
ASCII - American Standard Code for Information Interchange
Le 32 premiers octets (0x00 - 0x1F) étaient utiles pour le télétexte, et sont réservés pour tous les codages. Il en reste sur les systèmes informatiques modernes quelques octets de contrôle :
- octet 8 (0x08, parfois codé \b) de retour à gauche
- octet 9 (0x09, parfois codé \t) de tabulation
- octet 10 (0x0A, parfois codé \n) de saut de ligne
- octet 11 (0x0B, parfois codé \v) la tabulation verticale, souvent limitée à 1 ligne
- octet 12 (0x0C, parfois codé \f) qui représente un saut de page
- octet 13 (0x0D, parfois codé \r) de fin de paragraphe
- octet 27 (0x1B) pour les séquences d'échappement, utiles en émulation de terminal VT··· et pour les imprimantes. Le code ASCII se limite aux 128 premiers octets.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2_ | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / | |
3_ | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4_ | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
5_ | P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
6_ | ` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
7_ | p | q | r | s | t | u | v | w | x | y | z | { | | | } | ~ | � |
En codage HTML,
- les caractères accentués peuvent être rendus par une codification : é à û ï œ… ainsi que d'autres alphabets : α… voir les mnémoniques de la page caractères (1,2Mo)
- les caractères & < > doivent respectivement être codés & < >
- les guillemets "doubles" peuvent être codés " ou " et les 'simples' ' ou ' par exemple dans une chaîne à l'intérieur d'une balise.
ISO-8859
Les cartes ISO-8859 reprennent les caractères ASCII, de 0 (00) à 127 (7F), ce qui rend possible d'écrire le code HTML à l'aide des caractères latins non accentués, des caractères spéciaux courants ou de quelques autres alphabets. Concernant la partie étendue, octets 128 (80) à 255 (FF) :
- les octets de 128 à 159 (80 - 9F) n'y sont jamais utilisés.
- l'octet 160 (A0) est l'espace insécable ( ).
- l'octet 173 (AD) est la césure optionnelle (­), sauf pour l'ISO8859-11 (thaï).
ISO-8859-1 – latin1 – Europe de l'ouest
1 2 3 4 5 6 7 8 9 10 11 13 14 15 16
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
A_ | ¡ | ¢ | £ | ¤ | ¥ | ¦ | § | ¨ | © | ª | « | ¬ | - | ® | ¯ | |
B_ | ° | ± | ² | ³ | ´ | µ | ¶ | · | ¸ | ¹ | º | » | ¼ | ½ | ¾ | ¿ |
C_ | À | Á | Â | Ã | Ä | Å | Æ | Ç | È | É | Ê | Ë | Ì | Í | Î | Ï |
D_ | Ð | Ñ | Ò | Ó | Ô | Õ | Ö | × | Ø | Ù | Ú | Û | Ü | Ý | Þ | ß |
E_ | à | á | â | ã | ä | å | æ | ç | è | é | ê | ë | ì | í | î | ï |
F_ | ð | ñ | ò | ó | ô | õ | ö | ÷ | ø | ù | ú | û | ü | ý | þ | ÿ |
Les octets codant ces caractères sont repris comme points de code Unicode ; ils sont codés sur deux octets en UTF-8.
Le manque de €, œ, Œ, Ÿ… est à l'origine des normes ISO-8859-15 et Windows-1252.
ISO-8859-15 – latin9 – Europe de l'ouest
1 2 3 4 5 6 7 8 9 10 11 13 14 15 16
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
A_ | ¡ | ¢ | £ | € | ¥ | Š | § | š | © | ª | « | ¬ | - | ® | ¯ | |
B_ | ° | ± | ² | ³ | Ž | µ | ¶ | · | ž | ¹ | º | » | Œ | œ | Ÿ | ¿ |
C_ | À | Á | Â | Ã | Ä | Å | Æ | Ç | È | É | Ê | Ë | Ì | Í | Î | Ï |
D_ | Ð | Ñ | Ò | Ó | Ô | Õ | Ö | × | Ø | Ù | Ú | Û | Ü | Ý | Þ | ß |
E_ | à | á | â | ã | ä | å | æ | ç | è | é | ê | ë | ì | í | î | ï |
F_ | ð | ñ | ò | ó | ô | õ | ö | ÷ | ø | ù | ú | û | ü | ý | þ | ÿ |
Windows 1252
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8_ | € | | ‚ | ƒ | „ | … | † | ‡ | ˆ | ‰ | Š | ‹ | Œ | | Ž | |
9_ | | ‘ | ’ | “ | ” | • | – | — | ˜ | ™ | š | › | œ | | ž | Ÿ |
A_ | ¡ | ¢ | £ | ¤ | ¥ | ¦ | § | ¨ | © | ª | « | ¬ | - | ® | ¯ | |
B_ | ° | ± | ² | ³ | ´ | µ | ¶ | · | ¸ | ¹ | º | » | ¼ | ½ | ¾ | ¿ |
C_ | À | Á | Â | Ã | Ä | Å | Æ | Ç | È | É | Ê | Ë | Ì | Í | Î | Ï |
D_ | Ð | Ñ | Ò | Ó | Ô | Õ | Ö | × | Ø | Ù | Ú | Û | Ü | Ý | Þ | ß |
E_ | à | á | â | ã | ä | å | æ | ç | è | é | ê | ë | ì | í | î | ï |
F_ | ð | ñ | ò | ó | ô | õ | ö | ÷ | ø | ù | ú | û | ü | ý | þ | ÿ |
Cette carte de caractères reprend l'ISO-8859-1 et utilise en plus la plage 128-159 / (80-9F) pour les ajouts. Cette norme est l'une de celles prônées par le consortium W3.
ISO-8859-2 – latin2 – Europe de l'est
1 2 3 4 5 6 7 8 9 10 11 13 14 15 16
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
A_ | Ą | ˘ | Ł | ¤ | Ľ | Ś | § | ¨ | Š | Ş | Ť | Ź | - | Ž | Ż | |
B_ | ° | ą | ˛ | ł | ´ | ľ | ś | ˇ | ¸ | š | ş | ť | Ź | ˝ | ž | ż |
C_ | Ŕ | Á | Â | Ă | Ä | Ĺ | Ć | Ç | Č | É | Ę | Ë | Ě | Í | Î | Ď |
D_ | Đ | Ń | Ň | Ó | Ô | Ő | Ö | × | Ř | Ů | Ú | Ű | Ü | Ý | Ţ | ß |
E_ | ŕ | á | â | ă | ä | ĺ | ć | ç | č | é | ę | ë | ě | í | î | ď |
F_ | đ | ń | ň | ó | ô | ő | ö | ÷ | ř | ů | ú | ű | ü | ý | ţ | ˙ |
ISO-8859-3 – latin3 – Europe du sud
1 2 3 4 5 6 7 8 9 10 11 13 14 15 16
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
A_ | Ħ | ˘ | £ | ¤ | � | Ĥ | § | ¨ | İ | Ş | Ğ | Ĵ | - | � | Ż | |
B_ | ° | ħ | ² | ³ | ´ | µ | ĥ | · | ¸ | ı | ş | ğ | ĵ | ½ | � | ż |
C_ | À | Á | Â | � | Ä | Ċ | Ĉ | Ç | È | É | Ê | Ë | Ì | Í | Î | Ï |
D_ | � | Ñ | Ò | Ó | Ô | Ġ | Ö | × | Ĝ | Ù | Ú | Û | Ü | Ŭ | Ŝ | ß |
E_ | à | á | â | � | ä | ċ | ĉ | ç | è | é | ê | ë | ì | í | î | ï |
F_ | � | ñ | ò | ó | ô | ġ | ö | ÷ | ĝ | ù | ú | û | ü | ŭ | ŝ | ˙ |
Pour le turc (voir iso8859-9), le maltais et l'esperanto.
ISO-8859-4 – latin4 – Europe du nord
1 2 3 4 5 6 7 8 9 10 11 13 14 15 16
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
A_ | Ą | ĸ | Ŗ | ¤ | Ĩ | Ļ | § | ¨ | Š | Ē | Ģ | Ŧ | - | Ž | ¯ | |
B_ | ° | ą | ˛ | ŗ | ´ | ĩ | ļ | ˇ | ¸ | š | ē | ģ | ŧ | Ŋ | ž | ŋ |
C_ | Ā | Á | Â | Ã | Ä | Å | Æ | Į | Č | É | Ę | Ë | Ė | Í | Î | Ī |
D_ | Đ | Ņ | Ō | Ķ | Ô | Õ | Ö | × | Ø | Ų | Ú | Û | Ü | Ũ | Ū | ß |
E_ | ā | á | â | ã | ä | å | æ | į | č | é | ę | ë | ė | í | î | ī |
F_ | đ | ņ | ō | ķ | ô | õ | ö | ÷ | ø | ų | ú | û | ü | ũ | ū | ˙ |
ISO-8859-5 – cyrillique
1 2 3 4 5 6 7 8 9 10 11 13 14 15 16
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
A_ | Ё | Ђ | Ѓ | Є | Ѕ | І | Ї | Ј | Љ | Њ | Ћ | Ќ | - | Ў | Џ | |
B_ | А | Б | В | Г | Д | Е | Ж | З | И | Й | К | Л | М | Н | О | П |
C_ | Р | С | Т | У | Ф | Х | Ц | Ч | Ш | Щ | Ъ | Ы | Ь | Э | Ю | Я |
D_ | а | б | в | г | д | е | ж | з | и | й | к | л | м | н | о | п |
E_ | р | с | т | у | ф | х | ц | ч | ш | щ | ъ | ы | ь | э | ю | я |
F_ | № | ё | ђ | ѓ | є | ѕ | і | ї | ј | љ | њ | ћ | ќ | § | ў | џ |
ISO-8859-6 – arabe
1 2 3 4 5 6 7 8 9 10 11 13 14 15 16
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
A_ | � | � | � | ¤ | � | � | � | � | � | � | � | ، | - | � | � | |
B_ | � | � | � | � | � | � | � | � | � | � | � | ؛ | � | � | � | ؟ |
C_ | � | ء | آ | أ | ؤ | إ | ئ | ا | ب | ة | ت | ث | ج | ح | خ | د |
D_ | ذ | ر | ز | س | ش | ص | ض | ط | ظ | ع | غ | � | � | � | � | � |
E_ | ـ | ف | ق | ك | ل | م | ن | ه | و | ى | ي | ◌ً | ◌ٌ | ◌ٍ | ◌َ | ◌ُ |
F_ | ◌ِ | ◌ّ | ◌ْ | � | � | � | � | � | � | � | � | � | � | � | � | � |
ISO-8859-7 – grec monotonique
1 2 3 4 5 6 7 8 9 10 11 13 14 15 16
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
A_ | ‘ | ’ | £ | € | ₯ | ¦ | § | ¨ | © | ͺ | « | ¬ | - | � | ― | |
B_ | ° | ± | ² | ³ | ΄ | ΅ | Ά | · | Έ | Ή | Ί | » | Ό | ½ | Ύ | Ώ |
C_ | ΐ | Α | Β | Γ | Δ | Ε | Ζ | Η | Θ | Ι | Κ | Λ | Μ | Ν | Ξ | Ο |
D_ | Π | Ρ | � | Σ | Τ | Υ | Φ | Χ | Ψ | Ω | Ϊ | Ϋ | ά | έ | ή | ί |
E_ | ΰ | α | β | γ | δ | ε | ζ | η | θ | ι | κ | λ | μ | ν | ξ | ο |
F_ | π | ρ | ς | σ | τ | υ | φ | χ | ψ | ω | ϊ | ϋ | ό | ύ | ώ | � |
ISO-8859-8 – hébreu
1 2 3 4 5 6 7 8 9 10 11 13 14 15 16
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
A_ | � | ¢ | £ | ¤ | ¥ | ¦ | § | ¨ | © | × | « | ¬ | - | ® | ¯ | |
B_ | ° | ± | ² | ³ | ´ | µ | ¶ | · | ¸ | ¹ | ÷ | » | ¼ | ½ | ¾ | � |
C_ | � | � | � | � | � | � | � | � | � | � | � | � | � | � | � | � |
D_ | � | � | � | � | � | � | � | � | � | � | � | � | � | � | � | ‗ |
E_ | א | ב | ג | ד | ה | ו | ז | ח | ט | י | ך | כ | ל | ם | מ | ן |
F_ | נ | ס | ע | ף | פ | ץ | צ | ק | ר | ש | ת | � | � | → | ← | � |
- l'octet 253 (FD) code le sens de gauche à droite, l'octet 254 (FE) de droite à gauche.
ISO-8859-9 – latin5 – turc/kurde
1 2 3 4 5 6 7 8 9 10 11 13 14 15 16
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
A_ | ¡ | ¢ | £ | ¤ | ¥ | ¦ | § | ¨ | © | ª | « | ¬ | - | ® | ¯ | |
B_ | ° | ± | ² | ³ | ´ | µ | ¶ | · | ¸ | ¹ | º | » | ¼ | ½ | ¾ | ¿ |
C_ | À | Á | Â | Ã | Ä | Å | Æ | Ç | È | É | Ê | Ë | Ì | Í | Î | Ï |
D_ | Ğ | Ñ | Ò | Ó | Ô | Õ | Ö | × | Ø | Ù | Ú | Û | Ü | İ | Ş | ß |
E_ | à | á | â | ã | ä | å | æ | ç | è | é | ê | ë | ì | í | î | ï |
F_ | ğ | ñ | ò | ó | ô | õ | ö | ÷ | ø | ù | ú | û | ü | ı | ş | ÿ |
ISO-8859-10 – latin6 – Europe du nord
1 2 3 4 5 6 7 8 9 10 11 13 14 15 16
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
A_ | Ą | Ē | Ģ | Ī | Ĩ | Ķ | § | Ļ | Đ | Š | Ŧ | Ž | - | Ū | Ŋ | |
B_ | ° | ą | ē | ģ | ī | ĩ | ķ | · | ļ | đ | š | ŧ | ž | ― | ū | ŋ |
C_ | Ā | Á | Â | Ã | Ä | Å | Æ | Į | Č | É | Ę | Ë | Ė | Í | Î | Ï |
D_ | Ð | Ņ | Ō | Ó | Ô | Õ | Ö | Ũ | Ø | Ų | Ú | Û | Ü | Ý | Þ | ß |
E_ | ā | á | â | ã | ä | å | æ | į | č | é | ę | ë | ė | í | î | ï |
F_ | ð | ņ | ō | ó | ô | õ | ö | ũ | ø | ų | ú | û | ü | ý | þ | ĸ |
ISO-8859-11 – thai
1 2 3 4 5 6 7 8 9 10 11 13 14 15 16
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
A_ | ก | ข | ฃ | ค | ฅ | ฆ | ง | จ | ฉ | ช | ซ | ฌ | ญ | ฎ | ฏ | |
B_ | ฐ | ฑ | ฒ | ณ | ด | ต | ถ | ท | ธ | น | บ | ป | ผ | ฝ | พ | ฟ |
C_ | ภ | ม | ย | ร | ฤ | ล | ฦ | ว | ศ | ษ | ส | ห | ฬ | อ | ฮ | ฯ |
D_ | ะ | ◌ั | า | ำ | ◌ิ | ◌ี | ◌ึ | ◌ื | ◌ุ | ◌ู | ◌ฺ | � | � | � | � | ฿ |
E_ | เ | แ | โ | ใ | ไ | ๅ | ๆ | ◌็ | ◌่ | ◌้ | ◌๊ | ◌๋ | ◌์ | ◌ํ | ◌๎ | ๏ |
F_ | ๐ | ๑ | ๒ | ๓ | ๔ | ๕ | ๖ | ๗ | ๘ | ๙ | ๚ | ๛ | � | � | � | � |
ISO-8859-12 – inutilisé
Pressenti la norme pour le devanagari (hindi), mais abandonné.
ISO-8859-13 – latin-7 – baltique
1 2 3 4 5 6 7 8 9 10 11 13 14 15 16
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
A_ | ” | ¢ | £ | ¤ | „ | ¦ | § | Ø | © | Ŗ | « | ¬ | - | ® | Æ | |
B_ | ° | ± | ² | ³ | “ | µ | ¶ | · | ø | ¹ | ŗ | » | ¼ | ½ | ¾ | æ |
C_ | Ą | Į | Ā | Ć | Ä | Å | Ę | Ē | Č | É | Ź | Ė | Ģ | Ķ | Ī | Ļ |
D_ | Š | Ń | Ņ | Ó | Ō | Õ | Ö | × | Ų | Ł | Ś | Ū | Ü | Ż | Ž | ß |
E_ | ą | į | ā | ć | ä | å | ę | ē | č | é | Ź | ė | ģ | ķ | ī | ļ |
F_ | š | ń | ņ | ó | ō | õ | ö | ÷ | ų | ł | ś | ū | ü | ż | ž | ’ |
ISO-8859-14 – latin8 – celtique
1 2 3 4 5 6 7 8 9 10 11 13 14 15 16
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
A_ | Ḃ | ḃ | £ | Ċ | ċ | Ḋ | § | Ẁ | © | Ẃ | ḋ | Ỳ | - | ® | Ÿ | |
B_ | Ḟ | ḟ | Ġ | ġ | Ṁ | ṁ | ¶ | Ṗ | ẁ | ṗ | ẃ | Ṡ | ỳ | Ẅ | ẅ | ṡ |
C_ | À | Á | Â | Ã | Ä | Å | Æ | Ç | È | É | Ê | Ë | Ì | Í | Î | Ï |
D_ | Ŵ | Ñ | Ò | Ó | Ô | Õ | Ö | Ṫ | Ø | Ù | Ú | Û | Ü | Ý | Ŷ | ß |
E_ | à | á | â | ã | ä | å | æ | ç | è | é | ê | ë | ì | í | î | ï |
F_ | ŵ | ñ | ò | ó | ô | õ | ö | ṫ | ø | ù | ú | û | ü | ý | ŷ | ÿ |
ISO-8859-16 – latin10 – Europe du sud-est
1 2 3 4 5 6 7 8 9 10 11 13 14 15 16
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
A_ | Ą | ą | Ł | € | „ | Š | § | š | © | Ș | « | Ź | - | Ź | Ż | |
B_ | ° | ± | Č | ł | Ž | ” | ¶ | · | ž | č | ș | » | Œ | œ | Ÿ | ż |
C_ | À | Á | Â | Ă | Ä | Ć | Æ | Ç | È | É | Ê | Ë | Ì | Í | Î | Ï |
D_ | Đ | Ń | Ò | Ó | Ô | Ő | Ö | Ś | Ű | Ù | Ú | Û | Ü | Ę | Ț | ß |
E_ | à | á | â | ă | ä | ć | æ | ç | è | é | ê | ë | ì | í | î | ï |
F_ | đ | ń | ò | ó | ô | ő | ö | ś | ű | ù | ú | û | ü | ę | ț | ÿ |