ISO/IEC 8859

(ECMA-94에서 넘어옴)

ISO/IEC 8859는 컴퓨터에서 8비트로 문자를 나타내기 위한 ISOIEC의 공동 표준이다. ISO/IEC 8859-1, ISO/IEC 8859-2 등의 세부 표준이 제안되어 있다.

ISO/IEC 8859 파트 1, 2, 3, 4는 원래 Ecma 인터내셔널 표준 ECMA-94이었다.

소개

편집

ASCII에 포함된 95자의 인쇄 영역은 현대 영어로 정보를 표현하는 데 충분하다. 하지만 로마 문자를 쓰는 다른 언어에는 ASCII로 처리할 수 없는 추가적인 기호를 포함하고 있다. 예를 들면 ß(독일어), ñ(에스파냐어), å(스웨덴어와 북유럽 언어) 등이다. ISO 8859는 8비트로 구성된 바이트의 8번째 비트를 이용하여 128자의 추가적인 문자를 할당하여 이 문제를 처리하기 위해 제안되었다. 하지만 한 종류의 문자 집합만으로는 필요로 하는 모든 문자를 처리할 수 없어 여러 가지 매핑이 개발되었다.

ISO 8859-n 부호화는 인쇄 가능한 문자만을 포함한다. 문자가 대응되지 않은 곳은 제어 문자로 활용된다. IANAISO/IEC 646에 정의된 C0 영역(0-31)과 ISO 6429에 정의된 C1 영역(127-159)을 제어 문자로 사용한다. 이 문자 집합 이름은 MIME 이름으로도 활용된다.

구성

편집

ISO/IEC 8859는 다음 문자 집합으로 이루어져 있다.

ISO/IEC 8859-1
ISO/IEC 8859-2
ISO/IEC 8859-3
ISO/IEC 8859-4
ISO/IEC 8859-5
ISO/IEC 8859-6
  • 라틴/아랍
  • 아랍어를 지원한다. 아랍 문자를 쓰는 다른 언어는 지원하지 않는다. 표시를 위해서는 양방향 문자와 문자 결합을 처리해줘야 한다.
ISO/IEC 8859-7
  • 라틴/그리스
  • 현대 그리스어를 지원한다. 문자 개혁 이전의 고전 그리스어(polytonic orthography)는 유니코드에서 지원한다.
ISO/IEC 8859-8
  • 라틴/히브리
  • 이스라엘에서 쓰이는 현대 히브리어를 지원한다. 좌에서 우, 또는 우에서 좌 두가지 방향의 인코딩이 모두 존재한다.
ISO/IEC 8859-9
ISO/IEC 8859-10
  • 라틴-6
    노르딕
  • 라틴-4의 문자를 재배열했다. 노르딕 언어의 표기에 더 적합하다. 발트 언어에게는 라틴-4가 더 편리하다.
ISO/IEC 8859-11
ISO/IEC 8859-12
ISO/IEC 8859-13
  • 라틴-7
    발트 해 연안
  • 라틴-4와 라틴-6에 빠진 발트 언어의 문자를 추가했다.
ISO/IEC 8859-14
ISO/IEC 8859-15
ISO/IEC 8859-16
  1. 네덜란드어에서 쓰이는 IJ:*IJ/ij 문자가 빠졌으며, 로마 문자 IJ로 사용된다.
  2. 빠진 글자는 ISO 8859-15에 추가되었다.
  3. 1991년 우크라이나어에 재도입된 Ґ/ґ 문자가 빠져있다.
ISO/IEC 8859 간의 비교
Bin Oct Dec Hex 1 2 3 4 5 6 7 8 9 10 11 13 14 15 16
10100000 240 160 A0 Non-breaking space (NBSP)
10100001 241 161 A1 ¡ Ą Ħ Ą Ё     ¡ Ą ¡ Ą
10100010 242 162 A2 ¢ ˘ ĸ Ђ   ¢ ¢ Ē ¢ ¢ ą
10100011 243 163 A3 £ Ł £ Ŗ Ѓ   £ Ģ £ Ł
10100100 244 164 A4 ¤ Є ¤ ¤ Ī ¤ Ċ
10100101 245 165 A5 ¥ Ľ   Ĩ Ѕ   ¥ Ĩ ċ ¥
10100110 246 166 A6 ¦ Ś Ĥ Ļ І   ¦ Ķ ¦ Š
10100111 247 167 A7 § Ї   § §
10101000 250 168 A8 ¨ Ј   ¨ Ļ Ø š
10101001 251 169 A9 © Š İ Š Љ   © Đ ©
10101010 252 170 AA ª Ş Ē Њ   ͺ × ª Š Ŗ ª Ș
10101011 253 171 AB « Ť Ğ Ģ Ћ   « Ŧ « «
10101100 254 172 AC ¬ Ź Ĵ Ŧ Ќ ، ¬ Ž ¬ ¬ Ź
10101101 255 173 AD soft hyphen (SHY) SHY
10101110 256 174 AE ® Ž   Ž Ў     ® Ū ® ź
10101111 257 175 AF ¯ Ż ¯ Џ   ¯ Ŋ Æ Ÿ ¯ Ż
10110000 260 176 B0 ° А   ° ° °
10110001 261 177 B1 ± ą ħ ą Б   ± ą ± ±
10110010 262 178 B2 ² ˛ ² ˛ В   ² ē ² Ġ ² Č
10110011 263 179 B3 ³ ł ³ ŗ Г   ³ ģ ³ ġ ³ ł
10110100 264 180 B4 ´ Д   ΄ ´ ī Ž
10110101 265 181 B5 µ ľ µ ĩ Е   ΅ µ ĩ µ µ
10110110 266 182 B6 ś ĥ ļ Ж   Ά ķ
10110111 267 183 B7 · ˇ · ˇ З   · · ·
10111000 270 184 B8 ¸ И   Έ ¸ ļ ø ž
10111001 271 185 B9 ¹ š ı š Й   Ή ¹ đ ¹ ¹ č
10111010 272 186 BA º ş ē К   Ί ÷ º š ŗ º ș
10111011 273 187 BB » ť ğ ģ Л ؛ » ŧ » »
10111100 274 188 BC ¼ ź ĵ ŧ М   Ό ¼ ž ¼ Œ
10111101 275 189 BD ½ ˝ ½ Ŋ Н   ½ ½ œ
10111110 276 190 BE ¾ ž   ž О   Ύ ¾ ū ¾ Ÿ
10111111 277 191 BF ¿ ż ŋ П ؟ Ώ   ¿ ŋ æ ¿ ż
11000000 300 192 C0 À Ŕ À Ā Р   ΐ   À Ā Ą À
11000001 301 193 C1 Á С ء Α   Á Į Á
11000010 302 194 C2 Â Т آ Β   Â Ā Â
11000011 303 195 C3 Ã Ă   Ã У أ Γ   Ã Ć Ã Ă
11000100 304 196 C4 Ä Ф ؤ Δ   Ä Ä
11000101 305 197 C5 Å Ĺ Ċ Å Х إ Ε   Å Å Ć
11000110 306 198 C6 Æ Ć Ĉ Æ Ц ئ Ζ   Æ Ę Æ
11000111 307 199 C7 Ç Į Ч ا Η   Ç Į Ē Ç
11001000 310 200 C8 È Č È Č Ш ب Θ   È Č Č È
11001001 311 201 C9 É Щ ة Ι   É É
11001010 312 202 CA Ê Ę Ê Ę Ъ ت Κ   Ê Ę Ź Ê
11001011 313 203 CB Ë Ы ث Λ   Ë Ė Ë
11001100 314 204 CC Ì Ě Ì Ė Ь ج Μ   Ì Ė Ģ Ì
11001101 315 205 CD Í Э ح Ν   Í Ķ Í
11001110 316 206 CE Î Ю خ Ξ   Î Ī Î
11001111 317 207 CF Ï Ď Ï Ī Я د Ο   Ï Ļ Ï
11010000 320 208 D0 Ð Đ   Đ а ذ Π   Ğ Ð Š Ŵ Ð
11010001 321 209 D1 Ñ Ń Ñ Ņ б ر Ρ   Ñ Ņ Ń Ñ Ń
11010010 322 210 D2 Ò Ň Ò Ō в ز     Ò Ō Ņ Ò
11010011 323 211 D3 Ó Ķ г س Σ   Ó Ó
11010100 324 212 D4 Ô д ش Τ   Ô Ō Ô
11010101 325 213 D5 Ő Ġ Õ е ص Υ   Õ Ő
11010110 326 214 D6 Ö ж ض Φ   Ö Ö
11010111 327 215 D7 × з ط Χ   × Ũ × × Ś
11011000 330 216 D8 Ø Ř Ĝ Ø и ظ Ψ   Ø Ų Ø Ű
11011001 331 217 D9 Ù Ů Ù Ų й ع Ω   Ù Ų Ł Ù
11011010 332 218 DA Ú к غ Ϊ   Ú Ś Ú
11011011 333 219 DB Û Ű Û л   Ϋ   Û   Ū Û
11011100 334 220 DC Ü м   ά   Ü   Ü
11011101 335 221 DD Ý Ŭ Ũ н   έ   İ Ý   Ż Ý Ę
11011110 336 222 DE Þ Ţ Ŝ Ū о   ή   Ş Þ   Ž Ŷ Þ Ț
11011111 337 223 DF ß п   ί ß ฿ ß
11100000 340 224 E0 à ŕ à ā р ـ ΰ א à ā ą à
11100001 341 225 E1 á с ف α ב á į á
11100010 342 226 E2 â т ق β ג â ā â
11100011 343 227 E3 ã ă   ã у ك γ ד ã ć ã ă
11100100 344 228 E4 ä ф ل δ ה ä ä
11100101 345 229 E5 å ĺ ċ å х م ε ו å å ć
11100110 346 230 E6 æ ć ĉ æ ц ن ζ ז æ ę æ
11100111 347 231 E7 Ç į ч ه η ח Ç į ē Ç
11101000 350 232 E8 È č È č ш و θ ט È č č È
11101001 351 233 E9 É щ ى ι י É É
11101010 352 234 EA Ê ę Ê ę ъ ي κ ך Ê ę ź Ê
11101011 353 235 EB Ë ы ً λ כ Ë ė Ë
11101100 354 236 EC Ì ě Ì ė ь ٌ μ ל Ì ė ģ Ì
11101101 355 237 ED Í э ٍ ν ם Í ķ Í
11101110 356 238 EE î ю َ ξ מ î ī î
11101111 357 239 EF ï ď ï ī я ُ ο ן ï ļ ï
11110000 360 240 F0 ð đ   đ ȑ ِ π נ ğ ð š ŵ ð đ
11110001 361 241 F1 ñ ń ñ ņ ё ّ ρ ס ñ ņ ń ñ ń
11110010 362 242 F2 ò ň ò ō ђ ْ ς ע ò ō ņ ò
11110011 363 243 F3 ó ķ ѓ   σ ף ó ó
11110100 364 244 F4 ô є   τ פ ô ō ô
11110101 365 245 F5 ő ġ õ ѕ   υ ץ õ ő
11110110 366 246 F6 ö і   φ צ ö ö
11110111 367 247 F7 ÷ ї   χ ק ÷ ũ ÷ ÷ ś
11111000 370 248 F8 ø ř ĝ ø ј   ψ ר ø ų ø ű
11111001 371 249 F9 ù ů ù ų љ   ω ש ù ų ł ù
11111010 372 250 FA ú њ   ϊ ת ú ś ú
11111011 373 251 FB û ű û ћ   ϋ   û ū û
11111100 374 252 FC ü ќ   ό   ü   ü
11111101 375 253 FD ý ŭ ũ §   ύ LRM ı ý   ż ý ę
11111110 376 254 FE þ ţ ŝ ū ў   ώ RLM ş þ   ž ŷ þ ț
11111111 377 255 FF ÿ ˙ џ       ÿ ĸ   ÿ
  • 0xA0위치에는 NBSP(non breaking space) 문자가, 0xAD에는 대개 소프트 하이픈(soft hyphen) 문자가 놓여있다. 다른 빈 자리는 할당되지 않은 영역이거나 현재 사용자 시스템이 표시할 수 없는 글자이다.
  • ISO/IEC 8859-7:2003과 ISO/IEC 8859-8:1999에서 새로 추가된 영역이 있다. LRM은 좌에서 우표시(U+200E), RLM은 우에서 좌 표시(U+200F)에 대응한다.