UTF-8: 두 판 사이의 차이

내용 삭제됨 내용 추가됨
홍길똥 (토론 | 기여)
홍길똥 (토론 | 기여)
편집 요약 없음
26번째 줄:
* [[16진수]] C704는 [[2진수]] <tt>1100-0111-0000-0100</tt>와 같다.
* 이 비트들은 순서대로 <tt>x</tt>로 표시된 비트에 들어 간다: <tt>1110'''1100''' 10'''011100''' 10'''000100'''</tt>
* 결과적으로 이 문자는 3바이트로 인코딩되다6진인코딩된다. (수로16진수로 표시하면 <tt>EC 9C 84</tt>가 된다.)
)
 
따라서 첫 128 문자는 1바이트로 표시되고, 그 다음 1920 문자<ref>[[발음 구별 기호]]가 붙은 [[라틴 문자]], [[그리스 문자]], [[키릴 문자]], [[콥트 문자]], [[아르메니아 문자]], [[히브리 문자]], [[아랍 문자]]</ref>는 2바이트로 표시되며, 나머지 문자들 중 BMP 안에 들어 있는 것은 3바이트, 아닌 것은 4바이트로 표시된다.