UTF-16: 두 판 사이의 차이

내용 삭제됨 내용 추가됨
Chobot (토론 | 기여)
잔글 robot Adding: nl:UTF-16
잔글 오타 수정: U+DFFF 까지의 값을 갖으며를 ....가지며... 로. 처음나는 서로?게이트를 옆에 (surrogate) 표시.
35번째 줄:
 
 
기본 다국어 평면에 포함되지 않는 문자들, 즉 16비트로 값을 표현할 수 없는 문자들은 서로게이트(Surrogate) 문자 영역에 해당하는 두 개의 16비트 문자로 변환되어 이 한 쌍(즉 32비트)이 그 문자를 나타내게 된다. 그 자세한 방식은 다음 그림을 통해 설명한다.
 
Bit
57번째 줄:
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
 
유니코드 문자 영역에서 상위 서로게이트는 U+D800 에서 U+DBFF 까지의 값을 갖는다. 즉 최상위비트 6개의 값이 그림에서 보듯이 110110 으로 일정하다. 마찬가지로 하위 서로게이트는 U+DC00 에서 U+DFFF 까지의 값을 갖으며가지며 최상위비트 6개의 값은 110111 이 된다. 각 서로게이트 문자는 하위 10비트 씩의 자유도를 갖는다. 따라서 주어진 문자를 10비트 씩 두조각을 내서 상위 서로게이트와 하위 서로게이트에 배정한 것이다.
 
여기서 다음을 만족한다.