확장 문자: 두 판 사이의 차이

내용 삭제됨 내용 추가됨
잔글편집 요약 없음
잔글 →‎역사: 링크 수정
4번째 줄:
1960년대 동안 메인프레임 컴퓨터와 미니컴퓨터 제조업체들은 8비트 [[바이트]] 정도를 최소 자료형으로 표준화하기 시작하였다. 그 동안 7비트 [[아스키]] 문자가 [[인쇄 전신기]], [[컴퓨터 터미널]]의 [[영숫자]] 인코딩에 대한 산업 표준 방식으로 채택되어 있었다. 그 결과 8비트 바이트는 컴퓨터 시스템에서 ASCII 문자를 메모리에 저장하는 [[데 팍토|사실 상의]] 자료형이 되어왔다.
 
나중에 컴퓨터 제조업체들은 제한된 [[영어 알파벳]] 문자 집합을 넘어서서 아스키 문자 집합을 확장하기 위한 여분의 비트를 이용하기 시작하였다. [[EBCDIC 037|IBM 코드 페이지 37]], [[PETSCI]], [[ISO/IEC 8859|ISO 8859]]와 같은 [[확장 아스키|8비트 확장]]이 일반화되어 터미널에 [[그리스 문자]], [[키릴 문자]] 등의 문자 지원을 제공하게 되었다. 그러나 이러한 확장은 특정 지역에 국한된다는 단점이 있었고 동시에 사용할 수 없었다. 문자 집합마다 특수한 변환 루틴을 사용하여 변환해 주어야 했으므로 대상 집합에 존재하는 문자가 없을 때 이따금 변환을 실패하기도 했다.
 
1989년에 [[국제 표준화 기구]]는 [[국제 문자 세트|범용 문자 집합]](UCS)을 만들기 시작하였는데 이 집합은 16비트(2바이트)나 32비트(4바이트) 값을 이용하여 인코딩할 수 있는 다국어 문자 집합을 가리킨다. 이렇게 큰 값은 8비트 보다 더 큰 자료형을 이용하여야 메모리에 새로운 문자 값을 저장할 수 있었다. 그러므로 확장 문자라는 이 용어는 전통적인 8비트 문자 자료형과는 구분된다.