사용자:Yes0song/다지모/다양한 표기법 현황

이 문서는 다양한 표기법을 지원하고 있거나 지원 가능성이 있는 위키백과들의 실태에 관해 간략히 정리한 글입니다. 이하 존대말은 생략합니다.

언어 목록

: 간어 · 감어 · 객가어 · 고대 교회 슬라브어 · 고려말 · 고려말 한자 · 고려말 한자 혼용 · 고려말 한자혼용 · 고려어 · 고려어 한자 · 고려어 한자 혼용 · 고려어 한자혼용 · 고트어 · 광동어 · 광동어 · 길라크어 · 꿰냐 · 끼르기즈어

: 노르만어

: 도이췰란드어 · 도이치어 · 도이칠란트어 · 독어 · 독일어 · 따쥐끄어 · 따따르어 · 뛰르끼예어 · 뚜르끄멘어

: 라디노어 · 로마어 · 로므니아어 · 루마니아어 · 류구어 · 류뀨어 · 류우뀨우어 · 류우큐우어 · 류큐어 · 링구아프랑카노바

: 만주어 · 말레이어 · 말레이시아어 · 말레이지아어 · 몰도바어 · 몽고어 · 몽골어 · 문언문 · 민난어 · 민남어 · 민동어 · 민둥어

: 백노서아어 · 백러시아어 · 베트남어 · 베트남어 자남 · 베트남어 쯔놈 · 베트남어 추놈 · 베트남어 한자 · 벨라루스어 · 벨라루씨어 · 벨로루시어 · 보스니아어 · 부랴찌야어 · 부랴트어 · 부리아트어 · 불란서어 · 불어 · 뽀르뚜갈어

: 서반아어 · 서어 · 세르보크로아티아어 계열 · 세르보크로아티아어 · 세르비아어 · 쉬운 영어 · 스코트어 · 스코틀랜드어 · 스페인어 · 시비르어 · 신디어

: 아이누어 · 아제르바이잔어 · 에스빠냐어 · 에스파냐어 · LNF · 엘엔에프 · 영어 · 오스만 뛰르끄어 · 오스만 뛰르끼예어 · 오스만 터키어 · 오스만 투르크어 · 오스만 튀르크어 · 오끼나와어 · 오키나와어 · 오어 · 와분따이 · 와분타이 · 우어 · 우즈베크어 · 우즈벡어 · 위구르어 · 월어 · 월남어 · 월남어 자남 · 월남어 쯔놈 · 월남어 추놈 · 월남어 한자 · 위에어 · 유고어 · 유고슬라비아어 · 유구어 · 인니어 · 인도네시아어 · 일본어 · 일본어 고문 · 일본어 문어 · 일본어 와분따이 · 일본어 와분타이 · 일본어 화문체 · 일어 · 일어 고문 · 일어 문어

: 자남 · 제주말 · 제주도 방언 · 제주도 사투리 · 제주 방언 · 제주 사투리 · 제주어 · 조선어 · 조선어 한자 · 조선어 한자 혼용 · 조선어 한자혼용 · 중국어 · 중문 · 중어 · 쯔놈

: 체첸어 · 체츠냐어 · 추놈 · 충승어

: 카슈미르어 · 카시미르어 · 카자흐어 · 캐시미르어 · 코리아어 · 코리아어 한자 · 코리아어 한자 혼용 · 코리아어 한자혼용 · 쿠르드어 · 퀘냐 · 크로아티아어 · 크리어 · 크림타타르어 ·클링곤 · 클링온 · 키르기스어 · 키르기즈어

: 타지크어 · 타타르어 · 터어키어 · 터키어 · 투르크멘어

: 펀자브어 · 펀잡어 · 포도아어 · 포어 · 포르투갈어 · 포르투칼어 · 프랑스어

: 하우사어 · 하카어 · 한국어 · 한국어 국한문 혼용 · 한국어 국한문혼용 · 한국어 한자 · 한국어 한자 혼용 · 한국어 한자혼용 · 한문 · 화문체

자동 변환기를 제공하는 경우

편집

전부

편집

세르비아어 위키백과

편집

세르비아어는 문자에 따라 두 알파벳(키릴 문자라틴 문자), 두 '방언'(ekavian과 ijekavian)으로 나뉜다. 결국 세르비아어는 키릴+ekavian, 키릴+ijekavian, 라틴+ekavian, 라틴+ijekavian 4종류의 이형(異形)이 있는 셈이다.

현재 세르비아어 위키백과는 키릴 문자와 라틴 문자 간에 자동 변환을 제공하고 있다. 두 방언 ekavian과 ijekavian 간에는 차이가 미미한데다 기술적으로 어려움이 있어 아직 방언별 자동 변환기가 제공되고 있지 않다.

이누이트어 위키백과

편집

이누이트어는 캐나다에서 알래스카 주에 이르는 지역에까지 살고 있는 이누이트인들이 사용하는 언어이다. 표기에 따라 이누이트 고유 문자와 로마자로 나뉜다. 현재 이누이트어 위키백과는 로마자판과 이누이트 고유 문자가 같이 사용되어 있었지만, 이누이트 고유 문자와 로마자와의 변환기는 준비되어 있지 않았다. 하지만 최근에 로마자와 이누이트 고유 문자 변환기를 도입했다.

중국어 위키백과

편집

중국어의 북방 방언(관화, 官話, Mandarin)의 백화문(白話文) 표기법은 크게 정체자(번체자)와 간체자라는 문자가 차이가 나고, 작게는 타이완의 印表機와 중국 대륙의 打印机(이상 '프린터') 같이 지역에 따른 어휘에 차이가 난다. 중국어 위키백과는 이에 맞추어 zh(변환하지 않은 원본, 不转换/不轉換), zh-hans(간체 범용, 简体), zh-hant(정·번체 범용, 繁體), zh-cn(중국 대륙 간체, 大陆简体), zh-tw(타이완 정·번체, 台灣正體), zh-hk(홍콩·마카오 정·번체, 港澳繁體), zh-sg(싱가포르·말레이시아 간체, 马新简体) 일곱 종류의 표기 방식을 자동 변환기로 처리하고 있다.

대륙 간체를 중국 번체자(중화인민공화국에서 규정한 번체자 字體)로 일대일로 변환한 표기법도 지원해 볼 법하지만, 실제 혜택이 돌아갈 사용자 수가 적어서인지 현재는 추진 중이진 않은 것 같다(관련 논의: zh:User:Yes0song/保存文書#提議新建“傳統正體”或稱“大陸繁體”轉換模式).

자매 프로젝트 현황

편집

위키백과 이외의 중국어 위키미디어 프로젝트는 자동 변환기가 다소 다르게 작동 중이다.

위키백과와 동일한 방식으로 zh, zh-cn, zh-tw, zh-hk, zh-sg의 5종으로 처리하고 있는 것은 위키뉴스뿐이다. 위키낱말사전, 위키책, 위키인용집, 위키자료집은 간단히 간체(zh-cn)와 번체(zh-tw)로만 구분하여 변환기를 제공하고 있다. 언어별로 따로 서버를 호스팅 하지 않는 공동 프로젝트인 메타위키, 위키미디어 공용, 위키스페시스는 원래부터 자동 변환기를 제공하지 않으므로, 모든 중국어 문서를 간체판과 번체판으로 따로 작성한다. 아직 출범하지 않은 중국어판 위키버시티는, 이 프로젝트 자체가 위키책에서 분리된 것이므로 중국어 위키책처럼 간·번체로만 구분하여 변환기를 제공할 가능성이 있다.

카자흐어 위키백과

편집

카자흐어의 표기는 문자에 따라서 키릴, 라틴, 아랍 문자 세 종류로 나뉜다. 카자흐어의 위키백과에서는 이 세 문자를 모두 자동 변환기에 따라 변환해 보여준다. 아랍 문자는 오른쪽에서 왼쪽으로 써 나가는 문자이므로, 아랍 문자로 볼 때는 위키백과의 레이아웃이 좌우가 바뀌어 나타나게 된다.

일부

편집

간어 위키백과

편집

간어(贛語감어)는 중국어의 방언으로, 한자(간체자, 번체자)로 표기하는 방법과 라틴 문자로 표기하는 방법 두 가지가 있다. 간어위키백과가 생겨났으며, 최근에는 간체자↔번체자변환기가 도입되었다. 아직 로마자와의 변환기는 준비되어 있지 않다.

우즈베크어 위키백과

편집

우즈베크어는 구소련에서 쓰이는 문자(라틴 문자와 키릴 문자), 구소련 밖에서 쓰이는 문자(아랍 문자)로 나뉘어져 있다. 구소련이 해체된 뒤에는 라틴 문자도 사용된다. 우즈베크어 위키백과에는 로마자로만 수록이 되어 있었지만, 최근 키릴 문자↔라틴 문자변환기를 도입했다. 하지만 아직 아랍 문자 변환기를 제공하고 있지 않다.

쿠르드어 위키백과

편집

쿠르드어는 지역에 따라서 라틴 문자를 쓰는 경우(터키시리아), 아랍 문자를 쓰는 경우(이라크이란), 키릴 문자를 쓰는 경우(구 소련)로 나뉜다. 최근에 쿠르드어 위키백과는 라틴 문자와 아랍 문자 변환기를 도입했다. 아직 키릴판은 도입되지 않았다.

타지크어 위키백과

편집

타지크어도 위구르어, 키르기스어, 카자흐어와 마찬가지로 구소련에서 쓰이는 타지크어는 키릴 문자와 일부 라틴 문자, 구소련 밖에서는 아랍 문자를 사용한다. 최근 타지크어 위키백과에선 로마자 변환기를 도입했으며, 키릴 문자↔로마자로 변환할 수 있다. 하지만 아직 아랍 문자 변환기는 준비되어 있지 않다.

자동 변환기를 제공하지 않는 경우

편집

고대 교회 슬라브어 위키백과

편집

고대 교회 슬라브어는 남슬라브어족에 속한 언어로, 문자는 글라골 문자와 키릴 문자를 사용한다. 고대 교회 슬라브어는 여러 슬라브언어에 영향을 끼쳤으며, 초기 키릴 문자는 키릴 문자의 모체가 되었다. 초기 키릴 문자는 아직 유니코드에 일부 문자가 잘 나오지 않으며, 글라골 문자는 고트 문자와 마찬가지로 유니코드에 전부 나오지 않고 있다. 현재 고대 교회 슬라브어 위키백과는 초기 키릴 문자로만 표기되어 있으며, 초기 키릴 문자↔글라골 문자 변환기는 아직 준비되어 있지 않다.

고트어 위키백과

편집

고트어는 고트 문자로 표기되는 언어이다. 고트어 위키백과는 기본적으로 고트 문자로 표기되지만, 고트 문자는 현재 유니코드에서 빠져 있어서 잘 나타나 있지 않다. 고트어 위키백과는 라틴 문자와 룬 문자 버전도 준비되어 있다. 하지만 아직은 고트 문자↔라틴↔룬 문자 변환기는 준비되어 있지 않다.

광둥어 위키백과

편집

광둥어(廣東語광동어; 粵語월어)는 다른 중국어의 방언과 마찬가지로 사용되는 문자가 정체자와 간체자로 나뉜다. 광동어의 경우 정체자는 홍콩과 마카오에서 주로 사용되고 간체자는 중국 대륙에서 사용된다. 현재 광둥어 위키백과에서는 정체자만 사용되고 있으며, 아직 간체자와의 자동 변환기는 제공되고 있지 않다.

길라크어 위키백과

편집

길라크어는 이란 북동쪽에서 쓰이는 이란어계 언어로, 문자는 아랍 문자를 사용하는 언어이다. 길라크어 위키백과에서는 아랍 문자로 쓰여진 문서, 라틴 문자로 쓰여진 문서를 볼 수 있으나, 현재 아랍↔라틴 변환기는 준비되어 있지 않다.

노르만어 위키백과

편집

노르만어에는 프랑스에 있는 노르망디 본토 방언과, 영국 왕실령인 채널 제도건지 방언, 저지 방언, 올더니 방언사어(死語), 사크 방언 등이 있다. 아직 노르만어 위키백과에서는 이들 방언 간의 자동 변환기가 없이, 매 문서마다 어느 방언인지 설명하는 틀(template)을 삽입하는 방식으로 편찬되고 있다.

독일어 위키백과

편집

독일어는 게르만어족 가운데 영어다음으로 두번째로 많이 쓰이는 언어이다. 독일어는 지역에 따라 여러 방언으로 나뉘어져 있으며, 사용 국가에 따라 독일본토, 오스트리아, 리히텐슈타인, 스위스, 동유럽, 벨기에로 나뉘어져 있다. 독일어 위키백과에선 현재 이들 방언과 나라별 독일어 변환기가 없는 상태이다.

라디노어 위키백과

편집

라디노어는 에스파냐어의 방언이지만, 유대인들이 사용하는 언어이다. 라디노어는 히브리 문자와 라틴 문자로 표기되지만 라디노어 위키백과는 대부분의 경우 라틴 문자로 쓰여져 있다. 히브리 문자로 쓰여진 문서도 볼 수 있으나 아직 히브리 문자↔라틴 문자 변환기는 준비되어 있지 않다.

로마어 위키백과

편집

로마어는 인도에서 유럽에 사용하는 언어로 문자는 데바나가리 문자를 사용한다. 가끔 라틴 문자도 사용되며 키릴 문자도 사용된다. 현재 로마어 위키백과에서는 데바나가리 문자와 라틴 문자가 병기되어 있으며, 문서는 주로 라틴 문자로 표기된다. 아직 데바나가리 문자↔라틴 문자↔키릴 문자 변환기는 준비되어 있지 않다.

루마니아어-몰도바어 계열

편집

루마니아어 위키백과

편집

루마니아어는 루마니아와 몰도바에서 사용하는 로망스어족의 언어이다. 문자는 루마니아 본토가 라틴 문자, 몰도바는 키릴 문자를 사용한다. 최근 몰도바에서 라틴 문자도 사용하게 됨에 따라 루마니아어와 몰도바어는 그 형태가 거의 비슷해졌다고 볼 수 있다. 루마니아어도 예전에는 키릴 문자를 사용했으나, 지금은 라틴 문자만 사용한다. 루마니아어 위키백과와 몰도바어 위키백과가 통합됨에 따라서, 라틴 문자판(루마니아 본토)↔키릴 문자판(몰도바) 변환기는 아직 준비되어 있지 않다.

몰도바어 위키백과

편집

몰도바어는 몰도바에서 사용하는 루마니아어의 방언이라고 할 수 있을 정도로, 두 언어는 매우 유사하다. 루마니아어와 몰도바어는 언어학적으로는 서로 같은 로망스어족의 언어이다. 서로 같은 동질성을 지녔으나, 문자적으로 보면 몰도바어는 키릴 문자, 루마니아어는 라틴 문자를 사용한다. 하지만 소련 붕괴 뒤에는 라틴 문자를 다시 사용하기 시작했다(트란스니스트리아에서는 여전히 키릴 문자로 표기된다). 원래 몰도바어 위키백과는 키릴 문자와 라틴 문자가 혼용되었으나, 변환기가 준비되어 있지 않았다. 그리고 몰도바어 위키백과는 루마니아어 위키백과에 통합되어 폐쇄되었다.

말레이어/인도네시아어 위키백과

편집

말레이어는 말레이시아, 인도네시아, 브루나이, 타이 남쪽, 싱가포르에서, 인도네시아어는 인도네시아와 싱가포르, 동티모르에서 사용되는 언어이다. 말레이어와 인도네시아어는 언어학적으론 서로 사촌뻘되는 언어이다. 이들 언어는 문자는 라틴 문자와 자위 문자를 사용하며, 자위 문자는 아랍 문자를 말레이어 발음과 인도네시아어 발음에 맞게 변형한 문자이다. 현재 말레이어와 인도네시아어는 이들 문자를 사용하고 있다. 하지만 말레이어 위키백과와 인도네시아어 위키백과는 전부 라틴 문자로만 표기하고 있으며, 아직 라틴 문자↔아랍 문자 변환기는 준비되어 있지 않다.

몽골어 위키백과

편집

몽골어(蒙古語몽고어)는 몽골에서는 키릴 문자, 중국 네이멍구 자치구에서는 몽골 문자로(+세로쓰기) 쓰인다. 몽골 문자가 세로쓰기 전용 문자인데, 아직 인터넷상에서 세로쓰기 기술 구현이 확정되지 않아(단, 인터넷 익스플로러에서는 세로쓰기가 지원된다) 아직 표준적인 전산화는 이루어지지 못하고 있는 상황이다. 이런 기술적인 문제 때문에 현재 몽골어 위키백과는 키릴 문자로만 작성되고 있다. 현재 몽골 문자는 유니코드에서 지원되므로 세로쓰기 문제만 해결되면 자동변환기를 통한 지원이 가능해질 것으로 생각된다.

민난어/민둥어 위키백과

편집

민난어(閩南語민남어)와 민둥어(閩東語민동어)는 중국어의 방언으로, 표기 문자는 한자를 쓰는 방식과 로마자를 쓰는 방식으로 나뉘어진다. 현재 이들 위키백과는 로마자로 작성되고 있으며, 한자(간체자·번체자)와의 자동 변환 등의 기능은 제공되고 있지 않다.

베트남어 위키백과

편집

베트남어는 현재 로마자로 표기되고 있으나 전통적으로 한자(한·중·일·베트남 공통 한자+베트남 고유 한자 쯔놈)로 표기되어 왔다. 베트남어 위키백과는 로마자로만 표기되며 한자판은 아예 없는 상태고 따라서 자동 변환기도 없다.

위키미디어 인큐베이터에는 쯔놈판(한자판) 위키백과 시험판이 있다. 이 시험판에 참여하고 있는 사람의 말에 따르면, 한자→로마자 자동 변환기를 만드는 것이 어렵다고 한다(참고).

벨라루스어 위키백과

편집

벨라루스어는 벨라루스의 공용어이다. 벨라루스어는 키릴 문자를 기본으로 사용하지만 간혹 '라친카' 라는 로마자 표기법을 사용하기도 한다. 그러나 벨라루스어 위키백과는 현재 키릴 문자로만 표기되어 있으며, 키릴 문자↔라틴 문자 변환기는 아직 없다.

벨로루시어 위키백과

편집

부랴트어 위키백과

편집

부랴트어는 부랴트 공화국, 몽골, 중국에서 사용되는 몽골어의 방언으로, 문자는 러시아에서 키릴 문자, 몽골에서 몽골 문자, 중국에서 아랍 문자를 사용한다. 현재 부랴트어 위키백과는 러시아쪽 부랴트어를 기준으로 되어있으며, 키릴 문자로만 표기되어 있다. 아직 몽골 문자와 아랍 문자, 키릴 문자 변환기는 아직 준비되어 있지 않다.

세르보크로아티아어 계열

편집

세르보크로아티아어는 몬테네그로어, 보스니아어, 세르비아어, 크로아티아어 등을 포괄하는 명칭이다. 이 언어를 하나의 언어로 보는 입장(몬테네그로어 등은 이 언어의 방언으로 취급)과 별개의 언어로 보는 입장이 있으며, 각국의 민족주의자들은 대개 후자의 입장을 취하고 있다. 위키미디어 재단에서는 이들을 한데 아우르는 세르보크로아티아어판도 있고, 별개로 나눈 보스니아어, 세르비아어, 크로아티아어판도 있어 혼란스러운 상황이다(아직 몬테네그로어판은 없다).

다음 표는 대략적인 세르보크로아티아어 여러 언어의 방언 분포이다(출처: en:Montenegrin language).

방언 하위 방언 세르비아어 크로아티아어 보스니아어 몬테네그로어
Štokavian Torlakian x
Zeta-South Sandžak x x x
Eastern Herzgovinian x x x x
Šumadija-Vojvodina x
Western Ikavian x x
Kosovo-Resava x
Eastern Bosnian x x x
Slavonian x
Čakavian x
Kajkavian x

이보다 더 세분화한 것은 다음과 같다(출처: en:South Slavic languages). 굵은 글씨로 된 것이 광의의 세르보크로아티아어에 포함된다.

  • South Slavic languages
    • Eastern
      • 생략
    • Transitional East-West
      • 생략
    • Western
      • Central (or East-West) South Slavic diasystem or Serbo-Croatian diasystem[1]
        • Štokavian
          • istočnohercegovački in Bosnia and Herzegovina, Serbia, Montenegro and Croatia
          • zetsko-južnosandžacki in Serbia and Montenegro
          • istočnobosanski in Bosnia and Herzegovina
          • šumadijsko-vojvođanski in Serbia, Bosnia and Herzegovina and Croatia
          • smederevsko-vršački in Serbia
          • kosovsko-resavski in Serbia
          • prizrensko-južnomoravski in Serbia
          • srvljiško-zaplanjski in Serbia
          • timočko-lužnički in Serbia
          • mladi ikavski in Croatia, Serbia and Bosnia and Herzegovina
          • slavonski in Serbia, Croatia and Bosnia and Herzegovina
          • Ekavian sub-dialect
          • Ijekavian sub-dialect
          • Ikavian sub-dialect
          • Molise Croatian dialect
      • Chakavian[1] in Croatia
      • Kajkavian[1]
        • zagorsko-medimurski in Hungary and Croatia
        • krizevačko-podravski in Hungary and Croatia
        • turopoljsko-posavski in Croatia
        • prigorski in Croatia
        • donjosutlanski in Croatia
        • goranski in Croatia
      • Slovenian language[1]
  1. 몇몇 언어학자들은 Štokavian과 Chakavian을 Central South Slavic으로, Kajkavian and Slovenian을 Western South Slavic으로 분류한다. 인용 오류: 잘못된 <ref> 태그; "EW"이 다른 콘텐츠로 여러 번 정의되었습니다

보스니아어 위키백과

편집

보스니아어는 하위 방언으로 Štokavian 계열의 몇몇 방언이 존재한다. 표기 문자로는 주로 라틴 문자가 사용되고 드물게 키릴 문자도 사용된다. 현재 이들 방언 및 문자 간의 자동 변환기는 지원되지 않고 있다.

세르보크로아티아어 위키백과

편집

세르보크로아티아어는 방언(또는 하위 언어)를 앞서 말한 몬테네그로어, 보스니아어, 세르비아어, 크로아티아어 등과 같이 분류하기도 하고, Štokavian, Čakavian, Kajkavian 등(이들 방언 밑에 또 하위 방언 분류가 존재한다)과 같이 분류하기도 한다. 이 두 분류 체계를 종합하면 엄청나게 많은 형태의 방언이 산출된다. 따라서 이 모두를 모두 포괄하는 자동 변환기를 만드는 것은 어렵고, 무의미하다(굳이 방언별 자동 변환기를 만든다면 각국의 표준어만을 대상으로 삼는 것이 나을 것으로 보인다). 따라서 현재 세르보크로아티아어 위키백과에서는 이들 방언의 자동 변환기가 따로 없이 여러 방언 표기가 공존하고 있다.

또 문자는 세르비아어와 보스니아어에서 로마자와 키릴 문자가 모두 사용되고 있는데, 아직 세르보크로아티아어 위키백과에서는 문자에 대해서도 자동 변환기를 지원하지 않고 있다. 현재 이 위키백과에서는 거의 로마자로 작성되고 있고, 키릴 문자로 작성된 것은 적다.

세르비아어 위키백과

편집

크로아티아어 위키백과

편집

크로아티아어에는 하위 방언이 여러 가지가 있고, 표기 문자는 로마자뿐이다. 현재 크로아티아어에는 방언간 자동 변환기를 제공하지 않고 있다.

스코트어 위키백과

편집

스코트어는 스코틀랜드 남부와 북아일랜드 일부에서 사용되는 언어이다. 북아일랜드의 스코트어 방언(얼스터 스코트어)을 따로 떼어내 독립된 언어처럼 취급하기도 한다. 현재 스코트어 위키백과는 스코틀랜드 스코트어로 작성되는 경향이 강하며, 스코틀랜드↔얼스터간 자동 변환 등의 지원은 없는 상태이다.

훗날 얼스터 스코트어 위키백과가 따로 생길 가능성이 있다.

시비르어 위키백과

편집

러시아에서 사용되는 시비르어는 러시아어의 여러북쪽방언이 혼합되면서 만들어진 인공어이다. 어휘나 문법은 북부 러시아 방언에 영향을 받았고 포모르인들이 사용하는 러시아어 방언인 포모르어와 함께 시비르어를 형성하고 있다. 현재 시비르어 위키백과는 시비르어와 포모르어가 함께 쓰인다. 시비르어 위키백과에는 아직 시비르어↔포모르어 변환기가 없었다. 하지만 시비르어 위키백과는 결국 폐쇄되었다.

신디어 위키백과

편집

신디어는 데바나가리 문자와 아랍 문자로 표기되는 언어이다. 하지만 신디어 위키백과에선 전부 아랍 문자로 표기되어 있으며, 아직 데바나가리 문자↔아랍 문자 변환기는 준비되어 있지 않다.

아제르바이잔어 위키백과

편집

아제르바이잔어도 라틴 문자와 키릴 문자, 아랍 문자를 쓴다. 소련이 해체되면서 아제르바이잔어도 라틴 문자로 표기된다. 아제르바이잔어 위키백과에선 아랍 문자와 라틴 문자가 병기되어 있으며, 아랍 문자 버전도 밑에 있다. 하지만 아직 라틴 문자↔키릴 문자↔아랍 문자 변환기는 제공되어 있지 않다.

에스파냐어 위키백과

편집

에스파냐어는 에스파냐, 중남미, 미국, 필리핀에서 사용되는 언어이다. 에스파냐어도 지역에 따라, 그리고 방언에 따라 조금씩 차이를 보인다. 에스파냐어 위키백과도 방언별 변환기, 나라별 변환기가 준비되어 있지 않다.

영어/쉬운 영어 위키백과

편집

영어 표기법에는 크게 영국식 영어와 미국식 영어로 대별된다. 아직 영어와 쉬운 영어 위키백과에서는 두 방언 간의 자동 변환기가 없다. 미국 관련 문서에는 주로 미국식이, 영국 관련 문서에는 주로 영국식이 쓰이는 식으로 편찬되고 있다.

오세티야어 위키백과

편집

오세티야어는 그루지야와 러시아에 거주하는 오세티야인들이 사용하는 언어로 키릴 문자를 사용하고 있다. 이론 방언과 디고르 방언이 사용되고 있으며 표준어는 이론 방언을 바탕으로 해서 만들어졌다. 디고르 방언도 사용되나 아직 이론 방언↔디고르 방언 변환기를 제공하고 있지 않다.

우어 위키백과

편집

우어(吳語오어; 吴语)는 중화인민공화국 내에서만 사용되는 중국어 방언이다. 그래서 현재는 간체자만 제공하고 있고, 번체자와의 자동 변환기는 제공되고 있지 않은 실정이다.

투르크멘어 위키백과

편집

투르크멘어는 구소련에서 쓰이는 문자(라틴 문자와 키릴 문자), 구소련 밖에서 쓰이는 문자(아랍 문자)로 나뉘어져 있다. 구소련이 해체된 뒤에는 라틴 문자도 사용된다. 아직 투르크멘어는 키릴 문자↔라틴 문자↔아랍 문자 변환기를 제공하고 있지 않다.

위구르어 위키백과

편집

위구르어도 쿠르드어와 마찬가지로 아랍 문자로 쓰는 지역(신장 웨이우얼 자치구), 키릴 문자와 라틴 문자로 쓰는 지역(구 소련)으로 나뉜다. 위구르어 위키백과에선 라틴/아랍으로 혼용하고 문서는 제목은 기본적으로 아랍 문자, 그 다음 괄호쳐서 라틴과 키릴을 병기한다. 하지만 아직 카자흐어 위키백과처럼 변환기는 제공되어 있지 않다(현재는 로마자판 문서과 아랍 문자판 문서만 있고, 키릴판 문서은 아직 없다).

일본어 위키백과

편집

일본어 표기법은 현재의 신자체 한자+현대 가나 표기법 방식이 있고, 또한 과거(1945년 이전)의 구자체 한자+역사적 가나 표기법 방식이 있다. 일본어 위키백과에서는 현재 신자체 한자+현대 가나 표기법만 사용되고 있어 구자체 한자+역사적 가나 표기법 등의 자동 변환기는 없는 상태다.

체첸어 위키백과

편집

체첸어는 체첸 공화국에서 쓰이는 언어이다. 체첸어는 이전에는 아랍 문자를 사용하다가, 그 다음에는 라틴 문자, 그 다음에는 키릴 문자를 사용하게 되었다. 체첸어 위키백과는 예전에 키릴 문자로 쓰여진 문서, 라틴 문자로 쓰여진 문서를 볼 수 있었지만, 지금은 전부 키릴 문자로만 쓰여져 있다. 그리고 아직 키릴 문자↔라틴 문자 변환기는 없다.

카라칼파크어 위키백과

편집

카라칼파크어는 우즈베키스탄의 카라칼파크스탄 공화국에서 사용되는 언어로 우즈베크어와 가깝고 투르크어족에 속한다. 카라칼파크어는 공식적으론 로마자를 사용하지만, 소련 시절엔 키릴 문자를 사용했으며 간혹 키릴 문자도 사용된다. 카라칼파크어 위키백과는 로마자로만 표기되어 있고, 아직 키릴판과의 변환기는 준비되어 있지 않다.

카슈미르어 위키백과

편집

카슈미르어는 인도와 파키스탄에 속해 있는 카슈미르 지방에서 사용되는 언어이다. 문자는 데바나가리 문자와 아랍 문자를 사용한다. 카슈미르어 위키백과는 현재 문서는 아랍 문자로 쓰여진 문서, 데바나가리 문자로 쓰여진 문서를 볼 수가 있고, 아랍 문자와 데바나가리 문자가 병기되어 있다. 하지만 아직 아랍 문자, 데바나가리 문자 변환기를 준비되어 있지 않다.

크리어 위키백과

편집

크리어는 캐나다에서 사용하는 인디언 언어이다. 문자는 라틴 문자와 고유 문자를 사용한다. 현재 크리어 위키백과는 라틴 문자와 고유 문자가 혼용되어서 쓰이고 있으나, 아직 라틴 문자↔고유 문자 변환기가 없다.

크림타타르어 위키백과

편집

크림타타르어는 우크라이나어의 크림공화국에서 사용되고 있는 언어이다. 크림타타르족들이 사용하며 터키어와 사촌지간되는 언어이지만, 타타르어와는 다른 언어이다. 문자는 라틴문자를 사용했으나 소련시절엔 키릴문자를 사용하기도 했다. 해체이후엔 공식적으로 라틴 문자로 바꿨으나 인터넷상에선 키릴 문자로 표기된 사이트도 존재하며 간혹 키릴 문자도 사용한다. 크림 타타르어 위키백과도 개설되었으나, 아직 라틴 문자↔키릴 문자 변환기가 없다.

클링온 위키백과

편집

클링온은 TV 시리즈 스타트렉(en:Star Trek)에서 나오는 외계 언어이다. 스타트렉에서는 KLI pIqaD, Skybox pIqaD, Mandel script과 같은 외계 문자가 사용되나 현실 세계에서는 로마자로 표기된다. 클링온 위키백과는 로마자로만 표기되었으며 고유 외계 문자는 지원되지 않았다.

현재 클링곤 위키백과는 사실상 폐쇄되어 위키아로 이동했다. 역시 로마자로만 표기되고 있으며, 고유 외계 문자는 지원되고 있지 않고 있다. 다음은 위키아에 있는 클링온 백과사전의 링크이다.

키르기스어 위키백과

편집

키르기스어도 위구르어와 마찬가지로 문자는 아랍 문자(중국, 파키스탄, 아프가니스탄), 키릴 문자(구 소련)를 사용한다. 이들 문자는 키르기스어를 표기하는데 사용되지만, 현재 키르기스어 위키백과에선 키릴 문자로만 표기되며, 아직 키릴 문자↔아랍 문자 변환기는 준비되어 있지 않다.

타타르어 위키백과

편집

타타르어는 러시아 연방 타타르 공화국의 공용어이다. 타타르어는 원래 아랍 문자로 표기되었으나, 소련 시절부터 키릴 문자를 사용하게 된 언어였다. 하지만 중국쪽에 거주하는 타타르족들은 아직도 아랍 문자를 사용하고 있다. 소련이 해체되면서 타타르어는 라틴 문자도 사용하게 되었다. 현재 타타르어 위키백과는 키릴 문자대신 라틴 문자로 표기되어 있으나, 아직 키릴 문자↔라틴 문자↔아랍 문자 변환기는 준비되어 있지 않다(현재 대부분의 문서가 키릴 문자로 표기되었으며, 최근에는 키릴표기화되어가고 있다).

터키어 위키백과

편집

터키어는 현재 로마자로 적고 있으나 과거에는 아랍 문자로 표기하였다. 따라서 현재 터키어 위키백과는 로마자로만 편찬되고 있으며 아랍 문자판과의 자동 변환기는 필요성이 없기 때문에 제공되고 있지 않다.

과거 아랍 문자로 적던 터키어는 ‘오스만 터키어(Ottoman Turkish)’라는 문어(文語) 형태로 존재하였다. 현대 터키어가 새로 규정되면서 오스만 투르크어는 소멸되었다. 현재 인큐베이터에 오스만 터키어 테스트 위키백과가 있다.

팔리어 위키백과

편집

팔리어는 인도와 동남아시아에서 사용되는 언어로 인도아리아어계에 속한다. 주로 스님들이 사용하는 언어로 데바나가리 문자를 주로 사용한다. 하지만 아직 표준문자가 정해져있지않았으며, 다양한 표기가 존재한다. 학술적인 경우엔 로마자가 주로 사용된다. 팔리어 위키백과는 데바나가리 문자판만 존재하며 아직 로마자와 다른 문자와의 변환기는 준비되어 있지 않다.

펀자브어 위키백과

편집

펀자브어는 인도와 파키스탄에서 사용되는 언어이다. 문자는 아랍 문자와 데바나가리 문자를 사용한다. 현재 펀자브어 위키백과는 데바나가리 문자로만 표기되며, 아직 아랍 문자와 데바나가리 문자 변환기는 준비되어 있지 않다.

최근에는 펀자브어를 아랍 문자로 표기한 위키백과가 신설되었다.

포르투갈어 위키백과

편집

포르투갈어는 에스파냐어, 프랑스어, 이탈리아어와 사촌지간되는 언어로, 포르투갈, 브라질, 마카오, 인도, 동티모르에서 사용된다. 포르투갈어 위키백과는 아직 나라별 변환기가 준비되어 있지 않다.

최근에는 인큐베이터에 브라질식 포르투갈어 테스트 위키가 나타났다.

폰토스 그리스어 위키백과

편집

폰토스 그리스어는 그리스어의 일종으로 그리스 문자를 쓰나 터키쪽은 로마자, 러시아쪽은 키릴 문자를 사용하고 있다. 폰토스 그리스어 위키백과에는 그리스 문자로만 표기되고 있으며, 아직 그리스 문자↔로마자 표기↔키릴 표기 변환기는 준비되어 있지 않다.

프랑스어 위키백과

편집

프랑스어는 프랑스, 스위스, 벨기에, 캐나다, 미국 루이지애나 주, 서인도제도의 프랑스령 지역, 프랑스령 기아나, 프랑스령 태평양 연안 섬들, 인도차이나 3개국, 프랑스령 아프리카 지역과 예전에 프랑스의 지배를 받았던 지역에서 사용되는 언어이다. 현재 프랑스어 위키백과는 아직 이들 방언별, 나라별 변환기가 준비되어 있지 않다.

하우사어 위키백과

편집

하우사어는 아랍 문자와 로마자를 사용하는 언어이다. 현재 하우사어 위키백과는 아랍 문자가 아니라 전부 라틴 문자로 표기하고 있으며, 라틴 문자↔아랍 문자 변환기는 아직 없다.

하카어 위키백과

편집

하카어(客家語객가어)는 중국어의 방언으로, 표기 문자는 한자를 쓰는 방식과 로마자를 쓰는 방식으로 나뉘어진다. 현재 하카어 위키백과는 한 문서 안에 로마자와 한자(간체자)와 함께 작성하는 방식으로 편찬되고 있다.

한국어 위키백과

편집

한국어는 표기 방식에 따라 크게 한글 전용과 한글+한자 혼용 방식으로 나뉘고, 언어 규범에 따라 남한의 표준어, 북조선의 문화어, 중화인민공화국 옌볜(延邊연변) 말 등으로 나뉜다. 아직 한국어 위키백과는 이들 표기법, 규범에 따른 방언을 자동 변환기로 변환하는 것을 지원하고 있지 않다. 문자는 한글 전용으로 통일하였고(한자는 필요한 경우 괄호 안에 병기), 규범은 남한 표준어 위주로 되어 있다(북조선 관련 문서에서는 북조선 문화어도 참작하여 작성함).

한국어 위키백과 커뮤니티에서는 남한 표준어↔북조선 문화어↔한자 혼용판 등을 자동 변환기로 처리하는 방법을 도입할 것을 주장하는 모임이 생기기도 하였다. 그러나 기술적인 문제 등이 있어 이 계획은 보류되었고 한자 혼용판의 경우 아예 별도의 위키백과를 만드는 쪽으로 모임의 입장을 바꾸었다.

현재 인큐베이터에는 한자 혼용판 위키백과가 시험 중이다.

한문 위키백과

편집

한문은 동아시아에서 전역에서 전통적으로 쓰인 문어이다. 현재 한국·중국·일본 등 국가마다 구두점 다는 방법이 조금씩 다르며, 근·현대 들어 쓰이는 용어에 있어서는 大統領대통령(한국·일본)과 總統총통(중국)과 같이 차이를 많이 보이고 있다. 현재 한문판 위키백과는 중국의 표점(標點)과 중국어의 용어가 사용되고 있으며, 한·일어와의 자동 변환은 준비되어 있지 않다.

인큐베이터에서 준비 중인 위키백과

편집

아직 정식 출범하지 않았으나, 인큐베이터에서 테스트 중인 위키백과들도 정리해 본다.

꿰냐 위키백과

편집

꿰냐(Quenya)는 톨킨이 만들어낸 인공어이다. 톨킨이 만들어낸 문자인 텡과르, 사라티, 키르스 문자로 표기할 수 있고, 라틴 문자로도 표기할 수 있다. 인큐베이터에서는 전산화 문제로 라틴 문자로만 작성되고 있다.

만주어 위키백과

편집

본래 만주어는 몽골 문자를 사용하기 때문에 세로쓰기로 써야 한다. 아직 인터넷 환경에서는 세로쓰기를 완벽하게 지원하지 못하고 있기 때문에, 로마자로 대체해서 표기하기도 한다. 만주어 위키백과는 일단 몽골 문자의 지원은 포기하고 로마자로 표기하는 것을 준비 중이다.

메글레노루마니아어 위키백과

편집

메글레노루마니아어는 발칸 반도에서 사용되고 있는 로망스계열의 언어이다. 문자는 로마자, 키릴 문자, 그리스 문자를 사용하고 있지만, 테스트위키에선 아직 키릴판으로만 표기되어 있고, 로마자판, 그리스 문자판은 준비되어 있지 않다.

베트남어 쯔놈(한자) 위키백과

편집

보트어 위키백과

편집

보트어(바트어라고도 함)는 카렐리야어와 마찬가지로 러시아에서 사용되는 언어이다. 현재 보트어 사용자의 수는 많지 않으며 사멸위기에 놓여 있다. 문자는 사용자에 따라 로마자, 키릴을 사용하지만 테스트 위키백과에선 로마자로만 표기되어 있다.

오스만 터키어 위키백과

편집

오키나와어 위키백과

편집

오키나와어(沖繩語; ʔucināguci; うちなーぐち; 沖縄口) 등 류큐어(琉球語유구어)는 규범적인 표기법이 확립되어 있지 않은 상태이다. 흔히 사용되는 방식은 일본어와 같이 한자와 가나를 혼용하는 것이며, 학술적으로는 RPA(Ryūkyū Phonetic Alphabet) 같이 라틴 문자를 사용하는 방식도 있다. 가나를 표기하는 방식은 다양한 안(案)이 있는데, 그 중에는 기존 문자 외에 새로운 가나 문자를 추가하는 것도 있다(참고: en:Okinawan writing system).

처음 인큐베이터에서는 RPA만을 썼다. 최근에는 언어 범위를 류큐어에서 오키나와어로 공식적으로 축소함과 동시에 히라가나 전용의 표기도 쓰기 시작했다.

일본어 고문/문어 위키백과

편집

일본어의 고전 문어(文語)에는 화문체(和文體(와분타이)), 보통문(普通文(후쓰분)), 소로분(候文) 등의 형태가 있다. 한때 고문 인큐베이터에서는 세 가지 문체를 따로 문서를 만드는 방법을 사용하였다(세 문체 간에 자동 변환기를 만들 수 없다면 아예 이들을 완전히 개별적인 위키백과로 분리하는 것도 검토해 볼 필요가 있다고 생각된다).

최근에는 고문판에서는 헤이안시대의 화문체를 위주로, 문어판에서는 현재 일본에 정착되어 있는 화문체를 위주로 하는 것으로 고정이 된 듯하다.

고문판은 직접 옛 언어를 재현하는 것이므로 한자체를 구자체로 하는 것으로 잠정되었다. 문어판은 현대에도 종종 사용되는 언어이므로 현대 일본의 한자체인 신자체로 작성하는 것을 원칙으로 하되, 구자체(정자체)로 변환하는 스크립트를 소개하고 있다.

카렐리야어 위키백과

편집

카렐리야어(카리알라어라고도 불림)는 러시아의 카릴리야 공화국의 공용어이자 핀란드에 살고 있는 카렐리야인들이 사용하는 언어이다. 카렐리야어는 현재 로마자로 표기되지만, 소련시절엔 키릴문자를 사용하기도 했다. 공식적으로 로마자로 표기되고 있으며, 현재 로마자로만 표기되어 있고 아직 키릴판과의 변환은 준비되어 있지않다.

탈리시어 위키백과

편집

탈리시어는 이란과 아제르바이잔에 거주하는 탈리시인들이 사용하는 언어로, 페르시아어와 가까운 언어이다. 탈리시어는 이란에서 아랍 문자, 아제르바이잔에선 키릴과 로마자를 사용하고 있어서 3가지 문자로 표기되어 있다. 테스트 위키백과에선 예전엔 아랍 문자로만 표기되어 있다가, 키릴 표기화되어서 키릴 문서로 된 것들이 많이 존재한다. 아직 키릴판과 아랍 문자판과 로마자판과의 변환은 준비되어 있지 않다.

한국어 한자 혼용 위키백과

편집

기타

편집

아직 위키백과도 정식 출범하지 않았고, 인큐베이터에도 없으나, 도입이 논의된 바 있는 언어판 위키백과 또는 위키미디어 재단 외에서 운영 중인 언어판에 대해서도 정리해 본다.

링구아프랑카노바 위키위키

편집

링구아프랑카노바(LFN)는 생긴지 얼마 되지 않은 인공어·국제보조어이다. 그래서인지 이 언어의 사용자들은 현재 위키미디어 재단 소속의 위키백과가 아닌 별도의 위키 백과사전을 운영 중이다.

LFN은 사용 문자로 로마자와 키릴 문자 두 가지가 사용된다. 그런데 LFN 위키에서는 로마자 위주로 문서가 작성되고 있고, 간혹 키릴 문자로도 작성되고 있다. 자동 변환기는 없는 상태이다.

아이누어 위키백과

편집

아이누어는 류큐어처럼 확립된 표기 규범은 없는 상태이나 몇 가지 표기 방식이 사용되고 있다. 가타카나를 변형해서 쓰는 방식, 로마자로 표기하는 방식 등이 현재 사용되고 있다.

일본어 위키백과에서는 아이누어 위키백과를 만들 경우 어떤 문자를 사용할 것인가 심도있게 논의가 이루어진 바 있다(아래 링크 참고). 표음 문자로는 가타카나, 로마자, 국제 음성 기호(IPA), 한글 등이 거론되었고, 더불어 한자를 혼용해 쓰는 방식에 관해서도 언급이 되었다. 따라서 아이누어 위키백과는 중국어·세르비아어·카자흐어 위키백과처럼 자동 변환기를 사용하여 여러 문자를 지원하는 방식이 도입될 가능성도 있어 보인다.

제주어 위키백과

편집

제주 방언 표기에는 ㆍ(아래아) 등 옛한글이 사용되고 있다. 옛한글을 컴퓨터로 구현하는 코드는 유니코드 표준인 '첫가끝'과 한양 PUA 두 가지가 있다. 현재 메타에서는 제주어 위키백과를 첫가끝과 한양 PUA 간에 자동 변환을 하는 방식으로 만드는 것이 제안되어 있다. 자세한 것은 m:User:Yes0song/제주어 위키백과를 참고.