음성 합성: 두 판 사이의 차이

내용 삭제됨 내용 추가됨
파닭봇 (토론 | 기여)
잔글 bad link repair, replaced: 애플애플 using AWB
10번째 줄:
== 활용 사례 ==
음성 합성 기술은 문자를 읽기 어려운 장애인이나 문자를 읽을 수 없는 사람(아이, 외국인 등)에게 화면 읽기 소프트웨어(스크린 리더)로서 오랫동안 쓰이고 있어 말을 발표하는 것이 곤란한 사람이 대체 수단으로서 이용하는 경우도 많다.
사람이 말을 녹음하면 대사가 바뀔때마다 그 부분을 다시 녹음해야 하지만 음성 합성 기술만 있으면 데이터를 작성만 하면 다시 녹음할 필요가 없다. 이 기술을 활용하는 분야는 장애인 웹접근성 분야인 스크린리더 기술이 있다. 스크린리더 기술은 Jaws와 같은 PC형 스크린리더와 [http://www.voicemon.com 보이스몬], [http://www.webtalks.co.kr 웹톡스] 와 같은 웹스크린리더 방식의 두가지가 있으며, PC형 스크린리더는 전맹시각장애인이 주로 사용하며, 웹스크린리더는 저시력시각장애인과 난독증과 같은 학습장애, 인지장애인과 노인, 다문화가족 등의 웹접근성을 지원하기위해 사용된다. 또한 최근에 애플의 보이스오버라는 기술은 아이폰과 같은 모바일기기형 스크린리더가 다수 사용되고 있다. 이와 같은 기술로는 [[AH-Software|AHS]]사의 VOICEROID가 있다.
또한 이를 이용하여 [[VOCALOID]]라는 음성 합성 기술을 이용한 음악 소프트웨어도 있는데, 인공적으로 인간의 목소리를 내어 노래를 불러주는 소프트웨어이다. 이와 흡사한 소프트웨어로 [[보카리나]]가 있다.
 
23번째 줄:
 
=== 운영 체제에서의 음성 합성 ===
* 애플 운영체제 - 1984년에는 [[애플 (기업)|애플]] 컴퓨터에 매킨토크(MacInTalk) 기능을 탑재했다. 이후에도 새로운 OS 버전이 나오면서 음질이 개선되고있다. 또한 [[음성 인식]]도 도입하고 있으며, 시각 장애인을 위한 지원 프로그램이었던 플레인토크(PlainTalk)의 기능을 통합했다. [[Mac OS X]] v10.4 이상에는 보이스오버(VoiceOver)라는 음성 합성 기능이 제공되고있다.
* 마이크로소프트 윈도 - [[마이크로소프트 윈도|윈도]]에서는 SAPI라고 하는 오디오 관련 API를 제공하고있다. [[윈도 XP]]에서는 내레이터(Narrator)라는 음성 합성 프로그램이 추가되었다(영어). 콜 센터 등의 사용자에게 음성 인식과 음성 합성 패키지로 마이크로소프트 스피치 서버(Microsoft Speech Server)를 제공하고 있다.
 
31번째 줄:
=== 인터넷에서의 음성 합성 ===
* 음성 합성 마크업 언어 - 텍스트 음성 변환을 위한 XML 기반의 마크업 언어가 몇 가지있다. 최근 SSML가 W3C 에서 제안되어 초안 상태이다. 이외에도 SABLE, JSML 등이 있다. Cascading Style Sheets 2의 이전 버전인 Aural Cascading Style Sheets을 포함한다. 음성 합성 마크업 언어인 VoiceXML은 같은 대화 마크업 언어와는 다르다. 대화 마크업 언어는 텍스트 음성 변환뿐만 아니라, 음성 인식 등도 지원하고 있다.
최근 해외에선 구글 TTS, 대한민국에선 [http://www.voicemon.com [[보이스몬]]], [[http://www.webtalks.co.kr 웹톡스]] 와 같이 별도의 플러그인 소프트웨어 없이 특정 자바스크립트 삽입 만으로 인터넷을 통해 원격에서 음성지원이 되는 웹스크린리더 기술이 보편적인 저시력시각장애인과 난독증과 같은 학습장애, 인지장애인과 노인, 다문화가족 등의 웹접근성을 지원하기위해 사용되고 있다.
 
== 참고 자료 ==