통계적 기계 번역

(통계 기계 번역에서 넘어옴)

통계적 기계 번역(Statistical machine translation, SMT)은 기계 번역 패러다임의 하나로서, 파라미터들이 2개 언어 말뭉치의 분석에서 비롯된 통계 모델에 기초하여 번역이 생성된다. 이러한 통계적 접근은 예시 기반 기계 번역이라든지 규칙 기반 접근과는 대조된다.[1]

통계적 기계 번역의 최초 개념은 1949년 워런 위버에 의해 도입되었으며[2] 여기에는 클로드 섀넌정보이론을 적용하는 개념이 포함되어 있다. 통계적 기계 번역은 IBM토머스 J. 왓슨 연구소에 의해 1980년대 말과 1990년대 초에 다시 도입되었으며[3][4][5] 근래 수년에 걸쳐 기계 번역이 다시 유행하게 하는 데 일조하였다. 신경망 기계 번역이 도입되기 전 이 개념은 이제까지 가장 널리 연구된 기계 번역 방식이었다.

각주 편집

  1. Philipp Koehn (2009). 《Statistical Machine Translation》. Cambridge University Press. 27쪽. ISBN 978-0521874151. 2015년 3월 22일에 확인함. Statistical machine translation is related to other data-driven methods in machine translation, such as the earlier work on example-based machine translation. Contrast this to systems that are based on hand-crafted rules. 
  2. W. Weaver (1955). Translation (1949). In: Machine Translation of Languages, MIT Press, Cambridge, MA.
  3. P. Brown; John Cocke, S. Della Pietra, V. Della Pietra, Frederick Jelinek, Robert L. Mercer, P. Roossin (1988). “A statistical approach to language translation”. 《Coling'88》 (Association for Computational Linguistics) 1: 71–76. 2015년 3월 22일에 확인함. 
  4. P. Brown; John Cocke, S. Della Pietra, V. Della Pietra, Frederick Jelinek, John D. Lafferty, Robert L. Mercer, P. Roossin (1990). “A statistical approach to machine translation”. 《Computational Linguistics》 (MIT Press) 16 (2): 79–85. 2015년 3월 22일에 확인함. 
  5. P. Brown; S. Della Pietra, V. Della Pietra, and R. Mercer (1993). “The mathematics of statistical machine translation: parameter estimation.”. 《Computational Linguistics》 (MIT Press) 19 (2): 263–311. 2015년 3월 22일에 확인함. 

외부 링크 편집