형태 분석: 두 판 사이의 차이

내용 삭제됨 내용 추가됨
잔글 새 문서: {{언어학}} '''형태 분석'''(形態分析)은 단어를 보고 형태소 단위로 분리해내는 과정을 말한다. 수작업으로 하기도 했으나 컴퓨터의 발달...
 
잔글 수 밖에→수밖에
68번째 줄:
한국어 형태분석은 지속적으로 발전했지만 아직 넘어야 할 산들이 상당수 존재한다. 가장 큰 것은 웹에서의 언어파괴 현상으로 수많은 축약형과 의미조차 명시적으로 파악되지 않는 여러 명사/동사들의 존재 그 자체이다. 어떤 경우인지 알 수 조차 없는 상태에서 통용되는 무의미한 말들도 상당히 존재하며 심지어 '~삼'처럼 이것이 의문형인지, 청유형인지 구분하기도 어려운 어미까지 생겨난 형편이다. 이것은 복수 표준이 허용될 뿐만 아니라 의존명사나 복합명사 등에서 일관성없이 사용되는 띄어쓰기 문제의 더욱 심화된 형태로도 볼 수 있다.
 
또 여전히 중의성 문제는 난제로 남아있다. 아무리 사전으로 해결한다 하더라도 해결할 수 없는 중의성 문제가 존재할 뿐 아니라 수많은 이형태를 어떻게 처리할 것인가 또한 난제이다. 예를 들어 '가난 구제는 나라[나라님/임금]도 못한다[어렵다]'는 속담의 경우 사전 표제어 상에서도 6가지의 이형태가 가능하다. 게다가 문장 형식이므로 활용이 가능한데 그렇게 되면 경우의 수는 훨씬 늘어날 수 밖에수밖에 없다. 이런 것들을 어떻게 하나의 단위로 잘 묶어서 형태 분석을 해줄 것인가는 간단하지 않은 문제이다.
 
== 주석 ==