연어 (언어학): 두 판 사이의 차이

내용 삭제됨 내용 추가됨
새 문서: '''연어'''(連語, collocation)는 동일한 맥락에서 일반적인 경우보다 높은 빈도로 나타나는 어휘의 연쇄이다. 가령 한국어 화자는 ‘감을...
 
잔글 글 다듬음, 항목 추가
1번째 줄:
'''연어'''(連語, collocation)는 동일한 맥락에서 일반적인 경우보다 높은 빈도로 나타나는 어휘의 연쇄이다쌍이다. 가령 [[한국어]] 화자는 ‘감을 붙잡다’보다는 ‘감을 잡다’를 자주자연스럽게 사용하며여기며, [[영어]] 화자는 ‘strong computer’보다는 ‘powerful computer’를 선호한다.
 
공기(共起)하는 모든 어휘가 연어가 되는 것은 아니며, 두 어휘의 공기 빈도가 통계적인 기대 빈도보다 높은 경우에 연어가 된다. 그러나 ‘미역국을 먹다’처럼 문자 그대로의 의미로 쓰이지 않고 수사적 의미를 강하게 갖는 경우에는 연어라고 하지 않고 [[관용구]]라고 한다. 즉 연어는 일반적인 공기어와 관용구의 사이에 있다.
6번째 줄:
 
== 연어 추출 공식 ==
통계학적으로 유의미한 연어를 추출하기 위해서는 [[T-test]], [[상호의존정보]](MI score), [[가능도|로그 가능도]] 등이 주로 사용된다. 그 중 어휘 A와 어휘 B가 연이어 있을 때 이것이 연어인지 판정하는 T-test의 공식은 다음과 같다.
 
<math>t = \frac{w_{AB} - \frac{w_Aw_B}{N}}{\sqrt{w_{AB}}}</math>
17번째 줄:
== 같이 보기 ==
* [[관용구]](숙어)
* [[존 루퍼트 퍼스]]
* [[사전 편찬]]