사용자:Frf1226/연습장: 두 판 사이의 차이

내용 삭제됨 내용 추가됨
Pizzing2 (토론 | 기여)
Pizzing2 (토론 | 기여)
13번째 줄:
예를 들어, <math>x=(a, b, c), y=(x, y, z),</math><br> <math>x, y</math> 시퀀스에 대하여서는 제약이 없다.
|}
즉 예를 들면, 조건부 무작위장은 문자 a, b, c 가 연속적으로 나타났을 때, 문자 x, y, z 를 연속적으로 부여할(나타날) 확률을 의미한다고 할 수 있다. 여기서 y는 [[마르코프 성질]]을 만족하여야 한다. 그런데 만약 x의 집합과 y의 집합이 한정되어 있다면, 이 구조는 그래프 구조를 형성하게 된다. 일반적으로는 체인({{llang|en|chain}}) 그래프 구조를 형성한다고 한다.
그런데, 어떤 [[무작위장]]과도 양립할 수 없는({{llang|en|not compatible}}) 완벽한({{llang|en|consistent}}) [[조건부 확률]]({{llang|en|conditional probability}}) 체제가 있다고 한다<ref>Hamilton, M., and W. J. Anderson. "A consistent system of conditional probabilities which is not compatible with any random field." Canadian Journal of Statistics 6.1 (1978): 95-101.</ref>. 따라서 [[조건부 확률]]을 사용하여 조건부 무작위장을 표현할 수는 없는 것이다.<ref>이호석. "조건부 랜덤 필드와 응용에 대한 고찰." 한국정보과학회 학술발표논문집 36.2C (2009): 184-187.</ref><br><br>
조건부 무작위장 <math>(Y, X)</math>는 방향이 없는({{llang|en|undirected}}) 그래프 <math>G=(V, E)</math> 혹은 [[마르코프 무작위장]]으로 간주할 수 있다. 만약, 입력 시퀀스에서 조건부 독립을 가정할 수 있다면, 이론적으로 그래프의 구조는 여러 가지 형태를 나타낼 수 있다. 하지만 응용에서는 일반적으로 <math>Y</math>에 해당되는 노드는 간단한 체인({{llang|en|chain}})의 형태를 나타내는 경우가 많다<ref>Lafferty, John, Andrew McCallum, and Fernando CN Pereira. "Conditional random fields: Probabilistic models for segmenting and labeling sequence data." (2001).</ref>. 조건부 무작위장은 [[은닉 마르코프 모델]](HMM, Hidden Markov Model)에 비하여 변수 독립성 조건이 필요 없는 장점이 있다고 한다. 또한 조건부 무작위장은 [[최대 엔트로피 마코르프 모델]](MEMM, Maximum Entropy Markov Model)에 비하여 변수 치우침(bias)이 없는 장점이 있다고 한다<ref>Lafferty, John, Andrew McCallum, and Fernando CN Pereira. "Conditional random fields: Probabilistic models for segmenting and labeling sequence data." (2001).</ref>. 다음은 조건부 무작위장의 정의이다<ref>Lafferty, John, Andrew McCallum, and Fernando CN Pereira. "Conditional random fields: Probabilistic models for segmenting and labeling sequence data." (2001).</ref>.<ref>이호석. "조건부 랜덤 필드와 응용에 대한 고찰." 한국정보과학회 학술발표논문집 36.2C (2009): 184-187.</ref>
<br>
{| align="center" cellpadding ="20" cellspacing="0" border="1"
22번째 줄:
|}
<br>
* <math>Y</math>의 그래프 <math>G=(V,E)</math>가 트리를트리({{llang|en|tree}})를 형성한다면, <math>Y</math>의 클리크({{llang|en|clique}})는 에지와 버텍스가 된다. 따라서 시퀀스 <math>X</math>가 입력되었을 때, 시퀀스 <math>Y</math>에 대한 조인트 확률 분포는 다음과 같이 표현된다.
<br>
{| align="center" cellpadding ="20" cellspacing="0" border="1"
29번째 줄:
|}<br>
여기서 <math>x</math>는 입력 시퀀스이고, <math>y</math>는 출력 레이블 시퀀스이다. <math>y|_s</math>는 <math>y</math> 요소의 집합으로서 그래프 <math>G</math>의 서브그래프 <math>S</math>의 버텍스와 관계된다. <math>f_k</math>와 <math>g_k</math>는 주어져 있고 고정되어 있다고 가정한다.
위 수식을 다르게 해석할 수 있다. 수식에서 앞에 위치한 항목은 그래프에서 입력 시퀀스에 의하여 현재의 버텍스에서 다음 버텍스로 이동하는 천이 특징 함수({{llang|en|transition feature function}})로 간주할 수 있고, 뒤 항목은 현재의 버텍스의 상태 특징 함수({{llang|en|state feature function}})로 간주할 수 있다. 즉, 위 식은 입력되는 시퀀스의 요소들에 의하여 현재의 버텍스에 그대로 존재하는 경우를 나타내기도 하고, 또는 다음 버텍스로 이동하는 것을 나타내기도 한다. 전체적으로는 입력되는 시퀀스에 의하여 그래프의 버텍스 상에서 움직이는 상태와 이와 관련된 확률을 나타낸다.
<br>
* <math>Y</math>가 체인({{llang|en|chain}})을 구성하고 있다고 가정하면, 조건부 무작위장 확률을 다음과 같이 표현할 수도 있다.
{| align="center" cellpadding ="20" cellspacing="0" border="1"
|