[Bayesian Network] 2-1. D-separation

2021. 7. 27. 11:46Preliminary/Probability

728x90

이번 글에서는 확률 그래프 모델에서 확률변수들 간의 독립, 종속 관계를 알아볼 수 있는 D-separation 성질에 대해 알아보겠습니다.

[관련 글] [Bayesian Network] 2. 조건부 독립(Conditional Independence)


결합 확률분포를 통해 확률변수들 간의 독립, 종속에 대해 파악하기 위해서는 어떤 변수를 주변화(marginalize)하여 알아볼 수 있습니다. 하지만, 복잡한 결합 확률분포의 경우, 여러 변수들 간의 종속관계를 파악하기 어려울 수 있습니다.

방향성을 가진 그래프의 경우, 각 노드에서의 관계를 파악하여, 우리가 관심 있는 노드들이 조건부 독립인지 판단할 수 있습니다. 각 노드들이 다음과 같은 관계를 가지면 D-separated이라고 말합니다.

(1) $A$, $B$ 경로의 화살표가 head-to-tail 또는 tail-to-tail이고, 사이의 노드 중 일부가 $C$노드 집합에 있을 경우

(2) $A$, $B$ 경로의 화살표가 head-to-head이고 사이의 노드 중 일부가 $C$노드 집합에 없을 경우

여기서 $A$, $B$ 노드 집합은 우리가 관심 있는 노드들의 집합이고, $C$노드 집합은 관찰된 변수의 집합을 말합니다. 그리고 사이의 노드라는 것은 자식(descendant) 노드를 말합니다.

다음 예시를 통해 D-separated에 대해 알아보겠습니다.


$(a)$그림을 보겠습니다.

$a$에서 $b$로의 경로는 노드 $f$에 의해 차단되지 않습니다. 그 이유는 $f$노드는 tail-to-tail이고, 관찰되지 않았기 때문($C$노드 집합에 없음)입니다.

$a$에서 $b$로의 경로는 노드 $e$에 의해 차단되지 않습니다. 그 이유는 $e$노드는 head-to-head이고 관찰되지 않았지만, $c$가 관찰되었기 때문($C$노드 집합에 있음)에 독립이 성립하지 않습니다.

따라서, $a \not \! \perp \!\!\! \perp b~|~c$입니다.

$(b)$그림을 보겠습니다.

$a$에서 $b$로의 경로는 노드 $f$에 의해 차단됩니다. 그 이유는 $f$노드는 tail-to-tail이고, 관찰되었기 때문입니다.

$a$에서 $b$로의 경로는 노드 $e$에 의해 차단됩니다. 그 이유는 $e$노드는 head-to-head이고 관찰되지 않았고, $e$의 자식 노드인 $c$노드도 관찰되지 않았기 때문입니다.

따라서, $a \perp \!\!\! \perp b~|~c$입니다.