Loading [MathJax]/jax/output/CommonHTML/jax.js

[models] 가우시안 혼합모델GaussianMixture

2021. 7. 27. 22:48Machine Learning/Models

이번 글에서는 하나의 확률분포를 선형결합시켜 더 복잡한 형태를 만들 수 있는 혼합모델에 대해 알아보겠습니다. 

이번 글에서는 여러 혼합모델 중 가장 널리 쓰이는 가우시안 혼합모델에 대해 알아 볼 것 이므로, 이전 글[Probability] 8. 정규분포와 중심극한정리NormaldistributionandCentrallimittheorem 을 읽고 오시면 도움이 될 것 입니다.


Single Gaussian model

가우시안 분포는 수학적으로 좋은 특징이 많지만, 두 개로 나뉘어진 데이터를 정확하게 적합하지 못하는 문제가 있습니다. 만약 이 가우시안 분포를 선형결합superposition시킨다면, 더 복잡한 모양의 분포를 나타낼 수 있을 것 입니다. 

Gaussian Mixture model

위 그림은 세 개의 가우시안분포를 선형결합시킨 가우시안 혼합모델Gaussianmixturemodel입니다. 하나의 가우시안 분포를 사용하는 것 보다 훨씬 복잡한 경계를 만들어 낼 수 있습니다. 여러 개의 가우시안 분포를 선형결합하여 만든 가우시안 혼합모델은 다음과 같습니다. 

p(x)=Kk=1πkN(x|μk, Σk)

여기서 πk는 mixing coefficients로 각각의 가우시안 분포의 섞일 비중을 결정합니다.

단일 가우시안 분포를 적합 시킬 때, 로그 우도를 쓰게 되는데, 가우시안 혼합 모델에서의 로그 우도는 다음과 같습니다.

lnp(X|π, μ, Σ)=Nn=1ln{Kk=1πkN(xn|μk, Σk)}

가우시안 혼합모델의 로그 우도는 로그의 괄호 안에 식이 있기 때문에, 이 로그 우도를 닫힌 형식closedform으로 미분하는 것이 어렵습니다. 따라서, 가우시안 혼합모델은 최대우도추정법MLE으로 적합시킬 수 없고, 다른 방법으로 적합시켜야 합니다.