2021. 8. 16. 15:39ㆍBayesian
이번 글에서는 연속형 잠재 변수를 활용하는 가장 기본적인 모델에 해당하는 확률적 주성분 분석ProbabilisticPCA에 대해 알아보겠습니다.
[관련 글]
2021.08.16 - [Machine Learning/models] - [models] 주성분 분석PrincipalComponentAnalysis
주성분 분석은 원래 데이터 차원보다 더 낮은 차원으로 선형 사영linearprojection 시키는 방법을 말합니다.
주성분 분석의 고유 벡터와 고윳값은 라그랑주 승수법을 통해 구할 수 있습니다.
확률적 주성분 분석에서는 연속형 잠재 변수의 선형 결합을 통해 관찰된 변수를 나타냅니다. 이렇게 나타내게 되면, 기존의 확률론적 방법으로 통합될 수 있기 때문에 여러 이점MLE,EM알고리즘을통해해를구할수있음,베이지안방법으로확장가능이 있습니다.
관찰된 변수 x를 잠재 변수 z를 통해 다음과 같이 표현할 수 있습니다.
x=Wz+μ+ϵ, where ϵ∼N(0,σ2), p(z)=N(z|0,I), … (1)p(x|z)=N(x|Wz+μ, σ2I)
관찰된 변수 x의 주변 분포와 그 분포를 통해 도출한 평균과 공분산은 다음과 같습니다.
p(x)=∫p(x|z)p(z)E[x]=E[Wz+μ+ϵ]=μcov[x]=E[(Wz+ϵ)(Wz+ϵ)T]=E[WzzTWT]+E[ϵϵT]=WWT+σ2I
그리고 MLE 방법을 통해 우리가 원하는 행렬 W의 해를 구하면 다음과 같습니다.
WML=UM(LM−σ2I)1/2R
여기서 UM행렬은 데이터의 공분산S으로부터 추출된 고유 벡터 행렬을 의미하고, LM은 고윳값으로부터 만들어진 고유값 행렬을 의미합니다.
즉, (1)식의 가중치 행렬 W의 해는 고유 벡터 행렬과 고윳값을 이용해 만들어진 행렬의 곱으로 분해될 수 있다는 것을 의미합니다.
추가적으로 확률 주성분 분석을 확률 그래프 모델로 나타내면 다음과 같습니다.

[출처] BISHOP, Christopher M., et al. Neural networks for pattern recognition. Oxford university press, 1995.
'Bayesian' 카테고리의 다른 글
선형역학계LinearDynamicalSystems 0 | 2021.08.17 |
---|---|
베이지안 주성분 분석BayesianPCA 0 | 2021.08.16 |
7. 기댓값 전파ExpectationPropagation 0 | 2021.08.05 |
6-1. 평균 장 근사Mean−fieldapproximation 0 | 2021.08.03 |
6. 변분 베이즈 방법VariationalBayesMethod 0 | 2021.08.03 |