2021. 7. 19. 17:40ㆍBayesian
이번 글에서는 MCMCMarkovChainMonteCarlo의 알고리즘의 수렴 진단에 대해 알아보겠습니다.
[관련 글] MCMCEstimationofPosterior−MarkovChainMonteCarlo - 깁스 샘플러GibbsSampler, MCMCEstimationofPosterior−MarkovChainMonteCarlo - 메트로폴리스-헤스팅스 알고리즘Metropolis−HastingsAlgorithm
깁스 샘플링 또는 메트로폴리스-헤스팅스 알고리즘을 사용한 통계량의 추정이 정당성을 가지기 위해선 관심 모수 θ의 수렴성을 진단해야 합니다.
MCMC방법의 수렴을 진단하는 방법 중 겔만-루빈Gelman−Rubin 방법에 대해 알아보겠습니다.
겔만-루빈Gelman−Rubin 방법
겔만-루빈 방법은 하나 또는 그 이상의 스칼라 요약 통계량의 분산에 관해 생성된 여러 연쇄의 성능을 비교하는 것에 근거하고 있습니다. 통계량의 분산 추정 값들은 일원 배치 분산분석ANOVA에서 표본 간 그리고 표본 내 평균 제곱 오차를 기초로 한 추정 값과 유사합니다.
샘플의 길이가 2n인 m개의 병렬 연쇄Ynm을 고려할 때, 초깃값의 영향을 제거하기 위해 반복의 앞부분 n개를 버리고 나머지 n개를 사용하여 사후 평균과 사후 분산을 계산한다고 가정하겠습니다. 알고리즘은 다음과 같습니다.
1. 전체 평균 ˉψ과 수열 내 평균 ˉψ(i) 그리고 수열 내 평균 간 분산 B를 계산합니다.
ˉψ=m∑i=12n∑j=n+1ψ(ij)(mn)
ˉψ(i)=2n∑j=n+1ψn, i=1,…,m
B=m∑i=1(ˉψ−ˉψ(i))2(m−1)
2. 각 자유도가 (n−1)인 m개의 수열 내 분산 s2i의 평균인 W를 계산한다.
W=m∑i=1s2im
3. 수열 내 분산의 평균과 수열 내 평균 간 분산을 이용해 다음을 계산합니다.
s2=(n−1)Wn+Bn
V=s2+B(mn)
4. 2. 와 3. 에서 구한 값을 이용하여 잠재적 척도 축소 인자potentialscalereductionfactor ˆR을 계산합니다.
ˆR=VW
만약 ˆR이 1에 가까우면 이는 샘플링한 값들이 수렴한다는 것을 의미합니다.