Processing math: 43%

[Probability] 7. 베르누이 시행과 이항분포BernoullitrialandBinomialDistribution

2021. 7. 20. 16:55Preliminary/Probability

이번 글에서는 표본 공간 S의 실현 값이 오직 둘 중 하나로 분류될 수 있는 베르누이 시행Bernoullitrial에 대해 알아보고, 그의 확장인 이항 분포의 정의와 예시에 대해 알아보겠습니다.

[관련 글] 2. 확률변수RandomVariable,5. 기댓값과 분산ExpectationandVariance,6. 적률 생성 함수Momentgeneratingfunction


베르누이 시행Bernoullitrial은 표본 공간의 실현 값이 오직 둘 중 하나로 분류되는 실험인 베르누이 실험을 독립적으로 몇 회 반복했을 때 발생합니다. 이때 각각의 실험이 성공할 확률은 p로 동일합니다.

성공하는 경우를 1이라고 하고, 실패하는 경우를 0이라고 했을 때, 확률변수 X의 pmf를 다음과 같이 나타낼 수 있습니다.

p(x)=px(1p)1x,    x=0, 1

만약 확률변수가 위와 같은 pmf로 나타난다면, 확률변수 X가 베르누이 분포Bernoullidistribution를 따른다고 합니다. 베르누이 분포의 기댓값과 분산은 다음과 같습니다.

μ=E(X)=(0)(1p)+(1)(p)=p

σ2=Var(X)=p2(1p)+(1p)2p=p(1p)


베르누이 시행을 n번 시행한 후, x번 성공하는 경우를 확률변수로 표현한다고 생각해봅시다. 성공할 확률을 p 실패할 확률을 (1p)라고 가정한다면, 총 n번의 시도 중에서 x번을 선택하는 가짓수는 \binom {n}{x}이기 때문에 이 확률변수의 pmf는 다음과 같이 나타낼 수 있습니다.

p(x)=\binom {n}{x} p^{x}(1-p)^{n-x},~~~~x=0,~1,~2,\cdots, n

위와 같은 pmf를 가질 때, 확률변수 Y가 이항 분포Binomial distribution를 따른다고 합니다. 확률변수 Y가 이항 분포를 따르면 Y \sim B(n,~p)와 같이 나타냅니다. 이항 분포의 기댓값과 분산은 다음과 같습니다.

\mu=np

\sigma^2=np(1-p)

적률 생성 함수를 통해 기댓값과 분산을 구하면 다음과 같습니다.

M(t)=\displaystyle \sum_{x}{e^{tx} p(x)}=\displaystyle \sum_{x=0}^{n}{e^{tx} \binom {n}{x} p^x(1-p)^{n-x}} \\ ~~~~~~~~~=\displaystyle \sum_{x=0}^{n}{\binom {n}{x}}(pe^{t})^x (1-p)^{n-x} \\ ~~~~~~~~~=[(1-p)+pe^t]^n

M^{\prime}(t)=n[(1-p)+pe^t]^{n-1}(pe^t)

M^{\prime \prime}(t)=n[(1-p)+pe^t]^{n-1}(pe^t) + n(n-1)[(1-p)+pe^t]^{n-2}(pe^t)^2

\mu=M^{\prime}(0)=np

\sigma^2=M^{\prime \prime}(0)-\mu^2=np+n(n-1) p^2-(np)^2=np(1-p)