[Probability] 7. 베르누이 시행과 이항분포(Bernoulli trial and Binomial Distribution)

2021. 7. 20. 16:55Preliminary/Probability

이번 글에서는 표본 공간 $\mathbb {S}$의 실현 값이 오직 둘 중 하나로 분류될 수 있는 베르누이 시행(Bernoulli trial)에 대해 알아보고, 그의 확장인 이항 분포의 정의와 예시에 대해 알아보겠습니다.

[관련 글] 2. 확률변수(Random Variable)와,5. 기댓값과 분산(Expectation and Variance),6. 적률 생성 함수(Moment generating function)


베르누이 시행(Bernoulli trial)은 표본 공간의 실현 값이 오직 둘 중 하나로 분류되는 실험인 베르누이 실험을 독립적으로 몇 회 반복했을 때 발생합니다. 이때 각각의 실험이 성공할 확률은 $p$로 동일합니다.

성공하는 경우를 1이라고 하고, 실패하는 경우를 0이라고 했을 때, 확률변수 $X$의 pmf를 다음과 같이 나타낼 수 있습니다.

$p(x)=p^x(1-p)^{1-x},~~~~x=0,~1$

만약 확률변수가 위와 같은 pmf로 나타난다면, 확률변수 $X$가 베르누이 분포(Bernoulli distribution)를 따른다고 합니다. 베르누이 분포의 기댓값과 분산은 다음과 같습니다.

$\mu=\mathbb {E}(X)=(0)(1-p) + (1)(p) = p$

$\sigma^2=Var(X)=p^2(1-p)+(1-p)^2p=p(1-p)$


베르누이 시행을 $n$번 시행한 후, $x$번 성공하는 경우를 확률변수로 표현한다고 생각해봅시다. 성공할 확률을 $p$ 실패할 확률을 $(1-p)$라고 가정한다면, 총 $n$번의 시도 중에서 $x$번을 선택하는 가짓수는 $\binom {n}{x}$이기 때문에 이 확률변수의 pmf는 다음과 같이 나타낼 수 있습니다.

$p(x)=\binom {n}{x} p^{x}(1-p)^{n-x},~~~~x=0,~1,~2,\cdots, n $

위와 같은 pmf를 가질 때, 확률변수 $Y$가 이항 분포(Binomial distribution)를 따른다고 합니다. 확률변수 $Y$가 이항 분포를 따르면 $Y \sim B(n,~p)$와 같이 나타냅니다. 이항 분포의 기댓값과 분산은 다음과 같습니다.

$\mu=np$

$\sigma^2=np(1-p)$

적률 생성 함수를 통해 기댓값과 분산을 구하면 다음과 같습니다.

$M(t)=\displaystyle \sum_{x}{e^{tx} p(x)}=\displaystyle \sum_{x=0}^{n}{e^{tx} \binom {n}{x} p^x(1-p)^{n-x}} \\ ~~~~~~~~~=\displaystyle \sum_{x=0}^{n}{\binom {n}{x}}(pe^{t})^x (1-p)^{n-x} \\ ~~~~~~~~~=[(1-p)+pe^t]^n$

$M^{\prime}(t)=n[(1-p)+pe^t]^{n-1}(pe^t)$

$M^{\prime \prime}(t)=n[(1-p)+pe^t]^{n-1}(pe^t) + n(n-1)[(1-p)+pe^t]^{n-2}(pe^t)^2$

$\mu=M^{\prime}(0)=np$

$\sigma^2=M^{\prime \prime}(0)-\mu^2=np+n(n-1) p^2-(np)^2=np(1-p)$