[Probability] 2. 확률변수(Random Variable)

2021. 7. 9. 14:46Preliminary/Probability

이전 글([Measure] 2. Measurable function and Probability Measure)에서 Measure는 추상적인 단위에 대한 적분을 하기 위한 수학적인 정의라고 하였습니다. 이것을 조금 더 확률론적인 관점에서 풀어보도록 하겠습니다.

우리는 실제에서 일어나는 사건을 수학적으로 정의하기를 원합니다. 예를 들어서, 주사위를 던졌을 때, 1이 나올 확률을 수학적으로 표현하기를 원합니다. '주사위를 던진 사건'이 이전 글에서 언급한 '추상적인 단위'를 말합니다. 이렇게 실제의 사건을 수학적으로 다루기 위한 수단이 Measure인 것이고, 확률론적으로 정의한 것이 확률변수(Random Variable)입니다.

이번 글에서는 확률변수를 수학적으로 정의하고, 이산형 확률변수와 연속형 확률변수의 간단한 예시를 살펴보겠습니다.


확률변수는 다음과 같이 정의할 수 있습니다.

표본 공간 $\mathbb {S}$에서의 확률 실험이 주어졌을 때, 각 원소 $c \in \mathbb {S}$에 오직 하나의 실수 $X(c)=x$를 대응시키는 함수 $X$를 확률변수라고 합니다. $X$의 공간 또는 범위는 실수의 집합 $\mathbb {D}=\{x~:~x=X(c),~c \in \mathbb {S} \}$입니다.

일반적으로 $\mathbb {D}$는 이산형(Discrete)이거나 연속형(Continuous)입니다. 확률변수 $X$의 공간이 이산형 일 때, $X$를 이산형 확률변수, 연속형 일 때, $X$를 연속형 확률변수라고 지칭합니다.


이산형 확률변수의 예시를 살펴보겠습니다.

확률변수 $X$를 각각의 면에 1에서 6까지 숫자가 있는 공정한 정육면체 주사위 한쌍을 던졌을 때, 윗면에 나타난 숫자의 합이라고 정의하겠습니다. 그 경우 표본 공간  $\mathbb {S}=\{(i,~j)~:~1 \leq i,~j \geq6\}$입니다. 주사위가 공정하므로, $P[(i,~j)]=\frac {1}{36}$입니다. 확률변수 $X$는 $X(i,~j)=i+j$이고, $X$의 공간은 $\mathbb {D}=\{2,~...,~12\}$입니다. 확률변수$X$의 확률분포에 해당하는 PMF(probability math function)는 다음과 같이 나타낼 수 있습니다.

$x$ 2 3 4 5 6 7 8 9 10 11 12
$P(x)$ $\frac{1}{36}$ $\frac{2}{36}$ $\frac{3}{36}$ $\frac{4}{36}$ $\frac{5}{36}$ $\frac{6}{36}$ $\frac{5}{36}$ $\frac{4}{36}$ $\frac{3}{36}$ $\frac{2}{36}$ $\frac{1}{36}$

연속형 확률변수의 예시를 살펴보겠습니다.

이 경우 표본 공간 $\mathbb {S}$는 실수의 구간입니다. 실제 사건에서 연속형 확률변수를 종종 측정값에 해당합니다. 예를 들어서 성인의 몸무게는 연속형 확률변수를 이용해 모형화되는데, 한 개인의 몸무게가 200파운드 이상이 될 구간 확률에 관심이 있는 경우가 있습니다. 일반적으로 연속형 확률변수의 경우, 관심 있는 사건들은 구간으로 나타냅니다. 표본 공간 내의 어떤 실수의 구간 $(a,~b) \in D$에 대해 $X$의 확률분포에 해당하는 PDF(probability density function)을 다음과 같이 정의할 수 있습니다. 

$P_{x}[(a,~b)]=P [\{ c \in \mathbb {S} : a < X(c) < b\}] = \int_{a}^{b}{f_{X}(x)}dx$

$X$가 구간 $(a,~b)$ 내에 있을 확률은 $y=f_{X}(x)$의 곡선 아래에 있는 면적이 됩니다. 여기서 함수 $f_{X}(x)$는 음이 아니라는 조건과 $P_{X}(\mathbb {D})=\int_{D} f_{X}(x) dx=1$이라는 조건을 필요로 합니다.