이산확률변수와 확률질량함수
- 확률변수가 가질 수 있는 값들이 유한개이거나 자연수와 같이 셀 수 있을 때, 이 확률변수를 이산확률변수라고 합니다.
- 이산확률변수 가 가질 수 있는 모든 값 에 각각 대응하는 확률을 나타내는 함수를 이산확률변수 의 확률질량함수라고 합니다.
확률질량함수의 성질
- 확률은 항상 이상 이하의 값을 가집니다.
- 확률의 총합은 항상 1입니다:
이산확률변수의 기댓값(평균)
확률질량함수 일 때, 확률변수 의 기댓값 또는 평균은 다음과 같이 정의 됩니다. 의 는 기댓값을 뜻하는 Expectation의 첫 글자입니다. 는 평균을 나타내는 으로 표기되기도 합니다.
이산확률변수의 분산과 표준편차
의 기댓값을 이라 할 때, 확률변수 의 분산은 다음과 같이 정의됩니다.
분산 의 양의 제곱근을 의 표준편차라 하며, 다음과 같이 나타냅니다:
의 는 분산을 뜻하는 Variance의 첫 글자입니다. 는 표준편차를 뜻하는 standard deviation의 첫 글자에 해당하는 그리스 문자입니다.
의 분산 은 다음 식으로 계산할 수 있습니다.
확률변수 의 평균, 분산, 표준편차
확률변수 와 두 상수 에 대해 다음이 성립합니다.
- 평균:
- 분산:
- 표준편차:
이항분포
한 번의 시행에서 사건 가 일어날 확률이 로 일정할 때, 번의 독립시행에서 사건 가 일어나는 횟수를 확률변수 라고 정의합니다. 이 확률변수 의 확률질량함수는 다음과 같습니다.
확률변수 의 확률분포를 표로 나타내면 다음과 같습니다.
이와 같은 확률분포를 이항분포라고 하며, 기호로 로 나타냅니다. 확률변수 는 이항분포 를 따른다고 합니다. 이항정리에 의해 확률질량함수의 모든 확률의 합은 1이 됩니다.
이항분포의 평균, 분산, 표준편차
확률변수 가 이항분포 를 따를 때, 평균, 분산, 표준편차는 다음과 같습니다:
- 평균:
- 분산:
- 표준편차:
큰 수의 법칙
어떤 시행에서 사건 가 일어날 수학적 확률이 이고, 번의 독립시행에서 사건 가 일어나는 횟수를 라고 할 때, 이 한없이 커질수록 상대도수 는 이론적 확률 에 수렴합니다. 이를 큰 수의 법칙이라고 합니다.
예제
- 숫자 가 하나씩 적힌 개의 공이 들어 있는 주머니가 있다. 이 주머니에서 임의로 개의 공을 동시에 꺼낼 때, 꺼낸 개의 공에 적혀 있는 두 수의 합을 확률변수 라 하자. 의 값은?
2. 흰 공 $3$개, 검은 공 $3$개가 들어 있는 주머니에서 임의로 3개의 공을 동시에 꺼낼 때, 꺼낸 공 중 흰 공의 개수를 $a$, 검은 공의 개수를 $b$라 하자. $ab$의 값을 확률변수 $X$라 할 때, $E(X)$의 값은?
3. 이산확률변수 $X$에 대하여 $E(X) = 4$, $E((X - 4)^2) = 9$일 때, $E(X^2) - \sigma(X)$의 값은?
4. 이산확률변수 $X$에 대하여 $E(4X + 1) = E(X^2) + 1 = 5$일 때, $\sigma(\sqrt{3}X - \sqrt{3})$의 값은?
5. 확률변수 $X$가 이항분포 $B(n, \frac{1}{3})$를 따르고 $E(X^2) = 40$일 때, 자연수 $n$의 값은?