모집단과 표본
- 통계 조사에서 조사하고자 하는 대상 전체를 모집단이라 하며, 모집단 전체를 조사하는 것을 전수조사라고 합니다.
- 모집단에서 뽑은 일부를 표본이라 하고, 표본을 뽑아 조사하는 것을 표본조사라고 합니다. 또한, 표본조사에서 뽑은 표본의 개수를 표본의 크기라고 합니다.
- 모집단에 속하는 각 대상이 같은 확률로 추출되도록 표본을 추출하는 방법을 임의추출이라 합니다. 한 개의 자료를 뽑은 후 다시 넣고 반복하여 뽑는 것을 복원추출이라 하며, 넣지 않고 뽑는 것을 비복원추출이라 합니다.
모평균과 표본평균
모집단에서 조사하고자 하는 특성을 나타내는 확률변수를 라 할 때, 의 평균, 분산, 표준편차를 각각 모평균, 모분산, 모표준편차라 하고, 이를 기호로 다음과 같이 나타냅니다.
표본평균, 표본분산, 표본표준편차
-모집단에서 임의추출한 크기가 인 표본을 이라 할 때, 표본평균, 표본분산, 표본표준편차를 기호로 다음과 같이 나타냅니다.
- 표본평균:
- 표본분산:
표본평균을 정의할 때와 달리 표본분산의 정의에서 로 나누는 이유는 표본분산과 모분산의 차이를 줄이기 위함입니다.
- 표본표준편차:
표본평균의 평균, 분산, 표준편차
모평균이 , 모표준편차가 인 모집단에서 임의추출한 크기가 인 표본의 표본평균 에 대해 다음 성질이 성립합니다:
표본평균의 분포
모평균이 , 모표준편차가 인 모집단에서 임의추출한 크기가 인 표본의 표본평균 에 대해
-
모집단이 정규분포를 따르면 의 크기에 관계없이 표본평균 는 정규분포를 따릅니다.
-
모집단이 정규분포를 따르지 않아도 이 충분히 크면 표본평균 는 근사적으로 정규분포를 따릅니다.
보통 이면 충분히 큰 표본으로 간주합니다.
모평균의 추정
- 표본을 조사해 얻은 정보를 이용하여 모평균, 모표준편차와 같이 모집단의 특성을 나타내는 값을 추측하는 것을 추정이라고 합니다.
- 정규분포 를 따르는 모집단에서 임의추출한 크기가 인 표본의 표본평균의 값이 주어질 때, 신뢰도에 따른 모평균 에 대한 신뢰구간은 다음과 같습니다.
- (1) 신뢰도 95%의 신뢰구간:
- (2) 신뢰도 99%의 신뢰구간:
표본의 크기 이 충분히 크면 표본표준편차 의 값을 대신 사용하여 모평균에 대한 신뢰구간을 구할 수도 있습니다.