BackStatistical Inference: Estimation and Confidence Intervals
Study Guide - Smart Notes
Tailored notes based on your materials, expanded with key definitions, examples, and context.
통계적 추론 (Statistical Inference)
추정의 개념
통계적 추론은 모집단의 특성을 표본을 통해 추정하거나 검정하는 과정입니다. 추정에는 점추정(point estimation)과 구간추정(interval estimation)이 있습니다.
점추정: 모집단의 모수를 하나의 값으로 추정하는 방법입니다.
구간추정: 모수가 포함될 것으로 기대되는 구간을 제시하여 추정하는 방법입니다.

추정에는 불확실성이 존재하므로, 신뢰구간(confidence interval)과 신뢰수준(confidence level)을 함께 제시해야 합니다.
구간추정과 신뢰수준
신뢰구간과 신뢰수준
구간추정은 표본에서 계산된 추정치를 중심으로, 모수가 포함될 것으로 기대되는 구간을 확률적으로 제시합니다. 이때 신뢰구간의 폭과 신뢰수준이 중요합니다.
신뢰구간 (Confidence Interval, CI): 모수가 포함될 것으로 기대되는 구간
신뢰수준 (Confidence Level): 신뢰구간이 모수를 포함할 확률, 일반적으로 90%, 95%, 99%를 사용
유의수준 (Significance Level, α): 신뢰구간이 모수를 포함하지 않을 확률, 즉 1-신뢰수준
오차한계 (Margin of Error): 점추정치에서 신뢰구간의 상한 또는 하한까지의 거리

정규분포와 신뢰구간의 시각화
신뢰구간은 표준정규분포에서 중심 구간(예: 95%)을 기준으로 설정됩니다. 나머지 5%는 양쪽 꼬리에 각각 2.5%씩 분포합니다.


모평균의 신뢰구간 (Confidence Interval for the Mean)
모분산을 아는 경우
모집단이 정규분포를 따르고 모분산(σ²)을 아는 경우, 표본평균의 신뢰구간은 다음과 같이 계산합니다.
표본평균:
표준오차:
신뢰구간:

여기서 는 신뢰수준에 해당하는 표준정규분포의 임계값입니다. 예를 들어, 95% 신뢰수준에서는 입니다.
모분산을 모르는 경우
표본의 크기가 충분히 크고 모분산을 모를 때는 표본표준편차(s)를 사용하여 신뢰구간을 구합니다.
신뢰구간:
신뢰구간의 해석
신뢰구간은 표본에 따라 달라지며, 100개의 표본을 추출해 각각 신뢰구간을 구하면 약 95개는 모평균을 포함하게 됩니다. 즉, 신뢰구간이 모평균을 포함할 확률이 신뢰수준(예: 95%)입니다.
예제: 설탕 백의 평균 무게에 대한 신뢰구간
설탕 백의 무게가 표준편차 1온스의 정규분포를 따르고, 25개의 백을 무작위로 추출하여 평균이 49.8온스였다면:
표준오차:
오차한계(95% 신뢰수준):
신뢰구간:
해석: 25개의 표본으로 100개의 신뢰구간을 설정하면, 모평균이 95개의 신뢰구간에 포함될 것이다. 모평균이 (49.408, 50.192) 사이에 있을 것으로 95% 신뢰한다.


신뢰구간의 폭에 영향을 주는 요인
신뢰수준이 높아질수록 신뢰구간의 폭이 넓어진다.
표준편차가 작을수록 신뢰구간의 폭이 좁아진다.
표본의 크기가 커질수록 신뢰구간의 폭이 좁아진다.

표본크기의 결정 (Sample Size Determination)
모평균 추정에서 표본크기 공식
원하는 정확도로 모평균을 추정하기 위해 필요한 최소 표본크기는 다음과 같이 계산합니다.
모분산을 아는 경우:
자료의 범위(R)를 사용할 경우:

여기서 d는 허용 오차(margin of error)입니다.
모비율의 신뢰구간 (Confidence Interval for Proportion)
모비율의 점추정과 표준오차
모비율의 점추정치:
표준오차:
모비율의 신뢰구간 공식
신뢰구간:
예를 들어, 500명 중 41명이 지지한다고 할 때, 95% 신뢰구간은 입니다.
모비율 추정에서 표본크기 결정
공식:
p를 모를 때는 최대값 0.25를 사용하여 로 계산합니다.
정리
점추정은 모수를 하나의 값으로 추정, 구간추정은 신뢰구간을 제시하여 추정
신뢰구간은 표본평균, 표본비율 등 추정량의 표준오차와 신뢰수준에 따라 계산
표본의 크기가 클수록, 표준편차가 작을수록 신뢰구간이 좁아진다
모평균, 모비율 모두에 대해 신뢰구간과 표본크기 결정 공식을 활용할 수 있다