BackStatistical Inference: Estimation and Confidence Intervals
Study Guide - Smart Notes
Tailored notes based on your materials, expanded with key definitions, examples, and context.
통계적 추론 (Statistical Inference)
추정의 개념
통계적 추론은 모집단의 특성을 표본을 통해 추정하거나, 가설을 검정하는 과정입니다. 추정에는 점추정과 구간추정이 있습니다.
점추정 (Point Estimation): 모집단의 모수를 하나의 값으로 추정하는 방법입니다.
구간추정 (Interval Estimation): 모집단의 모수가 포함될 것으로 기대되는 구간을 제시하여 추정합니다.

추정량과 표준오차
추정량은 표본을 이용해 계산된 통계량으로, 모수를 추정하는 데 사용됩니다. 추정량의 표준편차를 표준오차 (Standard Error, S.E.)라고 하며, 표준오차가 작을수록 추정의 정확도가 높아집니다.
추정량 (Estimator): 모수를 추정하는 데 사용하는 통계량
추정치 (Estimate): 표본을 이용해 계산된 추정량의 값
표준오차: (모집단의 표준편차를 알 때)
추정된 표준오차: (표본 표준편차 사용)
구간추정과 신뢰구간 (Confidence Interval)
구간추정의 정의
구간추정은 모수가 포함될 것으로 기대되는 구간을 확률과 함께 제시하여, 추정치에 대한 불확실성을 표현합니다. 이때 사용되는 주요 개념은 신뢰구간과 신뢰수준입니다.
신뢰구간 (Confidence Interval, CI): 모수를 추정하는 데 이용되는 구간
신뢰수준 (Confidence Level): 신뢰구간에 모수가 포함될 확률
유의수준 (Significance Level): 모수가 신뢰구간을 벗어날 확률
오차한계 (Margin of Error, ME): 점추정치로부터 상한/하한까지의 거리폭

신뢰구간의 시각적 이해
신뢰구간은 정규분포에서 중심을 기준으로 양쪽에 오차 확률을 분포시키며, 신뢰수준에 따라 구간의 폭이 결정됩니다.


신뢰구간의 공식
모집단이 정규분포이고 모분산을 알 때, 모평균에 대한 신뢰구간은 다음과 같이 계산합니다:
신뢰구간 공식:
여기서 는 신뢰수준에 해당하는 Z값입니다. 예: 95% 신뢰수준에서는

신뢰구간의 특징
신뢰수준이 낮을수록, 표본크기가 클수록 신뢰구간의 길이가 작아진다.
신뢰수준이 높을수록, 표본크기가 작을수록 신뢰구간의 길이가 커진다.
표준편차가 작을수록 신뢰구간이 좁아진다.

예제: 신뢰구간 계산
25개의 설탕 백을 무작위로 추출하여 평균 무게를 측정한 결과, 평균은 49.8온스, 표준편차는 1온스였다. 95% 신뢰구간을 계산하면:
표준오차:
오차한계:
신뢰구간:


신뢰구간의 해석
100개의 표본을 추출하여 신뢰구간을 설정했을 때, 모평균이 95개의 신뢰구간 속에 포함될 것임을 95% 신뢰한다.
표본크기의 결정 (Sample Size Determination)
표본크기 결정의 원리
원하는 정확도로 모집단에 대한 추정을 하기 위해 필요한 표본의 크기를 결정하는 방법입니다. 신뢰구간에서 표본의 크기가 커질수록 신뢰구간이 짧아집니다.
모평균에 대한 추정에서 오차가 이하일 확률이 최소한 가 되도록 필요한 최소 표본크기:
표본 표준편차 또는 자료의 범위 를 사용할 수도 있음:

모비율에 대한 신뢰구간 (Confidence Interval for Proportion)
모비율의 점추정과 표준오차
점추정: (표본비율)
표준오차:
모비율의 신뢰구간 공식
예: 500명 중 41명이 지지한다면, , 95% 신뢰구간은
모비율의 표본크기 결정
오차가 이하일 확률이 최소한 가 되도록 필요한 최소 표본크기:
p를 모르면 로 가정하여

정리
신뢰구간은 표본을 통해 모수의 불확실성을 구간으로 표현하는 방법입니다.
신뢰수준, 표본크기, 표준편차에 따라 신뢰구간의 폭이 달라집니다.
표본크기 결정은 원하는 정확도와 신뢰수준에 따라 공식적으로 계산할 수 있습니다.