본 글은 유투브 '빅데이터 분석기사 필기(통계 기초 고등수학13강 마스터)' 강의를 듣고 정리한 내용입니다.
<모평균과 포본평균>
모집단: 알고 싶은 대상이 되는 집단
- 확률변수 $X$
- 모평균 $m$
- 모분산 $\sigma^2$
- 모표준편차 $\sigma$
표본집단: 모집단을 알기 위해 임의로 추출한 집단
- 확률분포 $\bar{X}$
- 기댓값 $E(\bar{X})=E(X)=m$
- 분산 $V(\bar{X})=\frac{\sigma^2}{n}$
- 표준편차 $\sigma(\bar{X})=\frac{\sigma}{\sqrt{n}}$
<중심극한 정리>
모분포가 정규분포이면, 표본평균 $\bar{X}$의 분포도 정규분포이다.
$$ X\sim N(\mu,\sigma^2) \rightarrow \bar{X}\sim N(\mu, (\frac{\sigma}{\sqrt{n}})^2) $$
모분포에 상관없이 n이 충분히 크면(n≥30), 표본평균 $\bar{X}$의 분포도 정규분포이다. $\bar{X}\sim N(\mu, (\frac{\sigma}{\sqrt{n}})^2)$
<신뢰구간/모평균 추정>
① 모집단의 분산(표준편차)를 알고있는 경우,
- 95% 신뢰구간 $\bar{X}-1.96\frac{\sigma}{\sqrt{n}}≤\mu≤ \bar{X}+1.96\frac{\sigma}{\sqrt{n}}$
- 99% 신뢰구간 $\bar{X}-2.58\frac{\sigma}{\sqrt{n}}≤\mu≤ \bar{X}+2.58\frac{\sigma}{\sqrt{n}}$
② 모집단의 분산(표준편차)을 모르더라도 표본이 충분히 크면(n≥30),
- 95% 신뢰구간 $\bar{X}-1.96\frac{s}{\sqrt{n}}≤\mu≤ \bar{X}+1.96\frac{s}{\sqrt{n}}$
- 99% 신뢰구간 $\bar{X}-2.58\frac{s}{\sqrt{n}}≤\mu≤ \bar{X}+2.58\frac{s}{\sqrt{n}}$
③ 모집단의 분산(표준편차)을 모르고 추출하는 개수(n)가 작을 때,
$\bar{X}-(t분포)\frac{s}{\sqrt{n}}≤\mu≤ \bar{X}+(t분포)\frac{s}{\sqrt{n}}$
** s: 표본표준편차
** $s^2=\frac{1}{n-1}\sum_{i=1}^{n}(x_i-\bar{x})$
반응형