본 글은 유투브 '빅데이터 분석기사 필기(통계 기초 고등수학13강 마스터)' 강의를 듣고 정리한 내용입니다.
빅데이터 분석기사 필기(통계 기초 고등수학13강 마스터)
빅분기 시험전 고등수학 기초통계 2시간만에 빠르게 정리하기
www.youtube.com
<모평균과 포본평균>
모집단: 알고 싶은 대상이 되는 집단
- 확률변수 XX
- 모평균 mm
- 모분산 σ2σ2
- 모표준편차 σσ
표본집단: 모집단을 알기 위해 임의로 추출한 집단
- 확률분포 ˉX¯X
- 기댓값 E(ˉX)=E(X)=mE(¯X)=E(X)=m
- 분산 V(ˉX)=σ2nV(¯X)=σ2n
- 표준편차 σ(ˉX)=σ√nσ(¯X)=σ√n
<중심극한 정리>
모분포가 정규분포이면, 표본평균 ˉX¯X의 분포도 정규분포이다.
X∼N(μ,σ2)→ˉX∼N(μ,(σ√n)2)X∼N(μ,σ2)→¯X∼N(μ,(σ√n)2)
모분포에 상관없이 n이 충분히 크면(n≥30), 표본평균 ˉX¯X의 분포도 정규분포이다. ˉX∼N(μ,(σ√n)2)¯X∼N(μ,(σ√n)2)
<신뢰구간/모평균 추정>
① 모집단의 분산(표준편차)를 알고있는 경우,
- 95% 신뢰구간 ˉX−1.96σ√n≤μ≤ˉX+1.96σ√n¯X−1.96σ√n≤μ≤¯X+1.96σ√n
- 99% 신뢰구간 ˉX−2.58σ√n≤μ≤ˉX+2.58σ√n¯X−2.58σ√n≤μ≤¯X+2.58σ√n
② 모집단의 분산(표준편차)을 모르더라도 표본이 충분히 크면(n≥30),
- 95% 신뢰구간 ˉX−1.96s√n≤μ≤ˉX+1.96s√n¯X−1.96s√n≤μ≤¯X+1.96s√n
- 99% 신뢰구간 ˉX−2.58s√n≤μ≤ˉX+2.58s√n¯X−2.58s√n≤μ≤¯X+2.58s√n
③ 모집단의 분산(표준편차)을 모르고 추출하는 개수(n)가 작을 때,
ˉX−(t분포)s√n≤μ≤ˉX+(t분포)s√n
** s: 표본표준편차
** s2=1n−1∑ni=1(xi−ˉx)
반응형