본 글은 유투브 '빅데이터 분석기사 필기(통계 기초 고등수학13강 마스터)' 강의를 듣고 정리한 내용입니다.
<기댓값/분산>
기댓값 $E(X)=\sum_{i=1}^{n}x_ip_i$
분산 $V(X)=\sum_{}^{}(x_i-m)^2p_i=E(X^2)-{E(X)}^2$
- $E(3X+1)=E(3X)+1=3E(X)+1$
- $V(3X+1)=3^2V(X)=9V(X)$
ex) 확률변수 X, E(X)=1, E(X^2)=2일 경우
① $E(-3X+1)=E(-3X)+1=-3E(X)+1=-2$
② $V(X)=E(X^2)-E(X)^2=2-1=1$
③ $V(-3X+1)=(-3)^2V(X)=9V(X)=9$
<정규분포>
$$ X \sim N(\mu,{\sigma}^2) $$
기댓값= $E(X)=\mu$
분산= $V(X)={\sigma}^2$
표준편차= $\sqrt{V(X)}=\sigma$
- 좌우대칭
- 그래프의 면적=확률
- 분산이 크면 흩어진 정도가 크다
- 표준정규분포: 평균이 0, 표준편차가 1인 분포
$$ X\sim Z(0,1^2) $$
반응형