본 글은 유투브 '빅데이터 분석기사 필기(통계 기초 고등수학13강 마스터)' 강의를 듣고 정리한 내용입니다.
<순열>
$$ _nP_r=n\times(n-1)\times(n-2)\times...\times(n-r+1) $$
- $ _7P_3=7\times 6 \times 5$
- $ _5P_4=5\times 4 \times 3$
- $ _5P_5=5\times 4 \times 3 \times 2 \times 1 = 5!$
- $ _4P_4= 4 \times 3 \times 2 \times 1 = 4!$
<조합>
$$ {n \choose r}=_nC_r=\frac{nPr}{r!} $$
- ${5 \choose 3}=_5C_3=\frac{5P3}{3!}=\frac{5 \times 4 \times 3}{3 \times 2\times 1}$
- ${7 \choose 4}=_7C_4=\frac{7P4}{4!}=\frac{7\times 6\times 5\times 4}{4\times 3\times 2\times 1}$
- $_5C_3=_5C_2$
- $_7C_3=_7C_4$
<이항분포>
$$ X \sim B(n,p) $$
- n: 시행 횟수
- p: 1번 발생할 확률
- q: 발생하지 않을 확률(1-p)
- 평균: np
- 분산: npq
- n이 충분히 클 때(n>30), $X \sim B(n,p)$ → $X \sim N(np,npq)$
<확률변수>
- 확률변수: 표본공간의 집합(숫자)
- 이산형 확률변수 ex) 나이
- 연속형 확률변수 ex) 키, 몸무게
- 확률분포표: 확률변수와 각각의 확률을 함께 표시한 표
x | 1 | 2 | 3 | 4 | 5 | 6 | 합계 |
P(X=x) | 1/6 | 1/6 | 1/6 | 1/6 | 1/6 | 1/6 | 1 |
<평균/분산/표준편차>
- 평균: $m=\frac{1}{n} \sum_{i=1}^{n} x_i$
- 편차: $x_i-m$
- 편차의 합: $\sum_{i=1}^{n}(x_i-m)=0$
- 분산: 평균적으로 흩어진 정도
- (편차)^2의 평균 = $\frac{1}{n}\sum_{i=1}^{n}(x_i-m)^2$
- 제곱의 평균-(평균)^2 =$\frac{1}{n}\sum_{i=1}^{n}(x_i)^2-m^2$
- 표준편차: $\sqrt {분산}$
반응형