베르누이 분포(Bernoulli Distribution)
- 베르누이 시행: 어떤 실험에서 발생 가능한 결과가 두 가지인 시행
1. 각 시행이 독립적으로 수행된다.
2. 모든 실험의 결과 확률은 동일하다.
ex) 베르누이 시행의 표본공간 S = { s, f } 에 대해 성공확률 P(s)=p, 실패확률 P(f)=1-p로 일정하다.
- 베르누이 확률변수: 모수(성공확률)가 p인 베르누이 시행결과에 따라 0 또는 1의 값을 대응시키는 확률변수
P(X = 1) = P(성공) = p
P(X = 0) = P(실패) = 1 - p
즉 이때 확률밀도함수 f(x)는 $f(x) = P(X = x) = p^x - p^{1-x}, x = 0, 1$ 가 된다.
이때 확률변수 X가 베르누이 분포를 따르므로 X~B(p) 라고 표기한다.
- 성질
$ E(X) = 0 \times (1 - p) + 1 \times p = p $
$ E(X^2) = p $
$ V(X) = E(X^2) - {E(X)}^2 = p(1 - p) $
- 베르누이 분포의 예시
- 복원추출 제비뽑기: n번째 시행에서의 당첨여부를 나타내는 확률변수 Xn에 대해 각 Xn들은 서로 독립이다.
- 비복원추출 제비뽑기: Xn은 서로 독립이 아니지만 제비가 N개, 당첨제비가 M개일 때 N과 M이 충분히 크면 베르누이 분포에 근사된다.
정규분포(Normal Distribution)
확률밀도함수는 위와 같고 확률변수 X가 평균이 μ이고 표준편차가 σ인 정규분포를 따를 때
X~N(μ, σ^2) 으로 나타낸다.
μ에서 최댓값을 가지고, μ로부터 σ만큼 떨어진 곳이 변곡점이다.
표준정규분포(Standard Normal Distribution)
X~N(μ, σ^2) 일 때 표준화하여
$Z = \frac{X - μ}{σ}$ ~ N(0, 1) 로 나타낼 수 있다.
P(Z>=z) = α를 만족하는 z값을 $z_α$라고 한다.
- 성질
용어 정리
모수: 모집단의 특성을 결정하는 상수 (정규분포의 경우 μ와σ, 베르누이 분포의 경우 p)
통계량: 표본으로부터 계산 가능한 표본의 특성값. 혹은 관측 가능한 표본의 함수.
ex) 확률표본의 함수: $\bar{X} = \frac{1}{n}\sum{X_i}$ (이때 관측가능한 표본은 $X_i$임)
추정량: 모수의 추정에 사용되는 통계량(확률변수) (표본평균, 표본분산, 표본비율...)
추정값: 추정량의 관측값(상수)
표본(표집)분포: 통계량의 확률분포
표본분포(Sampling Distribution)
모집단 {찬성, 찬성, 찬성, 반대, 반대} 을 생각하자. 이때 모비율 p = 0.6 이다.
이 모집단에서 크가가 3인 표본을 추출해보자.
가능한 표본 | 확률 | 표본비율 | 오차 |
찬성, 찬성, 찬성 | 0.1 | 1 | 0.4 |
찬성, 찬성, 반대 | 0.6 | 0.667 | 0.067 |
찬성, 반대, 반대 | 0.3 | 0.333 | -0.267 |
이때 가운데 두 열(확률, 표본비율)은 통계량(표본비율)의 확률분포, 즉 표본분포이다.
확률표본과 통계량
확률(랜덤)표본: 모집단에서 무작위로 선택한 관측값이다. 서로 독립이고 동일분포라고 가정한다.
ex) 정규분포 N(μ, σ^2)에서 n개의 표본을 무작위로 뽑으면 $X_1, X_2, ... X_n \sim iidN(μ, σ^2)$
이때 결합분포 $f_{X_1X_2...Xn}(x_1,...,x_n) = f_{X_1}(x_1)...f_{X_n}(x_n) = \prod_{i=1}^{n}f(x_i)$
즉, 서로 독립이기 때문에 결합분포는 주변분포들의 곱으로 표현된다.
'수학 > 통계학' 카테고리의 다른 글
초기하분포와 이항분포(Hypergeometric Distribution and Binomial Distribution) (0) | 2021.04.18 |
---|