표본분포
Random sample(확률표본) 모집단을 대표할 수 있는 표본
Independet(독립적), identical(동일한 확률밀도 함수f(x), 동일한 분포)를 IID라고 부른다.
실제 데이터들이 IID가 아니라면? 걱정할 필요 없다. IID로부터 나온 기술들은 모두 적용될 수 있다고 증명되었다.
중심극한정리
어떤 모집단에서 확률분포의 표본평균은 n이 커질수록 근사적으로 정규분포를 따른다.
모집단이 정규분포를 따르면 표본평균은 반드시 정규분포를 따른다
모집단이 정규분포를 따르지 않아도 n이 크다면 표본평균은 정규분포에 근사해진다.
대수의 법칙
- n이 커질수록 표본평균은 모평균에 가까워진다.
N이 커진다면, 표본평균으로부터 모평균의 정보를 얻을 수 있다는 좋은 특징(근사 예측 가능)
→ 중심극한정리, 대수의법칙은 굉장히 중요하다.
샘플이 작은 경우에도, x(모집단)이 정규분포를 따르면, x바(표본집단)도 정규분포를 따른다 (변별력 문제)
문제에서 ‘정규분포를 따르는’ 이라면 표본의 크기에 상관없이 표본평균도 무조건 정규분포를 따른다.
표본비율의 표본분포
X가 이항분포를 따른다 할 때, n이 크면 정규분포를 따른다(이항분포의 정규분포에 의한 근사)
X라는 확률변수의 평균을 구해보면, 평균:np, 분산:npq 일 것.
X라는 확률변수에 n을 나눈 것의 평균: p, 분산:pq/n 일 것. (평균은 그대로 계산, 분산은 제곱)
고로 X/n이라는 확률변수는 위와 같이 평균 p 분산 pq/n을 따른다.
여기서 X/n이 의미하는 것이 p햇(모비율 추정량)을 의미하는 것이다.
'파이썬 & 인공지능 > 수학 & 통계학' 카테고리의 다른 글
추정 (0) | 2019.11.19 |
---|---|
가설검정의 5단계 절차 - 귀무가설(영가설), 대립가설(연구가설) (0) | 2019.11.16 |
연속확률변수인 균등분포, 정규분포의 확률밀도함수와 기대값과 분산 (0) | 2019.11.14 |
연속확률변수의 정규분포 및 T분포, 카이제곱분포, F분포 그리고 표본분포(표본평균, 표본비율, 표본분산, 표본평균의 차이) (0) | 2019.11.12 |
여러가지 표본분포 (표본평균, 표본비율, 표본분산, 두 표본평균 차이) (0) | 2019.11.08 |