표본분포

Random sample(확률표본) 모집단을 대표할 수 있는 표본

Independet(독립적), identical(동일한 확률밀도 함수f(x), 동일한 분포)IID라고 부른다.

실제 데이터들이 IID가 아니라면? 걱정할 필요 없다. IID로부터 나온 기술들은 모두 적용될 수 있다고 증명되었다.

 

중심극한정리

어떤 모집단에서 확률분포의 표본평균은 n이 커질수록 근사적으로 정규분포를 따른다.

모집단이 정규분포를 따르면 표본평균은 반드시 정규분포를 따른다

모집단이 정규분포를 따르지 않아도 n이 크다면 표본평균은 정규분포에 근사해진다.

 

 

대수의 법칙

- n이 커질수록 표본평균은 모평균에 가까워진다.

N이 커진다면, 표본평균으로부터 모평균의 정보를 얻을 수 있다는 좋은 특징(근사 예측 가능)

→ 중심극한정리, 대수의법칙은 굉장히 중요하다.

 

샘플이 작은 경우에도, x(모집단)이 정규분포를 따르면, x(표본집단)도 정규분포를 따른다 (변별력 문제)

문제에서 정규분포를 따르는이라면 표본의 크기에 상관없이 표본평균도 무조건 정규분포를 따른다.

 

표본비율의 표본분포

X가 이항분포를 따른다 할 때, n이 크면 정규분포를 따른다(이항분포의 정규분포에 의한 근사)

X라는 확률변수의 평균을 구해보면, 평균:np, 분산:npq 일 것.

X라는 확률변수에 n을 나눈 것의 평균: p, 분산:pq/n 일 것. (평균은 그대로 계산, 분산은 제곱)

고로 X/n이라는 확률변수는 위와 같이 평균 p 분산 pq/n을 따른다.

여기서 X/n이 의미하는 것이 p(모비율 추정량)을 의미하는 것이다.

+ Recent posts