본문 바로가기
경영 직장

시장조사론 기초통계_표준정규분포

by 라파고1 2023. 2. 19.
반응형

시장조사론 기초통계 표준정규분포

• 표준정규분포 : 평균이 0이고, 표준편차가 1인 정규분포

- 정규분포 N(m,σ2)에서 알고자하는 값의 위치는 평균인 m의 값도, 표준편차인 σ의 값도 상관없이 m+kσ에서의 k값, 표준편차가 몇 개인지에 달려있다. 그런데 매번 서로 다른 평균값과 표준편차를 감안하여 계산하지 않고 모든 분포들을 표준화시키면 계산이 간편해진다. 어차피 평균이나 표준편차가 중요하지 않다면 그 값들을 하나로 통일시켜 자료의 비교 작업을 수월하게 하는 것이 효율적이다. 그래서 평균 m을 0으로, 표준편차 σ를 1로 바꾸어 m+kσ를 m+kσ=0+1·k=k로 간단하게 하면 표준편차의 개수 k만을 고려하면 되기 때문에 간단해진다. 이렇게 m=0, σ=1로 바꾸는 작업을 정규분포를 ‘표준화’한다고 하며 이로 인해 N(m,σ2)이던 정규분포가 N(0,12)가 되는데 이러한 N(0,12)을 표준정규분포라 한다.

 

 

• 표준정규분포표(Z분포, 가오스 분포) : 서로 다른 정규분포를 표준화하여 확률을 계산하는 틀

• Z값 구하는 법 Z = X – u / σ ( 통계량 – 모집단의 평균 / 표준편차 )

 

• 구간추정의 방식 : 추정하고자하는 모수가 특정한 구간 내에 위치할 확률이 얼마나 되는가에 관한 것

M후보의 대선 지지도를 조사했더니, 지지율이 50%이다.
신뢰수준은 95%이며, 오차범위는 +- 3%p 이다.

 

․ 신뢰수준 : 100번 시행했을 때 몇 번이 같게 나올 것인가, 100의 조사를 하면 95번은 지지율이 50%로 나올 것이다.

- 통계에서는 90%, 95%, 99%를 가장 많이 사용하고, 통상 95%를 사용한다

․ 신뢰구간 : 진정한 모수가 모함될 가능성이 있는 확률 구간

- 100번의 조사를 했을 때 95번의 경우에는 47% ~ 53% 사이의 결과로 나올 것이라는 것

․ 유의수준(=허용유의확률)(=α) : 신뢰구간 밖에 있을 확률

※ 신뢰구간 = 1 - α

 

• 각 유의수준에 해당하는 Z값 (양측 점증시)

- 10%(1-90%)/2 = 1.645

- 5% (1-95%)/2 = 1.96

- 1% (1-99%)/2 = 2.575

 

• Z분포는 표본이 30개가 넘어야한다.

t분포는 표본개수와 상관 없다. 그래서 t분포를 많이 사용한다.

 

추계통계학과 표본오차, 중심극한정리

 

■ 통계학의 종류와 기본용어

• 기술통계학(descriptive statistics) : 자료의 특성을 그대로 기술하는 것

ex) 연매출, 사원수, 연령별 인구 등

• 추계통계학(Inferential statistics) : 표본의 특성으로 모집단 특성을 추정하는 것

- 모집단의 특성을 나타내는 값을 모수 (parameter) 라고 하며

- 표본의 특성을 나타내는 값을 통계량 (statistic) 이라고 한다.

 

■ 추정의 오류진단과 표본추출분포

- 추계통계학은 표본의 통계량으로부터 모집단의 모수를 추정하기 때문에, 추정한 값이 오류를 내포할 가능성이 언제든 존재한다. 표본추출분포로서 모집단의 분포를 추정하며, 표본추출분포의 표준편차를 “표준오차”라고 한다.

 

• 평균의 표본추출분포 : 크기가 동일한 표본을 무한히 추출했을 때 표본평균값들의 분포 (무한하다는 것은 불가능하므로, 가설적 정의)

• 중심극한 정리(Central limit theorem)

- 크기 n의 표본을 반복적으로 추출하면 표본 평균값의 분포는 정규분포와 비슷하게 되며, 평균 u(뮤)와 표준편차 σ/√n 가 된다. 이 때의 표준편차 σ/√n 를 “표준오차”라고 부른다. 표본추출분포는 표본의 크기가 클수록 정규분포에 가깝게 되며, 보다 좁은 모습으로 나타난다.

반응형

댓글