'모집단'에 해당되는 글 2건







 안녕하세요 다비드s입니다. 계속적으로 선문조사에 필요한 이론을 알아보고 있습니다. 그전 포스팅에서 조사방법까지 알아보았다면 오늘은 설문조사에서 발생되는 오차와 설문조사분석을 위해 필요한 표본의 크기에 대해 알아보도록 하겠습니다.



1) 오차


 표본의 크기는 조사의 정확성을 어느 수준으로 할 것인가(즉, 오차를 어느 정도로 할 것인가)에 따라 결정됩니다(인적, 물적자원 등 상화에 따라 결정되기도 함). 따라서 오차를 먼저 설정하느냐에 따라 표본의 크기가 결정됩니다.

조사에서 오차는 항상 발생된다고 보셔야 합니다.


오차의 발생원인은 여러 가지 요인이 있으며, 오차는 크게 표본오차(sampling error)와 비표본오차(non-sampling error)로 나눌수 있습니다.


대부분의 조사에서 모집단 전체를 조사하는건 불가능 합니다. 그래서 그 일부인 표본을 조사하여 모집단의 특성을 추정하는데, 이렇게 전체를 다 조사하지 않고 그 일부인 표본만을 조사하여 모집단의 특성을 추정하기 때문에 발생하는 오차를 표본오차(sampling error)라고 합니다.


*전수조사는 모집단 전체를 조사하는 것이며 표본조사는 모집단의 일부를 조사하는 것입니다. 따라서 전수조사에서는 표본오차는 발생하지 않습니다. 그러기에 표본의 크기를 증가시면 오차는 감소하게 됩니다.


이에 반해, 비표본오차(non-sampling error) 실제 조사나 집계, 분석에서 일어나는 오차(; 회답오차, 무회답오차, 표본선출의 오차 등)를 말합니다. 
예를 들어 응답자가 거짓으로 답하거나, 무응답 또는 표본을 잘못 뽑았을때 발생하며 이 외에도 설문지 응답오류, 자료 입력 및 처리 오류 등으로 발생되는 경우가 있습니다. 따라서 비표본 오차는 표본조사나 전수조사 둘다 발생하며 일반적으로 전수조사에서 더 크게 발생합니다.


표본을 조사하는 것보다 모집단 전체를 조사하는 것이 훨씬 정확하며 표본조사를 불신하는 경향이 있지만 정치적으로 이용하고 시각화로 왜곡시키지 않는다면 믿어도 된다고 생각되어지며 일반적으로 조사 대상수를 늘리면 표본오차는 감소하지만 비표본오차는 증가하기에 합리적인 방법을 선택하는게 좋습니다.



2) 표본의 크기


표본의 크기는 조사의 정확성을 어느 수준으로 할 것인가 즉 오차를 어느 정도로 할 것인가에 따라 결정됩니다. 설문조사는 모비율(p)를 추정하고자 하는 경우가 대부분이므로 모비율 추정시 표본의 크기를 결정하는 방법이 있는데 두가지가 있습니다.





모집단 크기가 100,000이 넘으면 대규모 집단으로 간주할 수 있으며, 모집단 크기가 50,000만 넘어도 표본 크기는 거의 변하지 않습니다.



제가 표본크기 구할때 쓰는 엑셀입니다. 파일을 첨부하니 표본을 쉽게 구하실수 있습니다.




표본크기 구하기.xlsx





오늘도 끝까지 읽어주셔서 감사합니다. 이상 다비드s였습니다.~!!







'통계학_탐험기 > 통계자료분석 (Spss, Excel)' 카테고리의 다른 글

설문조사분석-5  (0) 2018.01.12
설문조사분석-3  (0) 2018.01.09
설문자료분석-2  (0) 2018.01.06
설문자료분석-1  (0) 2018.01.05
블로그 이미지

다비드s

,

 

 

 

 

1. 통계학이란


관심 또는 연구 대상이 되는 모집단(Population)의 특성을 파악하기 위해, 모집단에서 일부의 표본(Sample)을 수집하여 자료를 정리, 요약 그리고 분석을 통하여 모집단의 특성에 대해 추론하는 원리와 방법을 제공하는 학문입니다.

 

 

여기서 중요한 단어가 있습니다. 그 단어는 방법입니다.

'방법을 연구한다'라는 것 즉 통계학은 쉽게 말하여 도구라고 할수 있습니다.

사회현상이나 과학적현상을 관찰하고 분석하기까지의 과정을 통계학이라고 할 수 있고(단편적인 예로 남녀의 신장은 차이가 있다) 그 결과를 활용하여 다른 분야의 전문가들이 자신의 생각이나 이론을 뒷받침하고 결론을 도출해 냅니다.

 

통계학 = 수퍼서브학문 이라고 칭하고 싶습니다.

 

 

 

통계적 자료 분석은 먼저 예비조사를 통해 개념적 규정이 된 대상에 대하여 가설을 설정하고 조사를 디자인하여 조사방법을 선택합니다(탐색조사, 기술조사, 인과조사)

그 후 자료수집을 실사하고 분석을 통해 결과를 도출해내는 과정입니다.

아래의 이론들은 분석과정에서 필요한 방법들입니다.

 

1) 시공간적 및 경제적인 제약 조건들과 분석결과의 정확성을 고려하여 연구 목적에 필요한 자료와 정보를 최적의 방법으로 수집하는 것(표본추출법, 실험계획법)

 

2) 수집된 자료의 특성을 알아내기 위해 시각적인 방법과 수치적인 방법으로 자료를 정리하고 요약하는 방법(기술통계학)

 

3) 변이성이 내포되어 있는 표본을 이용하여 분석하고자 하는 연구 대상인 모집단의 성질에 대해 추론( 기술통계학; 추측통계학)

 

4) 비결정론적 현상을 수학적으로 기술하는 것을 목적으로 연구하는 방법(확률론)

 

5) 여러 단계를 거쳐 얻어진 최종 결과를 이용하여 행위에 대한 의사를 결정(의사결정론)

 

 

 

통계학에서 연구하려는 대상은 표본이 아니라 모집단입니다. 여러가지 제약조건 때문에 모집단의 전체를 직접 분석하기 어렵기 때문에 모집단에서 추출된 일부의 표본들의 특성을 유도하고 이것을 활용하여 모집단의 특수성을 추론하는 것입니다.

 

 

 

 

2. 통계 기본 용어

 

* 모집단(Population)

 - 연구의 대상이 되는 모든 개체들의 모임입니다.

 - 일반적으로 시간,공간, 경제적 제약의 문제로 모집단 전체에 관한 자료를 얻어 분석하는 방법이 불가능합니다. 하지만 요즘 빅데이터라는 방대한 자료의 수집으로 하여금 가능하게 될 것 같습니다.

예) 전국대학생집단

 

* 표본

 - 모집단에서 실제로 뽑은 측정값이나 관측값의 모임입니다.

 - 수집된 자료에는 항상 변이가 존재합니다.

 예) 대학생들에서 뽑은 1000~3000명 정도의 학생들

 

* 정규분포

 - 모집단의 분포가 어떤 모양을 하고 있던 표본의 크기가 점차 커지면(>30) 표본의 분포 를 그림으로 표현하면 모평균을 중심으로 대칭이며 종 모양(bell-shaped)의 형태와 비슷한 확률분포로 근사할 수 있습니다. 이분포를 정규분포라고 하며 통계학에서 가장 기본이 되는 확률분포 입니다. *단 정규분포의 근사 정도는 모집단의 분포모양과 표본의 크기에 관련이 있습니다.

 

 

 

* 표준정규분포

 - 평균이 0이고 분산이 1인 분포를 말합니다. 

 

-표준정규분포 그래프

 

 

 

 

* 중심극한정리

 - 평균이 μ이고 분산이 σ^2인 모집단에서 표본의 크기(n)가 30개 이상을 뽑으면 표본의 평균은 근사적으로 N( μ, σ^2/n)을 따르게 됩니다.

즉 표본평균의 분포는 n이 커짐에 따라 표준정규분포로 수렴한다는 것입니다.

 

 

다음시간에는 통계학의 기본에 대해 좀더 알아보도록 하겠습니다.
읽어주셔서 감사합니다.

 

 

 

 

 

 

블로그 이미지

다비드s

,