안녕하세요 다비드s입니다. 지난 포스팅은 표본의 키기와 오차에 대해 알아보았습니다. 오차와 표본크기는 밀접한 관계를 맺고 있습니다. 그러기에 표본을 뽑는 방법 또한 중요하다고 생각합니다. 그러기에 오늘은 표본 추출방법에 대해 글을 써보도록 하겠습니다.


표본의 크기에 맞는 데이터를 얻기 위하여 채택된 표본을 추출방법에 따라 실제로 선정하는 일로 표본추출 방법은 고정 표본추출법(fixed sampling)과 축차적 표본추출법(sequential sampling)으로 구분하거나 확률표본 추출법(probability sampling)과 비확률표본 추출법(nonprobability sampling)으로 구분할 수 있습니다.


*고정 추출법

- 조사에 필요한 표본의 크기를 사전에 확정하여 추출하고 조사결과를 평가하는 방법입니다.


*축차적 표본추출법

- 신뢰구간과 같은 일정한 기준을 결정해 놓고 소규모의 표본을 추출하여 조사결과를 평가하고 그결과가 사전에 정한 기준에 미치지 못할 떄 표본의 크기를 점차적으로 증대시켜 가는 방법입니다.


설문조사에서 가장많이 쓰이는 확률표본 추출법(probability sampling)과 비확률표본 추출법(nonprobability sampling)에 대해 알아보겠습니다.





1) 확률표본추출법

조사자는 모집단의 각 구성원이 표본으로 선정될 확률을 사전에 알 수 있도록 추출하며, 그러한 확률에 따라 표본구성원이 선정되므로 표본추출에 있어서 조사자나 면접자의 주관적인 판단이 전혀 개입되지 않아야 합니다.

이 때 모집단의 각 구성원이 표본의 구성원으로 추출된다는 확률이 있는것은 무작위성에 대한 실질적인 기준이 되며, 이와 같은 방법으로 표본을 확률화하는 일은 표본자료부터 오차를 제거하지 않지만 조사자에게 생길수 있는 표본오차의 범위를 평가할 수 있도록 하며, 이는 정보를 활용하는 데에 매우 중요한 요건입니다. 확률적으로 표본을 추출하기 떄문에 사전에 알려진 확률은 여러 표본 추출법에 따라 달라지겠지만, 단순무작위 추출법에서는 모든 모집단이 동일한 확률입니다.


쉽게 설명하자면 모집단의 크기와 구성형태에 대해 잘 알고 있는 경우에 사용하는 방법으로 모집단의 리스트를 가지고 있는 경우로 추출단위가 표본으로 선정되어지는 확률을 아는 경우입니다.


(1) 단순임의추출(simple random sampling)

모집단의 각 추출단위에 일련번호를 부여하고 비복원으로 난수를 뽑아 대응되는 추출단위를 표본으로 선정하는 방법입니다.

(표본추출목록으로 부터 표본을 선정하기 위해 난수표를 작성하여 뽑는 방법; 난수표본추출방법)


(2) 집락추출(cluster sampling)

모집단을 집락으로 구성하여 먼저 집락을 추출하고 추출된 집락 내의 일부 또는 전체를 조사하는 방법입니다.

예) 시골 농가를 조사할때 면(읍)단위로 추출하는 것


(3) 층화임의추출(stratified random sampling)

모집단의 추출단위들을 서로 중복되지 않는 몇 개의 층으로 나누고 이들 각 층에서 배정된 표본을 단순임의추출법에 따라 추출하는 방법입니다.


(4) 계통표본추출(systematic random)

모집단의 추출틀에서 처음의 k(=N/n)개 단위들 중에서 랜덤하게 하나의 단위를 추출하고 그 이후 매 k번째 간격마다 하나씩 표본으로 추출하는 방법입니다.


실제 사용될 때에는 추출법들이 개별적으로 사용된다기 보다 서로 결합된 방식으로 사용됩니다.

예)  층화집락임의추출




1) 비확률표본추출법

일반적인 경우에 모집단의 수를 모르는 경우가 많고, 모집단의 리스트를 구하는 것은 매우 어렵습니다. 그러므로 추출단위가 표본으로 선정되어지는 확률을 모르며, 추출단위들이 동일한 확률로 추출되었다고 확신하기가 어렵습니다.

따라서 개별 연구자들이 시행하는 설문조사의 대부분이 비확률표본추출법이 해당됩니다. 이 방법의 대표적인 방법은 보행자 조사법인데 예를들어 쇼핑센터 앞에서 쇼핑객들의 의식을 알기위해 면접조사를 실시하는 것입니다. 이러한 조사에는 모집단 리스트가 없고, 표본이 모집단을 잘 대표하는지에 대한 불확실성이 있습니다.


이러한 비확률추출번을 이용하는 경우, 추출단위들이 동일한 확률로 추출되었다고 할 수 없기에 이론적으로 정규분포 가정에 의해서 표본자료를 분석할 수도 없고, 표본과 관련되는 표본오차를 추정할 수 없습니다. 따라서 조사결과는 표본 자체에 대한 결과로 해석되어야 하며, 원칙적으로는 모집단에 대한 일반화가 불가능하다는 사실을 염뒤해 둬야합니다.


(1) 편의표본추출

조사자의 편의에 따라 표본을 선정하는 방법입니다. 하지만 모집단에 대한 표본의 대표성을 확신할 수 없기 때문에 표본오차를 추정하고 모집단 특성에 관한 통계적 진술을 실행 할수 없습니다. 따라서 편의표본은 기술적 조사나 인과적 조사에 이용할 수 없으며, 단지 연구조사와 관련된 아이디어나 통찰을 얻거나 통계적 가설을 구성하기 위한 탐색적 조사에 사용할 수 있습니다.

예) 자료수집방법으로는 부적당하며 아이디어나 가설을 추출하기 위한 탐색적 조사연구나 설문지의 사전조사에 사용


(2) 판단표본추출

조사문제에 대해 적절한 해답을 줄 수 있다고 판단되는 전문가들을 표본으로 선정하는 방법이며, 표본은 의도에 따라 선정됩니다.
이 표본추출법 또한 표본의 대표성을 확신할 수 없기 떄문에 표본오차를 추정하거나 조사결과에 대한 일반화가 불가능 합니다. 그러나 전문가의 판단이 유효하다면 편의표본추출법보다 좋습니다.


(3) 할당표본추출

각각의 층이 전체 모집단에서 동일한 비율을 갖는 표본으로 나타나는 층화표본추출과 비슷한 추출법입니다. 다른 비확률 표본추출에 비해 추출한 표본이 상대적으로 모집단의 속성을 좀 더 많이 반영할 수 있습니다. 일정한 특성을 갖는 표본의 비율이 모집단내에서 그러한 특성을 가지는 표본비율과 유사하도록 추출하는 방법입니다.

모집단을 구성하고 있는 계층을 골고루 대표할 수 있어 대표성이 높아지지만 모집단 분류에 있어 분류자의 편견이 개입되고 Quota의 작위적 표출은 오차의 개입가능성을 증대시킵니다. 


(4) 눈덩이추출

누적표본추출이라고도 하며 연구자가 임의로 선정한 제한적 표본에 해당하는 사람으로부터 추천을 받아 다른 표본을 선정하는 과정을 되풀이 하는 것으로 눈덩이를 굴리듯 표본을 누적한다 해서 눈덩이 추출법이라고 합니다.

이 방법은 연구자가 모집단의 구성원 전부를 파악하지 못할때 적절한 방법입니다.




오늘은 표본추출방법에대해 알아보았습니다.


확률표본추출과 비확률표본추출을 상황에 맞게 적용하여 표본추출을 한다면 양질의 조사와 원하는 연구결과가 도출될 것 입니다..

오늘도 읽어주셔서 감사합니다. 이상 다비드s였습니다




'통계학_탐험기 > 통계자료분석 (Spss, Excel)' 카테고리의 다른 글

설문조사분석-4  (0) 2018.01.11
설문조사분석-3  (0) 2018.01.09
설문자료분석-2  (0) 2018.01.06
설문자료분석-1  (0) 2018.01.05
블로그 이미지

다비드s

,