1. 통계학이란


관심 또는 연구 대상이 되는 모집단(Population)의 특성을 파악하기 위해, 모집단에서 일부의 표본(Sample)을 수집하여 자료를 정리, 요약 그리고 분석을 통하여 모집단의 특성에 대해 추론하는 원리와 방법을 제공하는 학문입니다.

 

 

여기서 중요한 단어가 있습니다. 그 단어는 방법입니다.

'방법을 연구한다'라는 것 즉 통계학은 쉽게 말하여 도구라고 할수 있습니다.

사회현상이나 과학적현상을 관찰하고 분석하기까지의 과정을 통계학이라고 할 수 있고(단편적인 예로 남녀의 신장은 차이가 있다) 그 결과를 활용하여 다른 분야의 전문가들이 자신의 생각이나 이론을 뒷받침하고 결론을 도출해 냅니다.

 

통계학 = 수퍼서브학문 이라고 칭하고 싶습니다.

 

 

 

통계적 자료 분석은 먼저 예비조사를 통해 개념적 규정이 된 대상에 대하여 가설을 설정하고 조사를 디자인하여 조사방법을 선택합니다(탐색조사, 기술조사, 인과조사)

그 후 자료수집을 실사하고 분석을 통해 결과를 도출해내는 과정입니다.

아래의 이론들은 분석과정에서 필요한 방법들입니다.

 

1) 시공간적 및 경제적인 제약 조건들과 분석결과의 정확성을 고려하여 연구 목적에 필요한 자료와 정보를 최적의 방법으로 수집하는 것(표본추출법, 실험계획법)

 

2) 수집된 자료의 특성을 알아내기 위해 시각적인 방법과 수치적인 방법으로 자료를 정리하고 요약하는 방법(기술통계학)

 

3) 변이성이 내포되어 있는 표본을 이용하여 분석하고자 하는 연구 대상인 모집단의 성질에 대해 추론( 기술통계학; 추측통계학)

 

4) 비결정론적 현상을 수학적으로 기술하는 것을 목적으로 연구하는 방법(확률론)

 

5) 여러 단계를 거쳐 얻어진 최종 결과를 이용하여 행위에 대한 의사를 결정(의사결정론)

 

 

 

통계학에서 연구하려는 대상은 표본이 아니라 모집단입니다. 여러가지 제약조건 때문에 모집단의 전체를 직접 분석하기 어렵기 때문에 모집단에서 추출된 일부의 표본들의 특성을 유도하고 이것을 활용하여 모집단의 특수성을 추론하는 것입니다.

 

 

 

 

2. 통계 기본 용어

 

* 모집단(Population)

 - 연구의 대상이 되는 모든 개체들의 모임입니다.

 - 일반적으로 시간,공간, 경제적 제약의 문제로 모집단 전체에 관한 자료를 얻어 분석하는 방법이 불가능합니다. 하지만 요즘 빅데이터라는 방대한 자료의 수집으로 하여금 가능하게 될 것 같습니다.

예) 전국대학생집단

 

* 표본

 - 모집단에서 실제로 뽑은 측정값이나 관측값의 모임입니다.

 - 수집된 자료에는 항상 변이가 존재합니다.

 예) 대학생들에서 뽑은 1000~3000명 정도의 학생들

 

* 정규분포

 - 모집단의 분포가 어떤 모양을 하고 있던 표본의 크기가 점차 커지면(>30) 표본의 분포 를 그림으로 표현하면 모평균을 중심으로 대칭이며 종 모양(bell-shaped)의 형태와 비슷한 확률분포로 근사할 수 있습니다. 이분포를 정규분포라고 하며 통계학에서 가장 기본이 되는 확률분포 입니다. *단 정규분포의 근사 정도는 모집단의 분포모양과 표본의 크기에 관련이 있습니다.

 

 

 

* 표준정규분포

 - 평균이 0이고 분산이 1인 분포를 말합니다. 

 

-표준정규분포 그래프

 

 

 

 

* 중심극한정리

 - 평균이 μ이고 분산이 σ^2인 모집단에서 표본의 크기(n)가 30개 이상을 뽑으면 표본의 평균은 근사적으로 N( μ, σ^2/n)을 따르게 됩니다.

즉 표본평균의 분포는 n이 커짐에 따라 표준정규분포로 수렴한다는 것입니다.

 

 

다음시간에는 통계학의 기본에 대해 좀더 알아보도록 하겠습니다.
읽어주셔서 감사합니다.

 

 

 

 

 

 

블로그 이미지

다비드s

,