집단은 모집단과 표본집단으로 분류할 수 있다. 모집단은 연구대상으로 가정할 수 있는 집단의 전체를 의미하며, 표본집단은 모집단의 일부로 전체를 파악하기 위해 추출된 일부분의 집단으로 모집단을 대표할 수 있는 집단을 말한다.
예를 들어 '이종격투기 관람이 청소년들의 공격성에 미치는 영향'이라는 주제를 가지고 연구한다고 가정할 때 전국에 있는 이종격투기 관람자들은 모집단이고, 그중 대표성이 있는 집단을 선발하는 과정을 견본추출이라 하고, 선발된 집단을 표본집단이라고 한다.
모집단에서 표본집단을 추출하기 위한 몇 가지 기준을 제시하면 다음과 같다.
1) 표본추출(sampling)
표집은 확률표본추출과 비확률표본 추출로 구분된다. 다양한 표집법들이 각각 장ㆍ단점을 가지고 있으나 현실적으로 현장에 적용하는데는 어려움이 있지만 확률표집이 비확률표집보다 이상적이며 데이터의 수만 충분하면 정상분포를 이룰 수 있을 것이다.
①확률표본추출
:모집단의 개별구성요소가 표본에 포함될 확률이 동일한 표집방법으로 대표성을 추구하고자 할 때 사용한다. 전집에서 표본으로 추출된 확률이 동일하도록 하여 표본을 선정하는 방법이다.
예) 각 지역, 각 구, 각 반에서 동일하게 추출하는 것, 프로야구 관람객 전라도 100명, 경상도 100명 등 동일하게 추출
단순무선 표본추출 : 크기 N인 모집단으로부터 크기 n인 표본을 균등한 확률로써 추출하는 것을 말한다. 우선 모집단의 전체 구성요소를 파악한 후 개별요소에 대하여 일련번호를 부여하고 주사위 던지기, 난수표 이용, 추첨 등을 통해 필요한 수의 표본을 추출하는 방법이다.
체계적 표본추출 : 구성원의 명부를 이용하여 컴퓨터용지에 무작위로 번호를 선택한 다음 n번째 오는 번호를 첫 번째로 추출하고, 다음부터의 표본은 일정한 간격(표집 간격)만큼 증가시켜 가면서 표본을 추출하는 방법이다.
층화 표본추출 또는 유층 표본추출 : 무집단이 서로 상이한 겅격으로 구성된 경우 모집단을 일련의 하위집단들로 층화 시킨 다음 각 하위 집단에서 적절한 수의 표본을 뽑아내는 방법이다. 모집단을 일정한 기준에 따라 2개 이상의 동질적인 층으로 구분하고 각 층별로 단순무선 표본추출을 적용하는 방법으로 모집단에 대한 기존 지식을 이용하여 모집단을 몇 개의 소집단으로 구분하되 각 집단내의 구성요소들이 전체 모집단의 구성요소보다 더 동질적으로 구성한 후에 단순무작위추출법을 적용하므로 표본의 표준오차를 줄일 수 있고, 표본의 대표성도 높아진다.
예) 구성원의 명부를 연령, 성별, 학력, 선호스포츠, 지역, 연봉 등 여러 개의 하위집단으로 나누는 방법
집락 표본추출 : 모집단을 이질적인 구성요소를 포함하는 여러 개의 군집으로 구분한 다음 구분된 군집을 표출단위로 하여 무작위로 몇 개의 군집을 표본으로 추출하고 이를 전수조사 혹은 무작위추출하는 방법이다.
예) 전국 스포츠센터 중 몇 개의 지역 스포츠센터는 단순무선 표집을 하고, 표집된 스포츠센터의 구성원 전체를 대상으로 하는 것은 집락추출법
다단계 집락 표본추출 : 군집분류를 여러 단계에 걸쳐 분류하는 방법이다.
예) 학교급(초, 중, 고)을 먼저 초, 중, 고로 나누고, 학급별에 따라 다시 학년으로 나눈 다음, 각 학년별로 몇 개의 반을 선정하는 겨우
②비확률 표본추출
: 연구자의 자의적 기준에 따라 표본을 선정하는 방법이다. 모집단 범위를 확정하기가 불가능하거나 확정이 가능한 경우도 목록 및 명부를 입수하기 어려운 경우 사용한다.
편의 표본추출 : 연구대상을 표집하는데 있어서 우발적으로 표집 하는 우발적 표본추출과 우연적 표본추출을 포함하는 표집법이다. 손쉽게 이용가능한 대상을 선택하는 방법으로 길거리나 강의실 등 연구자가 편리한 곳에서 대상을 표집 할 수 있다. 그러나 표집 된 대상이 대표성을 가질 수 있는가에 대한 문제가 발생한다.
유의 표본추출 : 연구자의 편의에 의해 대상을 표본 추출하는 방법이다. 편의추출법과 유사하나 다른 점은 연구자가 연구의 결과를 어느정도 추측이 가능하다는 것이다.
눈덩이 표본추출 : 모집단 파악이 힘든 경우(운동선수 중 약물복용자, 여성운동 선수 중 성적인 피해를 입은 자 등) 사용하는 표집방법으로 일종의 network 추출법이라고도 한다.
예) 한 명의 금메달리스트를 만나 필요한 자료를 구한 다음, 알고 있는 다른 금메달리스트 몇 사람을 추천받아 자료를 수집
할당 표본추출 : 보집단이 갖는 특성의 비율에 맞추어 표본을 추출하는 방법이다.
예) 연령을 할당 즉, 젊은 남자 50명, 젊은 여자 50명, 장년 남자50명, 장년 여자 50명 등 대상의 25%(1/4) 표집 하는 경우
2) 표본의 크기
표본의 크기, 즉 몇 개의 표본을 추출해야 모집단을 대표할 수 있는가는 매우 중요한 문제다. 표본 수가 너무 작으면 모집단에 대한 잘못된 추정을 하기 쉽고, 반대로 표본의 수가 필요 이상으로 많으면 시간이나 비용이 과하게 든다. 일반적으로 50명 미만의 표본수는 적은 것이고, 전체 모집단의 10% 이상이 되면 많은 것이라고 할 수 있다.
그러나 표본 수가 많다고 해서 조사 결과의 신뢰성이 반드시 높은 것은 아니다. 표본을 추출할 때 대표성이 없다면 모집단에서 아무런 관계가 없는 것도 표본에서는 높은 상관을 나타낼 수도 있으므로 주의해야 한다.
표본크기를 정하는 기준은 표본 크기가 클수록 좋으나, 연구자는 현실적으로 가장 적당한 크기가 얼마인가를 결정해야 한다. Gay(1996)의 표본 크기 결정에 관한 기준은 아래와 같다.
-모집단이 작으면 (N< 100), 모집단 전체를 표집
-모집단이 약 500 정도이면, 모집단의 50%를 표집
-모집단이 1500 정도이면, 모집단의 20%를 표집
-모집단이 약 5000을 넘으면, 모집단의 크기에 관계없이 표본크기에 관계없이 표본크기는 약 400이면 된다.(설문지, 조사연구)
이상으로 집단의 표본에 관한 포스팅을 마무리하고,
다음 포스팅에선 신뢰도와 타당도 그리고 가설에 대한 정보를 다뤄볼게요!
'통계프로그램' 카테고리의 다른 글
통계프로그램 : 가설(Hypothesis) 귀무가설(영가설), 연구가설(대립가설) (0) | 2024.03.25 |
---|---|
SPSS 통계프로그램 : 척도 (명목척도, 서열척도, 동간척도, 비율척도) (0) | 2024.03.13 |
spss 통계프로그램 : 변수 (독립변수, 종속변수, 통제변수, 매개변수) (0) | 2024.03.11 |