확률표본추출과 비확률표본추출의 특징 및 장단점
특징
- 연구 대상의 표본프레임이 확보된 경우
- 표본프레임에서 표본이 추출될 확률이 알려져 있는 경우
장점
- 분석 결과의 일반화 확보
- 표본오차의 추정 가능
단점
- 시간과 비용이 많이 소요
- 완벽한 표본프레임을 확보하기 어려움
연구 대상의 표본프레임이 확보된 경우
비확률표본추출과 비교하여 확률표본추출의 특징 *** (또는 확률표본추출과 비교하여 비확률표본추출의 특징)
확률표본추출과 비확률표본 추출의 종류
확률표본추출: 단순무작위 추출, 계통 추출, 층화 추출, 집락 추출
비확률표본추출: 편의추출, 판단 추출, 할당 추출, 스노우볼추출
확률표본추출 | 비확률표본추출 |
연구대상이 표본으로 추출될 확률이 알려져 있을 때 사용 | 연구대상이 표본으로 추출될 확률이 알려져 있지 않은 때 |
표본 리스트가 확보되어 무작위적으로 추출 | 표본 리스트를 확보할 수 없어 작위적으로 추출 |
표본오차의 추정이 가능 | 표본오차의 추정이 불가능 |
분석결과의 일반화가 가능 | 분셕결과의 일반화에 제약이 있음 |
시간과 비용이 많이 소요 됨 | 시간과 비용이 적게 소요 됨 |
확룔표본추출법
1. 단순무작위 추출
모집단의 크기가 n개로부터 선택될 확률이 모두 동일하여, 표본의 크기가 n개만큼의 표본을 난수표 등을 이용하여 무작위로 선택하는 방법
장점 | 단점 |
- 사전 지식의 불필요 - 표본오차의 계산이 용이하다 - 확률표본추출법 중에서 가장 용이하다 |
- 모집단에 대해 가지고 있는 지식을 출분히 활용할 수 없다 - 표본의 규모가 커야한다 - 동일한 크기의 표본일 경우 층화추출법에 비해 표본오차가 크다. - 조사의 효율성이 떨어진다 |
ex) 복권추첨, 제비뽑기
2. 계통추출(체계적 추출)
수집된 표집틀(표본 리스트)을 일정한 순서로 정렬 후, 추출하고자 하는 표본 수만큼 집단으로 분할한 뒤, 첫 번째 집단에서 무작위로 추출하고, 그 이후에는 일정한 간격을 두고 표본을 선택하는 방법
장점 | 단점 |
- 선정하기 쉽고, 비용이 적게 든다 - 때로는 단순무작위보다 대표성이 좋을 수 있다. |
- 표본들의 주기성이 존재한 경우 오류가 발생할 수 있다. - 표본의 정렬 시 연구자의 편견 삽입 우려가 있다. |
3. 층화표본추출
표본틀을 어떤 기준에 따라 상이한 2개 이상의 소집단으로 분류하고, 각 소집단으로부터 무작위 표본을 추출하는 방법으로 집단 내에서는 동질적이고 집단 간에는 이질적이어야 한다.
추출방법
- 조사 대상 모집단에서 성향을 파악 후, 유사한 성향끼리의 소집단들로 나눈다.
- 각 소집단들에서 얻은 표본의 비율을 정하여 각 소집단별 표본의 수를 결정한다.
- 각 소집단별로 단순무작위표본추출법을 사용하여 표본을 추출한다.
장점 | 단점 |
- 표본의 크기가 크지 않아도 모집단의 대표성이 보장된다 - 단순무작위추출 또는 계통추출보다 불필요한 자료의 분산을 축소한다. - 집단의 각 층화집단의 특수성을 알 수 있으며 비교가 가능 |
- 모집단의 각 층에 대한정보를 필요로 한다 - 층화가 너무 복잡하거나 잘못될 경우 오히려 표본오차가 더 커 질수 있다. - 정확한 정보 확보 및 층을 분류하기 위해 시관과 비용이 증가할 수 있다. |
4. 집락표본추출
모집단 구성원 내부의 이질적인 성격을 기준으로 다수의 집락으로 구분한 다음 구분된 집락을 소수로 선정하고, 선정된 집락에서 전수조사 또는 무작위 표본을 추출한다.
장점 | 단점 |
- 모집단의 분포가 널리 퍼져있는 전국 단위 대규모 조사에 이용된다 - 모집단의 목록이 없을 때 유리하다 - 광범위한 모집단에 적용하며 비용이 절감된다 |
- 집락 내부의 이질성 확보가 어렵다 - 대표성을 희생하면서 효율성을 늘려 오차가 커진다 - 다른 표본추출법에 비해 표본수가 상대적으로 많아야 한다 |
- 표본의 크기가 동일할 때, 표본오차를 비교해보면 집락표본추출 > 단순무작위 > 층화표본추출 순이다.
단순무작위추출법의 추출과정, 장단점 및 현실적으로 적용하기 어려운 이유 ***
단순무작위추출법이란 모집단에서 표본이 선택될 확률이 동일한 경우로, 연구자의 편견, 주관 등이 개입되지 않고 표본을 선택하는 방법
1. 표본추출과정
- 모집단 선정 후 모집단에 적합한 표본프레임을 작성한다
- 표본프레임에 고유번호를 부여한다
- 추출할 표본의 크기를 결정한다
- 표본의 크기만큼 무작위로 고유번호를 추출한다
- 추출된 고유번호와 일치하는 표본프레임을 표본으로 선정한다.
2. 장점
- 모집단에 대한 사전지식이 필요하지 않다
- 추출할 기회가 동등하고 독립적으로 추출된 표본의 우연성이 낮다
- 표본오차의 계산 및 실제 적용이 용이하다
3. 단점
- 연구자가 모집단에 대한 사전 지식이 있다면 그 지식을 활용할 수 없다
- 동일한 크기의 표본이라면 층화표본추출법에 비해 표본오차가 클 수 있다.
- 층화표본추출법에 비해 표본의 규모가 커야 한다
- 모집단에 적합한 표본프레임 작성이 어렵다.
4. 현실적으로 적용하기 어려운 이유
- 모집단이 크고, 표본의 수가 큰 경우라면 조사관리 비용의 효율성이 떨어진다.
- 모집단과 완벽한 표본프레임 정보 획득이 현실적으로 어려운 경우가 많다
- 고급 확률적 표본추출법에 비해 불안정한 추정량을 제공한다.
층화표본추출법의 과정
층화표본추출법은 모집단의 리스트를 확보 후 일정한 기준에 따라 2개 이상의 집단으로 분류하고 분류된 집단에서 무작위로 표본을 추출하는 활률표본추출법이다. 2개 이상의 집단은 집단 간에 서로 성질이 다르고, 집단 내에는 동질적인 성향을 가져야 한다. 층화표본추출법의 과정은 다음과 같다.
- 조사 대상 모집단의 최신 표본틀을 확보한다
- 표본틀을 기준으로 상호 독립적이고 분류 기준으로 다수의 소집단으로 분류한다
- 각 소집단들에서 얻은 표본의 비율을 고려하여 각 소집단별 표본의 수를 결정한다
- 표본수가 결정되면, 각 소집단별로 단순무작위표본추출법을 사용하여 표본을 설정한다.
집락표분추출의 절차와 특징
1. 절차
- 모집단 내부의 이질적인 성격을 기준으로 집단간 동질, 집단 내부에는 이질적은 성향을 가지는 2개 이상 집락으로 분리한다.
- 분리된 다수 집락에서 소수의 집락을 무작위로 선정한다
- 선정된 지박의 표집틀을 확보한다.
- 확보된 표집틀에서 전수조사 또는 무작위 표본 추출을 실시한다.
장점
- 확률표본추출로 모집단을 추정할 수 있다.
- 모집단의 분포가 널리 퍼져있는 전국 단위 대규모 조사에 이용된다.
- 모집단 전체의 목록이 없을 때 유리하다.
- 광범위한 모집단에 적용하며 비용이 절감된다.
단점
- 집락 내부의 이질성 확보가 어렵다
- 대표성을 희생하면서 효율성을 증가로 표본오차를 줄이기 쉽지 않다.
- 다른 확률표본추출법에 비해 표본수가 많아야 한다.
* 층화추출과 집락추출 비교
구분 | 표본추출법 | ||
층화표본추출 | 집락표본추출 | ||
공통점 | 확률표본추출법 | ||
모집단을 다수의 하위 집단으로 나눔 | |||
차이점 | 표본추출 단위 | 하위집단의 구성요소 | 하위집단 전체 혹은 일부 |
하위집단 구성 | 동질적 | 이질적 | |
집단 간 차이 | 이질적 | 동질적 |
비확률추출법
1. 편의(임의) 표본 추출법
- 조사자의 편견, 의도를 포함하여 작위적으로 표본을 추출
- 경제적 표본 추출에 용이, 신속한 결과 도출, 탐색적 조사에 적합하단 장점이 있음
- 조사자의 편견 삽입으로 일반화가 어려우며, 표본오차의 추정이 불가능하단 단점이 있음
2. 판단(유의) 추출법
- 조사자가 특정 목적에 맞춰 편중된 표본 추출로, 대표할 것으로 예상되는 사례를 표본으로 선정
- 경제적 표본추출에 용이, 적은 수의 표본으로 모집단의 특성을 파악하고자 할 때 사용한다는 장점이 있음
- 일반화가 어렵고, 표본에 대해 심층적이며, 정확한 정보 획득이 어렵고, 표본오차의 추정이 불가능하단 단점이 있음
3. 할당추출법
- 모집단 특성을 고려하여 층화 집단을 선정하고, 층화 집단별 구성원 수에 비례하여 표본크기 할당
- 무작위 표본보다 적은 비용으로 표본추출, 집단을 대표할 수 있는 층화의 효과가 있단 장점이 있음
- 조사자가 접근하기 용이한 대상만 조사할 가능성이 있으며 집단의 특성을 제대로 파악하지 못할 경우 분류 방식에 따른 오차가 발생할 수도 있다는 단점이 있음
4. 스노우볼 추출
- 연구자가 초기 조사 대상자는 무작위적으로 선정하고, 조사 대상자로부터 추천을 받아 표본을 확대
- 접근하기 어려운 대상을 조사할수 있고, 표본 프레임이 없어도 조사 가능하단 장점이 있음
- 질적 조사 연구로, 계량화가 어려우며 추천을 제대로 받지 못하면 표본 선정에 어려움이 있단 단점이 있음
비확률추출법을 사용하는 경우
- 연구대상이 표본으로 추출될 확률을 모를 때
- 모집단에 대한 정보나 목록이 없을 떄
- 표본을 찾기 힘든 경우
- 비용과 시간이 한정적이고, 탐색적 조사에 활용할 때
응답자의 태도에 따른 응답오류 발생원인
- 민감한 개인, 윤리적인 문제에 대한 응답 회피
- 응답자의 기분, 심리상태
- 응답에 관심이 없는 비 자발적인 조사
- 응답의 장소, 시간 등에 대한 영향
- 조사원의 대응 능력 부족
- 어려운 질문 내용, 배열
설문조사에서 설문의 신뢰도를 높이기 위해 측정오차를 줄이기 위한 방법
- 이미 신뢰도가 검증된 설문 문항을 사용한다
- 사전 검사 실시하여 응답자들이 모르거나 관심 없는 항목은 제외한다
- 조사 문항이 애매모호한 측정도구는 제외한다.
- 연구목적에 맞는 측정 항목수를 증가 시킨다.
- 조사 문항에 여구자의 편견, 모호성은 제거한다.
- 측정도구의 일관성을 유지한다.
- 조사원의 철저한 교육으로 조사원에 따른 오차를 감소시킨다.
- 중요한 질문은 2회 이상 멀리 배치하여 응답자의 신뢰도를 확인한다.
모수, 통계량, 표집간격, 표집률
모집단: 연구자의 목적에 적합한 정보를 알고자 하는 대상들의 전체 집합
표본: 모집단에 관한 정보를 얻기 위해 사용되는 모집단의 일부분
모수: 모집단의 특성치, 고정된 미지의 상수
통계량: 표본들을 요약할 수 있는 대표값(= 특성치)
통계치: 통계량을 통한 표본들의 실제 값 (평균 = 3.5)
추정: 표본 통계량을 기초로 모수를 추측, 추론
추정량: 모수를 측정하기 위한 일종의 함수
표집간격: 모집단으로부터 표본을 추출할 때 추출되는 간격 (모집단 항목의 수 / 표본크기)
표집률: 모집단으로부터 개별요소가 선택될 비율
오차가 발생하는 근원
모수치와 통계치가 다른 원인은 표본오차, 측정오차에서 기인한다.
1. 표본오차
조사대상 전체 중 일부만을 표본으로 선정함에 따라 발생하는 표본추출과정에서 발생하는 오차
모집단과 표본의 차이로 인해 발생하는 오차
최대한 확률표본추출을 이용하여 표본 오차를 줄임
2. 비표본오차
조사준비 과정, 실제 조사, 자료집계 및 자료처리 과정에서 발생하는 오차
- 체계적 오차 : 측정할 때 의도적 혹은 측정도구 자체에 문제가 있어서 특정한 방향성을 띄고 측정이 잘못되어 발생하는 오차
- 비체계적 오차 : 편향된 것이 아니라 다양하게 분산되어 무작위적으로 발생하는 오차
3. 측정 오차
실제값과 측정값과의 차이
- 측정 대상자 요인: 측정 대상자의 기분, 심리상태, 피로도, 건강상태
- 측정 환경 요인: 측정 장소, 측정 시간 등이 측정에 영향
- 측정 도구 요인: 측정 방법의 부적절성, 측정 항목의 불완전성, 용어의 불명확성 등에서 실제 값과 차이가 발생
표본틀, 표본오차, 비표본오차의 발생 원인과 최소화하기 위한 방법
1. 표본틀
모집단 내에 포함된 조사대상자들의 명단, 주소 등 정보가 수록된 목록을 말하며, 연구 목적에 맞는 최신의 표본틀 확보가 중요하다.
2. 표본오차
표본오차
표본오차는 모집단으로부터 표본을 추출하는 과정에서 표본집단이 모집단을 정확히 반영하지 못하는 데서 발생하는 오차로서, 표본조사에서만 발생하고, 전수조사에서는 발생하지 않는다.
감소방법
- 완전히 억제하기란 불가능하므로 오차의 범위를 제시한다.
- 가능하면 표본의 크기를 크게 하는 것이 효과적이다.
- 모집단을 잘 설명할 수 있는 표본프레임을 결정한다.
- 목적에 맞는 표본설계를 통해 표본을 추출해야 한다.
- 모집단의 성향을 파악하여, 연구 목정게 맞는 조사 설계를 해야 한다.
3. 비표본 오차
비표본오차는 조사대상자로부터 자료를 수집하는 과정에서 발생되는 측정오차이다.
비표본오차의 종류
- 체계적 오차: 측정할 때 의도적 혹은 측정도구 자체에 문제가 있어서 특정한 방향성을 띄고 측정이 잘못되어 발생하는 오차로 타당도와 반비례의 관계가 있다.
- 비체계적 오차: 편향된 것이 아니라 다양하게 분산되어 무작위적으로 발생하는 오차로 신뢰도와 반비례의 관계가 있다.
- 조사설계상의 오차: 잘못된 선정, 성숙, 역사, 선발, 검사, 회귀, 상실 등이 있다.
- 현장조사상의 오차: 면접, 관찰, 실태조사 등 조사원과 응답자 간 발생하는 차이이다.
- 자료처리상의 오차, 코딩, 펀칭, 분석 등에서의 오차가 있다.
- 무응답의 오류: 표본의 일부가 응답을 거부하여 발생한다.
비표본오차 발생원인
- 측정대상자의 요인: 측정 대상자의 기분 및 심리상태, 피로도, 건강상태, 표본 대상의 쏠림 등에 따라 측정에 영향을 줄 수 있다.
- 측정자 요인: 측정자의 성별, 외모, 말투, 신분 등에 따라 측정에 영향을 줄 수 있다.
- 측정환경의 요인: 측정장소, 주변 환경, 시간 등이 측정에 영향을 미칠 수 있다.
- 측정도구의 요인: 측정방법, 측정항목, 용어, 단어, 계측기 등 측정 도구에 의한 오차가 발생할 수 있다.
- 불명확한 범위: 조사/측정 범위가 불명확하거나 측정이 불가능 할 경우에 비표본오차가 발생한다.
- 잘못 된 인용 정보 및 근사값: 인용한 정보에서의 오류, 소수점 반올림이나 단위등의 근사값에 따른 오차가 발생할 수 있다.
비표본오차 감소 방안
- 조사원의 응대 및 교육을 한다
- 설문지 배열, 문구 고려한다
- 응답자의 기분, 심리, 피로도 등을 고려한다.
- 응답의 환경을 통제한다.
- 1회 이상의 검증, 다수의 관찰자를 투입하여 조사원에 의한 오차를 감소한다.
- 편견이 담긴 언어는 사용하지 않으며, 응답자가 이해할 수 있는 언어를 사용한다.
- 조사원들을 사전에 훈련하여 응답자가 질문의 뜻을 잘 이해하도록 한다.
- 관찰을 통한 조사라면 관찰 당하고 있다는 사실을 모르도록 한다.
- 조사자의 주관적 해석 금지: 응답자의 내용을 조사원이 작위적으로 해석한다는 것으로 실제 응답자의 내용의 왜곡은 철저하게 금지해야 한다.
표본오류, 비표본오류, 불포함오류, 무응답오류
1. 표본오류
- 표본오차는 조사대상 전체 중 일부만을 표본으로 선정함에 따라 발생하는 오차로 표본 조사 시에는 반드시 발생하는 오차이며, 통계량들이 모수 주위에 분산되어 있는 정도로 분산이 작을수록 표본오차는 작아진다.
- 표본오차의 원인을 살펴보면, 표본의 크기에 대한 조건을 만족시키지 못해서 발생하는 것이 대표적인 원인이다.
- 일반적으로 표본의 크기가 커지면, 대표성이 높아져 표본오차는 감소되고, 비표본오차는 증가한다.
- 표본오차에 영향을 주는 요인으로는 분산의 정도, 표본설계, 표본의 크기, 모집단의 특성 등이 있다.
- 표본오차 발생 억제 방법으로는 완전히 억제하기란 불가능 하기 때문에 오차의 범위를 제시하게 된다.
2. 비표본오차
- 조사준비 과정, 실제 조사, 자료집계 및 자료처리 과정, 측정과정에서 무작위로 발생하는 오차
- 체계적 오차
- 측정할 때 의도적으로 혹은 측정도구 자체에 문제가 있어서 특정한 방향성을 띄고 측정이 잘못되어 발생하는 오차로 타당도와 관련이 있다.
- 비체계적 오차
- 편향된 것이 아니라 다양하게 분산되어 무작위적으로 발생하는 오차로, 신뢰도와 관련이 있다.
- 조사설계상 오차
- 표본조사 시 표본체계가 완전하지 않아 발생하는 오류
- 표본추출방법이 모호할 경우 발생하며, 직접 발견이 어려움
- 통제가 어렵고, 오류라는 확증을 얻기 어려움
- 오류를 줄이는 방법: 타 조사결과의 비교, 전문가 경험 의존
- 무응답오류
- 표본의 일부가 응답을 거부하여 발생하는 오류
- 조사 결과의 타당성에 영향
- 응답거부인지, 문제를 이해하지 못했는지, 정말 모르는 것인지 여부 파악 어려움
- 응답자와 무응답자 간의 특성을 고려하여 분석/해석 시 유의
- 무응답오류를 줄이는 방법
- 이미 검증된 조사 문항 사용
- 사전 검사 실시로 무응답 문항의 수정, 제거
- 사전 검사 후 응답의 포괄성, 상호배타성 검증
- "응답 거부"라는 문항을 포함하여 체계적 자료 수집
- 현장조사에서의 오류
- 면접, 관찰과정에서 조사원과 응답자 간의 차이에서 발생하는 오류
- 오류를 줄이는 방안
- 응답자들과 유사한 성향을 띄고 있는 조사원 선정
- 면접능력과 경험이 풍부한 조사원 선정
- 충분한 래포, 응답 환경 형성
- 자료기록 및 처리상 오류
- 자료기록 시 조사원의 편견 삽입, 자료 입력 시 응답자의 실제 응답과 차이가 발생하는 오류
- 오류를 줄이는 방법
- FGI, 면접 조사의 경우 동영상 촬영을 통해 확인
- 동일 응답지를 2인에게 입력하여 그 결과를 비교
- 스프레드시트르르 활용하여 입력 상 오류, 이상치, 계산의 착오 찾아냄
- 무작위로 실제 응답자의 전화 조사를 통해 응답 내용과 확인
신뢰구간을 이용하여 표본의 크기를 구하는 의미 및 표본 크기를 정하는 절차
1. 신뢰구간을 이용한 표본의 크기를 구하는 의미
전수조사는 관심 대상인 모든 개체를 조사하는 방법이며, 표본조사는 관심의 대상이 전체 집단 중 일부를 선택하여, 이를 조사 후, 그 결과를 일반화하여 모집단의 특성을 추정한다. 표본조사는 비용이 절감되고, 비표본오차가 감소하고, 신속한 조사가 가능하다는 장점이 있다. 이와 같이 표본 조사를 실시하면, 표본을 활용한 모집단을 추측하는 추정 과정이 필요하며, 모수가 포함되리라 기대되는 구간을 설정하는 구간 추정을 사용한다. 표본조사를 실시하면 표본오차가 발생하며, 이러한 표본오차를 완벽하게 통제하기가 어려워 오차범위를 제시하게 된다.
신뢰구간과 표본의 크기는 1/√n 의 관계를 가지게 되는데 즉, 표본의 크기가 커질 수록 신뢰구간이 좁아지면서 추정의 정확성이 높아짐을 의미한다.
2. 표본의 크기를 정하는 5단계 절차
표본의 크기가 증가되며, 표본오차는 감소되지만, 비표본오차가 증가되며, 표본의 크기가 작으면 대표성에 문제가 발생하므로 적절한 표본의 크기를 결정해야 한다.
- 오차의 한계(최대허용오차 결정): 최대오차 한계인 d를 결정한다.
- 신뢰수준 z결정: 신뢰수준이 커질수록, 표본의 크기는 커져야 한다.
- 모분산 결정: 모분산이 작다는 것은 산포가 작다는 의미로, 표본의 크기는 작아진다. 모분산이 커지게 된다면 대표성확보를 위해 많은 수의 표본을 추출해야 한다.
- 모집단의 크기: 모집단의 크기가 크다면, 표본의 크기가 커야 한다.
- 표본의 크기 결정: 최종적으로 표본의 크기를 결정한다.
'Study > Etc' 카테고리의 다른 글
칼럼일기 (0) | 2023.07.09 |
---|---|
[사조사]사회조사분석사 2급 필답형 - Chapter 7-8. 질문지 설계 & 조사 관리 (0) | 2021.07.06 |
[사조사]사회조사분석사 2급 필답형 - chapter 5. 측정과 척도 (0) | 2021.07.05 |
[사조사]사회조사분석사 2급 필답형 - chapter 4. 자료수집방법 - 2 (0) | 2021.07.04 |
[사조사]사회조사분석사 2급 필답형 - chapter 4. 자료수집방법 - 1 (0) | 2021.07.02 |