이슈2023-04-25 19:28

【신창운의 여론다움 (9)】비확률 표집, “미안하다”

여론조사 역사는 표본추출 및 선거 예측 실패의 역사라 할 수 있습니다. 1936년 랜던 후보가 루즈벨트를 이길 거라고 리터러리 다이제스트가, 1948년 듀이 후보가 트루먼을 물리칠 것이라고 갤럽이 각각 잘못 예측한 건 모두 비확률적 방식에 의한 표본추출 때문이었습니다.  해리 트루먼 미국 대통령이 1948년 11월 4일 미주리주 세인트루이스에서 자신이 대선에 패했다는 대형 오보를 낸 시카고 데일리 트리뷴을 들어 보이며 웃고…

신창운

여론조사 역사는 표본추출 및 선거 예측 실패의 역사라 할 수 있습니다. 1936년 랜던 후보가 루즈벨트를 이길 거라고 리터러리 다이제스트가, 1948년 듀이 후보가 트루먼을 물리칠 것이라고 갤럽이 각각 잘못 예측한 건 모두 비확률적 방식에 의한 표본추출 때문이었습니다. 

해리 트루먼 미국 대통령이 1948년 11월 4일 미주리주 세인트루이스에서 자신이 대선에 패했다는 대형 오보를 낸 시카고 데일리 트리뷴을 들어 보이며 웃고 있다.
해리 트루먼 미국 대통령이 1948년 11월 4일 미주리주 세인트루이스에서 자신이 대선에 패했다는 대형 오보를 낸 시카고 데일리 트리뷴을 들어 보이며 웃고 있다.

‘1노3김’이 대결했던 1987년 한국 대선에서 김영삼 김대중 두 후보가 패배한 데엔 여러 가지 이유가 있지만, 표본의 대표성을 무시했던 측면도 있습니다. 2010년 지방선거 때 광역단체장 당선자 예측 실패 역시 비확률적 표집이 주요 원인 중 하나였습니다. 

조사방법 전공자들은 워낙 비확률적 표집에 대한 회의적 시각으로 출발합니다. 비확률적 표본추출에 기반한 예측 실패 역사를 통해 일종의 트라우마가 생긴 셈이죠. 그 결과 확률적 표본추출에 지나치게 집착하는 부작용이 나타난 반면, 다른 한편으로 비확률적 표집, 즉 응답자 선정 과정에서 엄격한 확률에 기초하지 않을 경우 자료의 질은 물론 그로부터 배울 게 없다는 인식이 널리 퍼졌습니다.               

그러나 표본추출과 관련된 교훈을 단순하게 받아들여선 곤란합니다. 실제로 확률적 표집은 여러 가지 난관에 빠져 있습니다. 이론적 가능성에 비해 실행이 어렵고 적지 않은 비용을 필요로 합니다. 10% 미만의 응답률은 엄격한 확률적 표집을 민망하게 만들고 있고요. 

이에 반해 비확률적 표집 쪽에선 흥미로운 발전이 보고되고 있습니다. 적절한 추가 분석, 가령 사후 층화(Post-stratification) 등을 통해 정확한 추정치 산출이 가능했다는 연구가 적지 않습니다. 게다가 비확률적 표집은 더 쉽고 빠르며 더 저렴하고 점점 발전하고 있습니다. 조사 횟수를 늘릴 수 있고 표본 크기가 더 커지며, 사회적 맥락 및 하위 집단 특성도 쉽게 파악할 수 있답니다. 

저만 그런 건 아니겠죠. 비확률적 표집에 대한 선입관과 오해에서 벗어나고 싶습니다. 비확률적 표집으로 전향하겠다는 건 아니지만, 본의 아니게 무시하거나 평가 절하했던 점을 반성하고 또 사과하고자 합니다. 

관련 태그:
공유하기:

관련 기사