PGR21.com
- 자유 주제로 사용할 수 있는 게시판입니다.
- 토론 게시판의 용도를 겸합니다.
Date 2017/04/09 18:46:12
Name 김테란
Subject [일반] 여론조사에 대한 오해
선거게시판에 한 보수후보의 지지율 예측에 대한 논의가 있었습니다.
그 중에 일부 근거로 11월 당시 조사간 국정지지율에서 5%이상씩 차이나는 것을 보니 갤럽조사가 전화면접이라 샤이층을 제대로 잡지 못한다였고,
전화면접과 ARS간에도 샤이층에 의한 영향이 이정도니 여론조사 자체의 샤이층에 의한 영향까지 더하면 실제 차이는 10% 이상일 것이다를 바탕으로 논지를 펴나갔습니다.
실제로 갤럽의 조사가 11월~12월9일 당시 국정운영 지지율 5% 4회, 4% 2회였는데 리얼미터 조사는 9.7%~11.5%였습니다.
갤럽의 경우는 전화면접 100%고 리얼미터는 ARS가 일부 섞여있음에 불과함에도 5%이상씩 차이나는 것이 아니냐로 부터 출발하는데
당시 TV에서 많은 패널들이 샤이층의 영향을 너무 과다한거 아닌가 싶게 부풀렸죠.

이 글에선 여론조사에 대한 이해를 돕기 위해 간단한 분석부터 시작해보려 합니다.
1.전화면접조사는 실제로 ARS에 비하여 어느 한측의 과다하게 숨은 샤이층때문에 왜곡이 심각한 정도인가
2.여론조사는 실제로 샤이층의 영향때문에 10% 이상씩 보정해야할 정도로 편향되어있는가

일단 샤이층의 영향에 자체에 대해선 부정하진 않습니다.
뭐 딱히 부끄러워서 뿐 아니라 그냥 프라이버시니까 말하기 꺼려하는 사람도 어느 측에나 있는 것이고 여론조사에선 이를 잡아내기 어렵다는 것은 사실이며,
다만 그게 여론조사가 무의미할 정도로 어느 한쪽으로 쏠린채로 1/5,1/10씩 되는가와 추정불가하기에 대충 막 떠벌려도 되는 것인가가 중요한거겠죠.
이를 분석하기 위해서 여론조사 심의위원회의 홈페이지에 가서 3월부터 최근 한달여간 조사들을 살펴봅니다.
샤이층의 영향을 분석하기 위한 가장 강력하고도 유일한 단서는 18대 대선 투표후보 질문인데요,
누구를 지지한다,지지했다,찍었었다 등을 말하는게 부끄럽다에서 출발하는게 샤이층 영향에 대한 논리이기 때문이죠.
약 40일간의 조사만 일일이 통계분석표를 보는데도 시간이 꽤 걸립니다. 10개 정도씩 12페이지던가였으니 120개정도 열어서 살펴봤더니,
최근에 좀 더 집중되게 11개가 나오더군요. 2배쯤 되었으면 그 정도로 분석하겠는데 좀 아쉽네요.
이전으로 갈 수록 빈도는 적어지겠으나 어차피 다 열어서 확인해봐야 하니 11월~2월 4배되는 기간을 다 열어보는데는 4배 가까운 시간이 더 걸릴겁니다.
이는 비효율적이라 판단하여 40일간 18대 대선질문 있던 조사기관으로 검색하여 11~2월의 자료들을 모아봅니다.
혹시 모르니 해당조사업체들의 작년 5~10월 조사결과들까지 다 살펴봅니다.
이리하여 엑셀에 조사일시,조사업체,무선비율,ARS비율,당시A후보,당시B후보,그외(기타,비투표,무응답등)으로 테이블을 작성하여 총 29개(9,10월조사 제외 26개)를 모았습니다.

직관적으로 이해하실 수 있도록 18대 대선후보 투표 질문 자료수가 많고 무선비율도 다양한 편인 한 업체의 데이터 몇개를 보여드리겠습니다.

3/24~25 한국사회여론연구소(무선 80% 전화면접 100%) A후보 364 B후보 396 기타 79 비투표/무응답등 170
3/10~11 한국사회여론연구소(무선 78% 전화면접 100%) A후보 399 B후보 364 기타 74 비투표/무응답등 191
2/24~25 한국사회여론연구소(무선 77% 전화면접 100%) A후보 391 B후보 409 기타 65 무응답등 182
2/17~18 한국사회여론연구소 (무선 58% 전화면접 100%) A후보 402 B후보 360 기타 84 무응답등 167
2/3~4 한국사회여론연구소 (무선 62% 전화면접 100%) A후보 392 B후보 376 기타 93 비투표/무응답등 198

언뜻 봐도 무선비율에 의해 크게 좌우되며, 한쪽으로 극히 편향되어 있지 않습니다.
이제 통계분석할 차례인데요, ARS에 대해선 한업체의 무선ARS 100%에 완전 집중되어 있는데다 데이터수도 적어서 다원분석해도 무용해 보입니다.
그러니 다른 통계프로그램까진 필요없고, 그냥 엑셀로 회귀분석해보면 되겠네요.
오차항column=0.518-A후보/(A후보+B후보)을 만들어 y로 현재 정례조사를 활발히 하는 조사업체의 무선비율(0.85)과의 차이를 x로 놓고 돌립니다.

hDFYrzY.png

무선조사 비율에 대해 유의하고, 18대 대선 후보투표비율과 3.28%정도 차이나는 결과가 나오네요.

ARS의 영향도 살펴봐야 하니 무선ARS 100%의 영향을 빼고 한번 보죠, 해당하는 4개의 데이터를 빼고 다시 회귀분석해봅니다.

WhK6Ec1.png

여전히 무선조사 비율에 대해 유의한데, 유의한 정도가 좀 줄었고 18대 대선 후보투표비율과 차이도 좀 줄은 2.89% 결과가 나오네요.
유의도가 줄은 것은 명확한 차이를 보여주는 무선100%의 점들이 빠졌기 때문이며,
y절편이 줄을 수 있는 이유는 두가지입니다, 무선조사를 100%로 하면 영향이 급격해지거나 ARS조사는 예상했던것과 달리 샤이층을 잡아주는 영향이 아닌 반대영향을 갖는다.
저는 후자는 존재한다 단정할 수 없고, 만일 있다해도 상대적으로 미미하며, 전자의 영향이 훨씬 크다 봅니다.
후자에 대해서 제대로 분석하려면 무선ARS 100%에 밀집된 소수가 아닌 고르게 분포된 더 많은 데이터들을 필요로 하는데, 이건 현재 그만큼 존재하질 않습니다.
어찌되었건 여기까지 실제민심-유무선복합전화면접이 2.89% 수준임을 알 수 있게 되었네요.
이는 현재 무선85% 전화면접 조사일 경우 18대 대선때 A후보에 투표했던 유권자가 51.8%가 아닌 49%정도로 잡힌다는 뜻입니다.

한가지 더, 그럼 무선조사비율 몇%일때 18대 대선투표의 실제결과와 가장 근접하겠는가,
오차항을 x로 무선조사비율을 y로 놓고 회귀분석합니다.

c8hYrE6.png

57%일 때 가장 근접한다는 결과가 나왔네요.
무선비율을 더 높여야 한다는 소리가 많음에도, 요즘 무선비율 60%정도인 조사들 또한 꽤 있는 것은 다 이유가 있는 것입니다.
그럼 57%일 때 가장 정확한 선거결과 예측을 할 수 있다는 것인가,
그렇진 않습니다. 선거예측에 필요한 표본은 투표의욕도 포함되기 때문에 보수측의 숨기는 비율이 더 많다해도 그것에 집중할 필요는 없습니다.
평시 표본구성에 가장 자연스러운 비율로 구성하는게 더 정확한 선거결과 예측이 가능하고,
이와 같은 분석으로 상대적인 샤이층의 폭이 얼마나 되는가를 무선비율이 다른 조사들을 봐가며 같이 파악해주면 되는 것이죠.

그럼 11월 이후로 원래는 진보샤이층이 더 많은게 정상(?)인건데, 보수샤이층이 급증한 것은 사실인가, 아쉽게도 그걸 분석하는데 필요한 조사결과가 별로 없습니다.
딱 3개 있는데요, 일단 리서치뷰의 2개를 보면

10/31 리서치뷰(무선ARS 100%) A후보 54.0%
9/28~29 리서치뷰(무선ARS 100%) A후보 58.7%

급증한 것처럼 보입니다, 헌데 2개뿐이라서 진짜 그런건지 신뢰도를 부여하기엔 턱없이 부족하죠.
헌데 이를 보면 오히려 ARS조사가 샤이층을 더 잘 잡아내는 것이 맞긴 한 것인지 의구심이 듭니다.
물론 이 역시도 이것만으론 알 수는 없으며, 나머지 1개를 보면 또 별 차이 없습니다.

10/29~30 엠브레인 (무선 51% 전화면접 100%) A후보 49.1%

결론을 정리하자면, 최근 7개월~1년의 상대적 샤이층을 파악할 수 있는 조사들을 바탕으로 분석해본 결과
1.전화면접조사라 해서 ARS에 비해 샤이층이 5%p이상씩 차이나지 않으며, 현 통계상으론 데이터 부족으로 그에 대한 상관관계를 찾을 수 없다. 4개 데이터만으로도 무선 2~40%증가에 의한 편향증가는 두드러지는데 반해 ARS 100% 증가의 영향은 보이지 않는다. ARS가 샤이층을 잡아내는데 설령 효과가 있더라도 몇%p를 논할 정도는 아닌것으로 보인다.
2.실제민심과 전화면접조사간 역시 10%p이상씩 차이나는 것은 아니며, 무선비율에 따라 크게 좌우되는데
무선 85%를 기준으로 18대 대선 당시 A후보를 찍었던 보수층은 51.8%가 아닌 49%정도로 잡힌다.
무선 85%가 표본구성상 가장 적절한 비율이 맞다면 현재 샤이층은 약간이지만 보수쪽에 더 많이 존재하는 것은 사실이다.
3.그렇다해서 무선비율 57%가 정확하다는 것은 아니며, 선거결과 예측을 위해선 투표의욕까지도 포함되어야하니
현재 진보보다 보수의 샤이층이 다소 더 많음을 인정한다면 무선비율 57%는 절대적 기준이 아닌 무선비율이 최소한 이정도는 되는게 좋겠다는 기준이 될 수 있다.

그 다음 얘기할 것은 그럼 갤럽조사는 왜 11월에 5%넘게 차이났는가와 여론조사를 대하는 자세 등인데,
11월에 차이난 이유까진 설명해야 의문에 대해 일단락 되지만, 너무 길어져서 그건 다음으로 넘겨야겠네요.

통합규정 1.3 이용안내 인용

"Pgr은 '명문화된 삭제규정'이 반드시 필요하지 않은 분을 환영합니다.
법 없이도 사는 사람, 남에게 상처를 주지 않으면서 같이 이야기 나눌 수 있는 분이면 좋겠습니다."
블랙번 록
17/04/09 19:03
수정 아이콘
브렉시트, 트럼프 사레는 암만봐도 해석하는 사람들 문제고
정말 틀린 건 한국 총선 밖에 없다는 느낌이.
와룽놔와와
17/04/09 19:36
수정 아이콘
근데 그 총선에서도 여론조사가 진행은 되지만 발표는 안되는 기간 깜깜이 기간이라고 하나요?
무튼 그 시기 동안 굉장히 많은 변동이 있었고 그 시기 여론조사 결과에선 거의 다 맞았다고 선거 후 뉴스에서 봤었는데
아니었나요?
김테란
17/04/09 19:41
수정 아이콘
그 이유를 간략히 말씀드리자면 총선때는 업체들의 무선조사가 사실상 불가능에 가까웠고,
폭발하는 지역수요때문에 별의별 업체들이 순간 난립합니다.
말씀하신 이유도 포함되구요. 다음편에서도 일부 관련된 얘기들이 포함될거니 여기까지 말씀드립니다.
마스터충달
17/04/09 21:33
수정 아이콘
음.. 그럼 샤이 지지층의 실체는 어디서 확인할 수 있을까요?

아! 그리고 좋은 글 감사합니다.
김테란
17/04/09 21:48
수정 아이콘
무선85% 기준으로 현재 진보에 비해 위에 언급한 만큼 정도 더 되는 보수샤이층의 실체는
이후 추이에 따라 여론조사상에서 나타날 수도 아닐수도, 당장의 선거에 나타날 수도 아닐 수도 있죠.
그들이 수면위로 나오면 통계상 잡히는거고 아니면 안잡히는 그건 어쩔 수 없는거구요,
때에 따라선 진보 샤이층(무조건 부끄럽다는 의미만은 아닌)이 더 많아질 수도 있긴 하지만
그런 상황까지 넘어가려면 그걸 알게 해주는 과정 또한 보일거구요.
마스터충달
17/04/09 21:52
수정 아이콘
음... 저는 이 글을 읽고 나니 샤이 지지층이 과연 존재하는 지 의구심이 들었습니다. 솔직히 샤이 박근혜 얘기 나왔을 때 어이가 없었거든요;;; 그런데 이렇게 분석한 글을 보니 과연 샤이 지지층이라는 게 유의미한 넘버를 가진 계층인지... 그냥 무시해도 별 문제 없는 게 아닐까 싶어서 말이죠.
김테란
17/04/09 21:56
수정 아이콘
당장 오늘 선거한다 치고 그것만을 생각한다면, 무시해도 상관없죠.
허나 앞을 위해서 조사도 연구도 하는 것이고, 표본상 양측의 균형이 맞게 된다면 어디까지 늘어나게 될 것인가 등을 보는 것이구요,
이는 무시할 필요도 쓸데없이 과장할 필요도 없다 봅니다.
그래야 현상황 파악 및 예측도 가능한거니까요.
목록 삭게로! 맨위로
번호 제목 이름 날짜 조회 추천
71402 [일반] [모난 조각] 10주차 주제 "추리소설" [8] 마스터충달5402 17/04/11 5402 7
71401 [일반] 선제공격 가능성에 대한 개인적인 생각 [15] 아수7855 17/04/11 7855 5
71400 [일반] 1937년 미국 고등학교 생도 가 뽑은 현대세계 10대 위인 [23] 안다나 9117 17/04/10 9117 1
71399 [일반] 2017 년 러시아 혁명 100주기 기념 설문조사 [7] 안다나 4526 17/04/10 4526 0
71398 [일반] 프랑스 르펜 대선 후보 - 2차대전 프랑스 의 유대인 학살 역사 책임 없다. [11] 안다나 5659 17/04/10 5659 0
71397 [일반] [바둑] 알파고가 5월 23일에 돌아옵니다. [69] bemanner12368 17/04/10 12368 3
71396 [일반] 사라진 1억 2천만원(feat. 농협) [39] 카미트리아14415 17/04/10 14415 7
71395 [일반] 고성 해안철책 인근 부사관 총상 [19] Drone11185 17/04/10 11185 0
71394 [일반] 웹툰 작가 레바, 계좌압류조치 사건의 결말 [89] 아라가키16697 17/04/10 16697 33
71393 [일반] 이랜드파크가 애슐리, 자연별곡을 매각 시도 중입니다. [51] 어리버리13758 17/04/10 13758 1
71392 [일반] 18세기 유럽 지식인들의 대표적인 지적 경향 - 중국, 그리고 중국 황제의 '이상화' [9] 신불해10425 17/04/10 10425 18
71391 [일반] 제가 돌아다닌 한국 (사진 64장) [281] 파츠20359 17/04/10 20359 120
71390 [일반] 한국이 볼거리가 없긴 없지요.. [133] 삭제됨17559 17/04/10 17559 7
71389 [일반] 현대기아, 세타2엔진 결함 자발적 리콜 결정에 관하여 [34] 여자친구13873 17/04/10 13873 26
71388 [일반] 중국, 미국의 북한에 대한 "액션" 동의 [121] aurelius22496 17/04/09 22496 5
71387 [일반] 중국의 지정학적 난관 그리고 패권을 드러내는 이유 [10] 테이스터9854 17/04/09 9854 10
71386 [일반] 일본 내에서 돌고 있는 트럼프-시진핑 김정은 망명제안설 [55] 군디츠마라18451 17/04/09 18451 1
71385 [일반] 미 칼빈슨 항모전단 입항과 중국 선양군 압록강쪽 이동 [56] 사고회로11065 17/04/09 11065 1
71384 [일반] 여론조사에 대한 오해 [7] 김테란7170 17/04/09 7170 12
71381 댓글잠금 [일반] 지루한 나라 : 한국 [711] 삭제됨26101 17/04/09 26101 7
71380 [일반] [책추천] "이슬람 제국의 탄생: In the Shadow of the Sword" [13] aurelius7431 17/04/08 7431 4
71378 [일반] 아마도 이러다 제 명에 못 죽을 것 같군요. [36] The xian15054 17/04/08 15054 18
71377 [일반] 개인적인 암 투병기 [20] Mighty Friend9543 17/04/08 9543 2
목록 이전 다음
댓글

+ : 최근 1시간내에 달린 댓글
+ : 최근 2시간내에 달린 댓글
맨 위로