- 전화 여론조사 신뢰 추락 원인

이준웅
서울대 언론정보학과 교수



전화조사의 문제점은 여러 차례 지적됐지만 보완이 이루어지지 않고 있다.
반대로 ARS 조사나 인터넷 조사 등 의심스럽거나 검토되지 않은 방법들이 도입되는 등 혼란이 가중되고 있다.
이런 현실에선 전화 여론조사 결과를 근거로 한 기사는 쓰지 않는 편이 더 좋겠다고 생각한다.



선거 여론조사에서 출구조사와 전화조사의 질적인 격차가 더욱 벌어지고 있다. 출구조사 방법론은 지난 몇 번의 선거를 거치면서 비약적으로 개선되고 있고, 예측 오차도 일정한 수준에서 통제가 되고 있다. 예컨대 2010년 6·2지방선거 예측 조사에서 한국방송협회의 KEP가 수행한 출구조사는 전 지역 당선 예측이라는 쾌거를 거두었다.

출구조사는 투표소 추출을 위한 층화표집 방법의 개선과 층별 투표소 정렬 등 표집방법이 세련화되고 있다. 또한 최종 조사대상 투표소 선정과 투표소 내 투표자 추출을 위한 체계적 표집 방법의 적용 등 조사관리 노하우가 축적되고 있다. 이 때문에 출구조사의 품질은 일정한 수준을 유지하고 있는 것으로 평가된다.


전화조사 방법론 보완 지지부진

그러나 선거 기간 전에 전반적인 여론의 흐름을 읽는 데 도움을 줄 것으로 기대되는 전화 여론조사는 오히려 오해와 혼란의 원인이 되고 있다. 예컨대 2010년 지방선거 예측 조사에 YTN-한국갤럽 및 MBN-GH코리아의 전화조사는 참담할 정도의 실적을 보였다. 사실 전화조사의 문제점은 여러 차례 지적되고 있지만 방법론적인 보완이 이루어지지 않고 있다. 반대로 오래된 방법론적 관행이 그대로 적용되는 것을 넘어서, ARS 조사나 인터넷 조사 등 의심스럽거나 검토되지 않은 방법들이 도입되는 등 혼란이 가중되고 있다. 특히 선거 기간에 앞서 언론에 보도되는 판세분석 기사를 위해 수행되는 전화여론조사는 예측 오차를 논의하기 어려울 정도로 나빠지고 있다.

선거 여론조사 등에 사용되는 전화 여론조사가 나빠지는 이유가 다음 세 가지라고 본다. 그리고 이 세 가지에 대한 전면적 개선이 없는 한, 전화 여론조사를 이용해 기사를 쓰는 것을 아예 하지 않는 편이 더 좋겠다고 생각한다. 왜냐하면 현재 관행적으로 수행되고 있는 전화 여론조사 중에는 조사 자체의 품질이 함량 미달인 경우가 많으며, 따라서 그 결과에 기초해서 기사를 쓰는 것이 사실상 무의미하다고 보기 때문이다. 따라서 다음과 같이 제언한다.

첫째, 전화조사 방법론에 대한 전면적인 재검토를 통해 조사 방법을 개선해야 한다. 지금까지 표집틀,표집 방법, 응답률, 재접촉 시도, 주말 조사 도입, 유선전화 없는 가구의 보정 등 방법론적 개선을 위한 논점들이 제시되었으며, 이런 논점들 중 다수는 타당성이 있는 것으로 확인되고 있다. 따라서 이런 점들을 반영한 전화 여론조사를 수행해야 한다. 또한 현행 전화 여론조사의 문제점을 극복할 수 있는 대안적인 방법론을 개발해야 한다.

둘째, 최소한의 품질이 보장되는 전화 여론조사를 수행하기 위해서는 전화조사 비용이 현실화될 필요가 있다. 전화 여론조사 수준이 지금같이 저열하게 된 데에는 낮은 조사 비용으로 여론조사 자료를 얻으려 하는 조사발주 기관, 즉 정당과 언론사의책임이 크다. 물론 이런 요구에 이끌려 조사의 품질을 낮추면서까지 단가를 맞춰 준 조사 회사의 책임도 있다. 결국 전화 여론조사의 견적, 입찰, 선정 등을 둘러싼 여론조사 업계의 관행이 획기적으로 개선되지 않는 한 현실적으로 ‘개선된 전화조사 방법론’이 적용될 가능성이 없다. 전화 여론조사의 방법론적
개선만큼이나 중요한 것이 조사 비용의 현실화이다.

셋째, 여론조사 보도가 개선되어야 한다. 앞서 제시한 표집틀, 표집 방법, 응답률, 재접촉 시도, 주말 조사 도입, 유선전화 없는 가구의 보정 등을 점검하고 그런 방법론적 논점을 염두에 둔 기사 작성이 필요하다. RDD를 제대로 수행했는지, 응답 가구에 대한 재접촉이 이루어졌는지, 응답률을 정직하게 밝혔는지, 주말을 이용해 조사를 수행했는지, 응답자 가중치의 분포는 어떠한지 등을 꼼꼼하게 따져 보고 이런 점들이 조사 결과에 미치는 영향을 고려해 기사를 써야 한다.


전화조사 품질을 결정하는 세 요인

전화조사의 품질을 규정하는 요인을 추출하기 위해 (1)방법, (2)문항, (3)분석 등 세 과정을 구분해 방법론을 검토해 볼 필요가 있다. 즉 어떤 방법론적 절차를 따라야 하며, 무엇을 물어 보며, 어떻게 분석했는지 등에 따라 전화조사의 품질을 규정할 수 있다는 것이다. 이를 이용해 여론조사의 방법론을 개선하는 데 고려해야 할 점이 무엇인지 도출할 수 있다고 본다. 또한 전화 여론조사에 대한 기사를 작성하는 데 무엇을 빠뜨리면 안 되고, 어떤 점을 강조해야 하는지 요점을 도출할 수 있다고 본다.

첫째, 표집틀의 결정 문제가 있다. 여기에서는 현재 두 가지 심각한 문제가 있다. 가구 내에 유선전화를 두지 않는 ‘휴대전화 및 인터넷 전화 설치 가구’가 유선전화에서 제외되는 문제점을 어떻게 보정해야 하는지가 첫 번째, 전통적인 전화번호부를 사용해 표집을 해야 하는지가 두 번째 문제다. 첫 번째 문제는 그 심각성이 어느 정도인지조차 검토되지 않은 사안이라서 더욱 심각하다. 즉 가구 내에 유선 전화를 두지 않고 휴대전화만 사용한다든지 아니면 인터넷 전화를 사용하는 가구가 전화 여론조사에서 체계적으로 제외되고 있다는 것이다. 이런 가구
는 주로 1인 가구이며, 젊은 유권자이며, 고학력 가구일 가능성이 높다는 추측만이 있다.

둘째, 전화번호부를 사용해 표집을 하느냐, 아니면 RDD와 같은 방법을 이용, 전화번호부를 구성해서 표집을 하느냐의 문제가 있다. 현재 전화조사는 흔히 전화조사 등재가구를 표집틀로 삼고 있지만, 가구전화의 전화번호부 등재율은 지속적으로 낮아지고 있으며 최근에는 50% 이하로 떨어진 것으로 알려져 있다. 전화번호 등재율 자체가 낮아지는 것도 문제지만, 등재가구와 비등재가구 간에 가구 구성원의 차이가 있다는 것이 더 큰 문제이다. <표2>에 제시되어 있듯이 가구주의 학력이 높을수록 전화번호가 미등재될 확률이 높아지고, 가구주의 가구소
득이 높을수록 미등재될 확률이 높아진다. 가구주의 학력이 높거나 소득이 높은 가구가 체계적으로표집틀에서 제외되고 있다.




응답자의 재택 확률에 따라 결과 달라

RDD를 수행하기 위해서는 첫째, 지역번호, 국번호(또는 가입자 앞 2자리 번호)를 전화번호 생성을 위한 기준 조합으로 설정한다. 그리고 전화번호 4자리를 생성해서 전화번호 데이터베이스를 구성한다. 업종상호편 전화번호부에 실린 전화번호를 확인해 제거한 후, 남은 번호 가운데 난수를 발생해서 필요한 수만큼의 전화번호를 추출한다. 이렇게 RDD 방법을 이용해 조사를 하면 표집틀을 개선한 효과가 보인다. 우선 RDD로 추출된 전화번호의 실제 등재율을 보면 지역별로 편차가 있는 것으로 확인된다. 서울이나 경기 등의 전화번호 등재율은 30% 수준
인 반면, 충북과 전북 등과 같은 지역은 60~70% 수준인 것으로 나타났다. 즉 전화번호부를 이용해 전국 전화조사를 하면 서울 지역의 고학력 가구주 등이 체계적으로 제외되는 문제가 발생한다는 것이다.

전화번호부 비등재가구는 등재가구에 비해 직업면에서 화이트칼라가 더 많고, 학력을 보면 대재 이상, 소득으로 보면 고소득자가 더 많이 나타났다. 이런 인구학적 특성을 감안했을 때, 전화번호부에 등재되지 않은 가구의 경우에는 등재가구보다 정치적으로 진보적 성향을 보인다고 추론할 수 있다. 실제 RDD 방법을 사용해 조사하면 등재된 전화번호 가구의 응답과 등재되지 않은 전화번호 가구의 응답 차이를 확인해 볼 수 있다. <표3>은 TNS가 지난 2010년 지방선거에서 특정 지역에서 수행한 전화 여론조사 결과를 보여 준다. 한나라당 후보와 민주당
후보의 지지율이 39 대 24였는데, 등재된 전화번호만 가지고 분석을 했을 때에는 44 대 21로 나타났다. 즉 RDD를 수행하지 않을 경우 한나라당 후보에게 유리하게 편향된 조사 결과를 얻을 수 있다는가설이 확인되었다.

넷째, 가구 내 응답자 선정에서 확률적 표집, 특히 무선표집을 사용해야 할지, 아니면 관행적으로 사용해 온 할당표집 방법을 고수할 것인지 문제가 있다. 우리나라 전화조사는 아직도 관행적으로 비확률적 표집 방법인 할당표집을 사용하고 있는데, 이는 다른 어떤 합당한 이유 때문이 아니라 조사 비용을 낮추고 편리하게 수행하기 위한 것으로 보인다. 할당표집이 아닌 확률추출 후 가구원에 대한 무작위 선별을 고집할 경우 가구원에 대한 재접촉이 불가피하며 따라서 반복되는 재접촉 시도로 인한 비용 증가 및 시간의 소요가 상당하다. 무작위로 선정된 가구에서 다시 무작위 방법을 적용해 응답자 개인을 선정하고, 선정된 응답자의 응답을 얻기 위해 반복적으로 재접촉을 수행하는 조사를 수행할 경우 조사원 1인당 하루 동안 완료하는 전화번호의 수가 할당표집에 비해 약 절반이라는 보고가 있다.

제한된 조사 비용과 조사 일정을 감안하면, 도저히 현재와 같은 비용으로 이런 일정에 따라 전화 여론조사를 수행할 수 없다는 것이다.

조사계 일부에서는 무선표집은 이상적인 방법이긴 하지만 현실적으로 수행하기에는 비용과 시간이 너무 많이 소요되고, 따라서 불가피하게 할당표집 방법을 사용할 수밖에 없다고 주장한다. 특히 시의성이 중요한 언론사가 주도하는 기획 조사의 경우 1주일 이상 조사를 해야 하는 무선표집을 엄격하게 적용하는 것은 무리라는 주장이다. 이는 일리가 있다. 즉 언론이 주도하는 기획 조사에서 무조건 교과 서에 나오는 방법이 옳다고 주장할 수 없다.

그러나 이 경우에는 할당표집을 적용할 때 초래되는 문제점을 정확하게 인식하고, 언론 기사에 조사 방법과 그 한계를 명시하고, 또한 조사 결과에 대한 해석도 보완적으로 수행하는 것이 필수적이다. 예를 들어 할당표집을 한 결과 30%도 안 되는 수준의 극도로 낮은 응답률을 기록했다는 사실, 화이트칼라 등 주요 하위 집단이 과소표집되어 의견 반영이 안됐다는 사실, 그리고 무엇보다도 이 조사는 할당표집을 이용한 조사라는 사실 등을 명백하게 밝히고 그 한계를 염두에 두고 기사를 작성해야 한다는 것이다.

할당 표집방법의 문제점은 잘 알려져 있다. 가장 큰 문제는 응답자의 재택 확률에 따라 특정 성향을 가진 응답자가 할당 기준을 먼저 채우면서, 특정한 정치적 성향을 가진 응답자가 과도하게 선정되는 편향이 나타난다는 것이다. 예를 들어 50대 여성 주부의 경우 가장 먼저 할당 기준을 채우며, 20대 남자 직장인의 경우는 상대적으로 늦게 응답자 할당 기준을 채우게 되는데, 연령대별로 응답을 얻기 어려운 자들의 정치적 성향의 차이에 따라 조사 결과가 달라질 수 있다. 문제는 할당을 채우기 어려운 연령대와 직업군의 응답이 체계적으로 저평가되는 구조
를 피할 수 없다는 데 있다. 할당표집을 이용한 전화조사에 대한 전면적인 재검토가 필요한 시점이라고 할 수 있다.



주말조사가 상대적으로 양호

다섯째, 할당표집이 불가피하다면 방법론상의 난점을 보완하기 위한 이른바 ‘강화된 할당표집’을 수행하는 방법을 생각해 볼 수 있다. 강화된 할당표집은 다음 세 가지 방법론적 개선이 이루어진 할당표집이다. (1)추출된 전화번호에 가구원의 응답을 얻기 위해 3차례까지 재접촉을 하는 것, (2)재접촉 시 시간대를 달리해서 전화를 하는 것, (3)주말을 이용해 전화를 하는 것. 결국 이는 모두 가구 내 응답자의 재택률을 고려해 응답을 얻기 위한 노력이라고 할 수있으며, 할당표집의 근본적인 문제점을 개선하지는못한다. 그럼에도 불구하고 이런 노력을 기울이는 것이 일정한 성과를 보여 준다는 증거가 있다. <그림1>은 강화된 할당표집을 수행하기 위한 한 사례를 제시한다. 여기에서 요점은 할당표집에 사용되는 전화번호의 수를 미리 제한함으로써(예를 들어 6,000개의 전화번호를 이용해 700표본 이상을 확보한다는 제한을 둠으로써), ‘부재중’이거나 ‘통화중’이거나(심지어 ‘조사거절’을 표명한) 가구에 대해 반복적으로 재접촉하도록 한다는 것이다. 이렇게 함으로써 할당표집의 가장 큰 문제인 재택률에 따른 응답자의 연령별 및 직업별 응답 확률의 차이 문제를 완화할 수 있다.



지난 6·2 지방선거에서 KEP가 수행한 전화조사는 RDD로 전화번호를 생성한 후, 유효 전화번호에 대해 3차례까지 재접촉을 시도했다. 부재중, 통화중, 조사거절에 따른 응답 가구 대체를 완전히 해소할 수는 없지만 최소화하는 방법을 채택한 것이다. 이 방법을 적용한 결과 다른 조사기관 및 회사의 결과에 비해 비교적 최종 선거 결과와 근사한 성과를 얻었다고 평가된다. KEP에 참여한 조사 회사들은 제한된 전화번호의 수를 갖고 재접촉을 강제한 ‘강화된 할당표집 방법’이 대안이 될 수 있다는 인식을 갖고 있다.

여섯째, 강화된 할당표집도 어려울 경우 주말조사를 수행하는 것을 고려할 수 있다. 강화된 할당표집은 응답 가구에 응답자가 있을 확률, 즉 잠재적응답자 재택률에 따른 편향효과를 통재하기 위한 것인데, 이것이 어려울 경우에는 최소한 주말을 이용해서 조사할 수 있다. 주말에는 평일에는 부재중인 응답자의 응답을 얻을 확률이 높아지고, 조사 수행의 관점에서도 오후 시간은 물론 오전까지 조사를수행할 수 있기 때문이다. 예컨대 직장생활을 하는 30대에서 40대까지의 화이트칼라의 경우 주말이 아니면 평일에 전화해 접촉하기 어렵기 때문에 주중에
조사를 수행할 경우 직장생활을 하지 않거나 자영업에 종사하는 30대와 40대가 편향적으로 많이 표집될 우려가 있다. 반대로 여성 중에서 주부들의 응답이 주중 조사에서 과대하게 표집될 우려가 있다. 주말 조사는 이런 문제점을 제한적이나마 통제할 수 있는 대안이 된다.


질문 수 적어 복잡한 흐름 파악 못해

<표4>는 지난 6·2 지방선거에서 주말 조사를 한 경우와 평일 조사를 하는 경우 응답자 구성이 달라지는 양상을 보여 준다. 인천 지역에서 총 3차례의 전화조사를 수행했는데, 1차와 3차의 경우는 주말 조사였고 2차는 주중에 조사를 했다. 성과 연령을 할당하고 조사를 수행한 결과 예상대로 주중 조사의경우 화이트칼라가 과소표집되고 주말 조사의 경우에는 상대적으로 주부의 비율이 감소되는 것을확인할 수 있었다.


 



<표4>에는 제시되지 않았지만, 교육수준 및 소득수준도 재택률과 상관관계가 있다고 예상할 수 있는데 주말 조사의 경우 고학력 및 고소득자의 응답이 더 많이 반영되는 결과를 얻었다. 그리고 당연하게도 직업, 학력, 소득 등은 응답자의 정치적 성향과 관련이 있다고 볼 수 있기 때문에 이런 차이에 따라 응답자의 후보 지지도 차이를 보일 것이라고 예상할 수 있다. 결국 불가피하게 할당표집을 해야 할 경우 주말 조사를 수행하기만 해도 최소한의 재택률 보정 효과를 얻을 수 있다고 평가할 수 있다.

전화 여론조사에 기초한 기사는 제한적 정보만을 제시하는 경우가 대부분이다. 일단 이는 전화 여론조사는 조사 수행 시간의 압박을 받기 때문에 면접 조사나 인터넷 조사 등에 비해 조사문항의 수가 적거나 복잡한 질문을 하지 못하기 때문이다. 흔히 전화 여론조사의 경우 성, 연령, 지역, 교육수준, 소득수준, 직업 등 핵심적인 인구사회적 변수를 제외한 실제 조사문항은 15개 내외로 조정된다. 따라서 전화조사를 수행하더라도 정당 지지도, 주요 정치인에 대한 지지도, 그리고 핵심 정책에 대한 찬반 등을 물어보면 다른 문항을 설문지에 포함시킬 수 있는 여유가 없는 경우가 대부분이다. 전화 여론조사를 통해 심층적인 질문을 던지고 답변을 구하기 어려운 까닭이 여기에 있다. 그러나 이런 전화 여론조사의 특성 때문에라도 다음과 같은 문제점을 극복하기 위한 문항들을 개발하고, 그런 문항을 이용해 분석적인 기사를 쓸 수 있도록 노력해야 한다.

첫째, 주요 관심 대상을 설명하기 위한 설명 변수를 포함시키지 못하는 경우가 대부분이다. 예를 들어 이명박 대통령의 국정수행 지지도를 알아보기 위한 조사가 있다고 하자. 요점은 이명박 대통령의 국정수행 지지도가 지난 조사에 비해 올랐는지, 떨어졌는지에 있기도 하겠지만, 사실 이런 변화는 언제나 어느 정도는 발생하기 마련이어서 그 자체로 크게 중요한 정보는 아니다. 보다 중요한 문제는 변화가 있다면 왜 그런 변화가 발생했는지 설명하는 것이다. 그런데 대통령 국정수행 지지도상의 변화를 관찰하더라도 ‘여론조사의 자료’에 근거해 변화를
설명하지 못하는 경우가 대부분이다. 왜냐하면 그런 변화를 설명할 수 있는 문항을 개발해 설문에 포함시키지 않기 때문이다.

만약 대통령 국정수행 지지도와 더불어 ‘국책 사업에 대한 지지도’, ‘안보에 대한 염려 정도’, ‘경제에 대한 평가 및 전망’, ‘주요 스캔들에 대한 태도’ 등을정기적으로 질문해 왔으며, 다른 문항에 대한 점수에는 변화가 없지만 특정 문항에 대한 응답이 대통령 국정수행 지지도와 상관관계를 보인다면 우리는 그 문항이 대통령 국정수행 지지도 하락을 설명하는 변수가 된다고 추론할 수 있다. 그러나 우리나라 전화 여론조사에 이런 설명을 위한 문항들이 주의 깊게 배치되는 경우가 드물다. 분석과 관련해서도 여러 문제점들이 발견된다.

둘째, 인구사회적 특성 이외에 응답자의 사회정치적 특성을 알아보기 위한 변수가 제시되지 않는다.조사 결과를 설명하기 위한 가장 기초적인 방법이응답자의 특성에 따른 응답의 차이를 알아보는 것이다. 그러나 성, 연령, 지역 등 일반적인 응답자의 인구사회적 특성 이외에 개인적 특성을 탐색하는 변수가 드물다. 대표적으로 응답자의 정치적 이념을 측정하기 위한 척도조차도 변변한 것이 없는 실정이다. 따라서 전화 여론조사에서는 주로 ‘귀하께서는자신을 보수적이라고 생각하십니까, 아니면 진보적이라고 생각하십니까’라는 자기 규정적 문항을 사용하고 있다. 정치사회적 가치나 규범, 그리고 주요사안에 대한 찬성과 반대를 물어 그에 대한 응답자의 태도를 기반으로 정치적 이념을 구성하는 방법을 사용하지 못하고 있다는 것이다. 응답자의 라이프 스타일이나 소비성향 등과 같은 변수들도 마찬가지다. 전화 여론조사에 적합하게 개발된 응답자 특성 문항이 없기에 매번 조사를 하면서도 단순 지지도나 평가 점수만 제시할 뿐 누가 왜 그런 응답을 했는지에 대한 분석을 수행할 수 없게 된다.


개인·지역별 응답률 차이로 편향성 초래

첫째, 최근 전화조사 응답률이 더욱 낮아지고 있다. 유선전화를 설치한 가구 구성원들의 재택률이 감소한 것인지, 전화조사에 대한 불신과 피로도가 높아져서 조사협력도가 낮아진 것인지, 아니면 다른 어떤 요인에 의한 것인지 모르겠지만 응답률 20% 이상을 기록하는 것이 어려운 일로 간주되고 있다. 여기에서 전화조사 응답률이란 전체 조사에 투입된 전화번호 리스트 가운데 결번이나 비가구번호를 제외한 통화중, 부재중, 조사거절, 설문중단, 통화예약, 대상자 부재 등과 성공한 전화번호 리스트를 분모로 했을 때, 성공한 전화번호의 수를 의미한다.


전화조사 응답률이 낮다는 것도 문제이지만 응답률이 지역이나 개인차에 따라 다르다는 것도 큰 문제이다. 예를 들어 응답률은 서울 및 대도시에서 낮아지고 지역에서 상대적으로 높아지는 등 지리적 차이를 보인다. <표5>는 응답률의 차이에 따른 조사 결과의 편향성은 분석적으로 가장 어려운 문제 중 하나이다. 뒤에 검토할 특정 문항에 대한 무응답은 해당 문항 응답자의 특성을 고찰해 추정해 내는 방법 등이 개발돼 있지만 조사를 거절하거나 중단하는 이른바 ‘조사거절자’에 대해서는 뾰족한 대처 방안이 없는 실정이다. 실은 이런 ‘조사거절자’는 애초에 유효표본으로 잡히지 않는 사람들이기에 실체를 파악하기 어렵다. 따라서 전화 여론조사 결과를 제시할 때 이들의 규모와 분포적 특성에 대한 최소한의 정보를 제시하고 해석을 덧붙임으로써 일반 독자가 조사 전체의 품질과 특성을 고려해 조사 결과를 볼 수 있도록 하는 것이 매우 중요하다.


둘째, 문항별 무응답 처리의 문제가 있다. 무응답이란 일단 조사에는 응했지만, 후보지지와 같은 중요한 문항에 대해 의견 표명을 하지 않은 경우를 지칭한다. 선거 판세조사의 경우 무응답은 여러 이유로 발생할 수 있다. (1)조사 시점에 응답자가 누구에게 투표할지 결정하지 않았을 수 있다. (2)어느 정도는 결정했다고 할지라도 확신이 없어서 응답을 머뭇거릴 수 있다. (3)마지막으로 누구에게 투표할지 결정했음에도 불구하고 의식적으로 응답을 하지 않을 수 있다. 과거에는 이른바 ‘판별분석’ 방법을 이용해 지지 후보를 밝히지 않은 응답자의 응답을 추론하는 것이 유행인 적이 있었다. 그러나 위와 같은 무응답의 사정을 고려하면 무응답자 추정이 필요한지 자체가 의문의 대상이다. 왜냐하면 실제로 표심을 결정하지 못한 유권자와 표심을 결정했지만 응답을 꺼리는 유권자는 서로 다른 이유로 응답하지 않은 것이다. 따라서 개인적 특성을 이용해 응답을 추정하는 방법을 두 유권자에게 일률적으로 적용하는 것은 무리이기 때문이다.

이유야 뭐든 후보지지 무응답은 조사 결과에 영향을 미친다. 예를 들어 후보 지지 무응답은 조사 시점이 투표일에 근접할수록 줄어드는 경향을 보이는데, 때로 이런 경향은 특정 후보에 대한 지지율과 연동된다. 예를 들어 <표6>은 지난 지방선거 중 충남지사 선거에서 후보 지지 무응답의 변화에 따른 후보별 지지율 변화를 보여 준다. 세 차례의 전화 여론조사가 수행되었는데, 후보 지지 무응답이 32%에서 30%, 그리고 29%로 감소하는 가운데, 한나라당 박해춘 후보의 지지율은 감소하는 반면 민주당 안희정 후보의 지지율은 체계적으로 증가하는 패턴을보인다. 투표일이 가까워지면서 유권자의 표심이 굳어지면서 후보 지지 무응답 비율이 감소하는 것이 선거의 향배를 결정하는 양상을 보였다는 것이다.


셋째, 전화 여론조사를 이용해 단순한 응답자의 의견이나 태도를 조사하는 것이 아니라 행위 의도를 조사하는 경우에는 각별히 주의가 필요하다. 대표적으로 응답자의 후보 지지에 대한 조사를 하는 것 보다 그의 투표 참여 의지를 조사하는 것이 훨씬 어려운 것으로 알려져 있다. 왜냐하면 투표에 참여하겠다고 응답한 사람들 가운데 상당수가 실제로 투표를 하지 않는다는 것이 알려져 있기 때문이다. 즉 전화 여론조사를 통해 확인된 예상 투표율은 실제 투표율보다 언제나 높다. 투표율에 따라 선거 결과가 달라진다는 것은 잘 알려져 있다. 특히 연령별,지역별 투표율의 차이에 따라 선거 결과가 영향을 받는다는 것은 일종의 상식이다. 따라서 전화 여론 조사를 통해 이런 변수에 따른 투표 의지의 집단별 차이를 추정하고, 그것에 근거해 실제 투표를 예측해 보는 것은 선거 판세 분석에서 매우 중요하다고 할 수 있다.

그러나 일반적으로 전화 여론조사를 이용해 개인의 투표 여부를 안정적으로 예측하는 것은 매우 어려운 것으로 알려져 있다. 특히 우리나라에서 투표일에 임박해 이른바 ‘바람’이 불어 특정 계층이 투표에 대거 참여하는 양상을 보일 경우 이런 ‘바람’에 따라 행동하는 자들을 찾아내기란 매우 어렵다. 흔히 전화 여론조사의 경우 투표율을 보정하기 전의 후보 지지율만 파악하고, 투표율은 사후적으로 분석적인 방법을 통해 보정하는 것이 최근의 추세이다. 예를 들어 (1)과거 유사한 선거의 성, 연령, 지역별 투표율을 구해 보정하는 법 또는 (2)출구조사 등을통해 해당 선거의 성, 연령, 지역별 투표율 추정치를 구해서 전화조사 후보 지지율을 보정하는 법 등을 사용할 수 있다.

마지막으로 개별 선거구 단위의 예측이 아닌 전체 의석수 예측에 따르는 별도의 문제가 없는지 검토할 필요가 있다. 예를 들어 대통령 선거나 지방자치 단체장 선거와 같이 선거구가 큰 경우에는 문제가 없지만, 총선이나 대규모 보궐선거의 경우에는 개별 선거구 예측이 중요한 것이 아니라 전체적인 선거의 판세를 정확하게 예측하는 것이 중요하다.

특히 총선에서는 누가 제일당이 될 것인지 예견하는 것이 관건인데, 개별 선거구에서 후보 지지의 예측 오차를 줄인다고 해서 전체 의석수 예측이 잘 맞는 것은 아니라는 데 문제가 있다. 지금까지 총선 예측 조사에서 예측이 어려웠던 결정적인 이유가 바로 이것이다. 즉 개별 선거구 예측에서는 적은 오차가 개입하지만 인근 선거구 전체가 한쪽 방향으로 오차를 보이는 편향을 보이며 또한 그 편향이 선거 결과에 영향을 미칠 정도가 되면, 전체적인 수준에서 편향이 가중되는 문제가 발생한다. 이 문제 역시 엄연히 실존하는 사실임에도 불구하고 엄밀하게 대처하기 어려운 문제 중 하나이다. 그러나 전화 여론조사가 전체적인 판세를 파악하는 게 주요 목적 중 하나라면 반드시 대처를 준비해야 할 문제 가운데 하나다.
Posted by inhana

댓글을 달아 주세요