주간동아 1086

2017.05.03

스페셜

‘文 펀드’엔 돈만 오간 게 아니다

빅데이터의 과학 알면 ‘장기 집권’ 가능할까

  • 정호재 기자 demian@donga.com

    입력2017-04-28 17:59:22

  • 글자크기 설정 닫기
    서울 서대문구에서만 크고 작은 선거를 20여 차례 치른 더불어민주당(민주당) 우상호 원내대표는 평소 기자들에게 “정치인의 손바닥 촉감이 바로 정치 풍향계”라고 말하곤 한다. 유권자와 악수할 때 느끼는 손아귀 힘과 미세한 표정 등으로 대략적인 승부는 물론, 나아가 전국 판세까지 예측할 수 있다는 얘기다. 정치인은 선거 기간 하루에도 수천 번씩 유권자와 악수해야 하기에 그렇게 쌓인 데이터는 적중률이 상당히 높았다는 게 우 대표의 주장이다.

    또 서울 은평구에서 자전거 유세로만 5선을 기록한 이재오 전 의원(현 대선후보)의 비장의 무기는 ‘발품’이었다. 자전거 페달을 부지런히 밟는 뒷모습을 주민에게 자주 내비쳐도 선거에서 이길 확률이 크게 올라간다는 경험 때문이다. 이 두 가지 사례는 현실정치에서 선거 전략이 구체적 수치보다 ‘감(感)’에 의존하고 있음을 보여준다.

    이는 대선 같은 전국 규모의 선거에서도 마찬가지였다. 첨예한 정치 이슈를 놓고 상대방과 각을 세우는 방식으로 큰 그림을 그린 뒤 세부적으로는 혈연·지연·학연 등을 총동원하는 고전적 인맥 전술로 선거를 치른 것이다. 이를 위해 매스미디어에 자주 노출되고 부지런히 발품을 팔며 격전지를 중심으로 유세활동을 벌이는 행보는 무척이나 자연스러운 우리네 선거 풍경이었다.

    그러나 21세기 인공지능(AI)이 주도하는 ‘4차 산업혁명’이 선거판의 주요 화두가 된 시점에 ‘3김(金) 시대’에나 통할 법한 고전적 기법이 승부의 열쇠라고 말하기엔 상당히 쑥스럽다. 특히 정치집단의 운명이 달린 대선이라면 좀 더 고차원의 승리 방정식과 첨단 통계, 마케팅 기법을 적용하는 것이 오히려 더 자연스럽다. 아직은 초보 단계이기는 하지만, 소셜네트워크서비스(SNS) 같은 뉴미디어가 바람을 불어넣고 선거공학자들이 판을 키운 ‘빅데이터 선거’가 이번 ‘장미 대선’에서 또 하나의 관전 포인트가 되고 있다.





    IT로 파악하는 민심(民心)?

    ‘구글 트렌드는 트럼프의 당선을 이미 알고 있었다?!’
    지난해 지구촌 최고 정치 이벤트는 영국의 유럽연합(EU) 탈퇴를 이끈 ‘브렉시트’ 투표와 도널드 트럼프 미국 대통령의 드라마틱한 대선 역전극이었다. 두 선거 모두 전통적인 문답방식의 여론조사 결과 역전이 불가능하리라 예측됐지만 승부가 뒤집혔다. 선거 이후 밝혀진 흥미로운 뒷이야기도 있다. 키워드 검색 통계인 구글 트렌드(trends.google.com) 분석에 따르면 두 선거 모두 결과를 예측할 수 있었다는 조사가 나온 것이다. 실제 구글 트렌드는 미국 대선을 치르기 전 3개월 동안 ‘트럼프’ 평균 검색 횟수가 ‘힐러리’ 검색 횟수보다 크게 앞섰다는 사실을 보여준다.

    구글 트렌드는 검색시장의 80% 이상을 차지한 구글의 검색 알고리즘에 잡힌 키워드 통계를 분석해 세간의 관심도를 보여주는 가장 단순한 빅데이터 분석이다. 이번 대선에서도 국내 여러 방송사와 기관 등에서 SNS 및 포털뉴스 댓글 등을 활용해 주로 화제성을 나타내는 빅데이터 지수를 발표하기도 한다. 하지만 조사마다 편차가 지나치게 커 아직은 구체적인 수치를 앞세운 여론조사에 눈길이 더 가기 마련이다. 미국에서도 선거 직전까지는 트럼프에 대한 부정적인 여론이 워낙 많아 구글 트렌드가 보여주는 단순한 검색량이 실제 선거 결과에 가까우리라고 믿는 사람은 많지 않았다.

    한국에서도 이런 현상은 엇비슷하게 반복되고 있다. 현재 구글 트렌드에서 안철수와 문재인 검색 결과는 4월 3일 이전까지는 문 후보가 앞서다 안 후보가 역전했지만, 18일 다시 뒤집힌 것으로 나온다. 완전히 일치하지는 않지만 여론조사에서 드러난 추이와 흡사하다. 그러나 국내에서는 구글 이용자가 많지 않은 데다 젊은 층에 편중돼 얼마나 신뢰성을 가진 정보일지는 여전히 미지수다(그래프 참조).

    이는 2012년 대선이나 지난해 총선에서도 마찬가지로 반복된 고민이기도 하다. 디지털미디어의 빠른 발달로 민심을 가늠할 정치 데이터가 폭증하면서 이른바 ‘빅데이터 분석 기법’에 대한 수요가 급증하고 자연스레 조사기업이 우후죽순으로 생겨났다. 여론조사의 빈틈을 메울 것만 같던 이 같은 흐름은 트위터 같은 SNS에 모을 수 있는 데이터가 특정 세대와 특정 정치 성향에 한정됐기에 전체 국민의 여론과는 크게 동떨어졌다는 지적이 나오면서 빠르게 사그라졌다.

    실제 인터넷 포털사이트 댓글만 해도 실제 투표에 참여하는 유권자와 연관성을 찾기 어려워 선거 전략에 직접적으로 활용하기 힘들다는 분석이 나온다. 민경배 경희사이버대 교수는 “국내 SNS가 워낙 편향성이 커 의미 있는 데이터 추출이 어렵고, 굳이 빅데이터 없이도 지역별, 이슈별, 세대별 유불리의 판단이 가능하기 때문에 정당들의 관심이 그리 크지 않다”고 지적한다.

    의미망 분석을 통해 전략 컨설팅을 제공하는 김도훈 아르스프락시아 대표 역시 “세간에 SNS와 댓글 분석만 ‘빅데이터 선거’라는 식의 오해가 만연해 있다”면서 “아직은 우리 정치가 데이터에 기반을 둔 선거 전략을 짜거나 운영할 역량을 갖추지 못했다”고 아쉬워했다. 먼저 빅데이터 선거의 의미를 제대로 알려면 미국 사례를 참고할 필요가 있다. 지난해 두 번의 선거로 세계적으로 관심을 모은 빅데이터 회사가 바로 영국 런던에 본사를 둔 미국 자본 소유의 ‘케임브리지 애널리티카’다.

    이 회사는 브렉시트 투표에서는 EU 탈퇴 쪽, 미국 대선에서는 트럼프 후보 쪽의 의뢰를 받아 데이터 조사 결과와 대응 방안을 제시했다. 특히 미국 대선에서 이 회사는 유권자 2억2000만 명에 관한 5000여 가지 데이터를 모두 취합해 일종의 유권자 심리 지형도를 만들어 유명해졌다. 트럼프 캠프는 이 회사의 핵심 인재를 ‘수석 데이터 과학자’로 임명해 열세 지역 극복에 적극 활용했다.

    즉 빅데이터 선거기법은 현 판세를 보여주는 데 그치는 것이 아니라, 정확한 유권자 분석을 통한 맞춤형 선거 전략을 세우는 데 도움을 줄 수 있다는 얘기다. 미국에서 100년 넘게 강고한 양당체제를 구축해온 공화당과 민주당은 주로 부동층을 공략하는 선거 전략 수립에 초점을 맞춰왔다. 이에 두 당은 수십 년 동안 쌓인 선거 데이터를 적극적으로 활용하고 여기에 유통사, 통신사 등이 확보한 최신 소비데이터를 더한 ‘빅데이터 전략’으로 구체적인 전국 유권자 지도를 만들었다.   

    2012년 버락 오바마 전 미국 대통령의 정보기술(IT) 선거 전략을 분석한 책 ‘빅데이터 승리의 과학’을 펴낸 고한석 민주연구원 부원장은 “선거운동의 핵심이 소극적 지지자를 동원하고 부동층을 설득하는 과정이라고 본다면 유권자에 대한 구체적 데이터가 많은 쪽이 유리할 수밖에 없다”며 “결국 민주 대 반민주 구도가 사라지는 순간 데이터(과학) 선거로 빠르게 이동할 것”이라고 전망한다.

    그렇다면 우리나라의 유권자 분석 수준은 어느 정도일까. 전문가들은 1995년 이건희 삼성전자 회장의 중국 베이징 발언을 인용하며 “여전히 우리나라 정치는 4류, 행정은 3류, 기업은 2류”라고 요약한다. 스윙보터(정당에 구애받지 않고 투표하는 계층)나 부동층을 정밀하게 겨냥해 공략하는 기업 또는 미국 같은 선진국과는 큰 차이를 보인다는 얘기다.

    우리도 선거 때만 되면 지역구 정치인은 유권자 정보 확보에 혈안이 된다. 조기축구회, 종교시설, 각종 사회단체 등 지역구에서 모을 수 있는 연락처를 최대한 확보해 이들에 대한 접촉 빈도를 늘리는 것이 선거의 기본 전략 가운데 하나다. 그러나 이 같은 정보가 당 차원으로 결집되지 못하고 1회성으로 사라지고 만다.  

    더 심각한 사례는 부실한 당원명부 관리다. 정당원의 구체적인 정보를 담은 명부는 일종의 차기 당권을 가늠하는 ‘옥새’ 구실을 해왔다. 명부 접근권을 확보한 쪽이 당내 경선 등에서 절대적 우위를 지니기 때문이다. 그러나 정당 역사가 짧고 세력 간 이합집산이 빈번한 탓에 당원명부는 보안이 지켜지기는커녕 분실이 반복했다. 2014년 전당대회를 준비하는 과정에서 2012년에 구축한 36만 명의 당원명부가 사라진 것을 확인하고 내홍에 휩싸인 민주당이 대표적 사례다. 2012년 새누리당(현 자유한국당)에서는 200만 명에 달하는 당원 정보를 스팸문자업체에 팔아넘긴 일도 있었다.



    “빅데이터는 곧 핵심 선거 전략”

    그렇다고 이번 선거가 ‘색깔론’과 ‘적폐’ 이슈가 지배하는 구시대 선거인 것만은 아니다. 각 정당의 승리 열망이 뜨거운 만큼 과학적 선거를 위한 노력도 여럿 찾아볼 수 있다. 엇비슷하다지만 그래도 준비가 많이 된 곳은 민주당이다. 길게는 9년, 적어도 2년 가까이 이번 대선을 준비한 덕분이다.

    지난해 총선에서 민주당은 당 차원에서 격전지 20여 곳을 집중 분석해 선거에 활용하는 전략을 선택해 쏠쏠한 재미를 봤다. 해당 지역을 동과 통 단위로 쪼개 그 지역 유권자를 △민주당 적극 지지자 △소극 지지자 △부동층 △상대 당 소극 지지자  △적극 지지자 등 5단계로 세분화해 공략을 시도한 것이다(지도 참조). 지역 및 유권자 성향을 분석하면 선거 기간 중 홍보물 발송이나 유세차량 배치, 후보의 유세 동선(動線) 운용에서 경쟁 후보에 비해 좋은 성과를 거둘 수 있다는 마케팅의 기본 원리를 활용한 사실상 첫 번째 사례였다. 

    이번 선거에서도 이와 유사한 (지도) 정보를 핵심 지역에 적용해 선거운동에 활용한다는 후문이다. 선거 효과가 높은 지역에 유세차를 배치해 후보와 유권자의 접촉을 늘릴 수 있다면 동일한 자원으로 경쟁할 경우 승률이 높아지는 원리다. 실제로 이 같은 빅데이터 전략이 효과를 발휘했는지, 부산 서면 유세장에 3만 명이 운집하는 등 문 후보의 유세가 있는 날이면 경쟁 후보보다 더 많은 유권자가 집결해 뜨거운 분위기를 연출하고 있다.

    유권자의 정치적 성향을 담은 정보를 얻으려는 노력도 계속되고 있다. 가장 대표적인 것으로 ‘정치 후원금’과 ‘문재인 펀드’ ‘내가 대통령이라면-공약 제안’ 프로그램 등이 꼽힌다. 정치 데이터에 대한 이해가 부족한 사람이라면 선거를 앞두고 ‘펀드 모집’ 같은 번거로운 작업을 하는 것에 고개를 갸웃할 수밖에 없다. 같은 금리라면 은행에서 빌려도 될 일을 한시적으로 채권자를 모집해 관리하는 일이 간단한 것은 아니기 때문이다.

    민주당 한 관계자는 “데이터 정치의 핵심이 ‘문재인 펀드’에도 담겨 있다”며 “돈 1만 원이라도 빌려준 핵심 지지자의 정보를  앞으로 활용할 수 있다는 것은 당 처지에서는 미래의 핵심 자산을 확보하는 셈”이라고 말한다. 휴대전화 문자메시지 소통 역시 마찬가지다. 4월 27일 현재 문 후보의 공개 전화에 도착한 정책 제언 문자메시지가 10만 건이 훌쩍 넘었다.

    만일 특정 전화번호로 ‘강원도 청년실업’에 대한 정책 제언이 들어온다면 그 전화번호는 강원지역에 사는 민주당 정책에 관심이 많은 젊은 층일 가능성이 높기 때문에 향후 선거에 반복 활용할 수 있다. 민주당은 500여 개에 달하는 세부 공약 공개가 늦어진 탓에 이번 선거에서는 큰 주목은 끌지 못했지만, 당초 ‘개인별 맞춤형 공약 홈페이지’ 운영을 통해 유권자의 e메일을 대규모로 수집할 계획도 갖고 있었다.

    이 같은 빅데이터 전략으로 지난 총선과 올해 대선, 그리고 내년 전국동시지방선거로 이어지는 3대 전국 선거는 향후 정책 선거, 데이터 선거로 변모하는 변곡점이 되리라고 선거 전문가들은 입을 모은다.



    文의 스마트 전략, 安의 실수?

    현재 문재인 후보의 우위와 안철수 후보의 빠른 쇠퇴도 빅데이터 분석을 통해 어느 정도 설명이 가능하다. 4월 3일 민주당 대선후보로 문 후보가 확정되는 시점에 선거구도가 크게 요동쳤다. 중도 포지션이던 안희정 충남도지사의 지지세력이 눈 깜짝할 사이 안 후보에게로 이동하는 대반전이 벌어진 것.

    당시 민주당 지도부는 단 2주 만에 20%p 가까이 급상승한 안 후보의 지지율에 경악을 금치 못했다. 하지만 전례 없이 빠른 전략 교체로 재역전에 성공했다는 자평이다. ‘주적(主敵)’ 논란에 뚜렷한 반대 의사를 내비치며 집토끼를 붙잡고, 사드(THAAD·고고도미사일방어체계) 배치에 대해선 전략적 모호성을 유지하는 중도 확장 전략으로 지지율을 붙잡는 데 성공한 것이다. 

    문재인 캠프의 한 핵심 관계자는 “만일 ‘적폐세력 청산’이라는 구호를 ‘든든한 대통령’으로 빠르게 바꾸지 못했다면 역전당했을 수 있다”면서 “그와 동시에 안 후보가 중도 포지션을 성급히 버리고 사드 찬성 등 보수 전략을 택한 것이나, 단설유치원 억제 발언 같은 실수도 행운으로 작용했다”고 설명한다.

    실제 빅데이터 전문가들은 문 후보가 여러 경쟁 후보에 비해 전략적 우위를 차지하고 있다는 중간 점검 판세 분석을 내놓았다. 만일 안 후보가 적확한 데이터에 기초해 능수능란한 중도 전략을 펼쳤다면 선거판이 달라졌을 공산이 크다는 얘기다. 이를 위한 정당 조직의 크기나 역사가 짧은 것이 불리하게 작용했으리라는 분석도 나온다.

    이번 선거는 ‘촛불정국’이 만든 조기 대선인 탓에 빅데이터의 위력이 덜했지만, 앞으로 미국식의 정책 대결 구도가 뚜렷해질 것이라는 데 전문가들은 뜻을 같이한다. 결국 정확한 유권자 정보를 더 많이 확보한 정당이 권력을 오래 유지할 가능성이 크다는 얘기다.

    고 부원장은 “미국 선거는 10%가량에 불과한 부동층을 효과적으로 공략할 수 있는 핵심 정책 개발에 관심을 쏟는다”면서 “우리도 색깔론과 개인사 검증 프레임 대신 유권자의 빅데이터를 적극 활용하는 정책 선거로 바뀔 가능성이 높다”고 이번 대선의 의미를 평가했다.




    댓글 0
    닫기