영주 닐슨의 글로벌 투자 읽기

당신은 데이터에 속고 있다

세상의 3가지 거짓말…거짓말, 새빨간 거짓말, 그리고 통계

  • 입력2018-07-10 10:46:31

  • 글자크기 설정 닫기
    [shutterstock]

    [shutterstock]

    ‘lies, damned lies, and statistics(거짓말, 새빨간 거짓말, 그리고 통계).’ 

    1906년 마크 트웨인이 쓴 ‘마크 트웨인 자서전’에 나오는 말이다. 이 말은 마크 트웨인 외에도 여러 사람이 한 것으로 알려져 있다. 필자가 이 말을 처음 접한 것은 ‘How to Lie with Statistics(어떻게 통계로 거짓말을 할 수 있을까)’라는 대럴 허프의 책을 통해서였다. 20~30년 전 통계학을 공부하는 학생들에게 자주 추천되던 책이다. 통계학 박사학위를 받은 이후 20년 가까이 통계를 매일 활용하면서 더욱 가슴으로 느끼게 된 말이다. 

    투자자는 항상 경제와 관련된 통계에 주목한다. 대다수 국가는 세계경제 투자자와 참여자들의 신뢰를 유지하고자 정확한 통계를 조사, 발표하는 일에 많은 노력을 기울인다. 하지만 이 경제통계에도 엄청난 거짓말들이 숨어 있곤 한다. 이 거짓말은 크게 두 가지 카테고리로 분류할 수 있다. 첫 번째, 일부러 속이려 한 경우다. 두 번째, 속이려 한 것은 아닌데 통계 속성상 잘못된 메시지를 전달한 경우다.

    신뢰받지 못하는 중국 통계

    첫 번째 범주에서 가장 의심받는 나라는 중국일 것이다. 많은 투자자는 지난해와 올해 중국 경제가 전보다 훨씬 좋아졌다고 생각한다. 그러나 실제 중국 국내총생산(GDP) 성장률에는 별로 반영되지 않았다. 왜 그럴까. 중국은 경제상황이 좋지 않았던 2011년부터 2016년까지 수년 동안 GDP를 속였기 때문에 이 갭을 메우려면 2017년과 2018년 성장률을 낮춰야 했다. 이에 대해 여러 가지 변명이 존재한다. 그중 가장 자주 듣는 변명이 지방 관리들이 데이터를 부풀려 보내기 때문에 중앙통계청 관료들이 알아서 조정한다는 것이다. 아무튼 중국의 경제데이터는 세계 투자자로부터 신뢰를 받지 못하고 있다.


    [동아DB]

    [동아DB]

    두 번째 범주는 통계를 어떻게 냈는지 모른 채 숫자만 들으면 속을 수밖에 없는 경우다. 몇 가지 예를 들어보자. 첫째, 통계를 계산하는 기초 숫자 자체가 바뀌는 것이다. 현재 한국 실업률은 4.1%이다. 이렇게 경제가 좋은 때가 없었다는 미국은 실업률이 3.9%이다. 두 숫자를 보면 뭔가 말이 안 된다. 한국 경제가 부진하다고 여겨지는데도 미국의 사상 최저 실업률과 거의 차이가 없기 때문이다. 그렇다고 한국이 거짓 자료로 계산한다든가, 계산법이 미국과 엄청 다른 것도 아니다. 



    대부분 국가는 국제적으로 통용되는 방법을 공통적으로 쓴다. 실업률의 경우 경제활동인구만 계산해 포함한다. 경제활동인구는 만 15세 이상 인구 가운데 조사 기간 재화나 용역을 생산하는 데 노동을 제공할 의사와 능력이 있는 사람을 말한다. 즉 실업률은 경제활동인구 중 실업자를 경제활동인구로 나눈 값이다. 그런데 지난 한 해 내내 구직활동을 하다 지쳐 잠시 4주간 구직활동을 하지 않으면 더는 경제활동인구에 포함되지 않는다. 구직하다 포기하거나 잠시 쉬면 실업자로 분류되지 않는 것이다. 불황이 오래 지속될 경우 상당수 구직 포기자가 실업자가 되지 않는 상황이 생길 수 있고, 그때 실업률은 완전히 다른 의미를 갖는다. 

    둘째, 잘못된 그룹을 비교하거나, 편중된 그룹을 대상으로 계산한 숫자만 보여주는 것이다. 얼마 전 정부가 소득주도성장 정책의 긍정 효과를 90%라고 발표한 것이 대표적 사례다. 이는 전체 가구의 소득이 아닌 근로자 가구만을 대상으로 발표한 것으로, 자영업자 등 근로자 이외 가구를 제외하고 근로자 가구 소득만을 봤을 때 소득주도성장 정책의 긍정 효과가 90%라는 얘기다. 이는 90%가 갖는 의미를 크게 왜곡할 여지가 있다. 전체 가구가 아니라, 일부 편중된 그룹에서만 유의미한 숫자라는 점에서다. 대상을 축소해 수치를 집계하는 것은 가장 쉽게 통계를 왜곡하는 방법이다.

    통계에 속지 않으려면…

    셋째, 통계 자체가 컨트롤할 수 없는 요소들을 갖고 있는 것이다. 소득주도성장 정책의 핵심은 최저임금이다. 최저임금이 얼마나 효과가 있는지가 문제의 핵심인데, 최저임금을 인상한 뒤 일자리가 줄지 않았다고, 또는 약간 늘었다고 꼭 최저임금이 효과를 가져왔다고 결론지을 수는 없다. 예를 들어 최저임금을 올리지 않았다면 새로운 일자리 10만 개가 창출됐을 텐데, 최저임금이 인상되는 바람에 2만 개밖에 만들어지지 않았다면 어떨까. 일자리 2만 개 증가를 들어 최저임금 인상 효과가 좋다고 한다면 오류를 범하는 것이다. 최저임금 인상 효과를 측정할 때 일자리 수와 평균 임금만 따지는 것 자체가 통계적으로 문제가 있다는 얘기다. 

    그저 통계만 보고 경제가 좋아졌는지 아닌지를 섣불리 판단하는 것은 옳지 않다. 통계를 가지고 잘못된 믿음을 전달하는 방법은 수없이 많지만, 위 3가지 사례만이라도 잘 알고 있으면 통계를 의심하고 유심히 따져보는 데 도움이 될 터다. 

    데이터가 넘치는 세상에 살면서 많은 데이터 생산자가 의도적으로, 또는 비의도적으로 타인을 속이려 들 것이다. 해결 방법은 한 가지다. 숫자를 주는 대로 받아 빨리, 편하게 결론내지 않는 것이다. 상식적이고 직관적으로 왜 그럴까를 생각하는 훈련을 해야 한다. 주로 언론을 통해 통계 정보를 얻는 일반인뿐 아니라, 데이터 전문가들에게도 가장 기본이 되는 원칙이다.


    영주 닐슨
    •전 헤지펀드 퀀타비움캐피탈 최고투자책임자
    •전 Citi 뉴욕 본사 G10 시스템트레이딩헤드
    •전 J.P.Morgan 뉴욕 본사 채권시스템트레이딩헤드
    •전 Barclays Global Investors 채권 리서치 오피서
    •전 Allianz Dresdner Asset Management 헤지펀드 리서치헤드




    댓글 0
    닫기