[이재형의 통계 이야기] ④

▲ 이재형 박사

최근 가계조사통계를 둘러싸고 많은 사회적 논란이 있었다. 이 때문에 통계청은 개청 이래 처음으로 단독 국정감사를 받기도 했다. 통계의 신뢰성에 사회적으로 의문이 제기되는 것은 바람직한 현상이 아니지만, 그 덕분에 많은 국민들이 통계에 관심을 갖게 된 것은 좋은 일이었다.

세 가지 거짓말의 유래

‘세상에는 세 가지 종류의 거짓말이 있다. 거짓말과 새빨간 거짓말, 그리고 통계다.’(There are three kinds of lies: lies, damned lies, and statistics.) <톰 소여의 모험>으로 유명한 미국 작가 마크 트웨인이 자서전에 써서 유명해진 문구다.

“나는 종종 숫자에 현혹된다. 나 자신에 관계된 것이라면 더욱 그렇다. 디즈레일리의 명언 ‘거짓말에는 세 종류가 있다. 거짓말, 새빨간 거짓말, 그리고 통계’라는 말이 내게는 정당성과 설득력을 갖는 것 같다.”

마크 트웨인이 이 말의 원작자로 소개한 벤저민 디즈레일리는 19세기 영국의 수상이었으며, 많은 소설을 쓴 작가이기도 했다. 트웨인은 대작가답게 그 문구가 디즈레일리 원작이라고 분명하게 언급해 ‘연구윤리’도 지켰다. 그런데도 이 말이 트웨인의 명언이라고 알려진 것을 보면 정치가보다는 작가의 말을 신뢰하기 때문인지도 모른다.

트웨인이 옮긴 이 말은 디즈레일리 사후 세상에 알려졌는데, 막상 디즈레일리가 남긴 어떤 글에서도 이 말이 없다. 그래서 원작자가 디즈레일리가 아닌 다른 이라는 의견도 있다. 사실 이 말은 당시 유행한 어구여서 여러 사람이 자주 인용했다고 한다. 경제학자이며 사상가인 월터 배저트(Walter Bagehot)가 원조라는 이도 있고, 정치가이자 철학자인 아더 밸푸어(Arthur J. Balfour)가 원조라고도 한다.

나중에 영국 왕립통계학회 회장이 된 레너드 커트네이(Leonard Courtenay)가 이 말을 자주 사용해 그를 원조로 보는 이도 있다. 원조를 찾기 어려운 것은 의정부 부대찌개나 장충동 족발뿐만이 아닌 것 같다. 20여 년 전 호주 통계청장을 지낸 데니스 트레윈(Dennis Trewin)은 디즈레일리의 말을 빌려 국가통계가 나아갈 길을 역설했다.

“세상에는 세 가지 진실이 있다. 그것은 진실, 지독한 진실, 그리고 통계다. 내가 신뢰하는 두 부류의 사람이 있다. 하나는 신이고 다른 하나는 통계인이다. 국민들이 국가의 모든 진실을 정확히 알게 되는 것은 민주주의의 출발점이다.”

누가 한 말인지 기억하지 못하지만 “통계는 거짓말을 하지 않는다, 다만 사람들이 통계를 사용하여 거짓말을 할 뿐이다”라는 말도 있다.

통계로 거짓말 하는 법

미국의 저널리스트인 대럴 허프(Darrell Huff)는 1950년대 중반 <통계로 거짓말하는 법>(How to lie with statistics)이라는 책을 썼다. 이 책은 상당히 인기를 얻어 1970년대에는 우리나라에서도 번역돼 많은 학생들이 재미있게 읽었다. 통계와 관련된 여러 거짓말을 소개하고 있는데, 이를 정리하면 크게 두 가지 유형으로 구분할 수 있다. 첫 번째는 통계 자체가 거짓말을 하고 있는 잘못된 통계다. 두 번째는 통계는 진실이지만 사람들이 이를 교묘히 악용하여 거짓말을 하는 경우다. 이 책의 몇 대목을 소개해본다.

▲ 미국의 저널리스트 대럴 허프는 저서 <통계로 거짓말 하는 법>에서 통계와 관련한 거짓말을 '통계 자체가 거짓말을 하고 있는 잘못된 통계' '통계는 진짜지만 사람들이 악용해 거짓말하는 경우' 등 두 가지 유형으로 구분했다. © pixabay

미국 한 잡지사가 1936년 대통령선거 여론조사를 했다. 조사대상자는 잡지 구독자와 전화를 가진 미국시민으로 모두 200만 명에 이르렀다. 당시 미국 유권자 숫자가 얼마나 되었는지 모르지만 표본수가 200만이라면 전수조사나 다름없는 큰 표본이다. 요즘 우리나라 대통령 선거 여론조사의 표본수가 1,000명 정도라는 점을 감안하면 얼마나 큰 표본인지 알 수 있다. 여론조사 결과 공화당의 랜던 후보가 선거인단 370명을 얻어 161명에 그친 민주당 루즈벨트 후보에게 압승하는 것으로 나타났다.

그러나 결과는 루즈벨트의 압승이었다. 왜 이런 결과가 나타났을까? 이 잡지의 구독자들이나 집에 전화를 가진 사람들은 대개 부유해 공화당 지지자들이 많았던 것이다. 통계학적 용어로 표현하자면 표본이 한 쪽으로 치우쳐(bias) 있었던 것이다. 소녀시대 팬클럽에 가서 소녀시대가 좋으냐, 트와이스가 좋으냐고 묻고는 우리나라에서 소녀시대의 인기가 압도적이라고 하는 것과 마찬가지 오류를 범한 것이다.

여학생 33.3%가 교직원과 결혼하다니!

키가 180㎝인 청년이 수영장에서 익사했는데, 수영장 깊이는 120㎝였다. 어떻게 이런 일이 생겼을까? ‘재수 없으면 접시 물에도 빠져죽는다’라는 우리 속담이 맞는 걸까? 수영장 깊이는 평균 120㎝일 뿐 얕은 곳은 1m밖에 안 돼도 깊은 곳은 3m나 됐던 것이다. 어느 회사의 직원 평균연봉은 1억원인데, 직원들은 월급이 적어 살기 힘들다며 파업을 하겠다고 한다. 조사해보니 직원이 사장까지 모두 10명인데, 사장 연봉이 8억원, 나머지 9명 연봉을 합하여 2억원으로 나타났다. 미국 존스홉킨스 대학의 어느 과에 다니는 여학생 가운데 33.3%가 교직원과 결혼한 것으로 나타났다. 이 학교 여학생들은 연애하러 학교에 다니나? 실제로 확인해보니 이 학과 여학생은 3명이었는데, 그 가운데 한 명이 교수와 결혼했다. 이 사례들은 모두 통계 자체는 거짓이 없지만, 평균이라는 개념이 갖는 함정을 소개한 것이다.

통계의 악용은 오래전부터 있었다. 찰스 디킨스(Charles Dickens)는 <올리버 트위스트> <두 도시 이야기> 등 뛰어난 명작을 남긴 영국의 대문호다. 그의 아버지는 빚에 찌들어 감옥에 간 적도 있고, 디킨스는 공장노동을 하는 등 불우한 유년기를 보냈다. 어린 시절 경험 때문인지 그는 문학을 하면서도 사회 문제에 깊은 관심을 가졌고, 특히 빈부격차, 인권, 노동조건 등의 사회문제에 적극적으로 의견을 내놨다.

디킨스가 <하우스홀드 워즈>라는 잡지의 편집장으로 일 할 때, 그와 뜻을 같이하는 친구인 헨리 모리가 산업안전에 관한 기사를 써왔다. 디킨스는 이 기사에 ‘죽음의 계산서’라는 제목을 붙였다. 이 기사는 위험한 작업환경에 처한 노동자들을 위해 정부가 안전규제를 강화하려고 하자 제조업자 단체가 이에 반대하는 주장을 다룬 것이었다. 제조업자들은 산업재해를 당하는 노동자 수가 영국 노동자의 총 숫자에 견주면 매우 적다는 통계를 들고 나와 정부의 안전규제 강화에 반대했다. 이 기사에서 모리는 도덕적 규범에 의해 정당화할 수 없는 일들이 산술에 의해 정당화할 수는 없다고 부르짖었다.

노동운동 탄압에 동원된 수출품 불량률 통계

1987년 6월의 6.29선언 이후 그동안 군사독재에 억눌려왔던 국민의 욕구가 일시에 각계에서 폭발했다. 그동안 지속적으로 탄압받아왔던 노동운동도 활발해져 블루칼라뿐 아니라 화이트칼라, 그동안 노동운동의 사각지대에 있던 공공부문에까지 노조설립이 확산되었고 곳곳에서 파업이 발생했다. 노동조합은 높아진 위상을 바탕으로 사용자측에 적극적으로 노동조건 개선을 요구했다. 노동운동 환경의 변화로 노조의 발언권이 높아지자 재계에서는 노동운동이나 노조가 생산성을 악화시켜 우리 기업의 대외경쟁력을 떨어뜨린다며 노동운동이나 노조에 반대하는 목소리를 높였다. 1980년대 후반에는 TV에서 지금보다 더 많은 토론 프로그램이 있었는데, 노동운동과 기업활동은 제일 자주, 그리고 치열하게 벌어지는 토론 주제 가운데 하나였다.

당시 토론 내용을 요약하면 이렇게 정리될 수 있다. 노동계에서는 노동자의 권리를 찾아야 하고 노동에 합당한 대가를 받아야 한다고 주장했다. 이를 위해서는 노동운동이 보장돼야 하고 그것이 장기적으로 기업경쟁력 향상에도 도움이 된다고 했다. 사용자측은 노동계의 요구는 과도하며 기업경쟁력을 위축시킴으로서 장기적으로 노동자에게 불리한 결과를 가져온다고 주장했다. 특히 잦은 파업 등 노동계의 횡포로 기업가의 의욕이 떨어지고, 노동자의 근로의욕과 직업윤리도 실종되고 있다고 했다.

노동계와 사용자측의 토론에서 출연자들은 자기 주장의 정당성을 입증하기 위해 모든 가능한 자료를 총동원했다. 이때 노동계를 매우 아프게 하는 사용자측 통계자료가 있었는데, 바로 ‘수출품 품질통계’에 나타난 수출품 불량률이다. 이 통계는 노사문제 관련 수많은 토론에서 사용자측의 좋은 무기가 되어 노동계를 궁지로 몰아넣곤 했다. 사용자측은 정부통계를 인용해 수출품 불량률이 1980년 후반에는 낮았는데 노조활동이 활발해진 뒤 급격히 높아졌다며, 이는 모두 노동자의 직업윤리 저하에서 비롯된 것이라 주장했다. 지금은 없어진 통계라서 숫자가 기억나지는 않지만, 당시에는 객관적인 숫자에 근거했기에 노동계는 반론을 찾기가 쉽지 않았다.

수출품 불량률이 어떤 통계인가? 이 통계는 아마 1990년대 중반에 폐지된 것 같은데, 당시 공업진흥청에서 작성하던 통계였다. 우리나라는 수출의 대외신인도를 높이기 위해 수출품 검사제를 시행하고 있었다. 불량품이 수출돼 국제시장에서 나쁜 평가를 받게 되는 사태를 피하려는 제도였다. 제도 시행 초기에는 불량률이 상당히 높게 나왔으나, 우리 산업기술이 발전하고 기업들도 품질향상에 노력을 기울이면서 수출품 불량률은 점점 낮아졌다. 1980년대 후반에는 대부분 기업들이 수출품 검사를 아무런 문제없이 통과했다. 이런 상황에서 수출품 검사는 오히려 기업에 불편을 주는 제도로 인식되기 시작했다.

통계검증 소홀로 당한 ‘의문의 연패’

1980년대 말부터 우리나라에서 규제완화 정책이 본격적으로 실시됐다. 수출품 검사제 역시 개선해야 할 규제의 하나로 평가되어 개선이 이루어졌다. 그동안 수출품 검사에서 문제가 없었거나, 객관적 조건으로 볼 때 불량제품을 수출할 우려가 없는 기업에는 수출품 검사를 대폭 면제하도록 했다. 그 결과 1980년대 후반 이후 수출품 검사 대상이 되는 제품 수는 급속히 줄었고, 불량품 가능성이 높은 기업만이 수출품 검사 대상으로 남게 됐다. 그 결과 수출품 불량률은 높아질 수밖에 없었다. 만약 그때 토론에 참석한 노동계 대표가 이 글을 읽는다면 억울한 생각이 들 것이다.

사용자측에서 수출품 불량률 통계의 문제점을 알면서도 이를 악용했다고는 생각하지 않는다. 노동계는 토론에서 수출품 검사 통계 때문에 매번 당하면서도, 통계의 내용을 제대로 파악할 생각을 하지 못해 적절히 대응할 기회를 놓쳐버린 것이다. 노동계나 사용자측뿐 아니라 수많은 우리나라 교수나 연구자 등 전문가들도 이런 사실을 모르고 지나쳐버렸다. 여기에는 통계를 연구해온 나도 포함된다. 몇 년 지난 뒤 규제개혁 관련 연구를 진행하면서 뒤늦게 이 사실을 발견했다. 아마 공업진흥청의 수출검사 담당 공무원들은 이런 문제를 알고 있었을 터인데 왜 묵묵히 있었는지 궁금하다. 노동계로서는 통계 검증을 소홀히 함으로써 ‘의문의 연패’를 당한 것이다.


민주주의는 건전한 공론장 없이는 성립되지 않는다. 공론장이 건전해지려면 객관적 현실 인식을 공유해야 하며 그 바탕이 되는 게 통계다. 통계가 흔들리면 정책도 여론도 왜곡될 수밖에 없다. 가짜뉴스도 통계 왜곡에서 출발한다. 언론인은 통계 해석을 잘못하면 ‘사회의 공적’이 될 수 있지만 잘하면 ‘해석특종’을 할 수 있다. 통계전문가인 이재형 박사가 통계에 얽힌 재미있는 얘기들을 풀어낸다. 한국개발연구원(KDI)에서 일하는 그는 <국가통계시스템발전방안> <한국의 산업조직과 시장구조> 등 많은 연구와 저술을 해왔고 통계청 통계개발원장을 역임했다. [편집자]

편집 : 양영전 기자

저작권자 © 단비뉴스 무단전재 및 재배포 금지