[이재형의 통계 이야기] ⑱

▲ 이재형 박사

사회가 필요로 하는 좋은 통계를 작성하고 공급하는 것은 정부의 중요한 역할이다. 그러면 어떤 통계가 좋은 통계인가?

공장 연기가 발전의 상징인 시절의 통계

먼저 사회가 필요로 하는 통계를 작성해야 한다. 우리 경제와 사회는 끊임없이 발전하고 사람들의 가치관이나 인식도 바뀐다. 정부나 기업, 일반 국민의 관심 분야도 달라진다. 예전에는 공장 굴뚝에서 검은 연기가 퍼져나가면 사람들은 그것을 바라보며 경제발전의 상징이라 생각하고 뿌듯하게 여겼다. 하지만 지금은 미세먼지 걱정으로 그것을 당장 시정하라는 항의가 빗발칠 것이다. 사회 환경이 바뀌면 사람들 생각이 바뀌고, 그에 따라 필요로 하는 통계정보도 달라진다. 과거에 살기 어려울 때는 경제발전을 가장 중시했지만, 지금은 환경, 보건, 복지 등 다양한 방면으로 관심이 커졌다. 이렇게 사회가 변화함에 따라 정부도 이에 대응하여, 사회가 요구하는 통계를 만들어 공급한다. 이것을 통계의 관련성(relevance)이라 표현한다.

▲ 과거 공장 굴뚝에서 나오는 연기를 보고 사람들은 경제발전이라 생각했다. 그러나 이제는 미세먼지 걱정으로 항의가 빗발칠 것이다. 환경이 바뀌면 사람들의 가치관과 인식이 바뀌듯, 사회가 요구하는 통계도 변화한다. ⓒ pixabay

100여 년 전만 해도 가장 중요한 통계는 인구통계였다. 인구는 국가를 구성하는 가장 기본적인 요소이며, 국가의 힘이기도 했다. 촉한을 세운 유비가 급박한 전쟁터에서도 백성을 끌고 다닌 것은 인구야말로 국가 건설의 기본이라고 생각했기 때문이리라. 인구는 국가의 산업 생산력이나 군사력 측정에 기본이 되는 통계다. 조선시대의 호적대장이나 호패제도 등도 모두 인구를 파악하기 위한 기초 통계자료라 볼 수 있다.

인구통계 다음으로 중요했던 농업통계

그 다음으로 중요한 것은 국민들이 먹고 사는 것, 즉 경제에 관한 통계다. 과거에는 산업이 대부분 농업이었기에 경제통계는 대부분 농업통계였다. 농업은 인간의 생존에 가장 필요한 먹는 것을 해결하는 산업이어서 어느 나라나 특별히 취급해왔다. 우리나라는 조선시대에 농업용 토지를 조사하는 양전(量田) 제도가 있었고, 이를 세금징수의 기초자료로 활용했다. 전통적인 농업국가였던 우리나라는 물론, 미국과 같은 나라에서도 농업은 특수성을 인정하고 농민들을 특별히 배려하고 있다. 그러다보니 인구통계 다음으로 발전한 것이 농업통계다.

산업과 기술이 발달함에 따라 경제활동 영역은 점점 넓어졌고, 그에 따라 조사대상도 제조업, 서비스업 등 다양한 산업으로 확장됐다. 같은 산업에서도 다양한 각도에서 그 특징을 관찰할 필요에 따라 새로운 통계수요가 발생했다. 경제발전이 일정 수준에 이르자 사람들은 ‘인간다운 삶’을 위해 환경, 복지, 건강, 취미, 레저, 사회활동 등으로 관심영역을 계속 확장하고 있다. 이런 사회 변화에 따라 통계를 새로이 개발하고 작성해야 하는데, 이렇게 사회적 통계수요에 맞추어 통계를 공급하는 것이 앞서 언급한 ‘통계의 관련성’이다. 좋은 통계가 되기 위해서는 먼저 관련성이 높아져야 한다.

정확성, 신뢰성, 시의성이 통계의 생명

통계는 언론보도처럼 정확성(accuracy)과 신뢰성(credibility)이 있어야 한다. 대체로 정확한 통계는 사람들이 신뢰하지만 그렇다고 그것이 반드시 일치하는 것은 아니다. 통계가 정확하더라도 사람들은 신뢰하지 않을 수도 있고, 정확성이 좀 떨어지는 통계라도 신뢰를 받는 경우가 얼마든지 있다. 최근 통계를 둘러싸고 상당한 논란이 벌어졌는데, 통계의 정확성보다 신뢰성에 관한 의구심에서 출발한 문제였다. 예를 들어 어떤 지역의 3년간 실제 소득이 100, 105, 120으로 변화했다고 생각해보자. A통계에서는 이것이 105, 115, 118로 나타났고, B통계에서는 50, 53, 60으로 나타났다고 하자. A통계가 B통계보다는 정확성에서 월등히 낫다. 하지만 변화 모습은 B통계 쪽에서 훨씬 사실과 가깝게 측정했다. 경우에 따라 사람들의 신뢰는 B통계 쪽으로 쏠릴 수 있다.

좋은 통계도 언론보도처럼 시의성(timeliness)이 있어야 한다. 즉 사회가 필요로 할 때 시간적으로 적절하게 통계가 작성·공급돼야 한다. 아무리 정확한 통계라도 필요할 때 바로 공급되지 못하면 그 효용은 크게 떨어질 수밖에 없다. 일반적으로 정확성과 시의성은 서로 상충 관계에 있다. 정확성을 기하자면 시의성이 떨어지고, 시의성을 중시하자면 정확성에 문제가 생길 수 있다. 그래서 GDP 통계와 같은 중요 통계는 ‘잠정치’를 작성해 발표한다. 사회적으로 GDP 통계의 수요가 많아서 정확성을 좀 희생하더라도 신속성을 중시해 잠정적인 통계 결과를 발표하는 것이다. 잠정치는 나중에 확정치에 의해 수정된다. 간혹 언론에서는 잠정치와 확정치가 차이가 난다고 해서 비난을 하는데, 잠정치와 확정치 간의 차이가 나는 것은 당연하며, 이런 비난은 오히려 통계정보의 공급을 위축시킬 우려가 있다.

▲ 통계와 언론보도는 크게 다르지 않다. 정확성(accuracy), 신뢰성(credibility), 시의성(timeliness)이 있어야 한다. ⓒ pixabay

그러면 잠정치와 확정치 통계는 왜 차이가 날까? GDP 통계의 예를 들어보자. GDP 통계는 직접 조사해서 작성하는 것이 아니라 이미 나와 있는 수많은 통계나 기업들로부터 수집한 자료를 이용해 작성한다. GDP 통계 작성을 위해 이용되는 통계나 자료는 150종이 넘는다. 이러한 통계나 자료들 가운데 그때그때 바로 작성되는 것도 있지만, 특성상 1-2년이 지나야 작성되는 것도 있다. 150종이 넘는 통계가 모두 나온 뒤에 GDP 통계를 작성한다면, 그것이 너무 늦게 나올 수밖에 없다. 시의성을 위해 일부 자료는 고려하지 못하고, 시간적으로 가능한 자료만을 토대로 잠정 GDP를 작성하게 된다. 그 때문에 잠정치와 확정치 간에는 어느 정도 차이가 날 수밖에 없다. 모든 재료를 다 넣어 만든 김치찌개와 급하게 몇 가지 재료만을 넣어 만든 김치찌개가 맛이 달라질 수밖에 없는 것과 같은 이치다.

2015년 경제센서스가 2017년 발표되는 이유

그러면 GDP 통계 작성에 이용되는 통계 가운데 늦게 나오는 통계를 일찍 나오도록 독려하면 될 게 아닌가 하는 생각도 들 것이다. 즉, 그 통계를 작성하는 통계기관이 좀 더 서두르면 더 빨리 통계를 작성할 수 있지 않을까 하는 의문이다. 그러나 어떤 통계는 특성상 대상연도보다 1~2년 늦게 작성되는 경우가 있다.

GDP 통계 작성에서 가장 중요한 자료로 활용되는 통계로 통계청에서 작성하는 경제센서스가 있다. 경제센서스 통계는 우리나라 모든 사업체의 산업활동을 조사하는 통계로, 산업통계의 가장 기본이 되는 것이다. 2015년 경제센서스를 예로 들어보자. 사업체들은 2015년 사업실적을 2016년 3월쯤 돼야 파악할 수 있다. 통계청에서 경제총조사를 위해 400만개에 가까운 조사대상 사업체를 파악하고, 조사준비를 하는 데 몇 달이 소요된다. 2016년 6월쯤 경제센서스 조사를 실시하며, 조사가 끝난 뒤에는 조사가 제대로 됐는지 점검하고, 사업체 하나하나의 조사자료에 문제가 없는지 검토한다. 조사자료가 어느 정도 정비되는 것이 2016년 12월쯤이다. 이를 토대로 통계표를 작성하여 발표하는 것은 2017년 전반기가 된다. 아무리 빨리 하더라도 2015년 경제센서스 통계자료는 2017년이 돼야 발표할 수밖에 없는 것이다. 참고로 경제센서스 통계 결과 발표는 우리나라에서 1년 반 정도 시차가 있지만, 일본에서는 3.5년, 미국에서는 5년 이상 시차를 두고 단계적으로 발표한다. 선진국들의 통계 발표가 우리보다 늦은 것은 다 이유가 있으며, 발표가 빠르다고 해서 반드시 좋은 것만은 아니다.

GDP 통계를 만드는 기초통계의 작성에 이렇게 시간이 소요되기 때문에 이런 통계자료를 모두 이용해 작성되는 GDP 통계는 확정치가 나오기까지 더 시간이 걸릴 수밖에 없다. 그렇다고 해서 모든 자료를 이용해서 GDP 확정치가 나오기까지 무작정 기다릴 수는 없는 노릇이다. GDP 통계는 국가경제 운영과 기업활동의 기본정보이기에 사회적 수요가 워낙 크다. 그러므로 정확성을 좀 희생하더라도 이를 활용할 수 있도록 잠정치 통계를 만드는 것이다.

통계는 대통령도 미리 받아볼 수 없다

통계의 시의성과 관련하여 또 하나 중요한 것이 통계 발표의 정시성(定時性)이다. 통계를 통계작성기관이나 정부의 형편에 따라 아무 때나 발표하는 것이 아니라 정해진 일정표에 따라 공표돼야 한다는 것이다. 통계의 신뢰성을 확보하는 데 중요한 것 중 하나가 통계 이용자들 사이 정보의 비대칭성(asymmetry of information)을 제거하는 것이다. 정보의 비대칭성은 사람들 사이에 획득하거나 보유하는 정보의 질과 양, 그리고 획득시간에 차이가 나는 경우를 말한다. 정보의 비대칭성은 의사결정의 타당성과 시기에 영향을 미쳐 의사결정 주체들 간의 이해에 큰 영향을 미칠 수 있다. 국가통계가 의사결정 주체들에게 차별적으로 제공되면 그들 간의 게임이 불공정해질 가능성이 크다.

과거에는 통계가 작성되면 먼저 청와대와 경제기획원(지금 기획재정부) 등 관계기관에 먼저 내용을 보고 한 뒤 하루 이틀 시차를 두고 국민에게 발표했다. 국민들은 통계를 좀 더 빨리 접할 수 있었는데도 관계기관 보고 절차 때문에 통계를 늦게 접했다. 정부와 국민들 간에 정보의 비대칭성이 발생한 것이다.

청와대나 경제기획원 담당자가 국민들에 앞서 알게 된 통계정보를 지인 등 주위에 흘리게 되면, 민간인 가운데서도 정보의 비대칭성, 정보의 불균형이 나타나게 된다. 특히 경제동향 통계는 주식시장 등 민간 경제 분야에 큰 영향을 미친다. 정보의 비대칭성이 발생할 경우 주식시장 등 민간 경제활동에서 불공정한 게임을 초래할 수 있다. 이런 이유로 2004년부터는 사전보고제를 폐지하고, 대통령부터 일반국민에 이르기까지 우리사회 모든 구성원이 동시에 통계에 접근할 수 있게 했다. 실제로 대통령이 일반국민보다 통계정보를 먼저 알고 있어야 할 이유는 없다. 이렇게 만들어진 제도가 ‘통계공표 사전예고제’다. 통계청이 작성하는 중요 통계는 미리 발표 일정을 공표해두고, 그에 따라 통계를 발표하도록 했다.

마음만 먹으면 통계를 이용할 수 있는 시대

좋은 통계는 접근성이나 이용편의성(accessability)도 높아야 한다. 통계이용자들이 편리하고 쉽게 통계를 이용할 수 있을 때 그 활용도가 늘어나고, 통계 활용도가 늘어난다는 것은 결국 통계가 우리사회 어디에선가 중요한 정보로 활용된다는 것을 의미한다. 이는 국가 전체의 생산성을 높이는 구실을 한다. 정책당국자들이 통계를 더 많이 이용하면 더 좋은 정책을 개발할 수 있고, 기업들이 이를 더 많이 이용하면 더 좋은 기업전략을 수립할 수 있고, 학자들이 통계를 더 많이 이용하면 더 좋은 연구 결과를 내놓을 수 있다. 이는 우리 사회의 발전에 기여한다. 통계이용자들이 통계를 더 많이 이용한다고 해서 추가 비용이 들어가는 것은 아니다. 같은 돈을 들여 만든 통계를 더 많은 사람들이 이용하면, 통계의 가치는 커지게 되며, 이것은 결국 국가 통계의 생산성을 높이는 효과가 있다.

최근에는 많은 국가들이 통계 이용의 편의성을 높이려고 노력한다. 20여 년 전만 하더라도 대부분 통계자료는 통계책자 형태의 인쇄물로 찾을 수 있었다. 국가에서 작성하는 수많은 통계가 여러 통계자료집에 흩어져 있어서 통계자료를 한번 찾는다는 게 보통 일이 아니었다. 필자처럼 연구소에서 일하는 사람들은 그래도 도서관이나 자료실에 통계책자가 비치되어 있어 큰 어려움이 없었지만, 그렇지 않는 사람들은 도서관 등을 이용할 수밖에 없었다. 그런 도서관들도 주요 통계책자만 비치해둘 뿐 전문 분야 통계자료집은 제대로 구비해놓지 못한 데가 대부분이었다. 그러다보니 당시는 연구에 필요한 통계를 구하는 데 소요되는 시간이 길었다. 연구원이나 교수 등 학자들의 사정이 그런데, 언론이나 기업, 학생, 일반국민들의 불편은 더 말할 나위도 없었다.

정보통신 기술이 획기적으로 발전한 지금은 통계 이용의 편의성이 크게 높아졌다. 대부분 선진국들은 통계수요자들이 통계를 편리하고 쉽게 이용할 수 있도록 다양한 방법을 강구한다. 대표적인 것이 인터넷을 이용한 국가통계포털이다. 국가통계포털이란 국가에서 작성하는 수많은 통계를 한 곳에 체계적으로 정리해두고 이용자들이 인터넷을 통해 편리하게 이용할 수 있도록 하는 시스템이다. 우리나라에서는 통계청에서 국가통계포털(KOSIS)를 운영하는데, 국가통계와 아울러 중요한 국제통계도 수록하고 있다.

▲ 불과 20여 년 전만 하더라도 통계자료는 대부분 책자 형태의 인쇄물이었다. 정보통신 기술이 발달한 지금은 인터넷을 통해 편리하고 쉽게 이용할 수 있다. ⓒ pixabay

한국은행은 경제정보시스템(ecos)을 운영하고 있다. 통계에 관심있는 이들은 사이트를 방문하면 필요한 통계를 쉽게 찾을 수 있다. 이외에도 대부분 정부기관과 공공기관은 홈페이지에 그 기관이 작성하는 통계 데이터베이스를 운영하고 있다. 미국, 일본, 영국 등 대부분의 선진국들도 각자 국가통계포털을 운영하고 있으며, 유엔, OECD, EU 등 국제기구들도 회원국의 통계를 수집하여 통계정보포털을 운영하고 있다. 통계이용자들이 마음만 먹으면 우리나라와 세계 각국의 통계를 자기 자리에서 손쉽게 찾아볼 수 있는 시대가 됐다.

통계는 한 정부기관에서 모두 생산하는 것은 아니다. 수많은 공공기관과 민간기관에서 국가통계를 작성한다. 이들 통계는 저마다 작성목적을 갖고 있으므로, 동일한 대상과 내용을 조사하는 경우는 드물다. 그렇지만 사회현상을 다양한 각도에서 파악하더라도 유사한 분야의 유사한 행위는 비록 통계작성 기관이 조사대상이 다르더라도 비슷한 모습으로 관찰된다. 다양한 국가통계들은 통계 간에 비교가능성(comparability)이 높아야 한다는 것이다. 예를 들면 1인당 GDP가 큰 폭으로 상승했다면, 가구를 조사대상으로 하는 가구소득도 큰 폭으로 상승하는 것으로 관찰되는 게 당연하다. 유사한 특성을 갖는 두 통계가 서로 다른 방향으로 나타난다면, 통계의 비교가능성은 낮아지고, 두 통계 가운데 적어도 하나는 결함이 존재할 가능성이 높다.

GDP 대비 취업자수 감소에 호들갑 떤 언론

며칠 전 여러 언론에서 GDP 대비 취업자수가 감소하고 있다고 요란하게 보도한 적이 있다. 즉, 경제성장에 따른 고용창출력이 떨어지고 있다는 것이다. 이것을 무슨 큰 일 인양 보도했지만, 지극히 당연한 현상이다. 다른 조건이 일정하다면 인구와 취업자수는 비례관계에 있다. 경제가 성장하면, 즉 1인당 GDP가 증가하면 취업자 1인당 GDP도 당연히 증가한다. 이것은 경제가 성장할수록 GDP 대비 취업자수가 감소할 수밖에 없다는 것을 의미한다. 국제비교를 하더라도 우리나라보다 못사는 나라들은 GDP 대비 취업자수가 우리보다 높고, 우리보다 잘사는 나라들은 우리보다 낮다. 국민 1인당 GDP와 취업자 1인당 GDP의 숫자의 변화는 같은 방향으로 움직여야 한다. 이것이 비교가능성이다.

통계작성기관은 통계생산에서 끊임없이 효율성을 추구해야 한다. 어차피 통계작성 기관이 보유하고 있는 인력이나 예산에는 한계가 있기에 사회가 원하는 모든 통계를 제공할 수는 없다. 그러므로 사회가 필요로 하는 통계수요를 파악하여 우선순위가 높은 통계를 작성할 수밖에 없다. 일단 사회적 통계수요가 정해지면 이들 통계를 생산하는 데 가장 능률적인 방법을 찾아야 한다. 작성해야 할 통계의 종류와 품질 수준이 결정되면, 이를 달성하는 데 인력과 예산을 최대한 절약할 수 있는 방법으로 통계를 작성해야 한다. 그러려면 통계와 관련한 끊임없는 연구개발 활동, 조직운영의 효율화, 지속적인 통계수요자 커뮤니케이션 등 다방면에 걸친 통계작성 기관의 노력이 필요하다.


민주주의는 건전한 공론장 없이는 성립되지 않는다. 공론장이 건전해지려면 객관적 현실 인식을 공유해야 하며 그 바탕이 되는 게 통계다. 통계가 흔들리면 정책도 여론도 왜곡될 수밖에 없다. 가짜뉴스도 통계 왜곡에서 출발한다. 언론인은 통계 해석을 잘못하면 ‘사회의 공적’이 될 수 있지만 잘하면 ‘해석특종’을 할 수 있다. 통계전문가인 이재형 박사가 통계에 얽힌 재미있는 얘기들을 풀어낸다. 한국개발연구원(KDI)에서 일하는 그는 <국가통계시스템발전방안> <한국의 산업조직과 시장구조> 등 많은 연구와 저술을 해왔고 통계청 통계개발원장을 역임했다. [편집자]

편집 : 박동주 기자

저작권자 © 단비뉴스 무단전재 및 재배포 금지