你在这里

统计数据的陷阱

今年两会期间,官媒报道说:2016年大气污染有所好转,PM2.5比上年减少30%。接下来很多网友跟帖表示没有感觉到污染有明显的改善。我不敢随便揣测官媒做假,尽管历史上报道称农业亩产上万斤的也是这家官媒,官媒吗,其职责总是报喜不报忧,但愿今天的官媒报道能够吸取过往的教训,即使报喜也应该客观一点。

我们暂且假定官媒的报道是客观的,那么,为什么民众的实际体验和官媒的报道相差那么多呢?

同样,统计局每年发布的通货膨胀率,也就是消费者物价指数(CPI),似乎都比实际过日子的主妇们感觉的要低很多。每次回国都去逛逛超市和商店,主妇们会埋怨物价涨得太快。其实中国的物价高是一目了然的。

另外,让我们来看看中国的人均GDP,所谓人均GDP是中国民众一年奋斗创造出的财富按人均算出的一个平均数,现在中国的人均GDP近9000美元。也就是说,一家3口,如果其收入水平是平均水准,年收入应该在25000美元上下(超过17万人民币)。我想应该有很多家庭一定会觉得自己在拖国家的后腿。为什么?因为他们的收入离这个平均值还差很远很远。特别是像中国这样一个人口众多,且现在只有少部分人先富起来的国家,政策执行者用人均GDP,这个平均值来表功实际没有太大意义。

回来说大气污染,现在测算大气污染一般用PM10和PM2.5的每立方米的浓度,这种测算的方法是科学,没有多少争议,但是,大气污染往往受天气因素影响,刮风能吹散污染物。所以,国内有些城市称PM2.5造成的大气污染是自然现象。如果把一年当中的平均值当作衡量大气污染的指标自然地掩盖了问题的严重性。因为大气污染在无风的情况下其浓度的上升造成的危害更客观而真实。对于所有人群,影响健康的不是那个平均值,更可怕的是PM2.5浓度高的时候所吸入的有害物质的浓度。

另外检测污染严重性的另一个指标是呼吸器官疾病的发病人数的变化,然而,现在国内这方面的统计据说是国家机密。当然,有人会说我们还无法一一举证这些疾病和大气污染的相关性。但即使无法举证,这一客观存在的数据还是应该公布出来以提醒人们的注意。

其次,物价指数的计算是很容易人为操作的,因为,计算物价指数是把各种商品价格和服务的价格乘上其权重(百分比),然后合计出物价指数。这里面的猫腻是如何安排各种商品和服务的权重?在实际的权重安排上,价格上涨高的食品,其权重被大大降低,大大低于恩格尔系数(家庭的食品消费÷可支配收入),这样一来,即使食品的价格上涨很多,其在物价指数里的权重被降低,那么整个物价指数就可能被低估很多。

至于说收入差距,比较科学的指标是基尼系数,但估算基尼系数需要比较精确的家庭收入数据,这在中国很困难。没有人能说的清中国人的实际收入。另外,由于基尼系数对非经济专业的人来说不容易明白,尽管,经济学教科书告诉我们:基尼系数越高(接近1),那么收入分配的两极分化就很严重。国家统计局公布的估算结果基尼系数为0.47。一般来说,基尼系数在0.3以下没有太大问题,超过0.4,社会就会陷入极度不稳定状态。

我看过一个预估的数字,说中国最有钱的3%的人群占有了全国财富的75%,如果真是这样,那问题就严重了。美国的贫富分化很大,但尽管如此,据说美国最富裕的4%的人群所占有的财富比例是45%。像中国这样一个人口众多而贫富分化大的国家,拿人均GDP来衡量中国的家庭收入实际是不准确的。

福布斯和那个叫胡润排行榜的调查结果都显示北京的富豪人数已经超过美国纽约,而且中国产生富豪的速度也是世界第一。人均GDP完全无法捕捉这些巨富人群,也无法捕捉一贫如洗的家庭。中国有世界上最富有的人群,世界上最贫穷的人群也在中国。今天的政府工作报告中把扶贫脱贫列入政策之中,应该说是客观而谦虚的。

统计数据是政策执行者制定和执行正确政策的依据和保障,如果统计数据被有选择的使用,特别是人为操作,甚至做假,那么我们就无法期待政策的正确性。比如大气污染的数据,仅仅公布一个城市的PM2.5的当天的平均值是不够的,应该是公布每个观察地点的数据,然后看其具体的变化。如果把郊外的数据和市中心的数据平均一下,自然容易会给人带来错觉。正确地收集和公布统计数据是正确制定和执行政策的保障,也是真正解决问题的第一步。

关键词: 
栏目: 
首页重点发表: 

Theme by Danetsoft and Danang Probo Sayekti inspired by Maksimer