不在统计之列
网络版专稿 记者 盛超 7月28日,国家统计局发布数据,称上半年,全国城镇单位在岗职工平均工资比去年同期增长了18.0%。尽管报告中没有显示这一数据是从对多少人的调查结果中计算出来的,但是我们有理由相信调查人数不会超过10万。因为在此之前的7月24日和25日两天,国家统计局公布上半年我国农民人均现金收入及我国城镇居民人均可支配收入的实际增长情况,结论与此次的18%同样乐观,农民人均现金收入实际增长10.3%,城镇居民人均可支配收入实际同比增长14.4%,但得出两个结论的调查人数均不到7万人。
根据国家统计局发布的《中国统计年鉴2007年》中的数据,2003年,中国乡村人口为7.3742亿。 在另一份统计报告中显示,2006年全国城镇人口数为5.7706亿。也就是说,国家统计局以不到7万人的数据调查分别代表了7.3742亿农民和5.7706亿城镇居民。抽样调查,根据结果统计以得出结论,这样的方式无可厚非。毕竟我们的人口众多,不可能核查到每个人的收入变化,那将是一个繁杂到很难完成的事情。但是这里有一个常识性的问题,统计数据的精确度与调查人数是成正比的 ,调查的人越多,精确度就越高。
万分之一的概率是否可以作为足够的理论依据来支撑“全国城镇单位在岗职工平均工资比去年同期增长了18.0%”这样巨大而且乐观的定论,我们能确定。但是可以确定的是,很多人不再统计之列。
按照统计学的理论,如果样本足以代表母体,那么由样本所做的推论和结论可以被引申到整个母体之上。最大的问题在于选定的样本是否足以代表整个母体。统计学提供了许多方法来估计和修正样本和资料的搜集过程中产生的随机性误差。希望统计方法的结果是有效的,只有当这个系统或是所讨论的母体满足方法论的基本假设。误用统计学可能会导致描述面或是推论面严重的错误,这个错误可能会影响社会政策。
举一个简单的例子,我们去买瓜子的时候,为了确定质量和味道,在决定之前会先尝尝。这就是统计学上的抽取样本。我们习惯性的从瓜子堆的正面也就是面对我们的一面随机的抓取几个瓜子品尝,如果满意,我们就买会买一些带回家去,因为抽取的样品显示出乐观的结果,百分之百令人满意。可结论做出后,回到家一吃,后悔了,瓜子全是坏的。为什么?因为我们的样品是从面对我们的一边抽取的,而买的瓜子是从我们看不到的一面抽取的。由此可见,样本不能代表母体,那么就会导致决策性错误。
如果一个统计有可能对国家决策产生哪怕一点影响,那么这个统计应该至少做到公正、负责、尽可能的全面,或者说尽可能少的让人在看到这个统计时说,我不在统计之列。
- 国家统计局:上半年中国宏观经济处绿灯区 | 2008-07-29
- 经济学家争夺宏观话语权 从紧派稍占上风 | 2008-07-29
- 央行讳言从紧 “一保一控”成首要任务 | 2008-07-28
- 不宜过早放松对投资的调控 | 2008-07-27
- 基金提前布局中报增长股 | 2008-07-25

