在北京哪个省的人最多?
统计维度是什么?这个“某地的人”又是指什么? 这问题有点意思,可能涉及到统计上的地理分布问题、以及对于“人”的定义。 先谈谈什么是地理分布,这涉及到底层数据是怎样的。我们统计某个地区的人数时,一般需要知道该地区的人口数量及构成,例如人口性别比、年龄比等等。但只有这些还不够,还需要知道该地区的家庭数量和构成等,才能进行加权计算得到每个人对应的数据。而家庭数量的多少又取决于该地区一家的平均人数,这就引出了下一个问题——怎么确定一家平均人数?
关于如何判定一家之“家”的统计学定义,目前没找到统一且合适的定义,但是我们可以找到一个近似定义——“居住单元”,这指的就是一个居民户口所在地为同一住址的住宅单位。如果这一概念被界定,就可以基于基层统计数据通过加权求得每个省份(地区)的人均GDP、城乡居民收入比等等指标。然而,一家平均人数究竟应该是几人呢?这似乎很难有一个放之四海而皆准的答案,所以只好选择一个折中的方法,也就是假设每家都是3.5人。(当然,如果你愿意假设各家大小不一,那也没问题。)
现在的问题变成了如何获得各省(地区)的家庭数量,这实际上是一个宏观经济学中的区域总量需求问题。因为家庭数量与人口数量一样具有天然的地域维度,所以在做全国加总的时候必须考虑地区差异和人口迁徙带来的变动。这里给出一种思路,仅供参考: 首先建立基础模型:假定每个地区(省市区县乡镇)的人都同等重视自己的福利,都试图将其他地区的消费品平摊到自己的消费中去,这样总消费的边际效用就等于每一地区消费的增加量。
在此基础上引入地区固定效应,可以得到每一个地区(省市区县乡镇)的人应占有的消费品数量: 接下来把各地的人应占有消费品的数量加总求和,就可以得到全国每一个人应有的消费品数量。最后用实际的消费品数量除以应有消费品数量可以得到修正系数,用这个修正系数可以重新计算出人均GDP等指标。
以上只是一个基本框架,具体的细节需要大量的数据和详细的测算才能完成,此处不再赘述。虽然本文提出了一个解决之道,但实际上由于数据难以取得等各种原因,这个问题几乎不可能得到解答。当看到各种报告中关于“某人最多的省份”的各种排名时,不必太当真。