人口分布推算–基于第五、第六次人口普查数据

本例基于人口普查的数据,按各年龄段的出生死亡比率建立人口推算模型。试图推测未来几年的人口年龄分布。

 

一、数据采集

首先采集全国分年龄、性别的人口数据:

数据来源:国家统计局

其次是分性别、年龄的死亡人口的数据:

数据来源:国家统计局

处理数据后得到下表:(蓝色数字为计算得出)

并将人口分为三个年龄区间。1:0-19岁;2:20-64岁;3:65岁以上。

数据来源:国家统计局

 

二、数据处理

在各年龄段,考虑年龄递增的因素后依各年龄的出生、死亡率计算出推算人数。

另根据总人口的出生、死亡率计算出总人口的推算人数(合计)。

可见随着年代的递增,分年龄段的推算人数汇总(合计(SUM))与总人口的推算人数(合计)之间的误差逐渐增大。2020年后误差((合计-合计(SUM))/合计(SUM))超过5%。

 

三、可视化

各年龄区间人口数分布:(单位:百万)

2000年各年龄段人数:(单位:百万)

2005年各年龄段人数:(单位:百万)

2010年各年龄段人数:(单位:百万)

2015年各年龄段人数:(单位:百万)

2020年各年龄段人数:(单位:百万)

第二年龄区间(20-64岁)人口数推算:(单位:百万)

第一年龄区间(0-19岁)人口数推算:(单位:百万)

 

四、结论

1、65岁以上人口占比将逐年上升。

2、第二年龄区间(20-64岁)人口在2015年达到峰值之后将逐年递减。

3、第一年龄区间(0-19岁)人口在经历快速下滑后于2015年以后趋于平稳。

 

五、2010年第六次人口普查数据

第六次人口普查数据处理:

数据来源:国家统计局

根据2000年人口普查数据推算结果与2010年人口普查数据比较:

各年龄区间人口数分布:(单位:百万)

2010年各年龄段人数:(单位:百万)

2015年各年龄段人数:(单位:百万)

2020年各年龄段人数:(单位:百万)

2025年各年龄段人数:(单位:百万)

2030年各年龄段人数:(单位:百万)

第二年龄区间(20-64岁)人口数推算:(单位:百万)

第一年龄区间(0-19岁)人口数推算:(单位:百万)

 

六、国家统计局公布数据

蓝色数字为计算得出。

数据来源:国家统计局