基于SPSS皮尔逊相关性预测快递网点的派件量

这是我最近这段时间学习统计学以来的一个成果,我甚至不清楚这样的成果是不是真的能够印证出快递网点的派件量,但是这已经是尽我的最大限度努力在完成这一成果,其中对数据条目上的数据不一致而产生的误差都有标注。预测派件量以平和县下辖各乡镇为例。

1 全盘思路

由于平和县各镇的派件量不论是早前的数据还是近年的数据都无法查询得到(其行政层级过低),因此将借助于其他变量(类似于中间量的概念)与行政层级高的已知派件量的皮尔逊相关性分析,来对平和县各镇的派件量作预测,由于这当中的逻辑略微难以理解,以下用思维导图阐释:

需要解释的一点是,我之所以认为能够用与行政层级高的已知派件量相关性显著的中间量,来预测行政层级低的未知派件量,是因为我所选的高行政层级同所要预测的低行政层级都处于同一个省,具有地缘上、文化上、经济上、政治上、历史上的共性特征。在无法得知切实的派件量时,我所想出来的办法就是这样。
为确保预测的精准性,这些中间量将会是平和县各镇所查得到的最新数据(这些数据来源于国家统计局发布的《2017中国县域统计年鉴(乡镇卷)》中平和县各镇的数据及其2010年的第六次全国人口普查 所公报的有关平和县下辖乡镇人口数据,后文附录将附上详细的数据量表),其中所记录的数据是相当有限的,有且仅有行政区域面积、常住人口、企业个数、企业从业人员、工业企业单位、城镇建成区常住人口这几个部分的数据,因此这几个仅有的数据只能作为中间量来预测了。高行政层级的(这里我所能找得到的已知派件量层级最低也必须到市级)中间量同时我也在数据搜罗中确保数据是所能查到的最新数据,并且后文会给出对这些数据的误差脚注。


1.《2017中国县域统计年鉴(乡镇卷)》:已经是目前所能查得到的最新数据,详询访问该网址:
国家统计局对该统计年鉴出版物所作出的官方阐述
2.人口普查每10年进行一次,尾数逢0的年份为普查年度。第七次全国人口普查将于2020展开,因此2010年的人口普查数据为目前所能查得到的最新数据,该(所能查得到的)数据提供平和县下辖乡镇的年龄分层人口数及男女性别比,数据来源自CITYPOPULATION

2 预测防控:两种备选已知派件量数据

1 两种备选数据的个案摘要

与此同时,为防避已知数的派件量数据与中间量所测出来的相关性都极弱,因此已知数需要有备选数据——这些备选数据必须是与派件量数据相关性极强的,目前所能找到的备选数据包括互联网用户和邮路单程长度这两种数据(2017年) ,如下表SPSS所导出的个案摘要所示,其中快递业务(万件)即已知的派件量数据:


发表评论

电子邮件地址不会被公开。 必填项已用*标注