宝贝在哪

中国失踪人口时空分布分析与预测研究


欢迎关注我们的实验与研究。
自2018年10月至今,我们开展了中国失踪人口时空分布分析与预测研究,并得到了一定成果:

研究发现,失踪人口在空间分布上是有规律的:我国东部地区的失踪和转移到达案例数要远多于西部地区;失踪者的转移路线主要为短距的,且更加集中分布在我国的中部和东部;有较多的失踪者被转移到达河北、河南和山东省。人口失踪的情况发生与时间有较强相关性:我国失踪人口数量先后经历缓慢增长、小幅剧增、大幅剧增和巨幅回落这四个阶段,“三年自然灾害”与“改革开放”的重大事件、“计划生育”政策的实施及经济发展成为这一现象的主导因素;失踪情况多发于我国人口大规模迁徙的春节前后,其次是气候温和的时节。时间变化不仅仅影响着总体失踪数量,还影响着不同区域的失踪情况和失踪转移形式:近年来,我国总体失踪情况越来越少发生,且过往相对固定的失踪者转移形式逐渐变得无规律化。
在得到人口失踪情况的时空分布结果及对应结论后,从数据集中提取失踪案例的时空特征和辅助性特征建立预测失踪者转移到达位置的随机森林模型。分别构建用于预测失踪者可能到达省份的预测模型、可能到达区块的预测模型、转移到达位置相对失踪地点距离的预测模型和转移到达位置相对失踪地点方位的预测模型。这四个模型是彼此独立的,每一个模型得到的结果不受其他模型结果所影响。这些模型表现出了较高的精度,经过经验误差检验与评价,省份预测模型的总体精度(OA)和 Kappa 系数分别高达 0.800 和 0.786。其他预测模型的 OA 和 Kappa 值也均在 0.639 和 0.581 之上。在这些独立预测模型的基础上,设计了城市级的综合预测算法,这一算法基于独立预测模型结果和样本数据进行统计分析,能够预测得到失踪者可能到达的城市结果集。使用样本集对这一模型进行检测可以发现,有多达 82.99%的实际结果位于预测结果集中。
本研究还从完成构建的随机森林独立预测模型入手,探究失踪者转移到达位置的驱动因素。根据随机森林中各决策树的构建情况,可以获知参与模型构建的不同参数权重。其中,与失踪者失踪时所在位置相关的失踪省份和失踪区块参数在各模型中的权重均为最高。权重其次的是与失踪者失踪时的时间相关量,包括失踪时年龄、失踪年份与失踪月份。权重最低的参数为失踪者自身属性信息,包括失踪者性别和失踪时身高。总体而言,失踪者的去向位置是由多个因素共同决定的,而失踪者失踪时所在位置对其转移到达位置的影响最大。

我们将成果进行了整理,撰写了论文Spatiotemporal distribution of human trafficking in China and predicting the locations of missing persons发表在了期刊Computers, Environment and Urban Systems。同时,我们也构建了中国失踪人口时空预测服务平台,协助失踪者亲属和相关人员对失踪者的寻找提供指导性建议。


刘一飞(starry1004@whu.edu.cn)  研究生在读

姚尧(yaoy@cug.edu.cn)  副教授