北京大数据研究院院长刘云淮教授团队获CIKM 2025最佳学生论文奖

2025-11-25
来源:
在近日举行的2025年ACM信息与知识管理大会(CIKM 2025)上,北京大学计算机学院软件研究所大数据与普适计算实验室与京东物流联合开展的研究《-TR: Data-driven Daily Delivery Task Rescheduling for Cost-effective Last-mile Delivery》荣获应用研究赛道最佳学生论文奖(Best Student Applied Research Paper)
图片

CIKM (International Conference on Information and Knowledge Management) 由ACM主办,是数据挖掘领域最高水平的国际学术会议之一,享有极高的学术声誉。该会议始于1991年,长期以来一直是推动数据挖掘发展的核心学术论坛。

图片

论文的第一作者为北京大学计算机学院博士生张立地,其他作者包括导师北京大数据研究院院长、北京大学计算机学院博士生导师刘云淮教授,和美国罗格斯大学的联合导师张德升教授。

图片

该论文场景来源于刘云淮教授与京东物流技术团队的合作项目。其解决的核心痛点是:在快递量波动、快递员随时可能请假的现实下,传统“固定片区”模式失灵,营业部只能临时高价招外包或由营业部经理凭经验手动改派,成本增加的同时时效也可能受到影响。D3-TR(Data-Driven Daily Delivery Task Rescheduling)因此诞生,目标是在“零新增人力”前提下,把缺席快递员的订单快速、公平地重新分配给在岗且有余力的人员。

为了实现“快且公平”,论文把工时评估的排序相关性首次引入快递分单场景:用 2022年至2024期间北京真实脱敏的500余万订单、200余名快递员、1200个区域数据训练了高一致性的XGBoost工作负载预测器。特征分为三类:①时间特征(是否大促、节假日、是否周末);②空间特征(区域类型、面积、历史单均配送时长);③快递员特征(近30天平均工时、个人单均配送时长、当天已分配区域数量)。训练时利用“首单揽收至末单签收”的真实在岗工时作为标签。关键改进是在传统XGBoost方法的MSE损失外增加可微Soft-Rank正则项,使预测工时序列与真实序列的Spearman排序相关性更高,保证下游优化时“谁更累”的相对顺序不颠倒。

优化端采用负荷感知的遗传算法:染色体采用“AOI→快递员”一维整数编码,适应度函数为“平均超时工时”(AWTOD),同时隐含公平性——方差越大,AWTOD越高。初始种群在“就近+容量余量”启发下生成;变异算子将以一定概率将高负荷快递员任务转移给低负荷快递员。每次迭代保留前10%的可行解,500代后输出当日改派方案。整个流程可以在小型笔记本电脑上几十分钟完成大规模进化,输出当天的分单方案。

2023年6月起,该方法在北京6个不同类型营业部(工业、住宅、商业及混合区等)部署上线,覆盖二百余名快递员。相比原人工方案,该方法最多可提升配送准时率约6.2%,降低快递员超时工作时长约10分钟。由于减少了快递员加班与外包成本,内部财务口径估算未来若推广到全国核心城市,预计每年可节省千万级人力成本。

论文信息:

Lidi Zhang, et. al,. D3-TR: Data-driven Daily Delivery Task Rescheduling for Cost-effective Last-mile Delivery. In Proceedings of the 34th ACM International Conference on Information and Knowledge Management (CIKM '25). https://doi.org/10.1145/3746252.3761550