第四届挑战赛B1-基于时间序列模型的铁路旅客流量预测

发布时间:2016-10-18 作者:BdRaces 浏览量:2119

摘要: 

本文旨在研究铁路旅客流量预测问题,通过对数据的挖掘,多维度的分析客流规律,建立客流规律预测模型并优化车辆配置及车辆停靠方案。

本文通过运用 eclipse,mySQL 等软件建立了列车到站离站信息数据库,包括列车表,站点表,到站离站表和区间表等常用表。用 matlab 结合 mySQL 对旅客梯形密度表中的数据从车次、时段、车站和区间四个角度进行了分类处理。综合考虑各车次的客座率,客流流入区间波动情况,每日的客流高峰时段,站点等级和客流流向,多维度的分析客流规律。针对站点,运用改造的 RFM 模型对各个站点分区;针对区间,从三个角度——ZD111-01  ZD190-01 的本地客流(管内上行)、ZD190-01  ZD111-01(下行)的本地客流和 ZD111-01  ZD190-01 的外地客流分析客流流向趋势。

其次,本文建立考虑季节特征的 SARIMAX 模型对未来客流进行了预测,但是节假日效应对预测误差影响明显。基于数据的分析,我们发现节假日的预测误差在期间以三角函数波形波动,我们采用傅立叶函数系对节假日误差段进行三阶拟合,拟合优度都在75%以上。同时结合预测值与实际值线性变化的性质,对前一年节日误差段进行当前年份的校正,并用 15 年春节数据对 16 年春节校正并检验,效果显著。这足以证明这种基于傅立叶拟合的节假日误差修正技术适合于消除 SARIMAX 模型所不能规避的节假日效应。

同时考虑天气的影响,发现天气虽然会影响客流量,但是对预测误差影响不明显,我们认为这是由于 SARIMAX 模型已经在客流量数据变化的角度解释了这种现象。

基于这两种情况的分析,给出了未来两周各搭乘区间客流量的预测。

最后,建立多阶段决策的调度模型。考虑到管内车客座率分配不均会导致高峰期列车资源的严重浪费的情况,兼顾模型求解的复杂性,建立了以日客座率各车次平均分配为目标的 0-1 规划模型。用 lingo 分支定界得到各车次不同日期的停靠站点的局部最优分配方案,同时对比节假日(高峰期)和工作日(低谷期)分配方案,得到常驻站点和可变站点的设置方案。此外,结合客流规律的分析,采用贪婪算法,对编组方案进行了优化设计。具体如下:取消 D11 和 D18 班次的 ZD250 站点;D16 增开 ZD062 站点;D05, D06,D07 和 D16 增开 ZD190-02 站点;D05 车次由 16 组编组改成 8 组编组。 

关键词:改造的 RFM 模型 SARIMAX 预测模型 傅里叶拟合 0-1 规划 贪婪算法