第十一届挑战赛B3-产品订单需求预测分析

发布时间:2023-09-01 作者:本站原创 浏览量:3830

摘要:

对产品订单需求的分析和预测一直是企业优化生产,降低风险的一项重要手段。只有充分了解产品需求才能更好的进行生产活动;只有提高需求预测的准确性,才能对未来的运营计划做决策参考。因此,我们将基于国内某大型制造企业在2015 年9 月1 日至2018 年12 月20 日面向经销商的出货数据,对产品订单需求量进行特征分析及预测分析。

由于历史数据可能在收集和传输时出现一定的错误,因此先要对出货数据的进行预处理,并对已有特征的有效信息进行处理与提取,构建新的特征,得到最终可以进行分析的订单数据。

针对问题1,首先通过逐步回归法进行特征筛选,除促销日外其他数据特征都与需求量有关。对产品订单数据特征进行深入分析,①通过产品价格对产品需求量的影响探究发现不同类型产品的价格对需求量的影响不同,对于大部分产品,产品价格越低,需求量越高,但整体上需求量会在一个稳定的价格区间内波动;②不同的销售区域内产品的需求量以及平均每订单产品需求量有一定差异,这可能取决于销售区域与制造企业的距离,距离远会增加产品的运输成本;③整体上在节假日上的日需求量会小于非节假日的日需求量,但不同类型的节假日对产品需求量的影响程度不同,其中春节对需求量的影响最大;④在一些大型促销活动如618、双11,经销商需在促销活动开始前提前一个月或两个月订购产品,避免因企业出货晚使得促销活动无法顺利进行,这也导致了需求量的季节性波动;⑤经销商倾向于在气温适宜的春秋季节订购较多的产品,在天气炎热的夏季产品需求量最低,而冬季气温低下,又逢春节,其产品需求量仅高于夏季;⑥一般来说线下实体经销商的产品需求量远高于线上电商平台的需求量,只有在大型电商促销活动如双11 的影响下,线上的需求量才会短暂高于线下;⑦ 一般产品需求量在月头时较低,在月末时较高,需求量会呈现月周期性波动。基于上述对需求量的特征分析,再深入探究不同品类间产品需求量在这些特征影响下的相同点与不同点。

针对问题2,为了从不同时间粒度对每个产品未来三个月的需求量进行预测,将每个产品的缺失日期补全,对应需求量填充为0,并按天、周、月粒度进行处理并进行特征筛选。以2015年9 月-2018 年9 月的历史数据作为训练集,以2018 年10 月-2018 年12 月的历史数据作为测试集,基于产品需求量的数据特征以及月周期性,构建随机森林模型、XGBoost 模型、Prophet模型,比较在测试集上的预测效果,得到在相同时间粒度下,对于MAE 和RMSE:Prophet 模型>随机森林模型>XGBoost 模型。对于R2:Prophet 模型<随机森林回归模型<XGBoost 模型。XGBoost 的预测效果要优于其他两种模型。在这三种预测模型中,R2 的值都是月粒度>周粒度>天粒度,因此,三种时间粒度下预测精度的大小为:月粒度>周粒度>天粒度,由此可见,对天粒度的产品需求量进行预测的准确率是最低的,对月粒度预测精度会更高,这刚好符合企业和经销商对产品需求量的预测需求,因为为了方便生产,企业只需要大致了解未来一个月的产品需求量以制定生产计划,由于产品需求量具有月周期性,且天粒度的需求量具有随机性,所以企业对需求的预测并不需具体到天。

最后,我们对月数据进行特征工程处理,加入滞后、差分、拓展窗口、滑动窗口特征,对XGBoost 模型进行改进。使用改进的模型对月粒度数据进行预测,改进的XGBoost 模型在测试集上的MAE 和RMSE 均小于原来的模型,且R2 提高到0.57,说明改进的XGBoost 模型的预测精度得到了进一步的提升,并基于改进后的XGBoost 模型对2619 种产品进行预测,新产品使用对应产品细类历史数据的时间序列均值,预测结果见result1.xlsx。

关键词:逐步回归法;时间序列;特征工程;随机森林;XGBoost 模型;Prophet 模型

点击查看全文