比赛题目的完整版思路+可执行代码+数据+参考论文都会在第一时间更新上传的,大家可以参考我往期的资料,所有的资料数据以及到最后更新的参考论文都是一次付费后续免费的。注意:(建议先下单占坑,因为随着后续我们更新资料数据的增多,会进行相应价格的提升)现在只有思路,比赛刚开始,后续会有代码+数据更新的,一次付费后续更新都是免费,不受涨价影响
群940430322
简单麦麦https://www.jdmm.cc/file/2710684/
问题1:点预测
- 数据预处理:
- 合并同一天、同一仓库、同一配件的订单需求量。
- 处理间断性数据,可以考虑使用插值法(如线性插值、最近邻插值等)来填充缺失值,但需注意这种处理方式可能引入误差。
- 特征工程:
- 根据SKU编码,可以提取配件的类别、品牌等属性作为特征。
- 考虑时间序列特征,如时间戳、月份、季节、节假日等。
- 可以构建一些统计特征,如历史平均需求量、最近N天的需求量变化率等。
- 模型选择:
- 由于数据存在间断性,可以考虑使用能够处理稀疏数据的模型,如决策树、随机森林、梯度提升树(GBDT)等。
- 也可以尝试时间序列预测模型,如长短期记忆网络(LSTM)、自回归模型(ARIMA)等,但需要确保有足够的数据来训练这些模型。
- 模型训练与评估:
- 使用历史数据训练模型,并使用1-wmape和1-smape作为评价指标。
- 可以通过交叉验证来评估模型的稳定性和泛化能力。
- 预测与结果展示:
- 对2023年8月1日至8月31日的需求进行预测,并以表格形式展示结果。
问题2:区间预测
- 数据预处理与特征工程:
- 与问题1相同,进行必要的数据预处理和特征工程。
- 模型选择:
- 对于区间预测,可以使用分位数回归模型(Quantile Regression)或基于概率预测的模型(如贝叶斯模型)。
- 这些模型能够预测不同分位数下的需求量。
- 模型训练与评估:
- 训练模型,并使用合适的指标(如分位数损失函数)来评估模型性能。
- 对于区间预测,可以使用覆盖率(Coverage)和平均宽度(PINAW)等指标来评估预测区间的准确性。
- 预测与结果展示:
- 对2023年8月1日至8月15日的需求进行区间预测,并给出10%、30%、70%和90%分位数的预测值,以表格形式展示结果。
问题3:时间序列分类与特征研究
- 时间序列分析:
- 对各SKU的日需求量时间序列进行可视化分析,观察其周期性、趋势性、季节性等特征。
- 时间序列分类:
- 使用聚类算法(如K-means、层次聚类等)对时间序列进行聚类,将相似的序列归为一类。
- 也可以考虑使用基于模型的方法,如基于ARIMA或LSTM的模型,根据模型参数或预测性能对时间序列进行分类。
- 特征研究:
- 对每一类时间序列的特征进行深入研究,如周期性强度、趋势性方向、季节性模式等。
- 这些特征可以用于指导后续模型的选择和参数调整,以提高预测精度。
- 模型优化:
- 根据分类结果和特征研究,可以对模型进行针对性的优化,如调整模型参数、引入新的特征、使用更复杂的模型等。
- 通过迭代优化过程,逐步提高预测精度。