基于ARIMA和随机森林的蔬菜定价补货策略研究
摘要
关键词
随机森林,销量预测,补货策略,成本加成定价,生鲜蔬菜
正文
1. 引言
在生鲜商超中,由于蔬菜类商品的保鲜期短,品相随着销售时间的增加而变差,若大部分蔬菜类商品当日未售出,隔日将无法再售。因此,商超每天会根据商品的历史销量和需求情况进行补货。但是由于商超销售的蔬菜品种多样与产地不同,且进货交易时间通常在凌晨 3:00-4:00,商家需要在不清楚具体品种和进货价格的情况下做出补货决策[1]。同时,蔬菜的定价一般采用“成本加成定价”方法,商超会对品质下降的商品进行打折销售。
综上,这篇文章目的是主要解决生鲜蔬菜商超的日补货量和定价策略问题。
2.材料与方法
2.1数据预处理
本研究收集了相关数据,包括蔬菜品类名称以及对应的编码和单品名称对应的编码,不同品类不同单品在不同时间的销售流水情况以及是否打折、退货等信息,各大单品在不同时间段的批发价格,品类和单品在运输和销售等过程中的磨损率。
2.2 研究方法
本文主要技术路线如下:
(1)使用成本加成定价公式计算每个蔬菜品类的成本利润率,并分析了其与销量的关系。
(2)使用ARIMA模型预测了各蔬菜品类的批发价格走势。
(3)基于随机森林算法建立了批发价格、销售价格等特征与销量之间的关系模型。
(4)考虑蔬菜的磨损率,通过优化模型确定了各蔬菜品类未来一周的最优补货量和销售价格策略。
3.模型建立与求解
3.1各蔬菜品类的销售总量与成本加成定价的关系
通过用皮尔逊相关性在以单品和品类为基础的分析。通过各个品类的热力图进行可视化。品类或单品在相关性分析中,成本利润率与总销量的相关性非常低即成本利润率与总销量和批发价格无关联性。相反,销售价格和总利润与成本利润率存在相关性,其中花菜类与辣椒类的品类中,两者呈正相关关系,在实际生活中,当成本利润率达到一定数值时,利率会下降。
因此,总体来看高的销售价格会带来高的成本利润率,但与之相反会使销售量更低。我们推测由于蔬菜类商品在日常生活中贩卖地域广,需求量相对较少,此时适当提高成本利润率会使盈利水平提高。
3.2各蔬菜品类于未来一周的日补货量和定价策略
通过批发价格,采用ARIMA时间序列模型来预测未来一周的走势。由于不同品类的价格基数不同,导致需要进行多次ARIMA模型的训练。由于ARIMA模型需要有自相关函数以及偏自相关函数来确定阶数[2,3],因此,我们采用网格搜索的方式,得出搜索区间为[-4,4],其中AIC值最小时对应AR阶数和MA阶数。根据运行后的图像观察阶数是否符合。
然后,我们为了检验数据是否稳定,通过ADF单位根检验的方式。P值为0.000207,P值若小于0.05则不需要进行额外拆分。
通过网格搜索的结果决定ARIMA模型的阶数为AR为3、I为1、MA为2并将其作为最终花叶类的预测未来七天批发价格的模型。其余的品类都将通过相同的过程确定,然后得到每个品类未来七天的批发价格。在此基础上,我们还行构建价格与销售量的关系,通过最小二乘法建立一元线性回归模型,观察价格能否给予恰当的销量。如下图1所示。
图1 花菜类价格和销量的线性回归结果
以花菜品为例,从图1来看,花菜类价格分布符号正态分布且可以进行线性回归,但却有预测销量较低,无法销售的问题。因此,采用随机森林进行多特征建模。将多种因素如:批发价格、销售价格、季节特征等多个时间特征合并一起进行预测,把数据划分为训练集和测试集两种,由于随机森林可以识别不同品类,因此只需通过一个随机森林带来的数据即可,得到训练集MAE值0.942,测试集MAE值0.631。分析知随机森林较线性回归有明显提升。根据给出的批发价格,通过输入不同的销售价格,结合多个时间特征来预测销量,随后即可计算出固定的销售价格所对应的总利润。
由于该优化函数只是线性优化问题,因此只需通过网格搜索的策略来求解足以得到最终的七天的不同品类的预测情况。
4. 结论
本研究通过随机森林算法预测了生鲜蔬菜的销量,并基于此制定了最优补货策略。研究发现,随机森林模型可以准确预测销量,为商超制定最优补货策略提供决策支持。此外,考虑蔬菜的磨损率,优化模型确定了各蔬菜品类未来一周的最优补货量和销售价格策略,实现了收益最大化。研究结果对商超运营管理具有实际意义,有助于提高生鲜蔬菜的运营效率。
参考文献
[1]李晓璐,周曙光. 我国生鲜商超零售业发展问题研究[J]. 商业经济研究,2021,(23):35-37.
[2]王勇超,罗胜文,杨英宝,张宏鑫. 知识图谱可视化综述[J]. 计算机辅助设计与图形学学报,2019,31(10):1666-1676.
[3]董红瑶,王弈丹,李丽红. 随机森林优化算法综述[J]. 信息与电脑(理论版),2021,33(17):34-37.
...