对于线上和线下的零售行业,销量展望都是一项至关重要的恣意,它可以帮助企业更好的预备库存以及在各个仓库之间分配商品。特别是在大型购物节期间,强劲的促销活动将极大地促进消费。然而,可供参考的历史数据却非常稀缺。如何同时对城市的分歧地区和分歧时光段的销量从事展望,是一个非常具有挑战的问题。
在2020年12月收录的AAAI 2021(CCF-A类)上,京东城市被收录了一篇名为《Robust Spatio-Temporal Purchase Prediction via Deep Meta Learning》的论文。该论文研究了如何通过深度元进修,结合城市中的各项信息以及历史的销量数据,对未来,特别是大型购物节期间,城市中各个地区分歧时光段的销量从事展望。
一、背景
购物中心和商店的空间散布、人口的散布属性以及分歧的日期典型(例如,工作日,周末或购物节)等因素,将会导致分歧的购物方式,如图1所示。
由于来自某个一定地区以及一定时光范围内的数据过于稀缺,我们无法仅使用某个范围的数据去训练一个高精度的展望模型。同时,城市中分歧地区的人口密度和散布特性高度异质,并且随着时光的推移地区特性也会发生变化,对这样复杂的时空采办形式从事建模是一个非常困难的恣意。
为了准确地拿获地区的空间特性,它需要考虑一组综合的空间特性,例如兴趣点(POI)散布,地区的人口统计特性等。如何通过跨时空建模进修提升单个地区在一定时光段的展望精度是我们的主要恣意。
图1 空间散布
作者将该展望恣意分为主要三个部分:
1)利用时空元进修推理,对分歧的时空地区天生对应的时空体现;
2)进修分歧时空地区间的同享信息,同时结合地区一定的时空体现,得到更加可靠的展望销量;
3)通过时空瓜代训练使得模型在空间以及时光层面都能够得到更加完善的进修。
图2 摊销网络
二、时空体现天生
我们开发了一个摊销网络(如图2 Amortization Network 所示),以对目标地区和日期典型的时空体现的近似后验散布从事建模,该模型需要同时考虑销量特性和相关空间特性的影响。
从图3(a)中我们可以看到,以北京为例,分歧城区的销量散布有着明显的区别。
要完全拿获分歧地区展望恣意的采办数据的时光特性,还需要考虑历史销量数据之间的线性和非线性时光相关性,例如采购订单和购物车记录中所隐藏的周期形式。
图3(b)中我们能够看到明显的以周为周期的销量形式变化。为了对这种复杂而动态的时光序列形式从事建模,我们使用了线性变换模块来获得销量的大致基数,并使用一个特殊的跳跃LSTM层来拿获销量变化的非线性时光形式。接着,通过特性融合模块将提取的时光特性与静态特性相结合,以进一步支持构建更具有代表性的销量时空体现。
图3 销量形式变化
三、时空销量展望
通过上一步,我们已经得到了一定时空地区的销量体现。接下来我们将介绍一种利用同享统计结构的天生模型,来进修分歧时空展望恣意间所同享信息。对于恣意一定的展望,它大大提高了进修效率和展望准确性。该天生模型的结构可以参考上节所属的摊销网络结构的解码器(图2 Generative Model 所示)。
它使用两个分歧的输出来天生最终的销量。第一个输出侧重于通过对最近一段时光的输出销量,利用特性提取和融合技术来挖掘当前的采办体现,该特性描述了近期的销量形式的变化。第二个输出是从摊销网络中采样的一定于某个时空展望恣意的时空特性体现。它拿获了目标恣意的宏观时空形式。最后,天生模型使用完全连接的网络将两个输出合并,对目标时刻的销量订单从事展望。
四、时空瓜代训练
分歧的时空恣意仅与来自一定地区和时光范围的有限数据相关联,无法完全描述一定地区的采办行为。受多视图进修的启发,我们构建了两种视图(空间视图和时光视图)来描述数据的分歧观点。两个视图相互补充,以增强进修到的信息并获得更准确的时空数据体现。空间观点倾向于进修分歧地区的采办形式,而时光观点倾向于挖掘分歧时光段典型的时光变化形式。
训练期间在分歧视图之间从事切换可以在分歧地区或日期典型之间进修到分歧的时空信息。同时,在瓜代训练期间还能够整合分歧时空恣意同享的天生模型,并提高了展望准确性。完整的训练过程如算法1所示。
算法1
五、实验
我们使用来自京东的海量高质量在线销量数据集来评估我们的模型。JD数据集包含时光跨度从2015年至2019年的采购订单,购物车数据(作为动态时光序列特性)和包括北京18个行政区块的地区特性(例如POI和人口统计资料数据)作为静态特性。
为了验证模型的有效性以及鲁棒性,作者对分歧时光区间(周内,周末,购物节等)的销量从事展望评估。同时还对模型中的分歧组件从事消融分析,对分歧组件的有效性从事评估,结果如表1所示。
表1 分歧组件的有效性表1中我们可以看到,对于平日较为平缓和购物节的爆发性展望设置中,STMP均优于所有基线方法。在MSE方面,STMP均比最佳基准提高了至少30%。在爆发性销量展望场景中,STMP仍比基准降低约30%至60%。这些结果表明,当实际采办形式与平时截然分歧时,我们的方法是有效且可靠的。
为了进一步研究STMP各个模型组成部分的影响,我们还在表1中比较了STMP及其变体的性能。可以观察到,STMP-VI在总体和周末情景中表现良好,这些情景具有相对稳定的采办形式,但在购物节上的表现要比STMP差。这是因为STMP-VI使用点估计而不是一定于恣意的时空体现的散布描述,当数据有限或形式高度不确定时,这会出现问题。
此外,与STMP或其他变体相比,STMP-SKIP的准确性较差,但仍优于其他基准。这证明需要考虑采办时光序列中的多个周期性形式。这也反映在图4(b)中,我们可以在采办时光序列数据中看到清晰的周期性形式。这些证明对数据中的多个周期性属性从事建模在提高模型性能方面起着重要作用。
图4为了探究模型在分歧地区以及时光段的效果,作者挑选了四个具有代表性的地区(覆盖分歧销量范围,详细地理位置请参见图4(a))将STMP与基线方法在整个2019年的销量数据上做可视化,如图4所示。在大多数地区,基线无法很好地展望购物节期间采办时光序列的突发性,例如中旬促销和11.11的采办高峰。他们倾向于给出保守的结果,并且只专注于提高整体准确性。但是,STMP利用分歧地区和日期典型的时空体现来支持多恣意少拍进修,以促进对一定地区和日期典型的更好展望。可以观察到,只有STMP能够准确地展望爆发式的销量(所有图6中的峰值)。
图5同时作者对于购物节历史数据的可参考情况从事了进一步的探究,在购物节销量数据非常稀缺的情况下,每增加一次购物节可见数据,精度会有一定的提升。然而即使在购物节可参考数据只有一次(持续大约一周)的情况下,STMP也具有较高的准确率,这表明了模型的鲁棒性。
表2最后,作者对时空瓜代训练方式在三个大型购物节上也做了比较。在时光训练中,合并操作将来自同一天典型的实例成批集成,而不考虑空间知识。同时,在空间训练中,模型将来自同一地区的一批实例集成在一起,而无需考虑时光信息。
从表2中我们可以看到,即使不完整的T训练和S训练也比表1列出的基线提供更高的准确性。但是,与完整的时空瓜代训练相比,缺乏时空上的联合元知识仍然会导致较低的准确性。这表明分歧的训练形式会跨地区和时光典型进修分歧的转换。从时空方面的补充训练可以有效地提高展望的准确性。
Powered by Froala Editor
原创文章,作者:京东科技开发者,如若转载,请注明出处:https://www.iaiol.com/news/aaai2021-lun-wen-li-yong-shen-du-yuan-jin-xiu-dui-cheng-shi/