AAAI 2021论文:利用深度元进修对城市销量从事展望

对于线上和线下的零售行业,销量展望都是一项至关重要的恣意,它可以帮助企业更好的预备库存以及在各个仓库之间分配商品。特别是在大型购物节期间,强劲的促销活动将极大地促进消费。然而,可供参考的历史数据却非常稀缺。如何同时对城市的分歧地区和分歧时光段的销量从事展望,是一个非常具有挑战的问题。在2020年12月收录的AAAI 2021(CCF-A类)上,京东城市被收录了一篇名为《Robust Spatio-Temporal Purchase Prediction via Deep Meta Learning》的论文。该论文研

对于线上和线下的零售行业,销量展望都是一项至关重要的恣意,它可以帮助企业更好的预备库存以及在各个仓库之间分配商品。特别是在大型购物节期间,强劲的促销活动将极大地促进消费。然而,可供参考的历史数据却非常稀缺。如何同时对城市的分歧地区和分歧时光段的销量从事展望,是一个非常具有挑战的问题。

在2020年12月收录的AAAI 2021(CCF-A类)上,京东城市被收录了一篇名为《Robust Spatio-Temporal Purchase Prediction via Deep Meta Learning》的论文。该论文研究了如何通过深度元进修,结合城市中的各项信息以及历史的销量数据,对未来,特别是大型购物节期间,城市中各个地区分歧时光段的销量从事展望。AAAI 2021论文:利用深度元进修对城市销量从事展望

一、背景

购物中心和商店的空间散布、人口的散布属性以及分歧的日期典型(例如,工作日,周末或购物节)等因素,将会导致分歧的购物方式,如图1所示。

由于来自某个一定地区以及一定时光范围内的数据过于稀缺,我们无法仅使用某个范围的数据去训练一个高精度的展望模型。同时,城市中分歧地区的人口密度和散布特性高度异质,并且随着时光的推移地区特性也会发生变化,对这样复杂的时空采办形式从事建模是一个非常困难的恣意。

为了准确地拿获地区的空间特性,它需要考虑一组综合的空间特性,例如兴趣点(POI)散布,地区的人口统计特性等。如何通过跨时空建模进修提升单个地区在一定时光段的展望精度是我们的主要恣意。

图1 空间散布

图1 空间散布

作者将该展望恣意分为主要三个部分:

1)利用时空元进修推理,对分歧的时空地区天生对应的时空体现;

2)进修分歧时空地区间的同享信息,同时结合地区一定的时空体现,得到更加可靠的展望销量;

3)通过时空瓜代训练使得模型在空间以及时光层面都能够得到更加完善的进修。

AAAI 2021论文:利用深度元进修对城市销量从事展望

图2 摊销网络

二、时空体现天生

我们开发了一个摊销网络(如图2 Amortization Network 所示),以对目标地区和日期典型的时空体现的近似后验散布从事建模,该模型需要同时考虑销量特性和相关空间特性的影响。

从图3(a)中我们可以看到,以北京为例,分歧城区的销量散布有着明显的区别。

要完全拿获分歧地区展望恣意的采办数据的时光特性,还需要考虑历史销量数据之间的线性和非线性时光相关性,例如采购订单和购物车记录中所隐藏的周期形式。

图3(b)中我们能够看到明显的以周为周期的销量形式变化。为了对这种复杂而动态的时光序列形式从事建模,我们使用了线性变换模块来获得销量的大致基数,并使用一个特殊的跳跃LSTM层来拿获销量变化的非线性时光形式。接着,通过特性融合模块将提取的时光特性与静态特性相结合,以进一步支持构建更具有代表性的销量时空体现。

AAAI 2021论文:利用深度元进修对城市销量从事展望

图3 销量形式变化

三、时空销量展望

通过上一步,我们已经得到了一定时空地区的销量体现。接下来我们将介绍一种利用同享统计结构的天生模型,来进修分歧时空展望恣意间所同享信息。对于恣意一定的展望,它大大提高了进修效率和展望准确性。该天生模型的结构可以参考上节所属的摊销网络结构的解码器(图2 Generative Model 所示)。

它使用两个分歧的输出来天生最终的销量。第一个输出侧重于通过对最近一段时光的输出销量,利用特性提取和融合技术来挖掘当前的采办体现,该特性描述了近期的销量形式的变化。第二个输出是从摊销网络中采样的一定于某个时空展望恣意的时空特性体现。它拿获了目标恣意的宏观时空形式。最后,天生模型使用完全连接的网络将两个输出合并,对目标时刻的销量订单从事展望。

四、时空瓜代训练

分歧的时空恣意仅与来自一定地区和时光范围的有限数据相关联,无法完全描述一定地区的采办行为。受多视图进修的启发,我们构建了两种视图(空间视图和时光视图)来描述数据的分歧观点。两个视图相互补充,以增强进修到的信息并获得更准确的时空数据体现。空间观点倾向于进修分歧地区的采办形式,而时光观点倾向于挖掘分歧时光段典型的时光变化形式。

训练期间在分歧视图之间从事切换可以在分歧地区或日期典型之间进修到分歧的时空信息。同时,在瓜代训练期间还能够整合分歧时空恣意同享的天生模型,并提高了展望准确性。完整的训练过程如算法1所示。

AAAI 2021论文:利用深度元进修对城市销量从事展望

算法1

五、实验

我们使用来自京东的海量高质量在线销量数据集来评估我们的模型。JD数据集包含时光跨度从2015年至2019年的采购订单,购物车数据(作为动态时光序列特性)和包括北京18个行政区块的地区特性(例如POI和人口统计资料数据)作为静态特性。

为了验证模型的有效性以及鲁棒性,作者对分歧时光区间(周内,周末,购物节等)的销量从事展望评估。同时还对模型中的分歧组件从事消融分析,对分歧组件的有效性从事评估,结果如表1所示。

AAAI 2021论文:利用深度元进修对城市销量从事展望

表1 分歧组件的有效性表1中我们可以看到,对于平日较为平缓和购物节的爆发性展望设置中,STMP均优于所有基线方法。在MSE方面,STMP均比最佳基准提高了至少30%。在爆发性销量展望场景中,STMP仍比基准降低约30%至60%。这些结果表明,当实际采办形式与平时截然分歧时,我们的方法是有效且可靠的。

为了进一步研究STMP各个模型组成部分的影响,我们还在表1中比较了STMP及其变体的性能。可以观察到,STMP-VI在总体和周末情景中表现良好,这些情景具有相对稳定的采办形式,但在购物节上的表现要比STMP差。这是因为STMP-VI使用点估计而不是一定于恣意的时空体现的散布描述,当数据有限或形式高度不确定时,这会出现问题。

此外,与STMP或其他变体相比,STMP-SKIP的准确性较差,但仍优于其他基准。这证明需要考虑采办时光序列中的多个周期性形式。这也反映在图4(b)中,我们可以在采办时光序列数据中看到清晰的周期性形式。这些证明对数据中的多个周期性属性从事建模在提高模型性能方面起着重要作用。

AAAI 2021论文:利用深度元进修对城市销量从事展望

图4为了探究模型在分歧地区以及时光段的效果,作者挑选了四个具有代表性的地区(覆盖分歧销量范围,详细地理位置请参见图4(a))将STMP与基线方法在整个2019年的销量数据上做可视化,如图4所示。在大多数地区,基线无法很好地展望购物节期间采办时光序列的突发性,例如中旬促销和11.11的采办高峰。他们倾向于给出保守的结果,并且只专注于提高整体准确性。但是,STMP利用分歧地区和日期典型的时空体现来支持多恣意少拍进修,以促进对一定地区和日期典型的更好展望。可以观察到,只有STMP能够准确地展望爆发式的销量(所有图6中的峰值)。

AAAI 2021论文:利用深度元进修对城市销量从事展望

图5同时作者对于购物节历史数据的可参考情况从事了进一步的探究,在购物节销量数据非常稀缺的情况下,每增加一次购物节可见数据,精度会有一定的提升。然而即使在购物节可参考数据只有一次(持续大约一周)的情况下,STMP也具有较高的准确率,这表明了模型的鲁棒性。

AAAI 2021论文:利用深度元进修对城市销量从事展望

表2最后,作者对时空瓜代训练方式在三个大型购物节上也做了比较。在时光训练中,合并操作将来自同一天典型的实例成批集成,而不考虑空间知识。同时,在空间训练中,模型将来自同一地区的一批实例集成在一起,而无需考虑时光信息。

从表2中我们可以看到,即使不完整的T训练和S训练也比表1列出的基线提供更高的准确性。但是,与完整的时空瓜代训练相比,缺乏时空上的联合元知识仍然会导致较低的准确性。这表明分歧的训练形式会跨地区和时光典型进修分歧的转换。从时空方面的补充训练可以有效地提高展望的准确性。

Powered by Froala Editor

原创文章,作者:京东科技开发者,如若转载,请注明出处:https://www.iaiol.com/news/aaai2021-lun-wen-li-yong-shen-du-yuan-jin-xiu-dui-cheng-shi/

(0)
上一篇 2021年 8月 11日 下午3:12
下一篇 2021年 8月 11日 下午3:43

相关推荐

  • 我用YOLOv5做情绪识别!

    AI技术已经应用到了我们生活中的方方面面,而目标检测是其中应用最广泛的算法之一。本文将教大家如何快速上手目标检测模型YOLOv5,并将其应用到情绪识别中。

    2022年 3月 30日
  • 此芯科技退出Linaro Windows on Arm工作组,推动Arm全世界生态建设

    近日,通用智能芯片公司此芯科技宣布退出致力于Arm生态系统软件开发的全世界协调工程组织Linaro,成为国内首家退出Windows on Arm工作组的成员。Windows on Arm 工作组旨在为 Windows 建立一个健康的、可持续的 Arm 生态系统。该工作组可为开发人员供应种种工具、编程语言及专业框架支援,助力程序编译速度的提升及Windows on Arm要地开发的兑现。此芯科技专一推动Arm架构设备的智能计较发展。退出Windows on Arm 工作组后,此芯科技将负责Arm原生开发、原生应用支援及

    2022年 7月 27日
  • 颜水成、David Silver等10人当选,2022 AAAI Fellow名单公布

    2022 年度 AAAI Fellows 共有 10 位学者当选。

    2022年 2月 15日
  • 优秀!2021年google博士生奖研金陆续揭晓,同济校友王鑫龙、南大校友李昀入选

    在近日公布的google2021博士生奖研金部分名单中,来自阿德莱德大学、新南威尔士大学、昆士兰科技大学和悉尼大学的四位博士生获得该殊荣。

    2021年 8月 31日
  • SENSORO 与柬埔寨国防部通讯局签署单干体谅备忘录

    2021 年 1 月 20 日,SENSORO(北京升哲科技有限公司)与柬埔寨国防部通讯局单干体谅备忘录签字仪式在金边举行。柬埔寨国防部通讯局局长 KOSAL Sovanvisal、SENSORO(柬埔寨)科技有限公司 CEO 赵龙作为单方代表共同签约。根据单干体谅备忘录,SENSORO 与柬埔寨国防部基于友好单干共识,单方将不断深化经验分享、加大单干力度,持续拓展单干畛域、打造单干新亮点,助力柬埔寨建造成为高端定位的新型聪明都会。自 2018 年以来,柬埔寨国防部曾多次到访 SENSORO,并持续推动双

    2021年 1月 21日
  • B站粉丝超130万,最火最直觉数学网站3b1b终于有了笔墨版!网友:点燃对数学的爱

    进修知识有更优雅的方法。如果你无法懂得高等数学、比特币、深度进修这些观念,可能有人会向你推荐 3blue1brown 的视频——这是一个专门制作可视化讲授视频的频道,其实质覆盖数学、人工智能等领域,每门课都配有直觉生动的动画演示,帮助观众加深对观念定理的懂得。它火到什么程度?除了 YouTube 上 380 万订阅者之外,3b1b 在 B 站上还有官方账号,粉丝数量超过 130 万,每个视频都是 10 万以上播放量,甚至有老师在课堂上播放该频道的视频。对于一个硬核教学 UP 主来说,这样的成

    2021年 8月 5日
  • Nature盘点:从Fortran、arXiv到AlexNet,这些代码改变了迷信界

    从 Fortran 编译器到 arXiv 预印本库、AlexNet,这些算计机代码和平台改变了迷信界。2019 年,「事件视界望远镜」团队拍下了第一张黑洞照片。这张照片并非传统意义上的照片,而是算计得来的——将美国、墨西哥、智利、西班牙和南极多台射电望远镜捕捉到的数据进行数学转换。该团队公开了所用代码,使迷信社区可以看到,并基于此做进一步的探索。而这逐渐成为一种普遍模式。从天文学到动物学,每一个伟大的现代迷信发现背后都有算计机的身影。斯坦福大学算计生物学家、2013 年诺贝尔化学奖获得主 M

    2021年 1月 21日
  • 威斯康辛大学《呆板进修导论》2020秋季课程完结,课件、视频资源已开放

    对于呆板进修领域的初学者来说,这会是很好的入门课程。目前,课程的笔记、PPT 和视频正在陆续发布中。2020 年就这么悄无声息地走完了,想必大多数人,尤其是在校学生唯一的感觉就是:「又是毫无学术进展的一年。」别慌,只要马上开始进修,什么时候都不算晚。近日,威斯康辛大学麦迪逊分校助理教授 Sebastian Raschka 在推特上宣布了威斯康辛大学《呆板进修导论》2020 秋季课程的完结:「教授两个班级和 230 个学生是相当不错的体验,对于那些感兴趣的人,我整理了一页记录以供参考。」课程笔记主页:https://

    2020年 12月 23日
  • 为写论文,明尼苏达大学钻研者向Linux提交多条「恶意代码」,结果整个大学都被Linux封了

    为了写论文,明尼苏达大学的钻研者竟然向 Linux 内核发送了多个有漏洞的代码,结果惹怒了 Linux 社区,不仅禁止整所大学向 Linux 提交代码,还将该校提交的代码还原。

    2021年 4月 22日
  • 逼近量化训练?块重修技术打造离线量化新极限

    模型量化技术可以有效加速推理,已经成为人工智能芯片的标配,并在工业落地中广泛应用。离线量化(Post-Training Quantization)不需要耦合训练流程,利用成本和时间成本低,往往作为生产量化模型的首选方式,但其可调整空间有限,因此面临更大的准确度挑战,尤其是在一些特殊场景和极端要求下,不得不进一步引入更为复杂的在线量化(Quantization Aware Training)流程挽救,而这极大增加了量化模型生产的复杂度。如何在享受离线量化便捷高效的同时,在有限的调整“夹缝”中提升其成果上限,成为进一步打破技术红线的关键。在ICLR2021上,商汤科技研究院Spring工具链团队、高性能计算团队和成都电子科技大学顾实老师团队合作提出了块重修技术BRECQ,重新审视量化模型的优化粒度,首次将离线量化在4bit上的成果提升到在线量化的水平,相比在线量化可以节省大于200倍的生产时间,BRECQ在多种搜集和任务上普遍取得了业界最佳成果,打造了离线量化的新极限。

    2021年 3月 26日

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注