服务量化投资,基于学问图谱的事宜表征框架钻研入选SIGIR

瞰点科技和上海交大的钻研团队提出了一种服务于量化投资的基于学问图谱的事宜表征框架,称为 Knowledge Graph-based Event Embedding Framework(KGEEF)。通过在真实股票市场上进行的大规模实行表明,本文提出的格式显著有助于量化投资的政策提升。

钻研表明金融市场对于旧事事宜的反应具有滞后性,并且相同事宜对不同股票在不同时间段内的影响程度都是有差异的。如何将富含信息量的旧事事宜融合进量化投资模型中是工业界与学术界面临的共同挑战。针对上述问题,瞰点科技与上海交大钻研团队共同研发了基于学问图谱的事宜表征框架来服务于量化投资模型政策。该成果发表于 ACM SIGIR 中,由于在表征中嵌入了金融领域学问图谱,所以使用上述表征建立的投资政策在真实股票市场中获得了良好的收益表现。

服务量化投资,基于学问图谱的事宜表征框架钻研入选SIGIR

简介金融市场的价格波动是对旧事和事宜的一种反应。通常来说,从海量旧事中获取有效的事宜表征能辅助投资者采取更合理的决策。近年来,一些钻研开始应用自然语言处理(NLP)技术来进修旧事事宜的分布式表征并基于此建立事宜驱动的交易政策。经典格式(例如 bags-of-words、命名实体)可以捕获事宜元组中的基础特性,但是这些特性并没有反应事宜之间的内在瓜葛。随着表征进修和 NLP 技术的发展,钻研者开始利用深度进修等技术来表征结构化事宜,这样相似的事宜即可以在特性空间中更加接近。然而股票的价格波动不仅取决于其自身的情况,与其关联的企业所涉及的事宜也高度相关。因此,如何从这种彼此关联的事宜信息中进修有效表征是量化投资领域的重要课题。

服务量化投资,基于学问图谱的事宜表征框架钻研入选SIGIR

论文地址:https://dl.acm.org/doi/abs/10.1145/3397271.3401427在本文中,瞰点科技和上海交大的钻研团队提出了一种服务于量化投资的基于学问图谱的事宜表征框架,我们称之为 Knowledge Graph-based Event Embedding Framework(KGEEF)。该框架首先从原始旧事文本中提取结构瓜葛和事宜元组,将瓜葛学问和属性学问存储在金融学问图谱(FinKG)中,其中节点表示实体,边对应实体之间的瓜葛。随后,KGEEF 将学问图谱与事宜一起进修联合表征,用于后续量化投资预测模型。最后,通过在真实股票市场上进行的大规模实行表明,本文提出的格式显著有助于量化投资的政策提升。模型和格式

服务量化投资,基于学问图谱的事宜表征框架钻研入选SIGIR

图 KGEEF 框架本文提出的格式主要包含三层:1)多源输出层:将原始文本转换为事宜元组(Event Tuple)、瓜葛元组(Relation Tuple)和学问图谱(FinKG)。本文使用序列进修模型来检测旧事文本中的实体瓜葛,然后将检测出的实体瓜葛存储在学问图谱中。2)事宜表征进修层:将预训练的事宜元组、瓜葛元组和节点在学问图谱中的表征作为输出,得到事宜层(Event Layer)、图谱层(Graph Layer)、瓜葛层(Relation Layer)的中间特性。随后使用 Multi-source Attention 网络进修多个来源的共同特性作为输出。3)检测与优化层:以实体、事宜和图谱特性为输出,进修其是一个真实事宜或瓜葛的可能性,并且采用事宜损失和瓜葛损失联合优化的格式对模型进行训练。

服务量化投资,基于学问图谱的事宜表征框架钻研入选SIGIR

图 量化投资事宜表征工作流上图展现了量化投资事宜表征的工作流程,主要包含四个模块:

历史语料库图谱建设模块(KG Construction):通过瓜葛检测模型从原始旧事语料库生成实体瓜葛。如果检测到瓜葛,则在学问图谱中储存下来。

事宜表征进修模块(Event Presentation Learning):该模块以事宜和学问图谱作为输出,生成训练好的模型以及相应的表征词典。

新事宜处理模块(New Event Process):从旧事数据中提取事宜元组,然后利用建立的学问图谱和表征词典获得相应事宜和实体的特性。

量化投资模块(Quantitative Investment):以事宜和图谱的联合特性作为输出,输出用于量化投资的预测推断。

实行最后,该钻研通过实行来评估 KGEEF 的有效性,下表中展现了事宜相似度评价和量化投资任务中事宜表征的有效性实行结果。

服务量化投资,基于学问图谱的事宜表征框架钻研入选SIGIR

表 事宜表征相似度任务结果KGEEF 框架同时也部署到了旧事资讯平台的微信小程序中,下图展现了其运行的效果。

服务量化投资,基于学问图谱的事宜表征框架钻研入选SIGIR

图 模型在移动程序的部署图 (a) 显示了聚合之后的热点旧事事宜。图 (b) 展现了中国石油天然气集团公司 (CBPC: 601857) 的价格以及模型抽取出的相应事宜。在相关事宜视图(c)中,该钻研的模型同时抽取出了关于塔里木油田 (上游工厂)、中国海洋石油总公司(竞争对手) 和熔喷布 (石化工业下游产品) 需求增加的消息。该例子展现了本文提出的模型在事宜自动抽取和表征方面的有效性。结论金融事宜的高质量表征对于事宜驱动的量化投资具有重要价值。在本文中,瞰点科技钻研团队提出了基于学问图谱的事宜表征框架,用于进修金融领域中的事宜和实体间的内在瓜葛,例如产业链上下游瓜葛。并且通过实行验证了所提出的格式在金融事宜检测、量化投资政策建立等方面的有效性。

服务量化投资,基于学问图谱的事宜表征框架钻研入选SIGIR

参考文献[1]. Yao, Liang, Chengsheng Mao, and Yuan Luo. "Graph convolutional networks for text classification." Proceedings of the AAAI Conference on Artificial Intelligence. Vol. 33. 2019.[2]. Kewei Hou. 2007. Industry information diffusion and the lead-lag effect in stock returns. The Review of Financial Studies 20, 4 (2007), 1113–1138.[3]. Swarnadeep Saha et al. 2018. Open information extraction from conjunctive sentences. In Proceedings of the 27th International Conference on Computational Linguistics. 2288–2299.[4]. Yankai Lin, Shiqi Shen, Zhiyuan Liu, Huanbo Luan, and Maosong Sun. 2016. Neural relation extraction with selective attention over instances. In Proceedings of the 54th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers). 2124–2133.[5]. Jacob Devlin, Ming-Wei Chang, Kenton Lee, and Kristina Toutanova. 2019. BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding. In Proceedings of the 2019 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, Volume 1 (Long and Short Papers). 4171–4186.[6]. Shirui Pan, Jia Wu, Xingquan Zhu, Chengqi Zhang, and Yang Wang. 2016. Triparty deep network representation. Network 11, 9 (2016), 12.[7]. Aditya Grover and Jure Leskovec. 2016. node2vec: Scalable feature learning for networks. In Proceedings of the 22nd ACM SIGKDD international conference on Knowledge discovery and data mining. 855–864.

原创文章,作者:机器之心,如若转载,请注明出处:https://www.iaiol.com/news/fu-wu-liang-hua-tou-zi-ji-yu-xue-wen-tu-pu-de-shi-yi-biao/

(0)
上一篇 2021年 8月 20日 下午12:18
下一篇 2021年 8月 22日 下午1:13

相关推荐

  • 94岁诺奖得主希格斯去世,曾预言「上帝粒子」的消失

    一名用诗意的语言揭示宇宙秘密的人。一名 94 岁巨大科学家的逝世,引发了人们广泛的哀思。4 月 10 日消息,诺贝尔物理学奖得主、著名物理学家彼得・希格斯(Peter Higgs)于周一去世,享年 94 岁。希格斯因提出希格斯玻色子也被称为「上帝粒子」而闻名。根据爱丁堡大学的一份声明我们得知(彼得・希格斯是该校的光荣退休传授),希格斯经历短暂的生病后,于 4 月 8 日星期一在家中安静的离开。对于老爷子的去世,爱丁堡大黉舍长 Peter Mathieson 沉重的表示:「彼得・希格斯是一名杰出的科学家 &mdash

    2024年 4月 10日
  • 2022级起,MIT规复复活入学SAT、ACT成绩央求

    「标准化测验最有助于帮助识别社会经济弱势先生。」

    2022年 3月 29日
  • 茂密化 芯力量|墨芯参展首日S4估计卡机能表现亮眼

    2022年7月15日,墨芯人工智能参展厦门半导体峰会,首席科学家严恩勖发表报告,展示墨芯如何用茂密化推动AI估计前沿和最新的产业进展。16日墨芯获评“最具投资价值奖”。集微峰会被誉为“半导体业风向标”,设特色“芯力量”展区和EDA展区。墨芯位于“芯力量”展区核心位置——76号展台。   墨芯作为茂密化估计引领者,致力于提供云端和终端AI估计平台和服务,打造软硬共同的新一代智能计

    2022年 8月 17日
  • 2023 IEEE Fellow出炉:唐立新、宗成庆、朱军、姬水旺、李佳等当选

    近日,美国电子电气工程师学会(Institute of Electrical and Electronic Engineers,IEEE)确定了新一届 Fellow 名单。

    2022年 11月 22日
  • 深度进修领域最常用的10个激活函数,一文详解数学原理及优缺点

    激活函数是神经网络模型重要的组成部分,本文作者Sukanya Bag从激活函数的数学原理出发,详解了十种激活函数的优缺点。

    2021年 2月 24日
  • 寻找了不起的AI开发者!2022年WAIC云帆奖报名开启

    2022 年 WAIC 云帆奖面向全球征选特出华人 AI 开发者,欢迎点击「阅读原文」报名或提名。

    2022年 4月 17日
  • 吴恩达那场十万人观察的讲座,如今有了专项课程

    如果你看过那个一小时的演讲,而且觉得意犹未尽,这门课程可能适合你。

    2021年 5月 14日
  • 安谋华夏首款ISP处置惩罚器“小巧”面世,IP产物线逐渐完善

    12月3日,安谋华夏发布了全新“小巧”多媒体产物线,其中首款产物“小巧”i3/i5 ISP处置惩罚器由安谋华夏本土团队自主研发,在降噪、清晰度和宽动静等指标上达到业界领先水平,具有高画质、低延时、可配置能力强、扩展兼容性高等特点。该款ISP处置惩罚器可广泛适用于安防监控、AIoT及智能汽车等领域的视频、图象处置惩罚工作,满足分歧场景的数据处置惩罚需要。安谋华夏产物研发常务副总裁刘澍表示:“近年来,伴随着智能化、网络化的发展,视频图象处置惩罚被广泛应用于智能安防、AIoT、智能汽车等诸多领域。受益于这些应用在华夏的蓬勃发展,华夏ISP市

    2020年 12月 7日
  • 10位大咖云聚,400分钟干货分享,这里有一场AI 家产发展趋向分享会等你来看!

    从 2015 年的 Alpha Go 人机大战,人工智能热潮如平地惊雷,光芒尽显。到 2020 年的突发疫情,倒逼家产智能突围,带来数字时代转型升级的加速发展。风起于青萍之末,浪成于微澜之间,从 2015 年到 2020 年,AI 家产趋向变化的草蛇灰线逐渐显现。在不平凡的 2020 年,意外和契机相伴而至,稳健与突破竞相呈现。站在 2020 的尾巴上,伴随着对过去的梳理和对未知的期待,我们需要重振激情,用全方位的知识储备把握未来 AI 家产趋向的走向和发展。新春将至,在即将到来的牛年里,作为一个 AI 人下面一年

    2021年 1月 29日
  • AutoX再发40分钟经营视频:不仅没有安全员,还实现全区经营

    继8月发布「城中村」复杂路况全无人驾驭测试视频后,AutoX又于今日(11月16日)发布了国内首个全区、全域、全无人的RoboTaxi经营视频,致力于做全无人Robotaxi的AutoX,已在深圳市坪山区开始进行了不需要安全员的Robotaxi经营。目前,AutoX全无人Robotaxi的经营区域已完全覆盖深圳市坪山区大小街道,也是是中国面积最大的完全无人驾驭经营域,达成了全域168平方公里「无人之境」。根据AutoX发布的经营视频来看,尽管当时并非早晚高峰,但在全程40分钟的经营记录中,仍碰到了大量复杂的门路环境

    2021年 11月 17日

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注