AI在线 AI在线

香港大学

港大联合字节跳动提出JoVA: 一种基于联合自注意力的视频-音频联合生成模型

港大联合字节跳动提出JoVA: 一种基于联合自注意力的视频-音频联合生成模型

作者介绍:本文第一作者黄小虎同学,目前是香港大学的三年级在读博士生,导师是韩锴教授。 黄小虎的研究方向是以视频为中心的领域,包括音视频生成、视频理解以及视频识别。 视频 - 音频联合生成的研究近期在开源与闭源社区都备受关注,其中,如何生成音视频对齐的内容是研究的重点。
12/30/2025 10:11:00 AM 机器之心
港大开源ViMax火了,实现AI自编自导自演

港大开源ViMax火了,实现AI自编自导自演

想象一下,只需要一句话描述,AI 就能为你拍出一部完整的短剧? 以后可能真的人人都能当导演了。 不用学复杂的拍摄技巧,不用买昂贵设备,甚至不用找演员。
12/12/2025 6:16:00 PM 机器之心
KDD 2024|港大黄超团队深度解析大模型在图机器学习领域的「未知边界」

KDD 2024|港大黄超团队深度解析大模型在图机器学习领域的「未知边界」

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected][email protected]本文的主要作者来自香港大学的数据智能实验室 (Data Intelligence Lab)。作者中,第一作者任旭滨和第二作者汤嘉斌都是香港大学数据科学院的一年级博士生,指导老师为 Data
7/22/2024 10:45:00 AM 机器之心