AI在线 AI在线

视觉编码器

推特争论引发学术新发现!谢赛宁团队发布 iREPA,仅需 3 行代码!

最近,谢赛宁团队的新作 “iREPA” 便是源于一场持续了四个月的推特辩论。 这场论战虽以谢赛宁的让步为结局,却意外催生了一篇重要论文,展示了新颖的研究思路。 事件的起源可以追溯到八月份。
12/17/2025 1:21:19 PM
AI在线

智源研究院开源轻量级超长视频理解模型Video-XL-2

近日,智源研究院联合上海交通大学等机构正式发布了一款新一代超长视频理解模型——Video-XL-2。 这一模型的推出标志着长视频理解技术在开源领域取得了重大突破,为多模态大模型在长视频内容理解方面的发展注入了新的活力。 在技术架构方面,Video-XL-2主要由视觉编码器、动态Token合成模块(DTS)以及大语言模型(LLM)三个核心组件构成。
6/3/2025 2:00:54 PM
AI在线