AI在线 AI在线

Meta出走华人创业团队,种子轮800万美元,要打造视觉AI记忆大脑

大家都在关注硅谷 AI 领头羊们的抢人大戏,尤其是 Meta 近期又挖去了三位来自谷歌的 IMO 金牌研究者。 虽然说小扎(扎克伯格)铆足了劲儿要重振 Llama 雄风,正如火如荼的进行人才大引进。 但是吧,挖进去的人在 Meta 显山露水还需要一段时间,而从 Meta 离开的人的创业成果已经崭露头角了。

大家都在关注硅谷 AI 领头羊们的抢人大戏,尤其是 Meta 近期又挖去了三位来自谷歌的 IMO 金牌研究者。

虽然说小扎(扎克伯格)铆足了劲儿要重振 Llama 雄风,正如火如荼的进行人才大引进。

但是吧,挖进去的人在 Meta 显山露水还需要一段时间,而从 Meta 离开的人的创业成果已经崭露头角了。

图片

      Dr. Shawn Shen,联合创始人兼首席执行官(左);Ben (Enmin) Zhou,联合创始人兼首席技术官(右)。

前 Meta Reality Labs 顶尖科学家团队创立的 AI 研究实验室 Memories.ai,正式宣布完成 800 万美元种子轮融资。本轮融资由 Susa Ventures 领投,三星风投(Samsung Next)、Fusion Fund 等知名机构跟投。

Memories.ai 团队已经在大模型领域完成了一项重大的突破成果,剑指 AI 系统的「记忆缺失」问题,为视觉模型创造了强大的「记忆大脑」。

「最强大脑」

众所周知,大模型是标标准准的「金鱼记忆」

比如,大多数 AI 系统都缺乏对历史画面的记忆,难以理解前后之间的关联。

就像我们经常开的玩笑,「记忆是个先进先出栈」,只不过大模型的栈容量似乎总是不够用。

这种「金鱼记忆」限制了它们在需要深入理解场景和动态变化的应用中发挥作用,尤其是在视频密集型任务里表现不佳。

为了彻底解决这个问题,Memories.ai 通过其核心创新 —— 大视觉记忆模型(LVMM),为 AI 系统引入了一个革命性的视觉记忆层。

该模型突破了传统 AI 在视频处理中仅限于片段式分析的范式,转而能够持续捕获、存储和结构化海量的视觉数据,从而使 AI 模型能够:

永久保留上下文信息: 从孤立的帧转向对事件因果链的深度理解。

精准识别时序模式: 实现对人脸、物体和行为在时间轴上的持续追踪和识别。

智能对比分析: 快速对比新旧视觉信息,有效识别变化和异常。

该平台把原始视频转化成可搜索、带上下文关联的数据库,让 AI 系统具备类似人类的持续学习能力,给 AI 系统配备了无限视觉记忆的「最强大脑」。这一突破让 AI 在理解视频和实际应用方面,迈出了里程碑式的一步。

该团队的大视觉记忆模型不仅在多个视觉理解任务中刷新了 SOTA 基准,更提供了一种全新的视角来解决复杂视觉信息检索与理解的挑战。

这些结果充分证明了模型在视频分类、视频检索和视频问答领域的「卓越性能」。

尤其在视觉记忆检索方面,能够高效处理那些需要大规模内容检索作为辅助参考的复杂查询,从而显著提升了模型的应用广度与深度。

图片

「巨大潜能」

LVMM 技术在多个关键领域展现出巨大的应用潜力,其核心优势在于:

  • 时间跨度无限制: 能够处理并记忆数月甚至数年的视频数据。

  • 上下文深度理解: 不仅识别物体,更能理解事件的因果链和时序模式。

  • 高效检索与分析: 将原始视频转化为可搜索数据库,实现秒级检索和分析。

该团队已与多个领域的合作伙伴展开合作,推动 LVMM 技术的应用落地:

  • 安防安全: 显著提升监控录像的检索效率,在数秒内搜索数月的数据。

  • 媒体娱乐: 实现对数十年内容库中特定场景或视觉元素的即时查找。

  • 市场营销: 对数百万社交视频进行深度情感和提及分析,捕捉新兴趋势。

  • 消费电子: 为下一代移动体验引入强大的视觉记忆能力,多家手机公司,如三星已成为首批合作对象之一。

Memories.ai 联合创始人兼首席执行官沈博士强调:「人类的智慧源于丰富的、相互关联的视觉记忆。我们的使命是赋予 AI 这种深度的情境感知能力,以共同构建一个更安全、更智能的世界。」

「便捷交互」

为了让用户更直观地体验 LVMM(大视觉记忆模型)的强大能力,该团队已将核心技术通过 API 接口全面开放,并同步推出直观、可交互的网页应用。用户可以便捷地上传视频或接入现有视频库,实现快速、精准的内容检索与深度分析。图片

借助毫秒级精度的检索引擎,在视频问答场景中展现了卓越的视频帧级引用能力,真正实现了对视频的多模态深度解析。图片

还有一系列的 Demo Agents,展示了模型在不同场景下的应用能力,例如:

Video Creator 对话式视频创作助手,基于全球首个大视觉记忆模型,通过可自由编辑的提示词模板,仅用简单对话即可生成多剪辑高质量视频。图片

Video Marketer 是一个基于大视觉记忆模型的智能营销工具,依托海量视频数据,能即时洞察 TikTok 的爆款趋势、热门开场白和头部网红策略,助力高效实现社交视频营销。图片

这些 Demo Agents 不仅是技术能力的展示,更是探索未来应用的起点。

如果你是一家公司,正被海量视频数据淹没;或者是一位对视觉记忆与智能交叉点着迷的研究者;又或者只是好奇当人工智能拥有记忆之后会变成什么样 —— 欢迎访问 https://memories.ai。

相关资讯

Memories AI携全球首个人工智能视觉记忆模型亮相,获800万美元种子轮融资

由前Meta研究员、剑桥大学计算机科学博士创立的AI研究实验室Memories AI正式发布,推出了全球首个人工智能大型视觉记忆模型(Large Visual Memory Model,简称LVMM)。 这一突破性技术旨在赋予AI类人般的视觉记忆能力,让机器能够像人类一样“看到、理解并记住”视觉信息。 同时,Memories AI宣布完成由Susa Ventures领投的800万美元种子轮融资,标志着其在AI视觉记忆领域的雄心壮志。
7/25/2025 4:31:09 PM
AI在线

AI视频记忆革命来了!Memories.ai获800万美元融资,挑战千万小时视频分析极限

人工智能正在突破视频理解的最后边界。 当前市面上的AI工具虽然能够分析单个视频并生成摘要,但面对数千小时的多视频内容时却显得力不从心。 这个技术瓶颈正困扰着安防公司和营销企业,前者需要AI筛查海量监控录像,后者则希望分析不同的视频营销活动和产品拍摄素材。
7/25/2025 9:31:02 AM
AI在线

上海AI Lab最新推出Mixture-of-Memories:线性注意力也有稀疏记忆了

AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
3/5/2025 2:51:00 PM
机器之心
  • 1