模态 | AI在线

AI

「清华系」视频天生公司生数科技宣布完成新一轮数亿元融资

近日，北京生数科技有限公司（以下简称“生数科技”）宣布完成新一轮数亿元融资，由启明创投领投，达泰资本、鸿福厚德、智谱AI、老股东BV百度风投和卓源亚洲继续跟投。本轮融资将主要用于多模态基础大模型的迭代研发、应用产品立异及市场拓展。本轮由华兴资本担任独家财务顾问。生数科技成立于2023年3月，是全世界领先的多模态大模型公司，致力于图象、3D、视频等原生多模态大模型的研发。生数科技核心团队来自清华大学人工智能研究院，此外还包括来自北京大学和阿里巴巴、腾讯、字节跳动等科技公司的多位技能人才。此前公司

2024年 3月 12日

AI

火了一整年的多模态进修，在工业界的落地和实践进展到底怎么样了？

在小红书，看见多模态进修的无限可能。

2022年 11月 23日

AI

最大数据集、多使命覆盖，阿里达摩院发布首个大规模华文多模态评测基准MUGE

在计算机视觉范围甚至人工智能的发展历程中，ImageNet对于整个范围的技术进步具有至关重要的作用。随着多模态学习成为当下的新热点，为了通过大规模数据集建设和全方位模型能力评测推动多模态范围的发展，阿里达摩院推出MUGE（全称Multimodal Understanding and Generation Evaluation Benchmark）评测基准。该基准是由达摩院联合浙江大学、阿里云天池平台联合发布，中国计算机学会计算机视觉专委会（CCF-CV专委）协助推出的首个大规模华文多模态评测基准。其拥有全球最大规模的华文多模态评测数据集，覆盖多种类型的使命，包括图文形貌、基于文本的图象天生、跨模态检索等。MUGE的推出旨在解决当前华文多模态范围下游使命数据集匮乏的问题，并且为广大研究者提供权威平台，从了解能力和天生能力两大角度去衡量算法模型的有效性。

2021年 12月 21日

AI

一个模型处理多种模态和工作，商汤等提出Uni-Perceiver，迈向通用预训练感知模型

来自商汤、西安交通大学等机构的研究者提出了一种通用感知架构 Uni-Perceiver ，该方法可以更好地将预训练中学到的知识迁移到下流工作中。

2021年 12月 12日

AI

AI「读图领会」首超人类！阿里达摩院刷新全球VQA纪录

历经六年，AI 在这一手艺上得分首超人类。

2021年 8月 12日