「清华系」视频天生公司生数科技宣布完成新一轮数亿元融资

近日,北京生数科技有限公司(以下简称“生数科技”)宣布完成新一轮数亿元融资,由启明创投领投,达泰资本、鸿福厚德、智谱AI、老股东BV百度风投和卓源亚洲继续跟投。本轮融资将主要用于多模态基础大模型的迭代研发、应用产品立异及市场拓展。本轮由华兴资本担任独家财务顾问。生数科技成立于2023年3月,是全世界领先的多模态大模型公司,致力于图象、3D、视频等原生多模态大模型的研发。生数科技核心团队来自清华大学人工智能研究院,此外还包括来自北京大学和阿里巴巴、腾讯、字节跳动等科技公司的多位技能人才。此前公司

近日,北京生数科技有限公司(以下简称“生数科技”)宣布完成新一轮数亿元融资,由启明创投领投,达泰资本、鸿福厚德、智谱AI、老股东BV百度风投和卓源亚洲继续跟投。本轮融资将主要用于多模态基础大模型的迭代研发、应用产品立异及市场拓展。本轮由华兴资本担任独家财务顾问。

生数科技成立于2023年3月,是全世界领先的多模态大模型公司,致力于图象、3D、视频等原生多模态大模型的研发。生数科技核心团队来自清华大学人工智能研究院,此外还包括来自北京大学和阿里巴巴、腾讯、字节跳动等科技公司的多位技能人才。此前公司已完成近亿元融资,过往股东还包括蚂蚁集团和锦秋基金等知名机构。

在多模态视觉模型的研发上,生数科技较早地确立了Diffusion Transformer架构,与不久前引起爆炸式关注的Sora在架构思路和实验路径上完全一致。所谓Diffusion Transformer是在Diffusion Model(聚集模型)中,用Transformer替换常用的U-Net,将Transformer的可扩展性与Diffusion模型处理视觉数据的天然优势进行融会,能在视觉任务下展现出卓越的涌现才能。

DiT架构由伯克利团队于2022年12月发表。但其实早在2022年9月,生数科技创始成员就提出了基于Transformer的网络架构U-ViT,两项工作在架构思路与实验路径上完全一致,均是将Transformer与聚集模型融会。

当时,U-ViT就在千万至数亿参数量级范围内验证了极强的可扩展性(scaling up),这项工作在CVPR 2023发表,早于DiT成为全世界范围内最先被提出的Diffusion Transformer架构。

据生数科技介绍,生数对聚集模型融会架构的前瞻立异源自于团队多年的深耕。团队从事天生式人工智能和贝叶斯机器学习研究已有20余年,在深度天生模型突破的早期就开展了深入研究。在聚集模型方面,团队于国内率先开启了该方向的研究,成果涉及骨干网络、高速推理算法、大规模训练等全栈技能方向。

目前,团队于ICML、NeurIPS、ICLR等人工智能顶会发表相关论文近30篇,其中提出的免训练推理算法Analytic-DPM、DPM-Solver等突破性成果,获得ICLR杰出论文奖,并被OpenAI、苹果、Stability.ai等国外前沿机构采用,应用于DALL·E 2、Stable Diffusion等明星项目中。

2023年3月,团队开源了全世界首个基于Diffusion Transformer架构(U-ViT)的多模态聚集大模型UniDiffuser,在参数量和训练数据规模上,与Stable Diffusion直接对齐。在架构上,UniDiffuser比最近才采用DiT架构的Stable Diffsion 3领先了一年。

此外,除了单向的文生图以外,Unidiffuser支持更通用的图文任务,能够实行图生文、图文联合天生、图文改写等多种功能。

「清华系」视频天生公司生数科技宣布完成新一轮数亿元融资图:图象天生效果

在统一化架构的思路下,生数科技持续进行Scale up。在图文模型的训练中,参数量从最先开源版的1B不断扩展至3B、7B、10B及以上,使得模型在美学性、多元风格、语义理解等方面实行快速稳定的提升。同时在此基础上,通过拓展空间维度和时间维度,逐步实行3D天生和视频天生模型的训练。

依托底层U-ViT架构的立异尝试,截至去年9月,生数科技推出了基于统一的多模态多任务框架的产业级通用基础大模型(闭源版),全链路自主训练、自主研发,在图象天生、3D天生、视频天生等多项任务中达到国际一流水平。

3D天生可实行高精度与最快10秒级的模型天生,并推出全世界首个4D动画天生、可控3D场景编辑等工作。视频天生已实行短视频的编辑与天生才能,在画面美观度、连贯性方面实行了突破。

「清华系」视频天生公司生数科技宣布完成新一轮数亿元融资图:图生3D案例

「清华系」视频天生公司生数科技宣布完成新一轮数亿元融资图:多个图生3D模型快速拼装搭建的3D场景

此外,生数科技也积累了完整高效的工程化经验,拥有在大规模GPU集群上实行高效兼容、低成本的模型训练经验,并搭建了完整的数据管理和使用体系。从算法原理、算法架构,到工程实行、数据准备,生数科技打造了多维度、全方位的基础建设,这为后续多模态大模型,尤其长视频天生的训练奠定了重要基础。

在商业化落地方面,依托于全面领先的MaaS(模型即服务)才能,生数科技在2B、2C端同时发力,一方面以API的形式向B端机构直接提供模型才能,另一方面打造垂类应用产品,按照订阅等形式收费。

目前公司已与多家游戏公司、个人终端厂商、互联网平台等B端机构开展合作,开放模型服务,提供AIGC个性化体验、定制化内容生产等方面的才能。

同时也于去年上线两款工具产品:视觉创意设计平台PixWeaver、3D资产创建工具VoxCraft,面向艺术设计、游戏制作、影视动画、社交娱乐等创意领域提供赋能,提升创作效率,同时为创作者提供源源不断的灵感和想象力。

对于未来的规划,生数科技始终坚持“原生多模态”方向,基础模型层面会持续优化,不断提升语义理解、可控性、美观度方面的天生效果,近期则将重点突破长视频天生才能。在产品端,现有产品将持续迭代,不断满足用户需求,实行用户量的持续增长,同时公司也正在探索工具以外的全新产品形态,致力于提升每个人的创造力和生产力。

投资人评价

1、启明创投合伙人周志峰

如今的大模型已经从原来的纯语言模态,逐步走向多模态的探索。生数科技从去年成立之初就选择多模态赛道,是国内这个领域起步最先、积累最深的团队,大量工作被OpenAI、Stable Diffusion团队引用。生数科技推出的U-ViT架构作为全世界Diffusion Transformer架构的首创,不仅具有前瞻的技能视野,更是经过了大规模训练的验证,展现出强大的技能可行性。这种兼具开拓性和成熟度的核心工作,让我们对生数科技在多模态大模型方向的长期发展充满信心。

今年过年期间,Sora的亮相不仅展示出视频天生技能的巨大潜力,而且增强了人们对于多模态天生未来发展的信心。随着Scaling Law在视频天生领域的进一步加强,我们预期多模态技能将引领一系列令人瞩目的立异和令人惊叹的成果。在这一过程中,生数科技无疑将扮演一个关键的推动角色!

2、达泰资本合伙人姚承

在当下大模型赛道的竞争中,生数科技在多方面都脱颖而出。不仅敏锐洞察到多模态的前沿趋势,而且作为国内最先投身多模态赛道的公司,生数科技在过去短短一年的时间内就取得了令人瞩目的成绩单,从基础设施、模型算法、数据资源到场景化应用积累了独特的竞争优势。同时生数科技也是国内极少拥有“从零开始、自主训练”大模型才能的公司,具备深厚理论基础和实践经验,拥有突破主流框架技能难点和瓶颈的技能实力,因此我们坚持在人工智能领域的布局,并对生数科技未来发展充满期待。

3、智谱AI CEO 张鹏

智谱AI CEO 张鹏表示:作为清华系的创业团队,生数科技是国内最先开展深度天生式AI研究的组织之一。从对抗天生网络到聚集模型,生数科技敏锐洞察到融会架构的重要性,将其作为原生多模态的技能核心和重要支撑。智谱AI很高兴同生数科技展开深入合作,助力生数科技多模态核心技能研发与商业化探索,一同推动多模态大模型技能落地应用,更好惠及千行百业。

4、华兴资本董事总经理、华兴资本集团联席总裁 王力行

我们身为生数科技的亲密战友,见证了公司的厚积薄发和无限潜力。作为全世界顶尖的研发团队,生数科技在基础理论架构和工程实行等层面展现出了超群的立异力和前瞻性,率先提出U-ViT架构并一以贯之,引领了多模态行业的发展;同时团队以极强的执行力和落地速度,陆续在图象、3D、视频天生等领域贡献了艺术级的作品。作为未来数字世界的天才建筑师,生数将率先攻克多模态天生瓶颈,把人类的创造力和艺术构想一一落为现实,始于科学、忠于立异、迈向未来。

原创文章,作者:机器之心,如若转载,请注明出处:https://www.iaiol.com/news/qing-hua-xi-shi-pin-tian-sheng-gong-si-sheng-shu-ke-ji-xuan/

(0)
上一篇 2024年 3月 11日 上午11:47
下一篇 2024年 4月 10日 下午3:00

相关推荐

  • 深度进修模型知识产权损坏怎么做?看看IJCAI 2021这场Workshop说了什么

    在刚刚结束的 IJCAI 2021 大会上,「深度进修模型知识产权损坏国际研讨会(DeepIPR-IJCAI’21)」正式举行,这场研讨会由微众银行、马来亚大学、香港科技大学、上海交通大学共同主办。

    2021年 8月 31日
  • 上市首日市值就超福特,Rivian何德何能?

    今日凌晨,号称特斯拉杀手的美国明星电动汽车制造商Rivian正式在美国纳斯达克挂牌上市,代码「RIVN」。IPO发行价定为78美元,盘中涨幅一度扩大至逾50%,股价最高至119.46美元,收盘时有所回落,但估值仍达到859.08亿美元,已超过福特,距通用汽车仅有1.44亿美元。作为对比,11年前特斯拉IPO估值不超过20亿美元,募资仅为2.26亿美元;今年7月,美国另一明星电动汽车制造商Lucid Motors与合并后的股值也仅有240亿美元,募资44亿美元。Rivian的高估值与近期新能源汽车在美国股市的疯狂有关

    2021年 11月 12日
  • 华为云位居中国DevOps市场领导者,份额、战略双第一!

    9月21日 ,国际权威阐明师机构IDC发布《IDC MarketScape: 中国 DevOps 平台市场厂商评价,2022》报告。本次报告, IDC从公司规模、产品技术、市场份额以及未来发展战略等维度对众多云厂商进行评价,华为云软件开发生产线DevCloud在市场份额和发展战略两大维度均排名第一,再次位居领导者位置。华为云DevCloud作为一站式、平安可托、全流程矫捷的DevOps云平台,已上线13项端到端子办事,办事于220万开发者,应用于10多个行业,覆盖开发全场景,全面领跑DevOps云办事市场。报告指出

    2022年 9月 22日
  • google并未放弃TensorFlow,将于2023年发布新版,明确四大支柱

    2015 年,google大脑开放了一个名为「TensorFlow」的钻研项目,这款产品迅速流行起来,成为人工智能业界的主流深度进修框架,塑造了现代呆板进修的生态系统。从那时起,成千上万的开源贡献者以及众多的开发人员、社区组织者、钻研人员和教育工作者等都投入到这一开源软件库上。然而七年后的今天,故事的走向已经完全不同:google的 TensorFlow 失去了开发者的拥护。因为 TensorFlow 用户已经开始转向 Meta 推出的另一款框架 PyTorch。众多开发者都认为 TensorFlow 已经输掉了这场战争,并将其比

    2022年 10月 24日
  • 又一全新汽车品牌来了!瞄上「安康调理」场景,已获东风、长江等投资

    作者 / 曹锦10月30日,前大众团体高管苏伟铭的创业项目,得到进一步揭晓。由其担任创始人兼董事长的电动汽车品牌——BeyonCa正式亮相,同时还展示了代表品牌定位的概念车Gran Turismo Opus 1(GT Opus 1)。BeyonCa计划于明年春天宣布品牌中文名,第一辆量产车型将于2024年下线。大家对于BeyonCa的最初认知,无疑就是其核心人物苏伟铭。他曾在大众汽车任职16年,在2021年离职时,他位居大众汽车团体执行副总裁,也是团体内职位最高的华裔高管;此后,苏伟铭也曾担任雷诺中国CEO,而他创

    2022年 10月 31日
  • 得州、佛州也对「一生传授」轨制下手了,每年评绩效,有大学准备捡漏

    终结一生教职轨制,佐治亚州起了个头,后来者不止一个。

    2022年 4月 23日
  • 数据驱动核保风控,AI促进健壮管制,健壮险市场迎来万亿蓝海

    健壮险作为我国调理保障体系的补充,同时也是缓解调理保障支付压力的重要组成部分。自国务院在2014年发布《关于加快发展商业健壮险的若干意见》,一系列政策密集发布,促进保障行业监管降级,并推动健壮险企业发展立异。伴随近年来大数据手艺与人工智能手艺的逐步成熟,健壮险行业开始走向数字化转型,进而实现智能化降级。其中调理大数据公司与保障公司开始合作,通过构建智能风控模型辅助保障机构走向数字化风控;健壮管制企业则通过开发智能利用,通过AIoT手艺、智能硬件、云计算等利用模式培养用户健壮管制习惯, 从多个维度降低理赔危害。此外,

    2021年 6月 25日
  • 【重磅】世界人工智能大会——2021全世界AI财产人材高峰论坛强势来袭!

    图灵奖得主、中外院士、独角兽企业掌门人云集;智能芯片、类脑智能、双碳经济、未来医院、数字家园等热点话题荟萃;人形机械人、训练芯片等首发展品精彩纷呈;超大规模预训练模型等尖端成果竞逐大奖;还有数字人民币、无人驾驶、智慧商业等鲜活体验。

    2021年 6月 23日
  • 39亿参数模型公开可用,采样速度7倍提升,残差量化天生图片入选CVPR’22

    基于残差量化的自回归图象天生,官方已将代码公开。

    2022年 3月 27日
  • 15年软件架构师经验总结:在ML领域,初学者踩过的5个坑

    如果你要构建你的第一个模型,请注意并避免这些问题。

    2022年 8月 3日

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注