3D

Meta 推出 SceneScript AI 视觉模型，利用可编程语言实时预测建立 3D 场景

据 Meta 公司官方新闻稿，该公司开发了一款名为“SceneScript”的视觉模型，该模型号称能够使用可编程语言来快速“建立”场景，实时推断房间几何形状，并将相关数据转换为建筑学层面的近似值。▲ 图源 Meta 公司官方新闻稿（下同）Meta 声称，相关方法能够高效且轻量地建立室内 3D 模型，号称“只需要数 KB 的内存即可生成清晰且完整的几何形状”，并且相关形状数据具有“可解释性”，用户可以轻松阅读和编辑这些数据表示。IT之家注意到，开发人员借鉴了大语言模型“预测单词”的方法来开发 SceneScript，

3/25/2024 10:08:44 PM 漾仔

WorldGPT来了：打造类Sora视频AI智能体，「复活」图文

前Meta首席工程负责人胡鲁辉带领Seeking AI携手哈佛、斯坦福、北大等知名学府推出WorldGPT，实现静态内容与动态视频的高度融合

3/21/2024 4:51:00 PM 机器之心

3D城市自动生成方案升级，腾讯GiiNEX游戏AI引擎正式亮相

3月20日，在2024全球游戏开发者大会（GDC）上，腾讯发布了自研游戏AI引擎——GiiNEX。基于生成式AI和决策AI技术，GiiNEX将为游戏全生命周期提供丰富的AI解决方案。借助大模型等生成式AI技术，GiiNEX面向AI NPC、场景制作、内容生成等场景，提供了包括2D图像、动画、3D城市、剧情、对话、关卡以及音乐等多样化的AIGC能力，帮助开发者提升高质量内容生成的效率。同时，GiiNEX也将决策AI技术用于游戏研发测试、模拟玩法等场景，加速游戏创新迭代，以快速适应玩家个性化需求和多变的市场趋势。在会上

3/21/2024 3:15:00 PM 新闻助手

可从单张图像创建多视图 3D 视频，Stability AI 发布 Stable Video 3D 模型

Stability AI 近日发布了 Stable Video 3D 模型，该模型可从单张图像创建多视图 3D 视频。▲ 图源 Stability AI，下同Stable Video 3D 包含两个变体，其中 SV3D_u 能基于单个图像输入生成轨道视频，无需相机调节；而 SV3D_p 扩展了 SVD3_u 的功能，其可容纳轨道视图，允许沿着指定的摄像机路径创建 3D 视频。相较之前的 Stable Zero123 模型或开源替代品 Zero123-XL，Stable Video 3D 在质量上有明显提高，并具有更

3/21/2024 10:53:01 AM 溯波（实习）

Stability AI 开源上新：3D 生成引入视频扩散模型，质量一致性 up，4090 可玩

Stable Diffusion 背后公司 Stability AI 又上新了。这次带来的是图生 3D 方面的新进展：基于 Stable Video Diffusion 的 Stable Video 3D（SV3D），只用一张图片就能生成高质量 3D 网格。Stable Video Diffusion（SVD）是 Stability AI 此前推出的高分辨率视频生成模型。也就是说，此番登场的 SV3D 首次将视频扩散模型应用到了 3D 生成领域。官方表示，基于此，SV3D 大大提高了 3D 生成的质量和视图一致性。

3/19/2024 4:07:19 PM 清源

3D版Midjourney来了？Luma AI发布Genie 1.0，生成手办只需10秒

机器之心报道机器之心编辑部文生 3D 模型又来新玩家。随着生成式 AI 的浪潮席卷而来，科技公司都在冲击 AIGC 的下一个突破口 —— 3D 生成。目前，文生 3D 在学术界取得了许多新突破。在产业界，无论是像英伟达这样的行业巨头，还是像 Stability AI 这样的中坚力量，都推出了自己的文生 3D 工具。虽然 3D 生成领域一直「卷」到飞起，但是好像一直没有出现一款效果足够惊艳，生成速度足够快的代表性产品。如今，一直致力于 3D 内容生产的 Luma AI 向这一领域发起了挑战。就在昨天，Luma AI

1/15/2024 10:10:00 AM 机器之能

胡渊鸣全新创业项目Meshy曝光：一句话生成3D游戏资产，仅需一分钟

机器之能报道编辑：吴昕它会是3D AIGC领域的Midjourney 吗？游戏、电影和 XR 行业对 3D 模型的需求正在激增。尤其是当苹果 Vision Pro、Quest 3 等硬件出货量达到一定量级时，市场对 3D 内容需求可能会出现井喷。遗憾的是目前市场供应侧，专业创作者还困顿于漫长的创作时间，而摩拳擦掌的业余玩家依旧游离在复杂的创作工具之外。随着生成 AI 技术的兴起，如何打造一款全新的 3D 内容生成工具，加速制作流程，弥合市场供需之间的巨大落差，正成为一些技术大神们关注的方向。Meshy 就是这样

11/28/2023 1:18:00 PM 机器之能

开源多模态医疗基础模型RadFM，首次支持2D/3D放射影像输入

上海交大&上海AI Lab发布开源多模态医疗大模型RadFM

11/20/2023 5:15:00 PM FM4Medicine

可预测蛋白质-配体结合亲和力，之江实验室&百度&港科大团队开发基于曲率的自适应图神经网络

编辑 | 萝卜皮准确预测蛋白质和配体之间的结合亲和力对于药物发现至关重要。图神经网络（GNN）的最新进展在学习蛋白质-配体复合物的表示以估计结合亲和力方面取得了重大进展。为了提高 GNN 的性能，经常需要从几何角度研究蛋白质-配体复合物。虽然「现成的」GNN 可以包含分子的一些基本几何结构，例如距离和角度，通过将复合体建模为同亲图，这些解决方案很少考虑更高级别的几何属性，例如曲率和同源性，以及异亲相互作用。为了解决这些限制，之江实验室、百度大数据以及香港科技大学的研究人员引入了基于曲率的自适应图神经网络（CurvA

10/26/2023 2:36:00 PM ScienceAI

一张图，就能「接着舞」，SHERF可泛化可驱动人体神经辐射场的新方法

输入的一张任意相机角度 3D 人体图片，Ta 就能动啦！

8/14/2023 3:16:00 PM MMLab

锦秋基金独家投资，生数科技完成数千万元天使+轮融资

近日，北京生数科技有限公司（简称“生数科技”）完成了数千万元天使轮融资，本轮融资由锦秋基金独家投资。此轮资金将主要用于算法研发、产品开发和团队扩充。值得一提的是，今年六月生数科技刚获得蚂蚁集团、BV百度风投、卓源资本的近亿元天使轮融资，不到两个月的时间内已经连续获得两轮投资。生数科技是全球领先的生成式人工智能基础设施及应用提供商，致力于打造可控多模态通用大模型，团队于今年3月发布9.5亿参数开源版本多模态大模型 UniDiffuser，基于一个Transformer网络架构实现图文模态之间的任意跨模态生成。在此基

8/10/2023 9:59:00 AM 机器之心

CVPR 2022 ｜精准高效估计多人3D姿态，美图&北航联合提出分布感知式单阶段模型

近日，计算机视觉顶会CVPR 2022公布了会议录取结果，美图影像研究院（MT Lab）与北京航空航天大学可乐实验室（CoLab）联合发表的论文被接收。该论文突破性地提出分布感知式单阶段模型，用于解决极具挑战性的多人3D人体姿态估计问题。该方法通过一次网络前向推理同时获取3D空间中人体位置信息以及相对应的关键点信息，从而简化了预测流程，提高了效率。此外，该方法有效地学习了人体关键点的真实分布，进而提升了基于回归框架的精度。多人3D人体姿态估计是当前的一个热点研究课题，也具有广泛的应用潜力。在计算机视觉中，基于单张R

6/25/2023 5:58:00 PM 美图影像研究院

专访生数科技唐家渝：清华系团队拿到近亿融资，用Transformer来做多模态大模型

随着GPT4的出现，多模态大模型的发展方向逐渐成为共识。近日，一支由清华人工智能研究院副院长朱军教授带领的新团队悄悄完成了近亿级天使轮融资。

6/20/2023 2:29:00 PM 机器之心

2023苹果学者名单公布，AI领域11位华人：清华游凯超等人入选

在今年评选出的 22 位苹果学者之中，华人占据了一半。

3/4/2023 5:53:00 PM 机器之心

Lidar 3D传感器点云数据与2D图像数据的融合标注

2D&3D融合以自动驾驶场景为例，自动驾驶汽车需要使用传感器来识别车辆周围的物理环境，用来捕获2D视觉数据，同时在车辆顶部安装雷达,用以捕捉精确目标定位的3D位置数据。激光雷达生成的点云数据可用于测量物体的形状和轮廓，估算周围物体的位置和速度，但点云数据缺少了RGB图像数据中对物体纹理和颜色等信息的提取，无法精确地将对象分类为汽车、行人、障碍物、信号灯等。所以需要将包括丰富的语义信息2D视觉图像和可以提供精确的目标定位3D点云数据进行融合，使自动驾驶系统能够精确地了解周围环境，准确做出判断，让自动驾驶功能得以广泛应

12/20/2022 3:30:00 PM 倍赛BasicFinder

一句话生成3D模型：AI扩散模型的突破，让建模师慌了

英伟达进入 AI 生成模型领域的研究，直接比别人多一个次元：一句描述生成 3D 模型。

11/23/2022 3:32:00 PM 机器之心

3D传感器芯片技术全球领先，灵明光子完成数亿元C轮融资

新一代全球领先的3D传感器芯片服务商灵明光子完成数亿元C轮融资，领投方为美团龙珠，老股东昆仲资本和高榕资本继续加注，光源资本担任独家财务顾问。融资完成后，公司将加速推进产品量产，并继续在先进领域投入研发，保持技术领先性。灵明光子致力于用国际领先的单光子探测器（SPAD）技术，为手机、激光雷达、机器人、AR设备等提供自主研发的高性能dToF深度传感器芯片。自2018年成立以来，灵明光子已迅速完成多轮融资，并引入小米、OPPO、欧菲光等产业资本，显示出市场对于灵明光子dToF芯片研发能力和应用前景的看好。dToF（di

4/11/2022 11:06:00 AM 新闻助手

国产工业软件弯道超车迎曙光，首款云原生CAD取得重大突破

《道德经》有云，道生一，一生二，二生三，三生万物。“三”往往引向无穷之数。三维家耕耘8年的科技实力即将迎来全面丰收，由此，“三体计划”横空出世。“三体计划”既包含三维家结盟三个世界顶尖技术伙伴的合作成果、在三个前沿学科的不懈探索、以及在三大科技盛会上的实力展现，也代表三维家坚持对先进技术的探索，用技术为产业开拓无限想象空间。“三体计划”最终导向三大目标：降维打击、打破边界、重塑视界。10月10日首款云原生CAD的发布开启了“三体计划”的第一篇章。2021年10月9日-10日，“智能制造和智能化管理”交流会议暨安徽

10/12/2021 11:00:00 AM 新闻助手

资讯热榜

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉

3D

Meta 推出 SceneScript AI 视觉模型，利用可编程语言实时预测建立 3D 场景

WorldGPT来了：打造类Sora视频AI智能体，「复活」图文

3D城市自动生成方案升级，腾讯GiiNEX游戏AI引擎正式亮相

可从单张图像创建多视图 3D 视频，Stability AI 发布 Stable Video 3D 模型

Stability AI 开源上新：3D 生成引入视频扩散模型，质量一致性 up，4090 可玩

3D版Midjourney来了？Luma AI发布Genie 1.0，生成手办只需10秒

胡渊鸣全新创业项目Meshy曝光：一句话生成3D游戏资产，仅需一分钟

开源多模态医疗基础模型RadFM，首次支持2D/3D放射影像输入

可预测蛋白质-配体结合亲和力，之江实验室&百度&港科大团队开发基于曲率的自适应图神经网络

一张图，就能「接着舞」，SHERF可泛化可驱动人体神经辐射场的新方法

锦秋基金独家投资，生数科技完成数千万元天使+轮融资

CVPR 2022 ｜ 精准高效估计多人3D姿态，美图&北航联合提出分布感知式单阶段模型

专访生数科技唐家渝：清华系团队拿到近亿融资，用Transformer来做多模态大模型

2023苹果学者名单公布，AI领域11位华人：清华游凯超等人入选

Lidar 3D传感器点云数据与2D图像数据的融合标注

一句话生成3D模型：AI扩散模型的突破，让建模师慌了

3D传感器芯片技术全球领先，灵明光子完成数亿元C轮融资

国产工业软件弯道超车迎曙光，首款云原生CAD取得重大突破

CVPR 2022 ｜精准高效估计多人3D姿态，美图&北航联合提出分布感知式单阶段模型