3D
首个VR端3D角色扮演AI发布!南洋理工公开SOLAMI技术报告,端到端VLA模型驱动,唱跳都能陪你玩
世界上第一个VR端 3D版的角色扮演AI就在刚刚诞生了! AI角色扮演类游戏(如C.AI、Talkie)从发布以来,一直都是人们最喜欢的AI产品之一。 虽然广受欢迎,但不少用户提出,期待和这些角色在VR中有更进一步的交流。
12/9/2024 2:30:00 PM
新智元
北大王选最新OpenAD!助力自动驾驶迈向开放3D世界
写在前面 & 笔者的个人理解开放世界自动驾驶包括域泛化和开放词汇。 领域泛化是指自动驾驶系统在不同场景和传感器参数配置下的能力。 开放词汇是指识别训练中没有遇到的各种语义类别的能力。
12/4/2024 10:00:00 AM
自动驾驶之心
3个月估值10亿,李飞飞空间智能首个模型诞生!一张图生成3D世界,视频游戏要变天
AI生成3D世界成真了! 就在刚刚,AI教母李飞飞创立的World Labs首次官宣「空间智能」模型,一张图,即可生成一个3D世界。 用李飞飞的话说,「无论怎样理论化这个想法,都很难用语言描述一张照片或一句话生成3D场景的互动体验。
12/3/2024 3:47:00 PM
新智元
李飞飞「世界实验室」重磅推出 AI“造物主”:一张图片生成 3D 世界“任意门”
刚刚斯坦福大学的李飞飞教授宣布,她带领的World Labs团队推出一个能从单张图片生成 3D 世界的 AI 系统! 不是简单的 3D 建模,而是真正可以交互的 3D 物理场景! 3D场景在浏览器里就能实时渲染,还能用WASD键和鼠标自由控制视角,就像玩游戏一样!
12/3/2024 10:15:00 AM
准确、快速地从头预测RNA 3D结构,港中大、复旦等深度学习方法RhoFold+登Nature子刊
编辑 | KXRNA 分子在分子生物学中心法则中起关键作用,RNA 结构如何影响基因调控和功能一直是研究的热门话题。 准确预测 RNA 三维 (3D) 结构仍是一个难题。 RNA 的结构灵活性导致实验确定的数据稀缺,从而使计算预测工作变得复杂。
11/29/2024 11:54:00 AM
ScienceAI
Babylon.js:如何与3D场景中的物体交互?
图片开发棋类游戏,需要实现鼠标控制棋子的功能,使得游戏能够将鼠标在屏幕上的位置准确地映射到棋盘上的对应落子点。 如果开发的是2D游戏的话,实现就比较简单,鼠标屏幕坐标和棋盘都是二维平面。 就像下图围棋所示,可以根据xy坐标表示鼠标的位置,同时围棋落子点的坐标也可以计算得出xy坐标,这样很轻松地就能实现鼠标位置和围棋落子点坐标的映射和距离比较。
11/26/2024 7:40:44 AM
一点鑫得
AI解锁500多年的圣殿,米开朗基罗杰作,你我触手可及
AI好好用报道编辑:Sia有了AI ,咱就更能理解什么是:条条大路通罗马。 活久见!就连世界六分之一人口的信仰中心、「文化瑰宝」——梵蒂冈也开始 AI 了 ! 要知道,教皇弗朗西斯一直呼吁警惕人工智能风险,本人也被 AI 恶搞过。
11/13/2024 4:06:00 PM
AI好好用
腾讯混元宣布大语言模型和3D模型正式开源
腾讯混元大模型正在加快开源步伐。 11月5日,腾讯混元宣布最新的MoE模型“混元Large“以及混元3D生成大模型“ Hunyuan3D-1.0”正式开源,支持企业及开发者精调、部署等不同场景的使用需求,可在HuggingFace、Github等技术社区直接下载,免费可商用。 本次开源是腾讯混元继文生图模型后持续开放的一大举措。
11/6/2024 9:47:00 AM
腾讯混元开源 Hunyuan3D-1.0:首个同时支持文生和图生的 3D 开源大模型
腾讯混元今日开源了 Hunyuan3D-1.0 大模型,官方称这是首个同时支持文生和图生的 3D 开源大模型。 ▲ 文生模型▲ 图生模型模型采用两阶段生成方法,官方表示在保证质量和可控的基础上,10 秒即可生成 3D 资产:第一阶段,团队采用了一种多视角扩散模型,轻量版模型能够在大约 4 秒内生成多视角图像。 这些多视角图像从不同的视角捕捉了 3D 资产的丰富的纹理和几何先验,将任务从单视角重建松弛到多视角重建第二阶段,团队引入了一种前馈重建模型,利用上一阶段生成的多视角图像。
11/5/2024 6:44:21 PM
沛霖(实习)
索尼 PlayStation 将使用更多 AI 技术,实现游戏开发降本增效
据 Insider Gaming 28 日报道,在索尼公司本月发布的《2024 年企业报告》中,索尼提出了未来的愿景 —— 要成为一家适应社会变革和技术发展的娱乐公司,AI 和机器学习将在 PlayStation 发挥核心作用,尤其是在游戏领域。报告举例说,在《漫威蜘蛛侠 2》的制作过程中,工作人员就使用了语音识别软件来自动同步字幕和人物对话,大大缩短了开发过程。据了解,索尼的目标是在不影响质量的前提下加快流程、降低成本,为此还计划将实时 3D 处理和传感器技术等技术整合到游戏开发中。“今后,我们计划在集团内跨职能
9/30/2024 11:03:38 PM
清源
单图就能解锁全景视角,北大 / 港中文 / 腾讯等推出 ViewCrafter 开源项目
随便给张图就能从更多视角查看全景了?!话不多说,先看一波效果,单视角输入 be like:难度升级,接下来换成双视角,看起来衔接也非常丝滑。以上来自 ViewCrafter,由北大、港中文、腾讯等机构的研究人员提出,可以从单张或稀疏输入图像生成精确相机可控的新视角视频。还支持场景级文生 3D、图生 3D、以及稀疏视角重建等应用。目前论文和代码均已开源,并提供了在线 Huggingface demo 供用户使用。ViewCrafter:一种新视角生成方法传统的新视角生成方法,如 NeRF 和 3D-GS 等技术,存在
9/18/2024 4:01:54 PM
汪淼
为吸引开发者创建游戏地图,“元宇宙平台”Roblox 将推出 3D 模型生成 AI 工具
《Roblox(罗布乐思)》是一个深受孩子们欢迎的社区游戏平台,也是一款“知名元宇宙游戏”, 玩家可以自行为这款游戏(平台)上传一系列场景脚本,从而能够在游戏(平台)中,使用同一角色游玩到各种各样的游戏内容。该平台在上周的开发者大会中宣布将提高游戏创作者的分成比例,并在游戏中集成(实体商品销售)电商平台。此外,Roblox 还将推出基于 AI 的 3D 模型生成工具以吸引开发者创建游戏地图。▲ Roblox 在开发者大会上演示的 AI 生成地区建模效果(下同)Roblox 指出,全球约有 34 亿人玩游戏,游戏产业
9/9/2024 1:29:21 PM
漾仔
元象推出国内首个基于物理的3D动作生成模型MotionGen
www.MotionGen.cn 一句话生成复杂3D动作,效果惊艳!测试期可申请免费试用。3D内容制作领域,生成逼真的角色动作生成是一个持续挑战,传统方法依赖大量的手K制作,或昂贵动作捕捉设备,效率低、成本高、难以生成一般运动任务或适应复杂场景和交互。元象XVERSE推出国内首个基于物理的3D动作生成模型MotionGen,创新性融合大模型、物理仿真和强化学习等前沿算法,让用户输入简单文本指令,就能快速生成逼真、流畅、复杂的3D动作,效果惊艳,标志着中国3D AIGC领域的重大突破。现在起,零经验创作者也能轻松上手
8/28/2024 3:41:00 PM
新闻助手
智谱 AI 开源 CogVideoX-5B 视频生成模型,RTX 3060 显卡可运行
智谱 AI 开源了 CogVideoX-5B 视频生成模型,相比此前开源的 CogVideoX-2B,官方称其视频生成质量更高,视觉效果更好。官方表示大幅度优化了模型的推理性能,推理门槛大幅降低,可以在 GTX 1080Ti 等早期显卡运行 CogVideoX-2B ,在 RTX 3060 等桌面端“甜品卡”运行 CogVideoX-5B 模型。CogVideoX 是一个大规模 DiT(diffusion transformer)模型,用于文本生成视频任务,主要采用了以下技术:3D causal VAE:通过压缩视
8/28/2024 8:49:49 AM
沛霖(实习)
第二波!2024年8月精选实用设计工具合集
大家好,这是 2024 年 8 月的第 2 波干货合集!
在搜集整理 3D 工具的时候,我注意到 2 个对于设计师非常友好的 3D 工具,其中一个是更加适宜新手入坑 3D 的建模平台 Womp3D,以及可以帮助前端快速将 3D 资源插入到网页中的代码工具,这俩在网页前端设计落地的过程中,甚至可以直接联动起来。
而 AI 工具这边,这期搜集到了 3 个非常值得关注的好东西,一个是阿里出品的开源的 AI 自动剪辑工具,对于做影视的小伙伴会非常友好,另外 2 个则和 UI 设计落地有关的 AI 平台,它们甚至隐约呈现出了
8/15/2024 7:19:49 AM
陈子木
一张图即可 0.5 秒生成三维建模,Stability AI 推出“Stable Fast 3D”模型
Stability AI 今天推出了一款名为 Stable Fast 3D 的 AI 模型,该模型主打“图生 3D 模型”,号称只需 0.5 秒就能快速生成完整且自然的 3D 模型,目前该模型已在 Hugging Face 平台上架,感兴趣的小伙伴们可以(点此访问)。AI在线获悉,Stable Fast 3D 只需要单张图片即可快速生成高质量的 3D 模型,相关模型自带材质及对应的参数,同时提供了精确的 UV 展开(UV Unwrapping)便于用户进行后期修改,如果用户需要,还可以选择四边形或三角形网格重建功能
8/2/2024 10:45:08 PM
漾仔
智加科技论文DualBEV入选计算机视觉顶会ECCV
近日,智加科技团队论文《DualBEV: Unifying Dual Veiw Transformation with Probabilistic Correspondences》入选欧洲计算机视觉国际会议(ECCV, European Conference on Computer Vision),ECCV是计算机视觉领域最具影响力和权威性的国际会议之一,与国际计算机视觉大会(ICCV)和计算机视觉与模式识别会议(CVPR)齐名,被誉为计算机视觉领域的“三大顶会”之一。ECCV 每两年举办一次,汇聚了全球顶尖的研究
7/9/2024 11:13:00 AM
新闻助手
Meta 发布 3D Gen AI 模型:1 分钟内生成高质量 3D 内容
Meta 公司昨日(7 月 2 日)发布研究论文,介绍了名为 Meta 3D Gen(3DGen)的全新 AI 模型,可以在 1 分钟内基于用户输入的提示词,生成高质量的 3D 内容。Meta 公司表示 Meta 3D Gen(3DGen)所生成的 3D 内容具备高分辨率纹理和材质贴图,还支持基于物理的渲染(PBR),并能对此前生成的 3D 内容重新再生成新纹理。IT之家援引论文主要内容,Meta 3D Gen 包含 text-to-3D 生成和 text-to-texture 生成两个主要组件,其工作原理如下:第
7/3/2024 10:47:25 AM
故渊
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
马斯克
AI创作
智能体
论文
英伟达
Anthropic
代码
算法
训练
Stable Diffusion
芯片
蛋白质
开发者
腾讯
LLM
生成式
苹果
Claude
Agent
AI新词
神经网络
3D
AI for Science
机器学习
研究
生成
xAI
人形机器人
AI视频
计算
Sora
GPU
AI设计
百度
华为
工具
大语言模型
搜索
具身智能
场景
RAG
字节跳动
大型语言模型
预测
深度学习
伟达
视觉
Transformer
视频生成
AGI
神器推荐
亚马逊
架构
Copilot
DeepMind
应用
安全