3D
单图就能解锁全景视角,北大 / 港中文 / 腾讯等推出 ViewCrafter 开源项目
随便给张图就能从更多视角查看全景了?!话不多说,先看一波效果,单视角输入 be like:难度升级,接下来换成双视角,看起来衔接也非常丝滑。以上来自 ViewCrafter,由北大、港中文、腾讯等机构的研究人员提出,可以从单张或稀疏输入图像生成精确相机可控的新视角视频。还支持场景级文生 3D、图生 3D、以及稀疏视角重建等应用。目前论文和代码均已开源,并提供了在线 Huggingface demo 供用户使用。ViewCrafter:一种新视角生成方法传统的新视角生成方法,如 NeRF 和 3D-GS 等技术,存在
9/18/2024 4:01:54 PM
汪淼
为吸引开发者创建游戏地图,“元宇宙平台”Roblox 将推出 3D 模型生成 AI 工具
《Roblox(罗布乐思)》是一个深受孩子们欢迎的社区游戏平台,也是一款“知名元宇宙游戏”, 玩家可以自行为这款游戏(平台)上传一系列场景脚本,从而能够在游戏(平台)中,使用同一角色游玩到各种各样的游戏内容。该平台在上周的开发者大会中宣布将提高游戏创作者的分成比例,并在游戏中集成(实体商品销售)电商平台。此外,Roblox 还将推出基于 AI 的 3D 模型生成工具以吸引开发者创建游戏地图。▲ Roblox 在开发者大会上演示的 AI 生成地区建模效果(下同)Roblox 指出,全球约有 34 亿人玩游戏,游戏产业
9/9/2024 1:29:21 PM
漾仔
元象推出国内首个基于物理的3D动作生成模型MotionGen
www.MotionGen.cn 一句话生成复杂3D动作,效果惊艳!测试期可申请免费试用。3D内容制作领域,生成逼真的角色动作生成是一个持续挑战,传统方法依赖大量的手K制作,或昂贵动作捕捉设备,效率低、成本高、难以生成一般运动任务或适应复杂场景和交互。元象XVERSE推出国内首个基于物理的3D动作生成模型MotionGen,创新性融合大模型、物理仿真和强化学习等前沿算法,让用户输入简单文本指令,就能快速生成逼真、流畅、复杂的3D动作,效果惊艳,标志着中国3D AIGC领域的重大突破。现在起,零经验创作者也能轻松上手
8/28/2024 3:41:00 PM
新闻助手
智谱 AI 开源 CogVideoX-5B 视频生成模型,RTX 3060 显卡可运行
智谱 AI 开源了 CogVideoX-5B 视频生成模型,相比此前开源的 CogVideoX-2B,官方称其视频生成质量更高,视觉效果更好。官方表示大幅度优化了模型的推理性能,推理门槛大幅降低,可以在 GTX 1080Ti 等早期显卡运行 CogVideoX-2B ,在 RTX 3060 等桌面端“甜品卡”运行 CogVideoX-5B 模型。CogVideoX 是一个大规模 DiT(diffusion transformer)模型,用于文本生成视频任务,主要采用了以下技术:3D causal VAE:通过压缩视
8/28/2024 8:49:49 AM
沛霖(实习)
第二波!2024年8月精选实用设计工具合集
大家好,这是 2024 年 8 月的第 2 波干货合集!
在搜集整理 3D 工具的时候,我注意到 2 个对于设计师非常友好的 3D 工具,其中一个是更加适宜新手入坑 3D 的建模平台 Womp3D,以及可以帮助前端快速将 3D 资源插入到网页中的代码工具,这俩在网页前端设计落地的过程中,甚至可以直接联动起来。
而 AI 工具这边,这期搜集到了 3 个非常值得关注的好东西,一个是阿里出品的开源的 AI 自动剪辑工具,对于做影视的小伙伴会非常友好,另外 2 个则和 UI 设计落地有关的 AI 平台,它们甚至隐约呈现出了
8/15/2024 7:19:49 AM
陈子木
一张图即可 0.5 秒生成三维建模,Stability AI 推出“Stable Fast 3D”模型
Stability AI 今天推出了一款名为 Stable Fast 3D 的 AI 模型,该模型主打“图生 3D 模型”,号称只需 0.5 秒就能快速生成完整且自然的 3D 模型,目前该模型已在 Hugging Face 平台上架,感兴趣的小伙伴们可以(点此访问)。AI在线获悉,Stable Fast 3D 只需要单张图片即可快速生成高质量的 3D 模型,相关模型自带材质及对应的参数,同时提供了精确的 UV 展开(UV Unwrapping)便于用户进行后期修改,如果用户需要,还可以选择四边形或三角形网格重建功能
8/2/2024 10:45:08 PM
漾仔
智加科技论文DualBEV入选计算机视觉顶会ECCV
近日,智加科技团队论文《DualBEV: Unifying Dual Veiw Transformation with Probabilistic Correspondences》入选欧洲计算机视觉国际会议(ECCV, European Conference on Computer Vision),ECCV是计算机视觉领域最具影响力和权威性的国际会议之一,与国际计算机视觉大会(ICCV)和计算机视觉与模式识别会议(CVPR)齐名,被誉为计算机视觉领域的“三大顶会”之一。ECCV 每两年举办一次,汇聚了全球顶尖的研究
7/9/2024 11:13:00 AM
新闻助手
Meta 发布 3D Gen AI 模型:1 分钟内生成高质量 3D 内容
Meta 公司昨日(7 月 2 日)发布研究论文,介绍了名为 Meta 3D Gen(3DGen)的全新 AI 模型,可以在 1 分钟内基于用户输入的提示词,生成高质量的 3D 内容。Meta 公司表示 Meta 3D Gen(3DGen)所生成的 3D 内容具备高分辨率纹理和材质贴图,还支持基于物理的渲染(PBR),并能对此前生成的 3D 内容重新再生成新纹理。IT之家援引论文主要内容,Meta 3D Gen 包含 text-to-3D 生成和 text-to-texture 生成两个主要组件,其工作原理如下:第
7/3/2024 10:47:25 AM
故渊
涵盖文本、定位和分割任务,智源、港中文联合提出首个多功能3D医学多模态大模型
作者 | 香港中文大学白帆编辑 | ScienceAI近日,香港中文大学和智源联合提出的 M3D 系列工作,包括 M3D-Data, M3D-LaMed 和 M3D-Bench,从数据集、模型和测评全方面推动 3D 医学图像分析的发展。(1)M3D-Data 是目前最大的 3D 医学图像数据集,包括 M3D-Cap (120K 3D 图文对), M3D-VQA (510K 问答对),M3D-Seg(150K 3D Mask),M3D-RefSeg (3K 推理分割)共四个子数据集。(2)M3D-LaMed 是目前最
6/21/2024 6:08:00 PM
ScienceAI
CVPR 2024全部奖项公布!近万人线下参会,谷歌华人研究员获最佳论文奖
北京时间 6 月 20 日凌晨,在西雅图举办的国际计算机视觉顶会 CVPR 2024 正式公布了最佳论文等奖项。今年共有 10 篇论文获奖,其中 2 篇最佳论文,2 篇最佳学生论文,另外还有 2 篇最佳论文提名和 4 篇最佳学生论文提名。作为计算机视觉(CV)领域的顶级会议,CVPR 每年都会吸引大量研究机构和高校参会。据统计,今年共提交了 11532 份论文,2719 篇被接收,录用率为 23.6%。根据佐治亚理工学院对 CVPR 2024 录用数据的统计分析,从研究主题来看,论文数量最多的是图像和视频合成与生成
6/20/2024 2:56:00 PM
机器之心
可控核聚变新里程碑,AI首次实现双托卡马克3D场全自动优化,登Nature子刊
编辑 | X几十年来,核聚变释放能量的「精妙」过程一直吸引着科学家们的研究兴趣。现在,在普林斯顿等离子体物理实验室(PPPL)中 ,科学家正借助人工智能,来解决人类面临的紧迫挑战:通过聚变等离子体产生清洁、可靠的能源。与传统的计算机代码不同,机器学习不仅仅是指令列表,它可以分析数据、推断特征之间的关系、从新知识中学习并适应。PPPL 研究人员相信,这种学习和适应能力可以通过多种方式改善他们对聚变反应的控制。这包括完善超热等离子体周围容器的设计、优化加热方法以及在越来越长的时间内保持反应的稳定控制。近日,PPPL 的
5/22/2024 7:20:00 PM
ScienceAI
三维设计巨头 Autodesk 收购 AI 视效创企 Wonder Dynamics
Autodesk 宣布已收购 Wonder Dynamics,两家公司曾一直有密切合作。据悉 Wonder Dynamics 作为一家初创公司,旗下的 Wonder Studio 是一款融合云技术与人工智能(AI)的 3D 动画和视觉特效创作工具,并与 Autodesk Maya 等其他主流的 3D 设计工具高度兼容,帮助艺术家更轻松地在场景中制作 3D 角色动画、灯光和构图。IT之家查询获悉,Wonder Dynamics 由视觉特效艺术家 Nikola Todorovic 和演员 Tye Sheridan 创立
5/22/2024 11:38:26 AM
满河(实习)
文生图 AI 巨头 Stability AI 被曝欠下近 1 亿美元,正与投资者洽谈融资事宜
综合路透社、The Information 消息,被视为文生图 AI 领域“巨头”之一的英国人工智能初创公司 Stability AI 发言人表示,该公司正与一批投资者洽谈大额股权融资事宜,以为当前资金短缺的 Stability AI 注入新的资金。该发言人表示,Stability AI 正与一家“世界知名的”技术投资集团进行独家合作。报道称,Stability AI 公司第一季度的收入不到 500 万美元(IT之家备注:当前约 3610 万元人民币),亏损超过 3000 万美元(当前约 2.17 亿元人民币),目
5/17/2024 8:12:25 PM
清源
李飞飞揭秘创业方向“空间智能”:视觉化为洞察,看见成为理解,理解导致行动
斯坦福李飞飞创业后,首次揭秘新概念“空间智能”。这不仅是她的创业方向,也是指引她的“北极星”,被她认为是“解决人工智能难题的关键拼图”。视觉化为洞察;看见成为理解;理解导致行动。李飞飞最新 15 分钟 TED 演讲完整公开,从数亿年前生命进化的起源开始,到人类如何不满足于自然赋予而发展人工智能,到下一步如何构建空间智能。而 9 年前,正是在同一个舞台上,李飞飞向世界介绍了刚诞生不久的 ImageNet—— 这一轮深度学习爆发的起点之一。她本人也向网友自我安利:如果把两个视频都看了,你就能对过去 10 年的计算机视觉
5/16/2024 11:36:37 PM
清源
一部手机就能玩出这种特效,难怪3D建模大神都点赞
机器之能报道编辑:Sia手机做的特效,居然也能骗过我的眼睛。这是一组让人怀疑双眼和大脑的视频,我打赌很多人很难分辨哪些东西是假的......视频链接:,哪些是真实的物理存在,哪些是添加的 3D 模型?机器人跑酷时,手足与长凳交互的方式近乎无缝甚至还有熟悉的机械声(记得打开音量),是不是感觉很逼真?就连日本 3D 建模大神 Hirokazu Yokohara 也加入了体验行列。她只花了几分钟就将一个四足机器人模型植入到真实场景中。来自@Yokohara_h视频链接:(你相信吗?)。通过一个叫 Simulon 的苹果
5/8/2024 7:17:00 PM
机器之能
优于SOTA,腾讯AI Lab开发双重扩散模型,实现靶标配体3D分子生成和先导化合物优化
编辑 | 萝卜皮基于结构的生成化学,通过探索广阔的化学空间来设计对靶标具有高结合亲和力的配体,在计算机辅助药物发现中至关重要。然而,传统的计算机方法受到计算效率低下的限制,机器学习方法则因自回归采样而面临瓶颈。为了解决这些问题,腾讯 AI lab、香港城市大学、锐格医药(Regor Therapeutics Group)的研究人员开发了一种条件深度生成模型 PMDM,用于生成适合特定靶标的 3D 分子。PMDM 由具有局部和全局分子动力学的条件等变扩散模型组成,使 PMDM 能够考虑条件蛋白质信息从而有效地生成分子
3/29/2024 6:15:00 PM
ScienceAI
准确率 >98%,基于电子密度的 GPT 用于化学研究,登 Nature 子刊
编辑 | 紫罗可合成的分子化学空间是巨大的。要想有效地驾驭这一领域,需要基于计算的筛选技术,如深度学习技术,以快速跟踪感兴趣的化合物发现。然而,使用算法进行化学发现需要将分子结构转换为计算机可用的数字表示形式,并开发基于这些表示形式的算法来生成新的分子结构。近日,来自英国格拉斯哥大学(University of Glasgow)的研究人员,提出了一种基于电子密度训练的机器学习模型,用于生产主客体 binders。这些以简化分子线性输入规范 (SMILES) 格式读出,准确率 98%,从而能够在二维上对分子进行完整的
3/26/2024 3:12:00 PM
ScienceAI
Meta 推出 SceneScript AI 视觉模型,利用可编程语言实时预测建立 3D 场景
据 Meta 公司官方新闻稿,该公司开发了一款名为“SceneScript”的视觉模型,该模型号称能够使用可编程语言来快速“建立”场景,实时推断房间几何形状,并将相关数据转换为建筑学层面的近似值。▲ 图源 Meta 公司官方新闻稿(下同)Meta 声称,相关方法能够高效且轻量地建立室内 3D 模型,号称“只需要数 KB 的内存即可生成清晰且完整的几何形状”,并且相关形状数据具有“可解释性”,用户可以轻松阅读和编辑这些数据表示。IT之家注意到,开发人员借鉴了大语言模型“预测单词”的方法来开发 SceneScript,
3/25/2024 10:08:44 PM
漾仔
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
数据
模型
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Stable Diffusion
马斯克
Gemini
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
3D
Sora
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
模态
字节跳动
Claude
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
Copilot
LLaMA
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
科技
亚马逊
智能体
DeepMind
特斯拉