香港科技大学(广州)
招生 | 港科大(广州)数据科学与分析学域2026-27博士项目申请开放!
告别高昂重制成本!港科大广州、快手可灵发布立体视频转换单步推理新方案
近年来,随着 VR 头戴设备、智能眼镜、3D 影院的发展,人们对于 3D 立体视频内容的需求不断增加。 3D 电影带来的沉浸式体验着实令人着迷,但因其制作过程需要专业的相机设备、复杂耗时的专家后处理,3D 内容的制作让普通玩家望而却步:2010 年,卡梅隆导演为了实现经典著作《泰坦尼克号》的 3D 版本重制,制作团队投入了高达 1800 万美元,动用了 300 名专业工程师,耗时整整 60 周才完成 [1]。 如此高昂的成本和复杂的人力投入,一直是 3D 内容生产的最大阻碍。
VGGT4D:无需训练,挖掘3D基础模型潜力,实现4D动态场景重建
如何让针对静态场景训练的 3D 基础模型(3D Foundation Models)在不增加训练成本的前提下,具备处理动态 4D 场景的能力? 来自香港科技大学(广州)与地平线 (Horizon Robotics) 的研究团队提出了 VGGT4D。 该工作通过深入分析 Visual Geometry Transformer (VGGT) 的内部机制,发现并利用了隐藏在注意力层中的运动线索。
奖学金18万/年,香港科技大学(广州)数据科学与分析方向招收全奖博士生
关于香港科技大学(广州)香港科技大学(广州)与香港科技大学在 “港科大一体,双校互补” 的框架下开展合作,地位平等,在学术规范、师资水平、课程质量等方面保持一致,实现资源共享、优势互补,共同助力国家与粤港澳大湾区发展。作为 HKUST 2.0 的重要组成部分,香港科技大学(广州)采用全新的、融合学科的学术架构,以 “枢纽”(Hub)和 “学域”(Thrust)取代传统学科学术架构的 “学院” 和 “学系”,推动学科交叉融合,同时大力发展新兴学科和前沿学科,以应对世界和人类社会面临的日趋复杂的重大挑战。在香港科技大学
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉