空间理解
3D视觉大模型SpatialLM开源,实时识别场景内容
在人工智能领域,3D视觉与空间理解技术正成为推动具身智能、自主导航及虚拟现实等应用的关键。 2025年3月,杭州群核科技在GTC2025全球大会上宣布正式开源其自主研发的3D视觉大语言模型 SpatialLM,引发业界广泛关注。 这一模型以其强大的空间认知能力和低成本的数据处理方式,为机器人训练、建筑设计及AR/VR等领域带来了革命性突破。
4/16/2025 10:01:17 AM
AI在线
- 1
资讯热榜
OpenMemory MCP发布!AI记忆本地共享,Claude、Cursor一键同步效率翻倍!
超多案例!让 Lovart 作图更好看更高效的提示词在这里了!
“逆天”研究!Cursor 与 Windsurf 背后的核心算法机制曝光!网友惊呼:Cursor代码总出Bug的原因找到了
谷歌Android Auto迎来Gemini AI,打造更智能车载体验
Meta 发布巨型 AI 化学数据集 OMol25及通用模型 UMA
TikTok 推出新 AI 工具 “AI Alive”,轻松将照片变成视频
Poe:DeepSeek使用率下降50%,快手崛起、OpenAI暴涨
中国版Cursor!腾讯推出 AI 编程助手 CodeBuddy
标签云
人工智能
AI
OpenAI
AIGC
ChatGPT
模型
DeepSeek
AI绘画
数据
机器人
谷歌
大模型
Midjourney
用户
智能
开源
微软
学习
GPT
Meta
图像
AI创作
技术
Gemini
论文
马斯克
Stable Diffusion
算法
代码
芯片
生成式
蛋白质
英伟达
腾讯
开发者
神经网络
研究
Anthropic
3D
计算
Sora
机器学习
AI设计
AI for Science
GPU
苹果
AI视频
场景
华为
生成
百度
人形机器人
搜索
预测
训练
伟达
Claude
xAI
深度学习
Transformer
大语言模型
字节跳动
模态
智能体
具身智能
神器推荐
Copilot
文本
驾驶
LLaMA
视觉
算力
应用
安全
API
干货合集
视频生成
大型语言模型
Agent
工具