应用
SIGGRAPH Asia 2025:摩尔线程赢图形顶会3DGS挑战赛大奖,自研LiteGS全面开源
12 月 17 日,在香港举办的全球图形学领域备受瞩目的顶级学术盛会 SIGGRAPH Asia 2025 上,摩尔线程在 3D Gaussian Splatting Reconstruction Challenge(3DGS 重建挑战赛)中凭借自研技术 LiteGS 出色的算法实力和软硬件协同优化能力,斩获大赛银奖,再次证明摩尔线程在新一代图形渲染技术上的深度积累与学术界的高度认可。 3DGS:下一代图形渲染的范式革命 开启 AI 加速的高效渲染时代3D Gaussian Splatting(3DGS,三维高斯溅射)是 2023 年提出的一项革命性 3D 场景表示与渲染技术,以可参数化的 3D 高斯分布为核心,实现了画质、效率与资源占用之间的卓越平衡。 与传统 NeRF 相比,3DGS 在保持逼真渲染质量的前提下,将渲染效率提升数百至上千倍,并在光线追踪、VR/AR 实时渲染、多模态融合等方向展现出极强的适应性与扩展性。
WAIC Future Tech 2026:全球科技曝光+合作,资本的下一个掘金点
腾讯混元世界模型 1.5 发布,首次开源业界最系统、最全面的实时世界模型框架
AI在线 12 月 17 日消息,今日,腾讯混元世界模型 1.5(Tencent HY WorldPlay) 正式发布。 官方称,混元世界模型 1.5(WorldPlay)首次开源了业界最系统、最全面的实时世界模型框架,涵盖数据、训练、流式推理部署等全链路、全环节,并提出了重构记忆力、长上下文蒸馏、基于 3D 的自回归扩散模型强化学习等算法模块。 AI在线附官方介绍如下:世界建模的新突破:实时交互、前后一致混元世界模型 1.5 带来世界建模的全新可能性,用户可以在生成的世界里随意移动探索,离开某个区域后再次返回时,模型能够 " 记住 " 该区域的三维结构,呈现前后一致的场景 —— 这种空间记忆能力标志着模型在三维世界理解上的突破。
再获头部厂商定点,千寻位置BG1101系列车规级芯片模组定点累计超千万片
近日,千寻位置宣布,其自主研发的步光BG1101系列车规级时空智能芯片模组(简称:BG1101系列车规级芯片模组)获得头部通信解决方案提供商定点。 至此,千寻位置已与多家头部Tier1厂商、主机厂商、通信解决方案提供商达成合作,累计定点规模突破千万片。 凭借稳定、可靠、安全的产品性能、完善的交付与保障体系,千寻位置车规级芯片模组已获得行业主流认可,实现从技术验证到规模化应用的关键跨越。
推特争论引发学术新发现!谢赛宁团队发布 iREPA,仅需 3 行代码!
最近,谢赛宁团队的新作 “iREPA” 便是源于一场持续了四个月的推特辩论。 这场论战虽以谢赛宁的让步为结局,却意外催生了一篇重要论文,展示了新颖的研究思路。 事件的起源可以追溯到八月份。
音乐界怒斥 AI 克隆歌曲泛滥,行业亟需整治
近日,音乐人、制作人及行业人士对 AI 生成的克隆音乐表达了越来越强烈的反对声。 虽然 AI 假曲早已存在,但随着技术的进步,假曲的数量和质量都在激增,让许多艺术家感到愤怒和无奈。 早在2023年,就出现了多首 AI 伪造的 Drake 歌曲,然而在过去两年中,问题愈加严重。
字节跳动发布 Seedance 1.5 Pro:AI 音视频创作进入 100% 视听同步时代!
12月16日,字节跳动在北京正式发布了其新一代音视频创作模型 ——Seedance1.5pro。 这一全新的创作工具不仅在音视频生成领域实现了重大突破,还为用户带来了更为丰富的视听体验。 Seedance1.5pro 支持音视频的联合生成,用户可以通过文本输入生成音视频内容,或者利用图像引导生成音视频。
Meta 推出新款 AI 眼镜,助你更清晰地听到对话
Meta 近日推出了一款新型 AI 眼镜,旨在帮助用户更清晰地听到周围人的对话。 这款眼镜采用开放式扬声器设计,可以放大与用户交谈的人的声音,提升日常交流的便利性。 这一功能特别适合在嘈杂环境中使用,例如咖啡馆或繁忙的街道,让用户更轻松地参与对话。
Meta 扩大员工使用竞争对手 AI 工具权限,含 ChatGPT-5、 Gemini 3 Pro 等
AI在线 12 月 17 日消息,据 Business Insider 获悉,为打造“人工智能优先”的办公环境,Meta 正扩大员工使用谷歌、OpenAI 等竞争对手旗下人工智能工具的权限。 该媒体获取的多份内部文件及帖子显示,这家社交媒体巨头一直鼓励员工将人工智能工具融入几乎所有工作流程。 Meta 首席信息官阿蒂什・班纳吉在 6 月的一份备忘录中向员工表示,公司的首要任务之一是“让人工智能成为我们工作方式的核心”。
英伟达护城河又宽了!低调收购开源算力调度王牌工具,全球过半顶级超算在用,Thinking Machines也离不开它
闻乐 发自 凹非寺. 量子位 | 公众号 QbitAI英伟达低调出手收购SchedMD,被业界评价为:悄悄把自家的护城河拓宽了。 SchedMD是全球HPC(高性能计算)与AI领域的“资源调度王牌管家”——Slurm系统的核心开发商。
小米自研 MINT 统一模型部署平台发布:降低 AI 开发门槛,优先向生态链公司开放
AI在线 12 月 17 日消息,在今日的 2025 小米“人车家全生态”合作伙伴大会上,小米生态链部总经理陈波发布了自研 MINT 统一模型部署平台,帮助 IoT 开发商降低 AI 开发门槛。 MINT 平台可以理解为一个“端到端流水线”,可以帮助开发者快速完成高复杂度的 AI 模型部署。 MINT 平台提供开箱即用的芯片级优化能力,支持跨厂商算法集成,还有自研模型小型化技术。
谷歌联合创始人布林称通勤时会使用 Gemini Live,更强大版本即将上线
AI在线 12 月 17 日消息,谢尔盖・布林(Sergey Brin)在通勤途中一直在内测谷歌的人工智能产品。 这位谷歌联合创始人于 2019 年卸任 Alphabet 公司总裁后,近年来重新投身于公司的人工智能研发工作,牵头推进 Gemini 项目。 上周在斯坦福大学的一场专题研讨会上,有听众询问布林如何保持思维敏锐,以及他在车里会听哪些播客。
全球最大规模!如视开源室内三维数据集Realsee3D
如视宣布,面向学术研究及非商业用途正式开放10000套室内三维数据集 Realsee3D——这或是全球目前最大规模的空间三维数据集,旨在为空间智能领域的研究者、开发者提供高质量数据基础,加速整个行业的技术迭代与应用落地。 Realsee3D此前,如视发布空间深度推测大模型 Argus1.0。 作为首个支持全景图输入的空间深度推测大模型,Argus1.0依托如视所积累的千万级三维空间数据库训练而成。
港中文 MMlab×美团新研究:仅用一个模型,应对多种视觉推理任务
在大模型迈向通用视觉智能的浪潮中,单一任务或单一模态的方法正面临瓶颈。 现实世界的视觉理解系统不仅要回答问题,还要理解动态视频、定位事件、跟踪目标、生成描述乃至进行复杂的逻辑推理,这要求模型具备综合的跨任务和跨模态能力。 然而,现有方法多数依赖任务专化模型,难以实现不同视觉任务间的协同与知识共享,这不仅导致系统复杂度高,也限制了模型在综合推理场景中的表现。
Google 推出个性化 AI 助手 CC,助你轻松管理晨间事务
Google 最近推出了一款名为 CC 的实验性 AI 助手,旨在改变用户早晨的忙碌状态。 这个助手每天早晨会主动为用户整理邮件、日历和文档信息,并将其以个性化的 “日程前瞻” 简报形式发送到用户的邮箱。 CC 的设计理念是让用户在醒来后,不再被繁杂的信息轰炸,而是通过一份清晰的概览来开始新的一天。
豆包手机助手 nubia M153工程机首批售罄,F 码申请紧急停止
由字节跳动旗下 AI 大模型“豆包”驱动的“豆包手机助手”于12月初上线,并与中兴通讯合作推出了 nubia M153 工程机。 这款具备跨应用语音操作能力(如自动完成比价并跳转下单)的新机迅速在科技圈引发抢购热潮。 官方近日发布声明称,市场对豆包手机助手的热情“超乎想象”,合作方 nubia 基于技术预览少量备货的首批 M153手机,目前已完全无法满足已申请的 F 码需求。
红帽收购 AI 公司 Chatterbox Labs 强化企业级 AI 安全能力
红帽(Red Hat)近期宣布收购了一家名为 Chatterbox Labs 的人工智能公司,此次收购是为了进一步增强其在企业级 AI 领域的布局。 Chatterbox Labs 成立于2011年,专注于 AI 模型测试和生成式 AI 的安全防护。 此次收购是继去年收购 Neural Magic 后,红帽再次加大在 AI 领域的投资。
Meta AI 眼镜重磅升级:新增“对话聚焦”和 Spotify 视觉配乐功能
Meta 公司周二宣布对其 Ray-Ban Meta 和 Oakley Meta HSTN 智能眼镜进行软件更新(v21),推出了两项关键新功能:“对话聚焦”以增强嘈杂环境中的听力清晰度,以及与 Spotify 合作的“视觉配乐”功能。 实用功能上线:AI 增强嘈杂环境中的对话清晰度本次更新中最具实用性的功能是**“对话聚焦”(Conversation Focus)。 该功能利用 AI 眼镜的开放式扬声器和人工智能技术,能够放大对话者的声音**,从而帮助用户在嘈杂的环境,如繁忙的餐厅、酒吧或通勤列车中,更清晰地听到对方说话。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉