AI在线 AI在线

AI

仅凭RGB图像实现户外场景高精度定位与重建,来自港科广团队 | ICRA 25

仅凭RGB图像实现户外场景高精度定位与重建,来自港科广团队 | ICRA 25

从自动驾驶、机器人导航,到AR/VR等前沿应用,SLAM都是离不开的核心技术之一。 现有基于3D高斯分布(3DGS)的SLAM方法虽在室内场景表现出色,但使用仅RGB输入来处理无界的户外场景仍然面临挑战:准确的深度和尺度估计困难,这影响了姿态精度和3DGS初始化图像重叠有限且视角单一,缺乏有效的约束,导致训练难以收敛为了解决上述挑战,港科广团队提出全新解决方案——OpenGS-SLAM。 仅凭RGB图像实现高精度定位与逼真场景重建。
3/19/2025 10:00:41 AM 量子位
首次,6人7天真人秀!南洋理工等发布第一视角AI生活管家数据EgoLife

首次,6人7天真人秀!南洋理工等发布第一视角AI生活管家数据EgoLife

当AI智能体(如Manus)接管你的大部分工作后,你是否曾想过,如何让自己的生活变得更加轻松与智能? 试想一个未来场景:你佩戴着智能眼镜,一个AI助理能无缝融入你的日常生活,根据你的个人习惯提供贴心的美食建议,下班后提醒你曾经购买过的物品,甚至通过分析你和家人过去的活动来主动预测你的需求。 这样一款「生活助手」将极大提升个人效率和家庭协作,让AI真正成为我们生活中的得力管家。
3/19/2025 9:43:43 AM 新智元
谷歌以 320 亿美元收购 Wiz,加速 AI 时代云安全与多云战略

谷歌以 320 亿美元收购 Wiz,加速 AI 时代云安全与多云战略

近日,谷歌宣布已签署最终协议,将以320亿美元全现金交易收购网络安全公司Wiz,这项交易需通过相关调整后最终完成。 交易完成后,Wiz将并入谷歌云(Google Cloud)。 此次收购标志着谷歌云正在加大对两大快速增长趋势的投资:提升云安全能力以及推动多云战略的实施。
3/19/2025 9:31:06 AM AI小蜜蜂
AI真·抢饭碗?美国码农就业跌至1980年以来最低,重回「吃豆人」时代

AI真·抢饭碗?美国码农就业跌至1980年以来最低,重回「吃豆人」时代

美国程序员的就业人数已跌至1980年以来的最低水平!那可是互联网存在之前的好多年了。 1980年,「吃豆人」(Pac-Man)游戏刚刚风靡全球。 亚马逊还没开始在线上卖货,苹果还没有出售它的iPhone。
3/19/2025 9:30:10 AM 新智元
智源开源多模态向量模型BGE-VL,助力多模态检索!

智源开源多模态向量模型BGE-VL,助力多模态检索!

智源研究院开源了多模态向量模型BGE-VL,助力主要多模态检索任务达到SOTA。 论文地址:: : :现有的多模态检索模型大多基于预训练的视觉-语言模型,这些模型主要通过文本-图像匹配任务进行预训练,对于其他常见的多模态任务(如组合图像检索和多模态文档检索)表现不足。 为了增强模型的多任务能力,研究者们开始采用指令微调的方法,但高质量的指令微调数据稀缺且难以大规模获取。
3/19/2025 9:30:00 AM Glodma
全球首个工业界多模态推理模型开源!38B硬刚DeepSeek-R1,训练秘籍全公开

全球首个工业界多模态推理模型开源!38B硬刚DeepSeek-R1,训练秘籍全公开

刚刚,昆仑万维正式开源了全球首个工业界多模态推理模型Skywork R1V(以下简称「R1V」)! R1V高效地将DeepSeek-R1这种强大的文本推理能力无缝scaling到了视觉模态,实现了多模态领域的领先表现,并以开源方式推动了技术进步。 由此,多模态推理的新时代即将开启。
3/19/2025 9:20:00 AM 新智元
多模态也做到了强推理!工业界首个开源的R1V,让视觉思考进入o1时代

多模态也做到了强推理!工业界首个开源的R1V,让视觉思考进入o1时代

DeepSeek-R1 问世后,我们一直在期待能「强推理、慢思考」的大模型进化成多模态模式。 如果能在视觉等各领域复刻强化学习(RL)在文本上的突破,AI 应用势必会将更多领域推入新的范式。 毫无疑问,这也是众多科技公司正在探索的方向。
3/19/2025 8:30:00 AM 机器之心
AI 代理协助编写恶意代码,网络安全面临新挑战

AI 代理协助编写恶意代码,网络安全面临新挑战

人工智能驱动的代理正在快速发展,为自动化日常任务提供了更强大的能力。 然而,研究人员发现,这些工具也可能被恶意行为者利用来实施攻击。 OpenAI 的“Operator”于 2025 年 1 月 23 日作为研究预览发布,代表了新一代能够与网页交互并在最少人为干预下执行复杂任务的 AI 工具。
3/19/2025 8:30:00 AM AI小蜜蜂
OpenAI 后训练研究负责人离职,创办材料科学 AI 初创公司

OpenAI 后训练研究负责人离职,创办材料科学 AI 初创公司

OpenAI负责后训练研究的副总裁Liam Fedus宣布离职,创立一家专注于材料科学的人工智能初创企业。OpenAI计划投资并与其建立合作关系。Fedus的公司将与谷歌DeepMind、微软等企业在材料科学AI领域展开竞争。#人工智能# #材料科学#
3/18/2025 4:35:54 PM 远洋
腾讯把AI生3D玩明白了,一口气开源两款模型,消费级显卡可跑!明天还有重磅开源!

腾讯把AI生3D玩明白了,一口气开源两款模型,消费级显卡可跑!明天还有重磅开源!

出品 | 51CTO技术栈(微信号:blog51cto)Hunyuan3D 2.0上线后就好评不断。 该家族又在今天的开源日中迎来了重磅的新成员——Hunyuan 3D-2mini以及Hunyuan 3D-2mv!今天腾讯的演示中,感觉他们真的把AI生3D玩明白了,真的能用AI重构游戏行业。 不愧是腾讯,手握众多王牌游戏就是有经验啊!
3/18/2025 2:17:57 PM
65岁陈立武点爆英特尔三把火!裁员砍中层,AI制造,争夺世界代工厂王座

65岁陈立武点爆英特尔三把火!裁员砍中层,AI制造,争夺世界代工厂王座

随着华人大佬执掌英特尔之后,一场大刀阔斧的改革呼之欲出。 路透独家报道称,新任CEO陈立武计划全面改革「制造和AI」业务,试图带领英特尔重回时代巅峰。 在上周的全员大会上,他直言不讳地告诉全员工,「公司需要做出艰难的决定」。
3/18/2025 1:11:15 PM 新智元
金山办公申请青丘大模型商标,布局科学仪器与网站服务领域

金山办公申请青丘大模型商标,布局科学仪器与网站服务领域

近日,北京金山办公软件股份有限公司(以下简称 “金山办公”)向国家知识产权局提交了「青丘大模型」商标的注册申请,涵盖科学仪器和网站服务的相关领域。 这一商标申请目前正在审查当中。 金山办公的注册资本约为4.6亿人民币,主要业务包括办公软件的开发、销售及计算机系统集成等。
3/18/2025 11:11:00 AM AI在线
导致AI项目失败的11种战略疏忽和错误

导致AI项目失败的11种战略疏忽和错误

企业正在AI工具、服务和内部战略上投入大量资金。 但遗憾的是,大额支出并不能保证成功。 “AI无处不在——正在改变行业,重塑工作流程,并承诺带来无限可能的未来,”技术咨询公司Searce的应用AI副总裁Paul .
3/18/2025 11:05:05 AM Bob Violino
深度解析以Decoder为核心的无BEV的大一统端到端架构 | 对话CCF-CV学术新锐奖贾萧松博士

深度解析以Decoder为核心的无BEV的大一统端到端架构 | 对话CCF-CV学术新锐奖贾萧松博士

论文的一些巧思1. 人开车其实并没有最优解,请问如何确定学习时的参考数据呢?开车其实也是多种多样的,然后你模仿学习本质上就是告诉他你只能这样做,你做了别的那个mass loss还会惩罚他。 其实就是我们说的,我们其实就不能通过模仿来做。
3/18/2025 10:29:48 AM 自动驾驶之心
谷歌升级 Gemini 2.0 系列模型,AI 助手可免费深度推理

谷歌升级 Gemini 2.0 系列模型,AI 助手可免费深度推理

此次更新标志着谷歌进一步普及AI工具,降低用户使用门槛。通过免费开放核心功能与优化模型性能,谷歌持续强化其AI生态竞争力。未来若能明确Pro版本优势并完善隐私保障,或将进一步推动AI助手的大众化应用。
3/18/2025 9:36:08 AM 故渊
ChatGPT创始成员、后训练负责人官宣离职!自立门户并将获OpenAI投资

ChatGPT创始成员、后训练负责人官宣离职!自立门户并将获OpenAI投资

OpenAI 又有重量级员工出走! 这次是后训练负责人、研究副总裁 William Fedus。 今天凌晨,Fedus 在 X 上发表了一则公开离职信,讲述了他离职的原因以及今后的去向。
3/18/2025 9:26:22 AM 机器之心
新注意力让大模型上下文内存占用砍半!精度不减还能加速2倍

新注意力让大模型上下文内存占用砍半!精度不减还能加速2倍

大模型同样的上下文窗口,只需一半内存就能实现,而且精度无损? 前苹果ASIC架构师Nils Graef,和一名UC伯克利在读本科生一起提出了新的注意力机制Slim Attention。 它以标准多头注意力(MHA)为基准,对其中的value缓存处理过程进行了调整,实现了更少的内存占用。
3/18/2025 9:23:22 AM 量子位
陶哲轩:o3-mini纠正了我一个数学错误,十分钟解决原本一小时才能完成的题目

陶哲轩:o3-mini纠正了我一个数学错误,十分钟解决原本一小时才能完成的题目

大模型持续震惊科学家! 以往一小时才能完成的代码,现在十分钟就能实现「生成、测试到得出结果」。 “大模型推广大神”陶哲轩又来分享他的亲测体验了。
3/18/2025 9:19:26 AM 量子位