AI
仅凭RGB图像实现户外场景高精度定位与重建,来自港科广团队 | ICRA 25
从自动驾驶、机器人导航,到AR/VR等前沿应用,SLAM都是离不开的核心技术之一。 现有基于3D高斯分布(3DGS)的SLAM方法虽在室内场景表现出色,但使用仅RGB输入来处理无界的户外场景仍然面临挑战:准确的深度和尺度估计困难,这影响了姿态精度和3DGS初始化图像重叠有限且视角单一,缺乏有效的约束,导致训练难以收敛为了解决上述挑战,港科广团队提出全新解决方案——OpenGS-SLAM。 仅凭RGB图像实现高精度定位与逼真场景重建。
首次,6人7天真人秀!南洋理工等发布第一视角AI生活管家数据EgoLife
当AI智能体(如Manus)接管你的大部分工作后,你是否曾想过,如何让自己的生活变得更加轻松与智能? 试想一个未来场景:你佩戴着智能眼镜,一个AI助理能无缝融入你的日常生活,根据你的个人习惯提供贴心的美食建议,下班后提醒你曾经购买过的物品,甚至通过分析你和家人过去的活动来主动预测你的需求。 这样一款「生活助手」将极大提升个人效率和家庭协作,让AI真正成为我们生活中的得力管家。
谷歌以 320 亿美元收购 Wiz,加速 AI 时代云安全与多云战略
近日,谷歌宣布已签署最终协议,将以320亿美元全现金交易收购网络安全公司Wiz,这项交易需通过相关调整后最终完成。 交易完成后,Wiz将并入谷歌云(Google Cloud)。 此次收购标志着谷歌云正在加大对两大快速增长趋势的投资:提升云安全能力以及推动多云战略的实施。
AI真·抢饭碗?美国码农就业跌至1980年以来最低,重回「吃豆人」时代
美国程序员的就业人数已跌至1980年以来的最低水平!那可是互联网存在之前的好多年了。 1980年,「吃豆人」(Pac-Man)游戏刚刚风靡全球。 亚马逊还没开始在线上卖货,苹果还没有出售它的iPhone。
智源开源多模态向量模型BGE-VL,助力多模态检索!
智源研究院开源了多模态向量模型BGE-VL,助力主要多模态检索任务达到SOTA。 论文地址:: : :现有的多模态检索模型大多基于预训练的视觉-语言模型,这些模型主要通过文本-图像匹配任务进行预训练,对于其他常见的多模态任务(如组合图像检索和多模态文档检索)表现不足。 为了增强模型的多任务能力,研究者们开始采用指令微调的方法,但高质量的指令微调数据稀缺且难以大规模获取。
全球首个工业界多模态推理模型开源!38B硬刚DeepSeek-R1,训练秘籍全公开
刚刚,昆仑万维正式开源了全球首个工业界多模态推理模型Skywork R1V(以下简称「R1V」)! R1V高效地将DeepSeek-R1这种强大的文本推理能力无缝scaling到了视觉模态,实现了多模态领域的领先表现,并以开源方式推动了技术进步。 由此,多模态推理的新时代即将开启。
多模态也做到了强推理!工业界首个开源的R1V,让视觉思考进入o1时代
DeepSeek-R1 问世后,我们一直在期待能「强推理、慢思考」的大模型进化成多模态模式。 如果能在视觉等各领域复刻强化学习(RL)在文本上的突破,AI 应用势必会将更多领域推入新的范式。 毫无疑问,这也是众多科技公司正在探索的方向。
AI 代理协助编写恶意代码,网络安全面临新挑战
人工智能驱动的代理正在快速发展,为自动化日常任务提供了更强大的能力。 然而,研究人员发现,这些工具也可能被恶意行为者利用来实施攻击。 OpenAI 的“Operator”于 2025 年 1 月 23 日作为研究预览发布,代表了新一代能够与网页交互并在最少人为干预下执行复杂任务的 AI 工具。
OpenAI 后训练研究负责人离职,创办材料科学 AI 初创公司
OpenAI负责后训练研究的副总裁Liam Fedus宣布离职,创立一家专注于材料科学的人工智能初创企业。OpenAI计划投资并与其建立合作关系。Fedus的公司将与谷歌DeepMind、微软等企业在材料科学AI领域展开竞争。#人工智能# #材料科学#
腾讯把AI生3D玩明白了,一口气开源两款模型,消费级显卡可跑!明天还有重磅开源!
出品 | 51CTO技术栈(微信号:blog51cto)Hunyuan3D 2.0上线后就好评不断。 该家族又在今天的开源日中迎来了重磅的新成员——Hunyuan 3D-2mini以及Hunyuan 3D-2mv!今天腾讯的演示中,感觉他们真的把AI生3D玩明白了,真的能用AI重构游戏行业。 不愧是腾讯,手握众多王牌游戏就是有经验啊!
65岁陈立武点爆英特尔三把火!裁员砍中层,AI制造,争夺世界代工厂王座
随着华人大佬执掌英特尔之后,一场大刀阔斧的改革呼之欲出。 路透独家报道称,新任CEO陈立武计划全面改革「制造和AI」业务,试图带领英特尔重回时代巅峰。 在上周的全员大会上,他直言不讳地告诉全员工,「公司需要做出艰难的决定」。
金山办公申请青丘大模型商标,布局科学仪器与网站服务领域
近日,北京金山办公软件股份有限公司(以下简称 “金山办公”)向国家知识产权局提交了「青丘大模型」商标的注册申请,涵盖科学仪器和网站服务的相关领域。 这一商标申请目前正在审查当中。 金山办公的注册资本约为4.6亿人民币,主要业务包括办公软件的开发、销售及计算机系统集成等。
导致AI项目失败的11种战略疏忽和错误
企业正在AI工具、服务和内部战略上投入大量资金。 但遗憾的是,大额支出并不能保证成功。 “AI无处不在——正在改变行业,重塑工作流程,并承诺带来无限可能的未来,”技术咨询公司Searce的应用AI副总裁Paul .
深度解析以Decoder为核心的无BEV的大一统端到端架构 | 对话CCF-CV学术新锐奖贾萧松博士
论文的一些巧思1. 人开车其实并没有最优解,请问如何确定学习时的参考数据呢?开车其实也是多种多样的,然后你模仿学习本质上就是告诉他你只能这样做,你做了别的那个mass loss还会惩罚他。 其实就是我们说的,我们其实就不能通过模仿来做。
谷歌升级 Gemini 2.0 系列模型,AI 助手可免费深度推理
此次更新标志着谷歌进一步普及AI工具,降低用户使用门槛。通过免费开放核心功能与优化模型性能,谷歌持续强化其AI生态竞争力。未来若能明确Pro版本优势并完善隐私保障,或将进一步推动AI助手的大众化应用。
ChatGPT创始成员、后训练负责人官宣离职!自立门户并将获OpenAI投资
OpenAI 又有重量级员工出走! 这次是后训练负责人、研究副总裁 William Fedus。 今天凌晨,Fedus 在 X 上发表了一则公开离职信,讲述了他离职的原因以及今后的去向。
新注意力让大模型上下文内存占用砍半!精度不减还能加速2倍
大模型同样的上下文窗口,只需一半内存就能实现,而且精度无损? 前苹果ASIC架构师Nils Graef,和一名UC伯克利在读本科生一起提出了新的注意力机制Slim Attention。 它以标准多头注意力(MHA)为基准,对其中的value缓存处理过程进行了调整,实现了更少的内存占用。
陶哲轩:o3-mini纠正了我一个数学错误,十分钟解决原本一小时才能完成的题目
大模型持续震惊科学家! 以往一小时才能完成的代码,现在十分钟就能实现「生成、测试到得出结果」。 “大模型推广大神”陶哲轩又来分享他的亲测体验了。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉