AI在线 AI在线

理论

无需百卡集群!港科等开源LightGen: 极低成本文生图方案媲美SOTA模型

LightGen 主要作者来自香港科技大学和 Everlyn AI, 第一作者为香港科技大学准博士生吴显峰,主要研究方向为生成式人工智能和 AI4Science。 通讯作者为香港科技大学助理教授 Harry Yang 和中佛罗里达副教授 Sernam Lim。 共同一作有香港科技大学访问学生白亚靖,香港科技大学博士生郑皓泽,Everlyn AI 实习生陈浩东,香港科技大学博士生刘业鑫。
3/19/2025 10:41:11 AM
机器之心

世界模型在机器人任务规划中的全新范式:NUS邵林团队提出通用机器人规划模型FLIP

本文的作者均来自新加坡国立大学 LinS Lab。 本文第一作者为新加坡国立大学博士生高崇凯,其余作者为北京大学实习生张浩卓,新加坡国立大学博士生徐志轩,新加坡国立大学硕士生蔡哲豪。 本文的通讯作者为新加坡国立大学助理教授邵林。
3/19/2025 10:26:10 AM
机器之心

Django创造者Simon Willison分享:我如何使用LLM帮我写代码

近段时间,著名 AI 科学家 Andrej Karpathy 提出的氛围编程(vibe coding)是 AI 领域的一大热门话题。 简单来说,氛围编程就是鼓励开发者忘掉代码,进入开发的氛围之中。 更简单地讲,就是向 LLM 提出需求,然后「全部接受」即可。
3/19/2025 10:19:22 AM
机器之心

英伟达发布GROOT N1,人形机器人基础模型再添重磅玩家

在3月18日举行的英伟达GTC大会上,英伟达创始人兼CEO黄仁勋正式发布了人形机器人基础模型GROOT . N1,标志着人形机器人基础模型领域再添重磅玩家。 黄仁勋透露,该模型已经被多家机器人制造商采用,包括Fourier GR-01、Agility .
3/19/2025 10:05:02 AM
极客机器人

AI“入侵”办公室!ChatGPT在全球办公室的普及率飙升至76%

根据时间管理软件DeskTime的最新研究,人工智能(AI)在工作场所的应用正呈现出快速增长的趋势。 截至2024年底,全球有76%的办公室已经引入了ChatGPT这一生成式AI工具,显示出AI技术在现代办公环境中正逐渐成为不可或缺的一部分。 员工使用率与时间投入显著增长2024年,个人对AI工具的使用量有了显著提升。
3/19/2025 10:02:48 AM

仅凭RGB图像实现户外场景高精度定位与重建,来自港科广团队 | ICRA 25

从自动驾驶、机器人导航,到AR/VR等前沿应用,SLAM都是离不开的核心技术之一。 现有基于3D高斯分布(3DGS)的SLAM方法虽在室内场景表现出色,但使用仅RGB输入来处理无界的户外场景仍然面临挑战:准确的深度和尺度估计困难,这影响了姿态精度和3DGS初始化图像重叠有限且视角单一,缺乏有效的约束,导致训练难以收敛为了解决上述挑战,港科广团队提出全新解决方案——OpenGS-SLAM。 仅凭RGB图像实现高精度定位与逼真场景重建。
3/19/2025 10:00:41 AM
量子位

到2027年,40%人工智能数据泄露将来自跨境GenAI滥用

根据Gartner数据,到2027年超过40%的人工智能相关数据泄露将由跨境不当使用生成式人工智能(GenAI)引起。 用户对GenAI技术的应用范围和速度超过了数据治理和安全措施的发展,由于支持这些技术所需的集中计算能力有限,引发了人们对数据本地化的担忧。 Gartner副总裁分析师Joerg Fritsch表示:“由于监管不足,经常会发生意外的跨境数据传输,特别是当GenAI在没有明确描述或公告的情况下集成到现有产品中时。
3/19/2025 9:58:26 AM
佚名

老黄发布新核弹B300,英伟达:B200已破DeepSeek-R1推理世界纪录

皮衣老黄,带着最强AI芯片GB300闪亮登场“AI超级碗”GTC,燃爆全场! 性能方面,和去年发布的GB200相比,推理性能是其1.5倍。 据悉,GB300将在今年的下半年出货。
3/19/2025 9:52:50 AM
量子位

DeepSeek如何助力数字化转型?一文讲清六大应用场景!

在当今竞争激烈的制造业市场中,数字化转型已成为企业生存与发展的关键。 而最近爆火的 DeepSeek,为制造业企业的数字化转型带来了新的契机。 今天制造企业CIO就来和大家聊聊如何利用 DeepSeek帮助企业实现数字化转型。
3/19/2025 9:48:09 AM
数据人作者联盟

首次,6人7天真人秀!南洋理工等发布第一视角AI生活管家数据EgoLife

当AI智能体(如Manus)接管你的大部分工作后,你是否曾想过,如何让自己的生活变得更加轻松与智能? 试想一个未来场景:你佩戴着智能眼镜,一个AI助理能无缝融入你的日常生活,根据你的个人习惯提供贴心的美食建议,下班后提醒你曾经购买过的物品,甚至通过分析你和家人过去的活动来主动预测你的需求。 这样一款「生活助手」将极大提升个人效率和家庭协作,让AI真正成为我们生活中的得力管家。
3/19/2025 9:43:43 AM
新智元

谷歌以 320 亿美元收购 Wiz,加速 AI 时代云安全与多云战略

近日,谷歌宣布已签署最终协议,将以320亿美元全现金交易收购网络安全公司Wiz,这项交易需通过相关调整后最终完成。 交易完成后,Wiz将并入谷歌云(Google Cloud)。 此次收购标志着谷歌云正在加大对两大快速增长趋势的投资:提升云安全能力以及推动多云战略的实施。
3/19/2025 9:31:06 AM
AI小蜜蜂

AI真·抢饭碗?美国码农就业跌至1980年以来最低,重回「吃豆人」时代

美国程序员的就业人数已跌至1980年以来的最低水平!那可是互联网存在之前的好多年了。 1980年,「吃豆人」(Pac-Man)游戏刚刚风靡全球。 亚马逊还没开始在线上卖货,苹果还没有出售它的iPhone。
3/19/2025 9:30:10 AM
新智元

智源开源多模态向量模型BGE-VL,助力多模态检索!

智源研究院开源了多模态向量模型BGE-VL,助力主要多模态检索任务达到SOTA。 论文地址:: : :现有的多模态检索模型大多基于预训练的视觉-语言模型,这些模型主要通过文本-图像匹配任务进行预训练,对于其他常见的多模态任务(如组合图像检索和多模态文档检索)表现不足。 为了增强模型的多任务能力,研究者们开始采用指令微调的方法,但高质量的指令微调数据稀缺且难以大规模获取。
3/19/2025 9:30:00 AM
Glodma

全球首个工业界多模态推理模型开源!38B硬刚DeepSeek-R1,训练秘籍全公开

刚刚,昆仑万维正式开源了全球首个工业界多模态推理模型Skywork R1V(以下简称「R1V」)! R1V高效地将DeepSeek-R1这种强大的文本推理能力无缝scaling到了视觉模态,实现了多模态领域的领先表现,并以开源方式推动了技术进步。 由此,多模态推理的新时代即将开启。
3/19/2025 9:20:00 AM
新智元

如何绕过限制,获取 Cursor 的系统提示词

大家好,我卡颂,专注程序员AI转型。 Cursor母公司Anysphere三个月前才完成一轮 1 亿刀的融资(估值 25 亿刀),现在已经在为 100 亿刀估值进行新一轮谈判。 可见Cursor发展之迅速。
3/19/2025 9:14:15 AM
卡颂

总有人问,出海怎么用 DeepSeek 满血版(别问了,上答案)

有好几个小伙伴问我,他们出海业务,该怎么用DeepSeek满血版,今天直接告诉你答案:毫无疑问,AWS Bedrock是不二的选择。 出海DeepSeek云平台的选择,主要需要考虑这么几个因素:是不是大平台?对平台上大模型的接入,是严格,还是放水?是不是战略上支持DeepSeek? 有没有上下游配套基础设施?
3/19/2025 9:00:00 AM
架构师之路

详解RAG应用开发幻觉检测利器LettuceDetect​

译者 | 朱先忠审校 | 重楼简介最近,我们团队推出了LettuceDetect框架,这是一款用于检索增强生成(RAG)开发管道的轻量级幻觉检测器。 它是一种基于ModernBERT模型构建的基于编码器的模型,根据MIT许可证发布,带有现成的Python包和预训练模型。 是什么:LettuceDetect是一个标记级检测器,可标记LLM回答中不受支持的片段。
3/19/2025 8:43:17 AM
朱先忠

多模态也做到了强推理!工业界首个开源的R1V,让视觉思考进入o1时代

DeepSeek-R1 问世后,我们一直在期待能「强推理、慢思考」的大模型进化成多模态模式。 如果能在视觉等各领域复刻强化学习(RL)在文本上的突破,AI 应用势必会将更多领域推入新的范式。 毫无疑问,这也是众多科技公司正在探索的方向。
3/19/2025 8:30:00 AM
机器之心