AI在线 AI在线

理论

揭秘RAG检索增强生成:从原理到Spring AI实战,开启AI新世界!

在当今人工智能的奇妙世界里,RAG检索增强生成技术就像是一颗冉冉升起的新星,正以其独特的魅力吸引着无数开发者和研究者的目光。 今天,咱们就一起来深入探究一下这个神奇的RAG技术,从它的基本原理到完整实现,再到结合Spring AI的超详细应用,保证让你对它有一个全方位的了解。 图片一、RAG技术:开启模型理解与生成的新大门(一)什么是RAG技术RAG,全称检索增强生成(Retrieval-Augmented Generation),这名字听起来就很厉害,感觉像是给模型加上了一个超级外挂。
9/28/2025 4:22:00 AM
demo123567

Code World Model (CWM):用世界模型改善代码生成的开源大语言模型

Meta发布了 Code World Model (CWM,论文:CWM: An Open-Weights LLM for Research on Code Generation with World Models),一个拥有32B参数的开源大语言模型(LLM),旨在推动基于世界模型的代码生成研究。 与传统仅从静态代码训练的模型不同,CWM在大规模 Python解释器执行轨迹 和 agent性Docker环境交互轨迹 上进行中期训练,并在可验证编码、数学和多轮软件工程环境中进行多任务强化学习(RL)。 CWM为研究者提供了探索世界建模在代码生成中通过推理和规划提升能力的强大平台。
9/28/2025 4:00:00 AM
无影寺

RAG在B站大会员中心数据智能平台的应用实践

在数字化浪潮中,数据已成为企业的核心资产。 在B站大会员中心部门,数据智能平台扮演着举足轻重的角色。 它不仅要处理和分析大规模的会员数据,为会员服务的优化和拓展提供坚实的数据支撑,还要满足业务对于数据洞察的多样化需求。
9/28/2025 4:00:00 AM
大数据

为什么说“嵌入”是 AI 的灵魂?一文带你玩转 SpringAI 向量模型

最近有小伙伴问我,AI 里的“嵌入模型 API”到底是干嘛的? 其实,它就像把文字、图片、数据转成“数字DNA”,方便 AI 理解和处理。 在 SpringAI 里,这一套 API 已经封装得很优雅,今天小米就带大家从故事开头一路聊到落地实现,保证看完你能用得飞起。
9/28/2025 3:55:00 AM
软件求生

小型革命:SLM、智能体人工智能与超级智能之路

过去十年的大部分时间里,人工智能领域被一个强大却终归存在局限的范式所主导——“越大越好”。 2010年代的里程碑式研究证实,扩大模型规模能带来可预测的性能提升,这一结论让“越大越好”的理念根深蒂固,进而引发了一场构建超大规模模型的竞赛,模型参数从数十亿一路突破至万亿级别。 在当时的认知里,通往高级智能的道路是一场垂直攀登,每一次突破都需要更多数据、更强算力以及更庞大的单体模型作为支撑。
9/28/2025 3:20:00 AM
大模型之路

Stability AI前CEO惊人预测:人类智力价值归零,只剩1000天!

Stability AI前CEO、缔造者Emad Mostaque,观点惊人:未来1000天内,人工智能不仅将取代工作岗位,更将彻底重塑人类的经济结构。 AI的「无情优化」可能让人类劳动力变得一文不值,甚至变成负值。 在最近的《影响理论》(Impact Theory)播客节目上,Emad Mostaque讨论了他的新书《最后的经济》。
9/28/2025 3:00:00 AM
新智元

首款推理具身模型,谷歌DeepMind造!自主理解/规划/执行复杂任务,打破一机一训,还能互相0样本迁移技能

全球首个具备模拟推理能力的具身模型来了! 谷歌DeepMind正式发布新一代通用机器人基座模型——Gemini Robotics 1.5系列。 它不止于对语言、图像进行理解,还结合了视觉、语言与动作(VLA),并通过具身推理(Embodied Reasoning)来实现“先思考,再行动”。
9/28/2025 2:00:00 AM
量子位

GGUF 是什么?一文看懂大模型里最火的模型格式

图片最近你要是混迹在 AI 圈,或者经常玩 Hugging Face、CSDN、GitHub 上的开源模型,肯定会碰到一个后缀:👉 .gguf比如:qwen2-7b-instruct.Q4_K_M.gguf很多人第一次见到就一头雾水:这是模型吗? 压缩包吗? 还是量化格式?
9/28/2025 1:55:00 AM
道玄

如何在 LLM 推理中战胜不确定性

最近thinkingmachines的一篇博文在内外网引起了无数的关注和转载,这篇文章的核心内容先是解释了一下为什么LLM推理会有不确定性,随后文章还给出了具体的解决方案。 在详细介绍文章的内容之前,我们先来说一下thinkingmachines这家公司。 它是由前OpenAI首席技术官Mira Murati与多位前OpenAI高管联合创立。
9/28/2025 1:25:00 AM
技不辱你

AI在前后端联调提效的实践

一、背景介绍现阶段前后端自测 联调耗时较长,经过摸底,耗时主要在以下几个方面:接口录入、接口转为前端代码、mock数据生成。 但是在我们预期中,联调耗时占比应该很少,理想情况下就像两个匹配的齿轮,各自完成开发后,组装在一起便可顺利运行。 为了达到这种状态,需要重新梳理我们现有的工具和流程,融入AI的能力,让联调自测环节更加高效。
9/28/2025 1:22:00 AM
叶宗洋

AI工作垃圾大爆发:员工花2小时擦屁股,企业一年亏900万美金

生成式 AI 本该成为效率革命的引擎,如今却被越来越多的员工拿来制造“看起来像完成了工作”的伪成果。 研究发现,所谓的“AI 工作垃圾”(Workslop),已经渗透进各大公司,并正以意想不到的方式削弱协作、拉低生产力。 从幻灯片、总结、代码到整篇报告,人们用 AI 生成光鲜的内容,但内容本身缺乏深度,缺少上下文,也没有真正的思考。
9/28/2025 12:00:05 AM

OpenAI史上最大算力军备竞赛!224亿美元背后的AI基础设施争夺战

说实话,当我看到OpenAI与CoreWeave的合作金额从119亿美元一路飙升到224亿美元时,第一反应是——这真的不是在开玩笑吗? 要知道,这个数字已经超过了很多国家的GDP。 但仔细一想,这背后反映的其实是一个更震撼的现实:AI行业的算力需求已经到了什么程度。
9/28/2025 12:00:00 AM
阿丸笔记

Project Imaging-X发布:1000+开放医学影像数据集全景式综述

作者丨项目团队编辑丨ScienceAI过去几年,通用领域的基础模型(Foundation Models)在大规模、异质、高质量数据的推动下快速演进。 在医学影像场景中,基础模型同样被寄予厚望:期望以一次预训练,支持多模态(CT/MR/PET/内镜等)、多任务(分割/检测/配准/追踪等)与多解剖部位的统一处理,成为从研究到临床的“通用基础”。 然而,医学影像数据的获取与敏感高度依赖医学专业知识,并受到伦理与隐私的严格约束,现有的公开数据长期呈现“小而散、偏科严重”的格局:与通用视觉领域的数据集相比,目前公开的医学影像数据集的规模普遍较小,通常只有数千张图像,与通用领域的数据集个数级数量相比。
9/26/2025 4:13:00 PM
ScienceAI

通用物理大模型雏形问世:跨越多领域模拟,精度最高提升29倍

编辑丨%在语言领域,GPT 这样的「大模型」只需一次训练,就处理翻译、写作、问答等不同任务。 那在物理世界,能不能也有一台「通用物理引擎」,一次训练后就能推演流体、热传递、甚至冲击波? 这个难题困扰着物理学家。
9/26/2025 2:05:00 PM
ScienceAI

美国七巨头,OpenAI、Claude、xAI后训练都找他要专家,时薪高达500刀!史上增长最快公司CEO:大模型处于评测时代

从 100 万美元到 5 亿美元营收仅用了 17 个月! 更厉害的是,他们从未有过客户流失,净收入留存率超过 1600%,年营收已经稳定在九位数的水平。 而这家公司的CEO兼联合创始人,Brendan Foody,更是美国的新一代的传奇人物。
9/26/2025 2:01:50 PM
云昭

刚刚,ChatGPT Pulse上线!私人秘书不再是富人特权

昨天你可能还在想:「我该问ChatGPT什么? 」今天它已经可以自己开口了。 就在今天,OpenAI推出ChatGPT Pulse。
9/26/2025 12:04:15 PM
新智元

缺数据也能拿SOTA?清华&上海AI Lab破解机器人RL两大瓶颈

视觉-语言-动作模型是实现机器人在复杂环境中灵活操作的关键因素。 然而,现有训练范式存在一些核心瓶颈,比如数据采集成本高、泛化能力不足等。 为此,研究团队提出了SimpleVLA-RL。
9/26/2025 10:59:55 AM

多模态推理最高加速3.2倍!华为诺亚新算法入选NeurIPS 2025

不牺牲任何生成质量,将多模态大模型推理最高加速3.2倍! 华为诺亚方舟实验室最新研究已入选NeurIPS 2025。 截至目前,投机推理(Speculative Decoding)技术已成为大语言模型(LLM)推理加速的“标准动作”,但在多模态大模型(VLM)上的应用却举步维艰,现有方法加速比不到1.5倍,性能提升有限。
9/26/2025 10:58:03 AM