AI在线 AI在线

资讯列表

打破LLM的语境障碍:InfiniRetri vs RAG

译者 | 晶颜审校 | 重楼大型语言模型(LLM)正在重塑人工智能的格局,然其亦面临一项持续性挑战——检索和利用超出其训练数据的信息。 目前,有两种模式相左的方法可以解决这个问题:其一为InfiniRetri,该方法借助LLM自身的注意力机制,从长输入中检索相关上下文;其二是检索增强生成(RAG),它在生成响应前,动态地从结构化数据库获取外部知识。 每种方法都有其独特的优势、局限性和权衡之处。
4/21/2025 8:11:09 AM
晶颜

天工机器人:人形机器人即将实现小批量量产,未来售价可与入门轿车相当

据中新经纬昨日报道,天工队、北京人形机器人创新中心CTO唐剑在接受采访时表示,随着人形机器人的大规模落地,其价格将与一台入门级的小轿车差不多。
4/21/2025 7:45:51 AM
清源

半马变翻车现场!宇树科技最新回应:G1开跑即摔倒系未使用原生算法!天工换三次电池夺冠——但也非独立智能!

出品 | 51CTO技术栈(微信号:blog51cto)宇树科技回应了机器人半马“开跑即摔倒”争议! 昨日,北京亦庄科技园举办了一场别开生面的赛事:全球首场人形机器人半程马拉松。 21台机器人被安排在专属跑道上与数千名人类选手同时出发,试图完成21公里的挑战。
4/21/2025 7:41:41 AM

OpenAI o3 模型基准测试成绩遭质疑,实测分数远不及宣称

OpenAI的o3模型在内部测试与第三方基准测试结果存在显著差异,Epoch研究所独立测试得分仅10%,远低于OpenAI宣称的25%。#AI争议##OpenAI#
4/21/2025 7:24:55 AM
远洋

研究:AI 医疗诊断平均准确率 52.1%,与非专家医生相当

大阪都会大学研究显示,生成式AI在医疗诊断中平均准确率达52.1%,与非专家医生相当,但专家医生仍领先15.8%。AI在皮肤科表现突出,泌尿科数据有限。研究认为AI可用于医学教育和资源有限地区。#AI医疗##医学诊断#
4/21/2025 7:07:00 AM
远洋

谈谈 RAG 的四个级别

选择正确的 RAG(检索增强生成)架构主要取决于具体的用例和实施要求,确保系统符合任务需求。 Agentic RAG 的重要性将日益增加,与Agentic X的概念相一致,其中代理能力嵌入个人助理和工作流程中。 这里的“X”代表代理系统的无限适应性,能够实现无缝任务自动化和跨不同环境的明智决策,从而提高组织效率和自主性。
4/21/2025 6:25:00 AM
晓晓

企业级RAG选择难题:数据方案的关键博弈

智能时代,企业数据每日剧增。 员工寻找答案的效率直接影响工作流程,StackOverflow调查表明54%的开发者因等待问题答案而工作中断。 信息就在那里,却被深埋在企业资源迷宫中。
4/21/2025 4:50:00 AM
大数据AI智能圈

基于 Spring AI + MCP + DeepSeek-R1-7B 构建企业级智能 Agent 工具调用系统

在大模型 Agent 发展浪潮下,如何通过模型驱动外部工具调用(Tool Calling)已成为构建智能业务系统的关键能力。 本文将手把手带你通过 Spring AI MCP(Model Context Protocol) DeepSeek-R1-7B 打造一个可落地的企业级智能 Agent。 项目背景与架构设计技术选型Spring AISpring 官方推出的 AI 接入框架,支持 LangChain、MCP、RAG 等能力;MCP(Model Context Protocol)模型与工具之间通信的协议桥梁;DeepSeek-R1-7B国产高性能开源大模型,已支持 Chat Completion、Tool Calling 接口;Ragflow用作 RAG 架构引擎(可选);系统功能用户向模型提问模型判断是否调用工具(如数据库查询)MCP 注册的工具服务完成任务模型生成最终响应环境准备安装依赖复制本地部署 DeepSeek-R1-7B 模型推荐使用 vLLM 启动 DeepSeek-R1-7B 模型服务:复制构建 Spring AI MCP 工具服务示例业务:产品信息查询复制注册 MCP 工具复制模型端配置(Ragflow 示例)在 ragflow.config.yaml 中配置模型地址及 MCP 工具启用:复制前端调用(可选)复制测试效果用户输入:复制输出结果:复制模型会自动触发 query-product 工具,无需用户指定,展示 Agent 工具能力。
4/21/2025 4:22:00 AM
编程疏影

告别SQL!四大技术重构数据查询:Text2SQL/RAG/TAG/MCP谁主沉浮?

想象这样的场景:市场部新来的实习生对咖啡机说:“帮我查华东区过去半年销量TOP3的爆款饮品,按周环比增长率排序。 ”系统秒速生成动态报表——这不再是科幻片桥段,而是自然语言查询技术带来的现实革命。 随着大模型突破性发展,企业数据正从“程序员黑箱”迈向“全员可探”的新纪元。
4/21/2025 4:10:00 AM
推推君

Cursor模型选型终极指南:解锁高效开发新姿势

引言在AI驱动开发的浪潮下,如何选择合适的工具模型成为决定项目成败的关键。 本文将结合MacOS环境下的Cursor 0.48.9实战体验,深度解析四大核心模型(Auto/Claude 3.7/GPT-4O/Gemini 2.5)的选型策略,助您构建高质量开发闭环。 一、智能开发新范式:Cursor的核心优势作为新一代AI开发利器,Cursor通过模型即服务的架构重塑开发流程。
4/21/2025 3:30:00 AM
前端组件开发

超全总结!15个AI视频镜头语言提示词+效果展示

在AI视频创作中,精准的镜头语言是提升作品质感的关键。 本文系统解析15种专业级拍摄技法,从经典50mm镜头到沉浸式FPV视角,结合视觉效果对比,为创作者提供直观的镜头语言应用指南。 超全总结!
4/21/2025 2:00:55 AM
AI设计师Lena

网络安全的战略性AI准备:从炒作到现实

构建网络安全中强大的AI就绪框架,基础概念至关重要,这些概念涵盖了企业的技术、数据、安全性、治理和运营流程。 AI就绪的表现AI在网络安全中的潜力在于其能够自动化、预测并增强随着威胁不断演变和复杂化而至关重要的决策能力。 例如,AI模型会处理网络流量模式以检测异常或基于历史数据预测潜在的攻击路径。
4/21/2025 2:00:00 AM
Aditya

十个AI网站生成神器,还没等咖啡凉透,网站就搭好了!

让AI帮你解决麻烦事,你只需专注想法本身,不再为技术抓狂。 我们说实话吧:大部分人其实并不享受从零开始做网站的过程。 要么技术太复杂,要么进度太缓慢,要么就是纯粹头大。
4/21/2025 12:00:00 AM
dev

宇树科技将推出人形机器人格斗大赛,预计 5 月至 6 月举行

据央视网报道,近一个月来,宇树科技技术团队一直在为参加格斗大赛的机器人进行技术研发调试与算法训练。赛事预计于今年 5 月至 6 月举行,期间将通过中央广播电视总台相关平台等进行全网直播。
4/20/2025 8:18:36 PM
浩渺

近40年前「拉马努金图」概率的赌局,被姚班校友黄骄阳等三位数学家用物理方法终结

一切始于一场赌局。 20 世纪 80 年代末,在洛桑的一次会议上,两位数学家 Noga Alon 和 Peter Sarnak 展开了一场友好的辩论。 两人当时都在研究由节点和边组成的集合即图,他们特别想更好地理解一种名为「扩展图」的看似矛盾的图类型,这种图的边相对较少,但仍然高度互连。
4/20/2025 2:39:00 PM
机器之心

扩散LLM推理用上类GRPO强化学习!优于单独SFT,UCLA、Meta新框架d1开源

当前,强化学习(RL)方法在最近模型的推理任务上取得了显著的改进,比如 DeepSeek-R1、Kimi K1.5,显示了将 RL 直接用于基础模型可以取得媲美 OpenAI o1 的性能。 不过,基于 RL 的后训练进展主要受限于自回归的大语言模型(LLM),它们通过从左到右的序列推理来运行。 与此同时,离散扩散大语言模型(dLLM)成为有潜力的语言建模的非自回归替代。
4/20/2025 2:34:00 PM
机器之心

合成数据也能通吃真实世界?首个融合重建-预测-规划的生成式世界模型AETHER开源

近日,上海人工智能实验室(上海 AI 实验室)开源了生成式世界模型 AETHER。 该模型全部由合成数据训练而成,不仅在传统重建与生成任务中表现领先,更首次赋予大模型在真实世界中的 3D 空间决策与规划能力,可助力机器人完成目标导向的视觉规划、4D 动态重建、动作条件的视频预测等复杂任务。 研究团队将几何重建与生成式建模深度融合,首创「重建 — 预测 — 规划」 一体化框架,通过 AETHER 使大模型能够感知周围环境,理解物体之间的位置、运动和因果关系,从而做出更智能的行动决策。
4/20/2025 2:31:00 PM
机器之心

对 ChatGPT 说“谢谢”,竟给 OpenAI 带来“数千万美元”开销

OpenAI CEO透露,仅仅是用户与AI进行的日常寒暄和礼貌性交流,例如“谢谢”和“请”等,就给公司带来了“数千万美元”的开销。#AI成本# #人机互动#
4/20/2025 11:36:07 AM
远洋