AI在线 AI在线

资讯列表

基于 Spring AI + MCP + DeepSeek-R1-7B 构建企业级智能 Agent 工具调用系统

在大模型 Agent 发展浪潮下,如何通过模型驱动外部工具调用(Tool Calling)已成为构建智能业务系统的关键能力。 本文将手把手带你通过 Spring AI MCP(Model Context Protocol) DeepSeek-R1-7B 打造一个可落地的企业级智能 Agent。 项目背景与架构设计技术选型Spring AISpring 官方推出的 AI 接入框架,支持 LangChain、MCP、RAG 等能力;MCP(Model Context Protocol)模型与工具之间通信的协议桥梁;DeepSeek-R1-7B国产高性能开源大模型,已支持 Chat Completion、Tool Calling 接口;Ragflow用作 RAG 架构引擎(可选);系统功能用户向模型提问模型判断是否调用工具(如数据库查询)MCP 注册的工具服务完成任务模型生成最终响应环境准备安装依赖复制本地部署 DeepSeek-R1-7B 模型推荐使用 vLLM 启动 DeepSeek-R1-7B 模型服务:复制构建 Spring AI MCP 工具服务示例业务:产品信息查询复制注册 MCP 工具复制模型端配置(Ragflow 示例)在 ragflow.config.yaml 中配置模型地址及 MCP 工具启用:复制前端调用(可选)复制测试效果用户输入:复制输出结果:复制模型会自动触发 query-product 工具,无需用户指定,展示 Agent 工具能力。
4/21/2025 4:22:00 AM
编程疏影

告别SQL!四大技术重构数据查询:Text2SQL/RAG/TAG/MCP谁主沉浮?

想象这样的场景:市场部新来的实习生对咖啡机说:“帮我查华东区过去半年销量TOP3的爆款饮品,按周环比增长率排序。 ”系统秒速生成动态报表——这不再是科幻片桥段,而是自然语言查询技术带来的现实革命。 随着大模型突破性发展,企业数据正从“程序员黑箱”迈向“全员可探”的新纪元。
4/21/2025 4:10:00 AM
推推君

Cursor模型选型终极指南:解锁高效开发新姿势

引言在AI驱动开发的浪潮下,如何选择合适的工具模型成为决定项目成败的关键。 本文将结合MacOS环境下的Cursor 0.48.9实战体验,深度解析四大核心模型(Auto/Claude 3.7/GPT-4O/Gemini 2.5)的选型策略,助您构建高质量开发闭环。 一、智能开发新范式:Cursor的核心优势作为新一代AI开发利器,Cursor通过模型即服务的架构重塑开发流程。
4/21/2025 3:30:00 AM
前端组件开发

超全总结!15个AI视频镜头语言提示词+效果展示

在AI视频创作中,精准的镜头语言是提升作品质感的关键。 本文系统解析15种专业级拍摄技法,从经典50mm镜头到沉浸式FPV视角,结合视觉效果对比,为创作者提供直观的镜头语言应用指南。 超全总结!
4/21/2025 2:00:55 AM
AI设计师Lena

网络安全的战略性AI准备:从炒作到现实

构建网络安全中强大的AI就绪框架,基础概念至关重要,这些概念涵盖了企业的技术、数据、安全性、治理和运营流程。 AI就绪的表现AI在网络安全中的潜力在于其能够自动化、预测并增强随着威胁不断演变和复杂化而至关重要的决策能力。 例如,AI模型会处理网络流量模式以检测异常或基于历史数据预测潜在的攻击路径。
4/21/2025 2:00:00 AM
Aditya

十个AI网站生成神器,还没等咖啡凉透,网站就搭好了!

让AI帮你解决麻烦事,你只需专注想法本身,不再为技术抓狂。 我们说实话吧:大部分人其实并不享受从零开始做网站的过程。 要么技术太复杂,要么进度太缓慢,要么就是纯粹头大。
4/21/2025 12:00:00 AM
dev

宇树科技将推出人形机器人格斗大赛,预计 5 月至 6 月举行

据央视网报道,近一个月来,宇树科技技术团队一直在为参加格斗大赛的机器人进行技术研发调试与算法训练。赛事预计于今年 5 月至 6 月举行,期间将通过中央广播电视总台相关平台等进行全网直播。
4/20/2025 8:18:36 PM
浩渺

近40年前「拉马努金图」概率的赌局,被姚班校友黄骄阳等三位数学家用物理方法终结

一切始于一场赌局。 20 世纪 80 年代末,在洛桑的一次会议上,两位数学家 Noga Alon 和 Peter Sarnak 展开了一场友好的辩论。 两人当时都在研究由节点和边组成的集合即图,他们特别想更好地理解一种名为「扩展图」的看似矛盾的图类型,这种图的边相对较少,但仍然高度互连。
4/20/2025 2:39:00 PM
机器之心

扩散LLM推理用上类GRPO强化学习!优于单独SFT,UCLA、Meta新框架d1开源

当前,强化学习(RL)方法在最近模型的推理任务上取得了显著的改进,比如 DeepSeek-R1、Kimi K1.5,显示了将 RL 直接用于基础模型可以取得媲美 OpenAI o1 的性能。 不过,基于 RL 的后训练进展主要受限于自回归的大语言模型(LLM),它们通过从左到右的序列推理来运行。 与此同时,离散扩散大语言模型(dLLM)成为有潜力的语言建模的非自回归替代。
4/20/2025 2:34:00 PM
机器之心

合成数据也能通吃真实世界?首个融合重建-预测-规划的生成式世界模型AETHER开源

近日,上海人工智能实验室(上海 AI 实验室)开源了生成式世界模型 AETHER。 该模型全部由合成数据训练而成,不仅在传统重建与生成任务中表现领先,更首次赋予大模型在真实世界中的 3D 空间决策与规划能力,可助力机器人完成目标导向的视觉规划、4D 动态重建、动作条件的视频预测等复杂任务。 研究团队将几何重建与生成式建模深度融合,首创「重建 — 预测 — 规划」 一体化框架,通过 AETHER 使大模型能够感知周围环境,理解物体之间的位置、运动和因果关系,从而做出更智能的行动决策。
4/20/2025 2:31:00 PM
机器之心

对 ChatGPT 说“谢谢”,竟给 OpenAI 带来“数千万美元”开销

OpenAI CEO透露,仅仅是用户与AI进行的日常寒暄和礼貌性交流,例如“谢谢”和“请”等,就给公司带来了“数千万美元”的开销。#AI成本# #人机互动#
4/20/2025 11:36:07 AM
远洋

264页智能体综述来了!MetaGPT等20家顶尖机构、47位学者参与

近期,大模型智能体(Agent)的相关话题爆火 —— 不论是 Anthropic 抢先 MCP 范式的快速普及,还是 OpenAI 推出的 Agents SDK 以及谷歌最新发布的 A2A 协议,都预示了 AI Agent 的巨大潜力。 然而,目前的大部分 Agent 应用仍是 LLM 能力的简单 “封装” 或延伸,距离真正通用的智能实体尚有距离 —— 在面对复杂的真实世界时,Agent 往往会暴露出推理规划、长期记忆、世界模型、自主进化以及安全对齐等核心能力不足的问题。 为了系统性地应对这些挑战,以构建真正具备通用能力的未来智能体,MetaGPT & Mila 联合全球范围内 20 个顶尖研究机构的 47 位学者,共同撰写并发布了长篇综述《Advances and Challenges in Foundation Agents: From Brain-Inspired Intelligence to Evolutionary, Collaborative, and Safe Systems》。
4/20/2025 10:33:00 AM
机器之心

推理模型其实无需「思考」?伯克利发现有时跳过思考过程会更快、更准确

当 DeepSeek-R1、OpenAI o1 这样的大型推理模型还在通过增加推理时的计算量提升性能时,加州大学伯克利分校与艾伦人工智能研究所突然扔出了一颗深水炸弹:别再卷 token 了,无需显式思维链,推理模型也能实现高效且准确的推理。 这项研究认为显式思考过程会显著增加 token 使用量和延迟,导致推理效率低下。 就比如在控制延迟条件时,NoThinking 的效果就显著好于 Thinking。
4/20/2025 10:24:00 AM
机器之心

英特尔®具身智能大小脑融合方案发布:构建具身智能落地新范式

在 4 月 18 日举办的 2025 英特尔具身智能解决方案推介会上,英特尔正式发布其具身智能大小脑融合方案(下称具身智能方案)。 该方案基于英特尔® 酷睿™ Ultra 处理器的强大算力,以及全新的具身智能软件开发套件和 AI 加速框架打造。 凭借创新性地模块化设计,其不仅能够兼顾操作精度和智能泛化能力,而且以卓越的性价比满足不同领域需求,为具身智能的规模化、场景化应用落地夯实基础。
4/20/2025 10:18:00 AM
机器之心

一台3090就能跑Gemma 3 27B!谷歌发布Gemma 3全系QAT版模型

谷歌 Gemma 3 上线刚刚过去一个月,现在又出新版本了。 该版本经过量化感知训练(Quantization-Aware Training,QAT)优化,能在保持高质量的同时显著降低内存需求。 比如经过 QAT 优化后,Gemma 3 27B 的 VRAM 占用量可以从 54GB 大幅降至 14.1GB,使其完全可以在 NVIDIA RTX 3090 等消费级 GPU 上本地运行!
4/20/2025 10:16:00 AM
机器之心

语音合成突破:F5R-TTS首次实现非自回归模型的GRPO优化,零样本克隆性能显著提升

在人工智能技术日新月异的今天,语音合成(TTS)领域正经历着一场前所未有的技术革命。 最新一代文本转语音系统不仅能够生成媲美真人音质的高保真语音,更实现了「只听一次」就能完美复刻目标音色的零样本克隆能力。 这一突破性进展的背后,是大规模语音数据的积累和大模型技术的快速发展。
4/20/2025 10:13:00 AM
机器之心

高德地图推出HumanRig技术 开源3D人形角色绑定设计数据集

高德地图宣布推出HumanRig技术,并开源了业界首个专门针对3D人形角色绑定设计的大规模数据集。 这项技术旨在降低角色动画制作成本,推动动画行业向更高效、更自动化的方向发展,成为高德打造沉浸式导航体验的关键基础设施。 HumanRig技术的核心是自动绑定算法,它通过先验引导的骨架估计器(Prior-guided Skeleton Estimator, PGSE)利用2D先验信息投射到3D空间,初始化粗略骨架,大幅降低绑定任务的复杂度。
4/20/2025 10:00:41 AM
AI在线

湖北武汉警方查处一起利用 AI 编造网络谣言案件,涉事公司被行政警告

武汉警方查处一起利用AI技术编造网络谣言的案件。涉事公司为提高网站流量,使用AI智能写作软件自动生成不实文章,未履行审核责任被行政警告。目前公司已公开致歉并整改。#AI监管##网络谣言#
4/20/2025 7:39:35 AM
漾仔