理论
必看!SpringAI轻松构建MCP Client-Server架构
MCP 这个概念相信大家已经听了无数次了,但不同人会有不同的解释,你可能也是听得云里雾里的。 不过没关系,今天这篇内容会通过 Spring AI 给你实现一个 MCP 的 Client 和 Server 架构,让你彻底搞懂 MCP 的概念,以及学会 MCP 的开发技能。 什么是MCP?
防御人工智能驱动的Deepfake
由于人工智能技术不断发展,深度伪造(Deepfake)也越来越难以发现。 这对依赖于任何形式个人图像的可信身份验证都构成了严重的问题。 然而,一些应对Deepfake威胁的方法显示出希望。
纯RGB输入,解决户外场景SLAM!误差降低至9.8%,港科广开源 | ICRA 2025
在自主驾驶、机器人导航、AR/VR等前沿应用中,Simultaneous Localization and Mapping (SLAM) 是核心技术之一。 现有基于3D高斯分布(3DGS)的SLAM方法虽在室内场景表现出色,但使用仅RGB输入来处理无界的户外场景仍然面临挑战:准确的深度和尺度估计困难,这影响了姿态精度和3DGS初始化图像重叠有限且视角单一,缺乏有效的约束,导致训练难以收敛为了解决上述挑战,港科广团队提出全新解决方案OpenGS-SLAM,仅凭RGB图像实现高精度定位与逼真场景重建。 论文链接:::,该方法采用了一个点图回归网络来生成帧间一致的点图,储存了来自多个标准视角的3D结构,包含了视角关系、2D到3D的对应关系和场景几何信息,使得相机位姿估计更加稳健,有效缓解了预训练深度网络的误差问题。
RAG检索不过关?试试这些优化策略,精准度飙升!
近来,RAG成了大语言模型的“救命稻草”,可让大语言模型回答更准确、更靠谱。 可问题来了,很多 RAG 应用的检索系统还是有点“笨”:要么漏掉关键信息,要么抓回一堆无关紧要的“噪声”,搞得最终答案质量参差不齐。 那么,我们该怎么优化 RAG 的检索算法,让它既精准又高效呢?
揭秘MCP:AI大模型的万能接口,开启智能新时代
在人工智能的世界里,最近有个新名字频频被提起:MCP(模型上下文协议,Model Context Protocol)。 这个由Anthropic在2024年11月推出的开放标准,正悄然改变着大型语言模型的玩法。 它就像一座桥梁,把那些被困在“信息孤岛”里的AI模型和外部世界连接起来,让它们不再只是会聊天,而是能真正干实事。
凌晨2点,再次Open!奥特曼宣布:OpenAI正式支持对手MCP协议
自从昨天OpenAI将GPT-4o的原生图像生成同步开放给免费用户后,今天他们又Open了一把。 就在刚刚,OpenAI对其Agents SDK进行了重大更新,支持了对手Anthropic推出的MCP服务协议。 凌晨2点,奥特曼便迫不及待地公布了这个消息。
清华稀疏Attention,无需训练加速一切模型!
在当今各类大语言模型以及视频模型中,长序列场景越来越普遍,而 Attention 的计算复杂度随着序列长度呈平方增长,成为长序列任务下的主要计算瓶颈。 此前,清华大学陈键飞团队提出的即插即用量化的 SageAttention 系列工作已实现 3 倍加速于 FlashAttention,且在各类大模型上均保持了端到端的精度,已被业界和社区广泛使用。 为了进一步加速 Attention,清华大学陈键飞团队进一步提出了无需训练可直接使用的稀疏 Attention(SpargeAttn)可用来加速任意模型。
阿里深夜开源Qwen2.5-Omni,7B参数完成看、听、说、写
3 月 27 日凌晨,阿里通义千问团队发布 Qwen2.5-Omni。 这是 Qwen 系列中全新的旗舰级多模态大模型,专为全面的多模式感知设计,可以无缝处理包括文本、图像、音频和视频的各种输入,同时支持流式的文本生成和自然语音合成输出。 从此以后,你可以像打电话或进行视频通话一样与 Qwen 聊天!
Spring AI + Ollama 实现 deepseek-r1 的API服务和调用
兄弟们,今天咱来聊聊一个超有意思的技术组合 ——Spring AI Ollama 实现 deepseek - r1 的 API 服务和调用。 咱都知道,人工智能这几年那可是火得一塌糊涂,各种大模型你方唱罢我登场。 deepseek - r1 就是其中一个挺厉害的模型,那怎么把它用起来,让它为咱们的项目服务呢?
Stable Diffusion变身3D神器!一个LoRA将2D图像转3D模型
在Stable Diffusion当中,只需加入一个LoRA就能根据图像创建3D模型了? 港科大(广州)与趣丸科技合作推出了全新三维生成大模型——Kiss3DGen,创新性地将3D生成与成熟的图像生成模型进行了对齐。 并且与主流2D扩散模型技术(如ControlNet、Flux-Redux)兼容协同,无需额外训练即可即插即用。
轨迹可控视频生成新范式,复旦微软破解视频生成难题,精准控制任意物体运动
轨迹可控的视频生成来了,支持三种不同级别的轨迹控制条件——分别为掩码、边界框和稀疏框。 近年来,视频生成技术快速发展,显著提升了视频的视觉质量与时间连贯性。 在此基础上,(trajectory-controllable video generation)涌现了许多工作,使得通过明确定义的路径精确控制生成视频中的物体运动轨迹成为可能。
人形机器人优雅漫步,强化学习新成果!独角兽Figure创始人:之前大家吐槽太猛
注意看,机器人像人一样从容地走出大门了! 甚至,还有一整支机器人队伍迎面走来。 人形机器人独角兽Figure,再次带来他们的新成果——利用强化学习实现自然人形行走。
突发!英伟达收购贾扬清新创业的Lepton AI
出品 | 51CTO技术栈(微信号:blog51cto)刚刚,有外媒曝出英伟达即将收购成立两年的 AI 创业公司 Lepton AI。 Lepton AI 的创始人是AI圈内知名人士贾扬清。 据悉这笔收购交易的金额是数亿美元。
关于智能体 Agent 的实现技术之思维链和函数调用 (function call) 的思考
Agent技术也被业界称为智能体技术,本质上是使得大模型具备独立思考和解决问题的能力;被广泛应用于各种应用场景,而且也被称为是实现通用人工智能的一种技术手段。 但在此之前对于智能体的理解比较肤浅,而今天突然发现原来智能体没我们想象中的那么简单,也没想象中的那么复杂。 今天我们就从Agent的两个实现技术之思维链和函数调用来重新理解智能体。
网络犯罪分子利用11种方式使网络钓鱼比以往更有危害力
网络犯罪分子正在改变其社交攻击的欺诈手段,以提高真实性,更好地绕过过滤器,并更有针对性地瞄准潜在受害者。 网络钓鱼一直是安全漏洞的主要来源——这一重大问题,尽管经过了多年的安全意识培训,但至今仍是网络安全方面的首要关注点。 不过,由于战术的改进和AI技术的恶意再利用,这种长期存在的社交攻击手段不断演变,网络犯罪分子正在寻找新的方法来诱骗用户点击恶意链接。
随着AI大模型和MCP生态发展,传统低代码平台和RPA类产品还有无出路?
今天准备跟大家聊一下随着AI大模型和MCP协议生态的发展,对传统的低代码产品和RPA机器人产品所带来的一些影响。 因为在一年多前我其实就聊过这个话题,但是最近一年的时间AI大模型、AI编程、AI智能体,包括最近的MCP协议生态的发展太快了,导致原来我们对这两个产品的影响分析会出现一些变化。 低代码平台影响分析首先我们先讲一下低代码,大家都知道其实低代码平台的产品,它的本质仍然是辅助我们编程,仍然是可能会生成源代码或者是生成低代码产品模板引擎能够解析的元数据。
星辰与代码:DeepSeek的发展历程
技术突破阶段2024 年,DeepSeek 强势开启生态扩张与技术爆发的新纪元,成为全球 AI 领域瞩目的焦点。 年初 1 月,DeepSeek 便以 DeepSeek-MoE 震撼登场,创新性架构设计以仅 60% 的计算量损耗,成功超越 Llama 2-7B 性能,为后续技术突破奠定坚实基础,在模型效率优化上迈出关键一步。 紧接着 2 月,DeepSeekMath 在 MATH 基准测试中表现惊艳,成绩飙升至 51.7%,无限逼近 GPT-4 水平,数学推理能力实现质的飞跃,极大提升了模型在复杂数学问题求解上的可靠性与精准度。
LLM中的分块技术:原理、应用与展望
在大语言模型(LLM)飞速发展的当下,分块技术(Chunking)(RAG 中的分块策略:从基础到前沿的全面剖析)作为提升模型性能的关键手段,受到了广泛关注。 它在优化信息处理、提高检索效率、增强模型理解能力等方面发挥着不可或缺的作用。 深入探究 LLMs 中的分块技术,对于推动自然语言处理(NLP)领域的发展具有重要意义。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉