Redis

SpringAI + Redis：构建高性能RAG问答系统的架构设计与实战

SpringAI + Redis：构建高性能RAG问答系统的架构设计与实战

引言：RAG技术为何成为企业AI应用首选实现成本降低千倍、响应速度秒级的企业级知识库解决方案在当前AI技术飞速发展的背景下，企业面临着一个核心挑战：如何让大语言模型（LLM）准确掌握企业内部知识并避免产生幻觉（Hallucination）？检索增强生成（Retrieval-Augmented Generation，RAG）技术应运而生，它通过将信息检索与生成模型相结合，有效解决了这一难题。 Spring AI作为Spring官方推出的AI开发框架，为Java开发者提供了构建AI应用的标准化方案。

9/26/2025 2:15:00 AM farerboy

炸裂！Spring Boot 3 搭配 AI 实现智能弹幕审核 + Redis 热点缓存 + 上下文识别

炸裂！Spring Boot 3 搭配 AI 实现智能弹幕审核 + Redis 热点缓存 + 上下文识别

我们用 Spring Boot 3 WebSocket 打造了一个实时弹幕系统。

8/18/2025 2:11:00 AM 编程疏影

使用FastAPI和Redis缓存加速机器学习模型服务

使用FastAPI和Redis缓存加速机器学习模型服务

译者 | 李睿审校 | 重楼本文介绍了如何使用FastAPI和Redis缓存加速机器学习模型服务。 FastAPI作为高性能Web框架用于构建API，Redis作为内存中的数据结构存储系统作为缓存层。通过集成FastAPI和Redis，系统能快速响应重复请求，避免冗余计算，显著降低延迟和CPU负载。

6/16/2025 7:55:29 AM 李睿

使用FastAPI和Redis Caching加快机器学习模型推理

使用FastAPI和Redis Caching加快机器学习模型推理

译者 | 布加迪审校 | 重楼Redis 是一款开源内存数据结构存储系统，是机器学习应用领域中缓存的优选。它的速度、耐用性以及支持各种数据结构使其成为满足实时推理任务的高吞吐量需求的理想选择。我们在本教程中将探讨Redis缓存在机器学习工作流程中的重要性。

5/14/2025 8:16:46 AM 布加迪

震惊！用 Redis+AI 模型实现秒级实时风控，这波操作太秀了

震惊！用 Redis+AI 模型实现秒级实时风控，这波操作太秀了

兄弟们，有没有遇到过这种情况：凌晨三点在某东抢购显卡，刚提交订单就提示"系统繁忙"，转头发现黄牛已经在海鲜市场挂出同款；扫码支付时突然弹出风险提示，非要验证人脸识别；更绝的是某银行APP，刚输完密码就收到短信提醒："检测到您的账户存在异常操作"——但此时您根本没动过手机。这些让人又爱又恨的操作背后，都藏着一个叫"实时风控"的技术妖怪。今天咱们就来扒一扒，这个妖怪是如何用 Redis 和 AI 模型在 0.1 秒内完成逆天操作的。

4/3/2025 9:30:56 AM 儒猿团队

DeepSeek R1 简易指南：架构、本地部署和硬件要求

DeepSeek R1 简易指南：架构、本地部署和硬件要求

DeepSeek 团队近期发布的DeepSeek-R1技术论文展示了其在增强大语言模型推理能力方面的创新实践。该研究突破性地采用强化学习（Reinforcement Learning）作为核心训练范式，在不依赖大规模监督微调的前提下显著提升了模型的复杂问题求解能力。技术架构深度解析模型体系：DeepSeek-R1系列包含两大核心成员：DeepSeek-R1-Zero参数规模：6710亿（MoE架构，每个token激活370亿参数）训练特点：完全基于强化学习的端到端训练核心优势：展现出自我验证、长链推理等涌现能力典型表现：AIME 2024基准测试71%准确率DeepSeek-R1参数规模：与Zero版保持相同体量训练创新：多阶段混合训练策略核心改进：监督微调冷启动强化学习优化性能提升：AIME 2024准确率提升至79.8%训练方法论对比强化学习与主要依赖监督学习的传统模型不同，DeepSeek-R1广泛使用了RL。

2/3/2025 6:00:00 AM dev

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ Mac也能跑Qwen3，一文看懂本地部署qwen 3配置要求

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉