AI在线 AI在线

理论

让 Gemini CLI 跑在你的私有大模型上

前不久,Google 开源了 Gemini CLI 工具,它允许用户通过命令行与 Gemini AI 模型进行高效交互。 然而,在实际应用中,出于安全性和成本控制的考虑,很多场景更适合使用本地部署的大语言模型(LLM)。 因此,让 Gemini CLI 支持连接本地 LLM 就显得尤为重要。
7/31/2025 6:45:00 AM
Andflow

多阶段的多模态RAG幻觉缓解方案:智能眼镜等实时交互场景比赛方案-MM-RAG

VLMs 在多模态推理中虽表现强大,但在处理特定场景时易产生 “幻觉”,如:复杂场景适配问题:面对第一视角图像(如智能眼镜拍摄的实时画面)、长尾实体(罕见物体 / 概念)、多跳推理问题(需多步逻辑推导)时,模型易因知识不足或误判生成错误结论;知识时效性问题:模型依赖内部先验知识,对涉及时效性的内容(如实时事件、动态变化的信息)易输出过时答案。 图片比赛链接:。 该框架通过四个核心阶段的协同运作,实现“减少幻觉”与“保证信息量”的平衡,同时兼顾效率与可靠性。
7/31/2025 5:15:00 AM
llmnlp

Bill Inmon:为什么你的数据湖需要的是 BLM,而不是 LLM

当你尝试使用文本生成 AI 解决结构化数据问题时,你投资的数据湖就变成了‘污水池’ 。 ” —— Bill Inmon根据 Gartner 的研究,85% 的大数据项目都失败了。 2023 年,规模达 152 亿美元的数据湖市场增长了 20% 以上,但大多数企业却无法从文本数据中提取价值。
7/31/2025 3:00:00 AM
晓晓

WAIC-Day3: 谈谈Agent场景及Agent OS基础设施

TL;DR看到今年Agent和具身智能爆火, 是否还记得去年云栖大会吴妈的一段话:“我们认为AI最大的想象力绝对不是在手机屏幕上,AI最大的想象力是在通过渗透数字世界,接管数字世界,并改变物理世界”那个时候还没有MCP也没有Manus/Flowith, 而如今我们看到了一条清晰的Agent渗透数字世界,接管数字世界的路径, 同时也看到了具身智能逐渐改变物理世界的趋势...别问我Day2干嘛去了, 干了一些不能说的秘密~ 然后下午本来在当观众看展, 结果在公司的展台站了一会儿, 就变成站台小哥讲了2小时...对于今年另一个热点, 那些各种各样所谓的“超节点”方案, 大概的背景和分析前些年其实都有了, 标准上的争议, 实现方案的差异很多. 国产方案 vs 国外UALink/SUE一堆... 实际上我想说的是ScaleUp本身的定义是不清晰的,所以超节点本身的技术设计上要么是欠缺考虑的, 要么是Over Engineering的.
7/31/2025 2:11:00 AM
zartbot

2025年ChatGPT编程神器指南:20个开发者必学提示!

我几乎每天都在写代码,ChatGPT现在已经是我工作流程的一部分,就像Git或VS Code一样。 但经过几个月的摸索,我发现了一个真相:ChatGPT的强大之处不在于你让它“修这段代码”或“写个Python函数”。 真正的秘诀在于你怎么问。
7/31/2025 2:11:00 AM
AI研究生

MedGemma开源发布:谷歌推出支持多医学任务的AI模型套件

谷歌和DeepMind联合发布了一个全新的开源人工智能模型套件:MedGemma。 这一套件面向医疗领域打造,不仅支持文本、图像和多模态输入,还能广泛适配放射学、皮肤病学、组织病理学和眼科学等多个分支。 它在今年的I/O开发者大会上首次亮相,MedGemma包含两个版本:一个是体量为40亿参数的4B模型,支持图文混合处理;另一个是更强大的270亿参数的27B模型,提供文本和多模态两种版本。
7/31/2025 2:00:15 AM

四维解析:智能体如何实现自我进化

大家好,我是肆〇柒。 当下,智能体正从“工具使用者”到“工具制造者”转变,这是从依赖预定义静态工具集,到使智能体能够自主扩展和精炼自身技能的关键飞跃。 这是实现认知自给(cognitive self-sufficiency)的核心。
7/31/2025 2:00:00 AM
肆零柒

大模型性能压测利器:解析vLLM推理服务压测工具

在大模型部署的汪洋大海中,性能压测就像是航行中的指南针——不仅指引方向,还能预见暗礁。 今天我们来聊聊一个专门为vLLM推理服务量身定制的性能压测工具,看看它如何让大模型的性能评估变得既科学又优雅。 痛点:大模型性能评估的"黑盒困境"想象一下这样的场景:你刚刚部署了一个32B参数的DeepSeek-R1模型,信心满满地准备上线服务。
7/31/2025 1:47:00 AM
萤火AI百宝箱

GLM-4.5:推理、编程与Agent能力的全面突破

GLM-4.5核心特性概览:•MoE 架构•混合推理模型•总参数 355B(激活参数 32B)•GQA 部分 RoPE•多 Token 预测•Muon 优化器 QK 归一化•22T Token 训练语料•Slime RL 基础设施•原生工具调用图片图片模型架构与预训练:GLM-4.5 总参数规模达 355B(激活参数 32B),采用更深但更窄的模型设计,通过增加层数和 96 个注意力头来优化推理能力。 轻量版 GLM-4.5-Air 为 106B 参数(激活参数 12B)。 图片训练语料库规模达 22T Token,其中包含 15T 通用数据和 7T 代码/推理专用数据。
7/31/2025 1:45:00 AM
无影寺

沈向洋对话谷歌前CEO施密特:AI发展与中美合作的未来展望

7月26日,世界人工智能大会(WAIC)在上海拉开帷幕。 香港科技大学校董会主席、美国国家工程院外籍院士沈向洋和前Google CEO埃里克·施密特(Eric Schmidt)围绕“人工智能全球合作展望”的主题,展开了一场“炉边对话”,回顾了中国在AI领域的飞速发展,并探讨了AI安全、中美合作等核心议题。 施密特强调,过去两年,中国的AI技术,特别是DeepSeek和Mini Max、Kimi等大模型,已经取得了举世瞩目的成就。
7/31/2025 1:44:00 AM

机器学习特征工程的最佳实践

特征工程是模型训练之前运行的关键过程,因为输入数据的质量直接决定了模型输出的质量。 虽然深度学习模型擅长从图像或文本等非结构化数据中自动学习特征,但明确的特征工程对于表格数据集仍然至关重要。 在本文中,云朵君将展示特征工程对回归任务的影响,特别关注具有混合数字、分类和基于时间的特征的大型表格数据集。
7/31/2025 1:22:00 AM
云朵君

ChatGPT「学习模式」火爆上线,一大波教育AI连夜被端!24小时导师免费用

刚刚,OpenAI迎来一个全新功能更新,但不是GPT-5。 ChatGPT上线了一个新模式——Study and Learn(学习模式)! 使用这种模式,ChatGPT不仅仅提供答案,而是逐步引导解决问题。
7/31/2025 1:15:00 AM

现代LLM架构设计一览:从DeepSeek-V3到Kimi K2

主要内容现代LLM架构的演进主要围绕以下几个核心目标:提高推理效率:通过GQA、MLA、滑动窗口注意力、MoE等技术减少内存占用和计算量。 增强训练稳定性:通过归一化层(如RMSNorm)的放置和QK-Norm等技术优化训练过程。 优化模型容量与性能:通过MoE实现更大参数量和知识吸收能力,同时保持推理效率。
7/31/2025 1:00:00 AM
常华Andy

高水准的开发:能用AI解决的问题,绝不自己动手去写

对于开发人员和软件测试人员来说,最重要的是有一款量身定制的接口调试工具,可以让开发和测试工作事半功倍。 Apipost是AI驱动的集API设计、调试、文档生成、自动化测试、性能测试于一体的API开发协作管理平台,功能全面,尤其适合注重团队协作和轻量体验的用户。 图片一、Apipost核心优势无需登录,离线可用:Apipost无需账号登录,支持离线调试,保护用户隐私,提升效率;高效的AI智能开发助手:集成AI大模型,解决接口开发测试过程中命名难题、手动维护文档繁琐等痛点问题,实现API设计、调试、文档生成和自动化测试的闭环高效开发管理;超轻量设计:资源占用少,加载迅速,适合对性能敏感的用户;100%兼容Postman脚本语法:用户可以无缝迁移现有Postman脚本,降低学习成本。
7/31/2025 12:00:05 AM

告别大统一模型!预填充解码分离背后的技术哲学革命

说实话,最近看到一个技术思路的时候,我有点被震撼到了。 我们一直觉得,既然大语言模型这么厉害,那就应该用一个统一的大模型来处理所有事情——输入理解、上下文处理、token生成,全都交给一个模型搞定。 这听起来很符合"大力出奇迹"的思路。
7/31/2025 12:00:00 AM
阿丸笔记

十年磨剑:云势数据以 AI 重构全球客户服务生态

某汽车客户通过云势数据 ConnectNow 电话机器人客户服务系统,引导终端用户处理设备故障问题。 该系统可以支持 10 种语言,语音识别和故障信息录入准确率超过 90%,每年省 550 万元。 这个案例数字的背后,是云势数据与亚马逊云科技合作,十年技术沉淀的爆发。
7/30/2025 5:52:19 PM
鸢玮

逆天!旧Mac上能run千亿参数SOTA!效果惊人:一次生成游戏,0修改!本地大模型拐点来了!网友:别被大模型叙事带偏了(附指南)

编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)起猛了,连老电脑都能跑智谱家新一代的 SOTA 模型了! 一篇来自技术人 Simon Willison(Python 知名 Web 框架 Django 的共同创始人)的实测文章,在 Hacker News 上引发热议:“我 2.5 年高龄的旧笔记本,现在不仅能在本地跑千亿参数模型,甚至还能用它写出一款完整的 JavaScript 太空入侵者游戏。 ”图片 这个模型,正是昨天新鲜出炉的 GLM-4.5 系列。
7/30/2025 2:11:55 PM
伊风

全球首次,「AI记忆」开源落地!MIRIX同步上线APP

还记得第一次用 GPT 写邮件的惊喜吗? 却也一定遇到过今天的 AI「忘性」——聊得再深入,窗口一关,历史烟消云散。 因此,研究人员认为:从「对话」到「记忆」,将是AI进化的必经之路。
7/30/2025 9:15:00 AM