AI在线 AI在线

理论

Claude Code烧钱黑洞曝光:99%成本都白费了,但我找到了方法

40,000个输入token,只产生30个输出token——这不是网络故障,而是Claude Code用户的真实遭遇。 更震撼的是,有开发者发现超过99%的成本都被浪费在了完全无关的臃肿上下文上。 一个简单的代码修复,居然烧掉了价值几十美元的token。
7/31/2025 9:28:25 AM
阿丸笔记

无需准确传感信号!轻松搞定「多段软体机械臂」复杂位姿与形状控制

软体机械臂由于其运动的非线性、时滞性与迟滞性而难以控制,而在多段软体机械臂(MSCA)内,其各段间的驱动、传感和运动的耦合更增加了控制难度。 但同时,由于MSCA的各段可以相对独立地驱动,这类机械臂可以实现末端位姿控制、形状控制、控制过程中自动避障、实时交互等复杂控制任务。 意大利比萨圣安娜高等学院和洛桑联邦理工学院的研究人员提出了一种利用双向循环神经网络(biLSTM)对于MSCA构型的规划与控制的策略,该方法即使运用不准确的内部传感信号也能实现上述复杂任务。
7/31/2025 9:08:00 AM

炮轰黄仁勋,决裂奥特曼!1700亿美元估值背后,硅谷最不好惹的AI狂人

Dario Amodei这位AI圈最敢说的大佬,因为家庭变故,找到了人生方向。 作为Anthropic的CEO,他在2025年简直是「火力全开」,与行业对手、政府官员以及公众关于AI的看法展开了激烈交锋。 他预测AI可能很快会淘汰50%的入门级白领工作,还在《纽约时报》上抨击了为期十年的AI监管禁令。
7/31/2025 9:07:00 AM

阿里刚刚开源Qwen3新思考模型:Agent能力超强,支持100万上下文

今天凌晨,阿里巴巴开源了Qwen3家族最新模型Qwen3-30B-A3B-Thinking-2507。 2507与之前阿里开源的Qwen3-30B-A3B-Thinking和Qwen3-235B-A22B-Thinking相比,在Agent智能体、AIME25数学、LiveCodeBench编程、GPQA解决复杂能力等方面,性能全部实现大幅度提升。 同时,2507也超过了谷歌的最新小参数模型Gemini-2.5-Flash-Thinking。
7/31/2025 9:06:00 AM

让你的服务变成MCP Server?FastAPI MCP 指南

在当今AI世界中,应用程序和大模型之间的无缝集成至关重要。 模型上下文协议 (MCP) 通过允许 AI 模型访问外部工具和数据源来弥合这一差距。 FastAPI MCP 可以用最少的配置将现有的 FastAPI 端点转换为与 MCP 兼容的工具。
7/31/2025 9:02:21 AM
曹洪伟

我在WAIC看见的十大趋势

太热了,实在太热了。 你能想象吗? 一个AI行业展会,现在都有了一种明星演唱会的错觉。
7/31/2025 8:50:00 AM

1.5B参数撬动“吉卜力级”全能体验,国产开源之光多模态统一模型,来了

听说了吗,GPT-5这两天那叫一个疯狂造势,奥特曼怕不是真有些急了(doge)。 但有一说一,回顾上半年最火AI事件,GPT-4o带来的“吉卜力”风暴,还是热度TOP。 △数据来自微信指数不仅由“万物皆可吉卜力”为始,GPT-4o生图功能被网友们疯玩至今,更重要的是,还引发了更深的技术思考:AIGC的范式,已经被悄然改变。
7/31/2025 8:45:00 AM

基于Dify动态解析异构银行流水:架构拆解→风控报告生成

两个月前,知识星球中有个关于银行流水分析的提问:想问问对于流水识别是否有比较好的解决方案呢? 我们现在想用大模型能够对多家银行进行识别,但是发现识别准确率很一般,经常出现表格识别数据错乱的情况,而且效率也不太行这个问题在企业信贷的贷前风控场景经常出现,不同银行的流水格式一般有所区别,而且一家企业往往涉及多家银行的账户使用。 这也导致了流水解析和分析工作复杂度确实高很多。
7/31/2025 6:57:27 AM
韦东东

让 Gemini CLI 跑在你的私有大模型上

前不久,Google 开源了 Gemini CLI 工具,它允许用户通过命令行与 Gemini AI 模型进行高效交互。 然而,在实际应用中,出于安全性和成本控制的考虑,很多场景更适合使用本地部署的大语言模型(LLM)。 因此,让 Gemini CLI 支持连接本地 LLM 就显得尤为重要。
7/31/2025 6:45:00 AM
Andflow

多阶段的多模态RAG幻觉缓解方案:智能眼镜等实时交互场景比赛方案-MM-RAG

VLMs 在多模态推理中虽表现强大,但在处理特定场景时易产生 “幻觉”,如:复杂场景适配问题:面对第一视角图像(如智能眼镜拍摄的实时画面)、长尾实体(罕见物体 / 概念)、多跳推理问题(需多步逻辑推导)时,模型易因知识不足或误判生成错误结论;知识时效性问题:模型依赖内部先验知识,对涉及时效性的内容(如实时事件、动态变化的信息)易输出过时答案。 图片比赛链接:。 该框架通过四个核心阶段的协同运作,实现“减少幻觉”与“保证信息量”的平衡,同时兼顾效率与可靠性。
7/31/2025 5:15:00 AM
llmnlp

Bill Inmon:为什么你的数据湖需要的是 BLM,而不是 LLM

当你尝试使用文本生成 AI 解决结构化数据问题时,你投资的数据湖就变成了‘污水池’ 。 ” —— Bill Inmon根据 Gartner 的研究,85% 的大数据项目都失败了。 2023 年,规模达 152 亿美元的数据湖市场增长了 20% 以上,但大多数企业却无法从文本数据中提取价值。
7/31/2025 3:00:00 AM
晓晓

WAIC-Day3: 谈谈Agent场景及Agent OS基础设施

TL;DR看到今年Agent和具身智能爆火, 是否还记得去年云栖大会吴妈的一段话:“我们认为AI最大的想象力绝对不是在手机屏幕上,AI最大的想象力是在通过渗透数字世界,接管数字世界,并改变物理世界”那个时候还没有MCP也没有Manus/Flowith, 而如今我们看到了一条清晰的Agent渗透数字世界,接管数字世界的路径, 同时也看到了具身智能逐渐改变物理世界的趋势...别问我Day2干嘛去了, 干了一些不能说的秘密~ 然后下午本来在当观众看展, 结果在公司的展台站了一会儿, 就变成站台小哥讲了2小时...对于今年另一个热点, 那些各种各样所谓的“超节点”方案, 大概的背景和分析前些年其实都有了, 标准上的争议, 实现方案的差异很多. 国产方案 vs 国外UALink/SUE一堆... 实际上我想说的是ScaleUp本身的定义是不清晰的,所以超节点本身的技术设计上要么是欠缺考虑的, 要么是Over Engineering的.
7/31/2025 2:11:00 AM
zartbot

2025年ChatGPT编程神器指南:20个开发者必学提示!

我几乎每天都在写代码,ChatGPT现在已经是我工作流程的一部分,就像Git或VS Code一样。 但经过几个月的摸索,我发现了一个真相:ChatGPT的强大之处不在于你让它“修这段代码”或“写个Python函数”。 真正的秘诀在于你怎么问。
7/31/2025 2:11:00 AM
AI研究生

MedGemma开源发布:谷歌推出支持多医学任务的AI模型套件

谷歌和DeepMind联合发布了一个全新的开源人工智能模型套件:MedGemma。 这一套件面向医疗领域打造,不仅支持文本、图像和多模态输入,还能广泛适配放射学、皮肤病学、组织病理学和眼科学等多个分支。 它在今年的I/O开发者大会上首次亮相,MedGemma包含两个版本:一个是体量为40亿参数的4B模型,支持图文混合处理;另一个是更强大的270亿参数的27B模型,提供文本和多模态两种版本。
7/31/2025 2:00:15 AM

四维解析:智能体如何实现自我进化

大家好,我是肆〇柒。 当下,智能体正从“工具使用者”到“工具制造者”转变,这是从依赖预定义静态工具集,到使智能体能够自主扩展和精炼自身技能的关键飞跃。 这是实现认知自给(cognitive self-sufficiency)的核心。
7/31/2025 2:00:00 AM
肆零柒

大模型性能压测利器:解析vLLM推理服务压测工具

在大模型部署的汪洋大海中,性能压测就像是航行中的指南针——不仅指引方向,还能预见暗礁。 今天我们来聊聊一个专门为vLLM推理服务量身定制的性能压测工具,看看它如何让大模型的性能评估变得既科学又优雅。 痛点:大模型性能评估的"黑盒困境"想象一下这样的场景:你刚刚部署了一个32B参数的DeepSeek-R1模型,信心满满地准备上线服务。
7/31/2025 1:47:00 AM
萤火AI百宝箱

GLM-4.5:推理、编程与Agent能力的全面突破

GLM-4.5核心特性概览:•MoE 架构•混合推理模型•总参数 355B(激活参数 32B)•GQA 部分 RoPE•多 Token 预测•Muon 优化器 QK 归一化•22T Token 训练语料•Slime RL 基础设施•原生工具调用图片图片模型架构与预训练:GLM-4.5 总参数规模达 355B(激活参数 32B),采用更深但更窄的模型设计,通过增加层数和 96 个注意力头来优化推理能力。 轻量版 GLM-4.5-Air 为 106B 参数(激活参数 12B)。 图片训练语料库规模达 22T Token,其中包含 15T 通用数据和 7T 代码/推理专用数据。
7/31/2025 1:45:00 AM
无影寺

沈向洋对话谷歌前CEO施密特:AI发展与中美合作的未来展望

7月26日,世界人工智能大会(WAIC)在上海拉开帷幕。 香港科技大学校董会主席、美国国家工程院外籍院士沈向洋和前Google CEO埃里克·施密特(Eric Schmidt)围绕“人工智能全球合作展望”的主题,展开了一场“炉边对话”,回顾了中国在AI领域的飞速发展,并探讨了AI安全、中美合作等核心议题。 施密特强调,过去两年,中国的AI技术,特别是DeepSeek和Mini Max、Kimi等大模型,已经取得了举世瞩目的成就。
7/31/2025 1:44:00 AM