AI在线 AI在线

理论

为什么 LangChain ReAct 机制值得关注 ?

在当前由大型语言模型(LLM)驱动的应用开发浪潮中,如何赋予模型超越文本生成、具备可靠推理与行动的能力,已成为衡量其智能水平的关键分野。 正是在这一背景下,Langchain 框架中的 ReAct(Reasoning and Acting)机制应运而生,并迅速成为业界瞩目的焦点。 ReAct 不仅仅是一种技术实现,更是一种富有远见的智能代理(Agent)设计哲学。
9/11/2025 10:01:45 AM
Luga Lee

AI代理8小时赚4500美元-程序员真的要失业了

一个明显的趋势是,AI正在从简单的代码补全工具,悄然进化成能够独立完成整个开发项目的"超级程序员"。 当我看到一个AI代理在8小时内完成Shopify扩展开发,并为客户节省了4500美元成本的消息时,说实话,第一反应是——这怎么可能? 但这确实发生了。
9/11/2025 9:19:46 AM
阿丸笔记

重磅!Thinking Machines开山之作:大模型输出随机的根本原因被揪出,并开源终结方案

要理解AI,先要理解它何以不确定,由OpenAI前CTO Mira Murati创办的Thinking Machines 开山之作来了,刚刚,Thinking Machines Lab 宣布正式上线技术研究博客:连接主义。 开篇就是万字技术雄文《击败LLM推理中的非确定性(Defeating Nondeterminism in LLM Inference)》。 为什么叫“连接主义”?
9/11/2025 9:04:00 AM

启发首席营销官的十大非AI领域的变革性创新

要点概览:CMO(首席营销官)作为企业的“指挥者”:数字化转型早已不只是IT的事情,CMO正在塑造客户体验和企业的数字化叙事。 颠覆即进步:Scott Anthony将颠覆重新定义为简化复杂性、让昂贵变得可负担的驱动力。 历史是最佳指南:《Epic Disruptions》强调,过去的成败为应对AI与未来浪潮提供了最有价值的经验。
9/11/2025 7:00:00 AM
Myles Suer

用 MarkItDown-MCP 让你的 AI 编程助手“通吃”各种文件!

大家好! 今天要跟大家聊一个超级实用的工具——MarkItDown-MCP! 如果你平时用 AI 编程助手(比如 Claude、Cursor 之类)写代码、查文档、处理数据,是不是经常遇到这样的烦恼:有些文件格式 AI 读不了,或者读起来效果不佳?
9/11/2025 4:00:00 AM
道玄

“扁平+拓扑”双索引,85页PDF"秒级"推理,MMRag幻觉率骤降76%

多模态长文档视觉问答(Multimodal Long-context Document Question Answering, 后文简称 M-L-DocQA)要求系统在给定一份可能长达数十页, 包含:文本、表格、图表、图像与版式元素的 PDF。 自动定位并融合跨页、跨模态的证据,最终生成自然语言答案。 图片这种任务常见于科研论文、上市公司年报、产品说明书、政府统计报告等场景。
9/11/2025 2:22:00 AM
CourseAI

数据集质量正成为AI大模型的终极壁垒

"老板,我们的模型效果怎么还是这么差? "小李拿着测试报告,一脸无奈地走进了技术总监的办公室。  "数据质量怎么样?
9/11/2025 2:00:00 AM
大数据AI智能圈

幻觉成了AI的“癌症”,连OpenAI也治不了

学生参加考试,当他不知道题目的答案时,可能会猜测。 实际上,AI聊天机器人也一样。 AI给出的答案可能看起来正确,实际却是完全错误的,这就是所谓的“幻觉”。
9/11/2025 1:00:00 AM
小刀

首个Data Agent基准测试来了!2007个测试任务将数据库、PDF、视频、音频异构数据源一网打尽

数据智能体到底好不好用? 测评一下就知道了! 南洋理工大学、新加坡国立大学携手华为开源推出首个专门针对数据智能体(Data Agents)异构混合数据分析的综合性基准测试FDABench。
9/10/2025 6:03:16 PM

快慢思考不用二选一!华为开源7B模型实现自由切,精度不变思维链减近50%

国产自研开源模型,让模型不用在快思考和慢思考间二选一了! 华为最新发布openPangu-Embedded-7B-v1.1,参数只有7B,却身怀双重“思维引擎”。 要知道,长期以来,大模型快思考与慢思考模式不可兼得,这成为业界的一大痛点。
9/10/2025 6:01:33 PM

真·博士水平!GPT-5首次给出第四矩定理显式收敛率,数学教授只点拨了一下

GPT-5真不愧是博士水平的AI! 在数学教授引导下,它首次将定性的第四矩定理扩展为带有显式收敛率的定量形式。 简单来讲就是,原来的定理仅说明收敛会发生,却没有给出具体速度,而借助GPT-5,这项研究首次明确了收敛速率。
9/10/2025 6:00:58 PM

数十亿人将用上免费AGI!OpenAI奥特曼高调断言:全球经济将迎来极度通缩!效率强如DeepSeek,全球AI也需百吉瓦能源!

编辑 | 伊风 出品 | 51CTO技术栈(微信号:blog51cto)奥特曼最新判断来了:未来会有数十亿人使用免费的 AGI! 不只是价格更低,而是以一种前所未有的方式,大规模普及到全球每一个角落。 同时,他认为,AI 所带来的巨大技术红利,将推动全球经济进入极度通缩的状态。
9/10/2025 5:42:29 PM
伊风

当人工智能「看见」量子世界:AI如何改变对复杂量子系统的认知,南洋理工、上交等发布量子系统学习综述

作者 | 论文团队编辑 | ScienceAI在量子科学中,复杂性往往增长得出乎意料。 一个经典比特只能是 0 或 1,而 50 个量子比特的状态,就需要超过一千万亿个复数来完整描述,这个规模远远超过任何超级计算机的存储能力。 随着实验室里量子设备的不断扩展,科学家们逐渐面临一个悖论:我们能够制造越来越大的量子系统,却常常无法用传统方法去全面理解它们。
9/10/2025 2:02:00 PM
ScienceAI

TextIn vs. DeepDoc性能测评:RAGFlow解析升级完整教程(附二开代码)

两个月前在星球的会员群中,有人推荐了TextIn这款解析工具。 我当时也是第一次听说,最近一段时间陆续在手头项目上测试了些以往认为是 Corner Case 的复杂布局文档后,发现居然都有不错的表现。 后续了解到TextIn背后的公司叫合合信息,看起来还是有点陌生,不过这家公司旗下另外一款叫做“扫描全能王”的产品各位应该听说过或者用过。
9/10/2025 10:06:19 AM
韦东东

VLDB2025 | Magnus: 字节跳动面向大规模机器学习的数据管理方案

导读机器学习广泛应用于字节跳动,数据作为机器学习训练的核心要素,如何高效灵活的管理支撑大规模训练数据的存储、生产以及训练,成为数据基础设施的一大挑战;近两年大模型迅猛发展,对数据集管理也提出了更多新的场景需求。 字节跳动在开源 Apache Iceberg 的基础上,打造了一套面向大规模机器学习的数据管理解决方案 Magnus,在存储格式、索引、元数据管理、更新机制、训练框架集成等多个维度实现优化。 Magnus 已在字节内部部署超过五年,在搜索、广告、推荐、大模型等核心业务中大规模落地,数据规模超5EB,相关成果已被 VLDB 2025收录。
9/10/2025 9:59:52 AM
基础技术训练设施

英伟达新GPU,超长上下文/视频生成专用

老黄对token密集型任务下手了。 刚刚,在AI Infra Summit上,英伟达宣布推出专为处理百万token级别的代码生成和生成式视频应用的全新GPU——NVIDIA Rubin CPX GPU。 老黄表示:Rubin CPX是首款为超大上下文AI量身定制的CUDA GPU,可以让模型“一口气”推理数百万token。
9/10/2025 9:38:56 AM

Claude用户退订潮!被指高峰期偷换缩水模型,工程师列9大罪状呼吁全网退订

Claude出现大危机,不是因为最近的某些骚操作,而是产品本身就出了问题。 已经有AI工程师带头呼吁大家退订(这里PoS指Piece of Shit,也就是一坨)。 点赞者就2000多,用实际行动退订的也不少。
9/10/2025 9:37:39 AM

腾讯开源混元Image 2.1:2K高清+完美文字嵌入,图文天花板来了

今天凌晨,腾讯开源最新图像模型混元Image 2.1。 混元Image 2.1支持原生2K分辨率图像和1000 token的超长篇复杂提示词,并且在文本语义理解和文字嵌入方面非常强几乎完美,能将中英文无缝写入到图像中,很适用于产品封面、插画、海报设计等专业场景此外,腾讯还开源了基于MeanFlow的加速版模型权重,该版本可将推理步数从100步大幅缩减至仅8步,以及业内首个工业级提示词改写模型 PromptEnhancer,能对提示词进行优化,帮助用户生成更细腻、富有表现力的图像。 开源地址: 2.1Github: 2.1?tab=readme-ov-file在线体验: 2.1案例目前,混元Image 2.1已经可以使用,下面给大家展示一下它的生成效果。
9/10/2025 9:35:14 AM