系统
LLM记忆终极指南:从上下文窗口到高级智能体记忆系统
当你向聊天机器人报上姓名,片刻后它却再次询问"你叫什么"时,这种数字失忆现象暴露出人工智能的关键短板:大型语言模型(LLMs)本质上是无状态的。 它们像金鱼一样"记不住"过去的对话,每次交互都被视为全新事件。 ChatGPT等应用展现的记忆能力,实则是通过在每轮对话中强行插入历史记录制造的 illusion(假象)。
7/29/2025 12:00:00 AM
大模型之路
Demis Hassabis最新采访:宇宙的本质是信息,一切都将被AI学习,2030年可实现AGI
谷歌DeepMind掌门人Demis Hassabis再度做客Lex Fridman播客,贡献了一场长达两个多小时、信息量爆炸的深度对话在这场对话中,Hassabis不仅给出了AGI实现的惊人时间表,更首次系统性地阐述了他关于宇宙、现实与AI的大一统哲学思想。 他将AlphaFold、视频模型Veo、电子游戏、P vs NP问题,乃至生命的起源和意识,全部串联到了一个宏大的框架之下全程两个多小时,3万多字,强烈建议去看原视频:搜索Demis Hassabis: Future of AI, Simulating Reality, Physics and Video Games以下是我觉得比较有意的的点,分享给大家宇宙的本质是信息,因此万物皆可被AI高效学习信息第一性: Hassabis明确提出,信息是比能量和物质更根本的宇宙单位。
7/28/2025 9:06:04 AM
AI破解宠物心声,读懂你的猫狗?全球首个AI与动物感知中心揭秘
养过宠物的人,会忍不住思考这些动物是如何思考的。 一个名为Traini的app,则号称能够基于大模型PetGPT,读懂宠物的叫声和面部表情,帮助主人理解宠物的情绪和需求。 descript近日,伦敦政治经济学院(LSE)将于9月30日启动Jeremy Coller动物感知中心将会给出回答。
7/25/2025 3:24:47 PM
新智元
为什么日本代码‘稳如狗’?走访丰田等多家日本团队:写代码像做寿司,每天进步1%「侘寂」美学让系统跑几十年,网友:任天堂都30年了
编译 | 云昭这周一,小编偶然看到了一篇角度很奇特的、有关日本代码风格的文章。 虽说现在 Vibe Coding 盛行,很多老铁们都不那么关注代码本身了,但若要真的让 AI 工具编写含金量组足够的代码,反而对于开发者的“代码审美”提出了更高的要求。 这篇文章的作者是一位老鸟后端工程师 Sohail Saifi,也在用各种 AI Coding 工具。
7/25/2025 10:51:38 AM
云昭
采用LangGraph集成多个MCP服务器的应用
现代人工智能应用程序通常需要对不同的语言模型和专门的服务器进行复杂的编排,每个服务器在更大的工作流中处理特定的任务。 然而,这种分布式方法引入了一个关键的挑战: 保持上下文的连续性。 当会话或任务在不同的模型或服务器之间转换时,上下文信息很容易丢失。
7/24/2025 8:13:36 AM
曹洪伟
让GUI智能体不再「过度执行」,上海交大、Meta联合发布OS-Kairos系统
本文第一作者是上海交通大学计算机学院三年级博士生程彭洲,研究方向为多模态大模型推理、AI Agent、Agent 安全等。 通讯作者为张倬胜助理教授和刘功申教授。 一、论文概述1.1 研究背景随着多模态大语言模型(Multimodal Large Language Models, MLLMs)的快速发展,越来越多的研究聚焦于构建能够在图形用户界面(GUI)中执行复杂任务的智能体。
7/3/2025 9:27:57 AM
深入浅出RAG详解:语言模型的“开卷考试”——让模型答案锚定现实的外部“记忆”
引言大型语言模型(LLMs)彻底革新了自然语言处理领域,但其对静态内部知识的依赖,在事实准确性和时效性方面暴露出根本性局限。 检索增强生成(RAG)作为一种强大的范式应运而生,它构建了一种混合架构,将模型输出动态锚定于外部可验证信息。 本文将深入探讨RAG框架的核心机制——从检索器与生成器组件到参数化记忆与非参数化记忆的关键区别,揭示其在知识密集型应用中实现前沿性能的奥秘。
7/3/2025 2:12:00 AM
柏企阅文
比10年专业医生准4倍!微软发布突破性医疗AI系统
微软首席执行官Satya Nadella在社交平台分享了,微软最新发布的突破性医疗AI系统MAI-DxO。 MAI-DxO最大技术创新在于其模型无关的设计,使其能够适配不同厂商、不同能力的语言模型,并普遍提升它们的诊断性能。 并且能模拟真实医生的诊断流程,比专业医生的准确率更高。
7/2/2025 9:43:13 AM
图驱动的自然语言接口:混合LLM与意图分类方法
在当今数据驱动的商业环境中,数据分析人员和营销人员经常需要与复杂的数据库交互以获取洞察。 然而,并非所有人都精通SQL等结构化查询语言,这就催生了对自然语言接口的需求。 本文将深入探讨一种创新的意图驱动自然语言接口,该接口结合了大型语言模型(LLM)和意图分类技术,为数据洁净室(Data Clean Rooms, DCRs)等隐私敏感环境提供了安全、高效的解决方案。
7/1/2025 9:00:00 AM
大模型之路
RAG系统的“聪明药”:如何用反馈回路让你的AI越用越聪明?
大家好,我是你们的AI技术侃侃而谈小能手。 今天我们来聊聊RAG(Retrieval-Augmented Generation,检索增强生成)系统的进化之路——如何让它像喝了聪明药一样,越用越聪明,越聊越懂你。 你是不是也有这样的体验?
7/1/2025 8:37:13 AM
许泽宇
北大CogSci 2025(Oral)| 人类创造力的核心机制,AI已经开始掌握了
“AI永远无法取代人类”证据-1! 北大团队最新论文揭示:人类引以为傲的创造力,如今AI也开始掌握了。 甚至,研究人员还提出了一种系统性框架,首次从认知科学的角度,对AI模型的组合创造力(Combinational Creativity)进行了量化评估与优化。
6/26/2025 8:56:00 AM
Windows最新搭载微软自研模型Mu,一句话搞定所有系统配置
还在为复杂的Windows设置头疼? 微软来重新定义设置界面交互了。 全新发布的设备端小语言模型Mu,让Windows 11的设置也拥有了自己的AI Agent。
6/25/2025 1:42:54 PM
形式化证明迈向多模态,MLLM正确率仅4%!港科大等推出全新基准
近年来,自动定理证明(ATP)取得了显著进展,但大部分工作都集中在处理纯文本形式的定理。 然而,在现实世界中,尤其是在几何学领域,许多定理的呈现和理解都离不开图像、图表等视觉元素。 人类数学家善于从这些图表中获取直觉,并将其作为引导严谨证明过程的关键。
6/18/2025 8:49:00 AM
多智能体在「燃烧」Token!Anthropic公开发现的一切
「Anthropic 发布了他们如何使用多个 Claude AI 智能体构建多智能体研究系统的精彩解释。 对于任何构建多智能体系统的人来说,这是一本必读的指南。 」刚刚,X 知名博主 Rohan Paul 强力推荐了 Anthropic 一项新研究。
6/16/2025 8:39:00 AM
上下文窗口错觉:为什么你的 128K token 不起作用
一、当理论容量遭遇现实困境在大语言模型(LLM)的技术竞赛中,上下文窗口长度早已成为各家标榜的核心指标。 从GPT-4o的128K到Gemini 1.5的1M,模型厂商不断突破Token容量的上限,仿佛更长的上下文就意味着更强的信息处理能力。 然而,这场“军备竞赛”背后却隐藏着一个残酷的现实:模型对长上下文的利用率远低于理论预期。
6/11/2025 4:25:00 AM
大模型之路
OCR 识别质量如何影响 RAG 系统的性能?有何解决办法?
检索增强生成(RAG)已成为连接大语言模型与企业数据的标准范式,但该方法存在一个鲜少被讨论的致命缺陷:当前生产环境中的 RAG 系统几乎全部依赖光学字符识别(OCR)技术处理 PDF、扫描件、演示文稿等文档,并默认假设识别结果足以支撑下游 AI 任务。 我们的深度分析表明,这一假设存在根本性缺陷。 OCR 的识别质量形成了一个隐形的天花板,甚至限制了最先进 RAG 系统的性能。
6/11/2025 3:10:00 AM
Baihai IDP
构建生产级LLM应用完整指南:从原型到落地的全流程实践
一、LLM应用落地的真实挑战当Jasper AI的写作助手因意外流量在数小时内崩溃时,人们意识到:让LLM应用从实验室走向真实用户,绝非简单的代码迁移。 根据Anthropic 2024年开发者调查,73%的LLM应用在触达用户前折戟沉沙,问题并非出在AI模型本身,而是支撑系统无法应对真实世界的复杂性——用户的不可预测输入、API的偶发故障、成本的突然飙升,这些都是原型阶段未曾遭遇的“暗礁”。 本文将以实战为导向,结合代码示例与架构设计,详解如何将一个基于OpenAI API的简单聊天机器人,升级为具备容错能力、成本可控且可弹性扩展的生产级系统。
6/5/2025 2:45:00 AM
大模型之路
AI是否知道什么时候该"思考"?Thinkless教会大模型何时该动脑筋
你是否曾经问过简单问题,却得到AI长篇大论的回答? 或者问复杂问题时,AI却草草了事? 今天我要和大家分享一项突破性研究,它让AI学会了"什么时候该思考,什么时候该直接回答"。
5/23/2025 6:47:33 PM
无影寺
资讯热榜
阿里推出 AI 医学助手 App“氢离子”:收录千万级核心期刊文献,还可查疾病、找药品
MyShell ShellAgent 2.0发布:一句话创建App,零前端的AI革命来袭
Lovart 实战深度测评!仅需4小时帮你完成一整套品牌全案设计!
AI视频记忆革命来了!Memories.ai获800万美元融资,挑战千万小时视频分析极限
Memories AI携全球首个人工智能视觉记忆模型亮相,获800万美元种子轮融资
性能比肩 Gemini-2.5 pro、o4-mini:阿里通义千问 Qwen 3 推理模型超级进化,现已开源
刷新无监督异常检测上限!首提「匹配代价滤波for异常检测」范式 | ICML'25
智谱 GLM-4.5 系列 AI 模型踪迹曝光,预估采用新混合专家架构
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
AI创作
马斯克
论文
智能体
Anthropic
英伟达
代码
算法
Stable Diffusion
训练
芯片
开发者
蛋白质
腾讯
生成式
LLM
苹果
Claude
神经网络
AI新词
3D
研究
机器学习
生成
AI for Science
Agent
xAI
计算
人形机器人
Sora
AI视频
GPU
AI设计
百度
华为
搜索
大语言模型
工具
场景
具身智能
字节跳动
RAG
大型语言模型
预测
深度学习
伟达
视觉
Transformer
AGI
视频生成
神器推荐
亚马逊
Copilot
DeepMind
架构
模态
应用