AI在线 AI在线

理论

RAG系统的“聪明药”:如何用反馈回路让你的AI越用越聪明?

大家好,我是你们的AI技术侃侃而谈小能手。 今天我们来聊聊RAG(Retrieval-Augmented Generation,检索增强生成)系统的进化之路——如何让它像喝了聪明药一样,越用越聪明,越聊越懂你。 你是不是也有这样的体验?
7/1/2025 8:37:13 AM
许泽宇

模型极简主义:为企业节省数百万的新型AI策略

大型语言模型(LLM)的出现使企业更容易构想出它们可以承担的项目类型,从而推动了试点项目向部署阶段的迅猛发展。 然而,随着这些项目的推进,企业意识到之前使用的大型语言模型不仅笨重,而且成本高昂。 于是,小型语言模型和模型蒸馏技术应运而生。
7/1/2025 7:05:00 AM
Emilia David

运行时攻击如何让盈利的AI变成预算黑洞

AI以其带来变革性洞察和效率提升的潜力吸引了企业界的目光,然而,随着各企业急于将其模型投入运营,一个严峻的现实正浮现出来:AI将投资转化为实时业务价值的推理阶段正受到围攻,这一关键节点正以初始商业案例未能预测到的方式推高总拥有成本。 那些因AI项目的变革性优势而批准项目的安全主管和CFO,如今正面临捍卫这些系统的隐性开支。 对手已发现,推理是AI为企业“创造价值”的环节,也正是他们能造成最大破坏的地方。
7/1/2025 7:00:00 AM
Louis Columbus

AI 智能体通信:潜力与挑战并存的未来

大家好,我是肆〇柒,大型语言模型(LLM)进步,以其卓越的自然语言理解和生成能力,催生了 LLM 驱动的 AI 智能体这一创新技术。 这些 AI 智能体,作为 LLM 的进阶应用形态,不仅具备传统 LLM 的语言处理能力,更集成了感知、推理、决策与行动执行等多元化功能,实现了从单纯的信息处理向自主任务操作的跨越。 其应用范围横跨科学研究、工业生产、社会服务等多个关键领域,展现出改变世界运行模式的巨大潜力,市场预计将以年均 40% 的速度增长,至 2035 年市场规模有望突破 2168 亿美元。
7/1/2025 5:00:00 AM
肆零柒

马斯克Neuralink脑机接口新成果!看完头皮发麻

注意看,这些人正在用意念玩马里奥赛车。 他们的手没有动一下,靠脑电波控制就完成了移动、转弯、吃道具等一系列动作。 帮助他们通过“心灵感应”完成游戏操作的,就是马斯克Neuralink的脑机接口N1。
7/1/2025 4:45:00 AM
量子位

工业4.0中的人工智能应用及案例

想象一下,在一家工厂里,机器之间可以互相窃窃私语,在故障发生前预测故障,机器人实时调整任务来制造定制汽车。 这不是科幻小说,而是工业4.0的现实。 两年前,我通过VR参观了西门子的安贝格工厂,亲眼目睹机器人与人工智能协作,以99.9%的精度组装设备。
7/1/2025 3:00:00 AM
晓晓

RAG搭建个人LLM知识库助手,很多人第一步就走错了...

基于RAG技术搭建本地知识库问答助手,已经是相当普遍的应用方案了。 前一阵我在公司实践过,用我们过往积累的、对业务重要的内部知识构建知识库,开发了一个智能问答Agent,能减少团队一部分的答疑时间。 构建知识库时,我们将内部知识整理成了 MarkDown 格式。
7/1/2025 2:22:00 AM
渡码

AI Agent 体如何改变我们与网页的互动方式

AI 智能体(像 OpenAI Operator 这样的)能帮你自动完成网上找产品、管理浏览器标签等任务,简直是解放双手! 但要让这些智能体真正派上用场,挑战可不小。 这篇文章会聊聊 AI 智能体在网页互动中的现状、痛点,以及一个叫 Agentic Web Interfaces (AWIs) 的新解决方案。
7/1/2025 2:10:00 AM
AI研究生

视觉语言模型如何突破感知边界?上海 AI 新势力提出“世界意识”赋能真实环境规划

——如何让多模态智能体真正“看懂”世界并做出复杂决策“把切好的苹果片冰一下再丢进垃圾桶”——这样一条看似普通的自然语言指令,若让一台具身智能体(Embodied Agent)执行,其背后实则隐藏了多步规划、常识应用、环境理解、工具使用等一系列交互复杂度极高的子任务。 如何让 AI 理解任务的潜台词、合理分解步骤,并在真实视觉输入中找准对象并正确执行,正是当前具身智能与多模态学习面临的最大挑战之一。 具身智能与多模态规划的研究背景具身智能(Embodied Intelligence)可以被视为 AI 研究“从认知走向行为”的转折点。
7/1/2025 1:35:00 AM
FlerkenS

VSCode AI 编程必装!五款DeepSeek集成插件,每款都让开发效率飙升

AI 大模型对编程的影响已深入技术前沿,以 Cursor 为代表的对话式编程工具正融入开发工作流。 作为 AI 编程领域的明星产品,Cursor 功能虽强,但价格较高,因此开发者们需要寻找免费替代品。 VSCode 的性价比优势明显,其免费 AI 编程插件在性能上与 Cursor 相当,且伴随 DeepSeek 等国产大模型崛起,插件生态已完成对其适配。
7/1/2025 1:33:00 AM
学研君

微软新推出的小语言模型Mu,是端侧AI的最优解吗?

上周,微软宣布推出一款名为“Mu”的新型生成式人工智能(GenAI)系统,它让我们得以一窥未来我们使用各种设备(从个人电脑到烤面包机)的方式。 借助“Mu”,用户能够通过日常语言来操控电脑。 例如,你可以键入或说出“打开暗黑模式”或“让我的鼠标指针变大”等指令,电脑便会照做。
7/1/2025 1:00:00 AM

React + AI = ?

AI 的飞速发展正在重塑前端开发的边界。 除了生成 UI、编写代码,AI 现在具备了更强的“执行能力”——而 MCP,正是实现这一能力的关键技术。 2024 年 11 月,Anthropic 提出了 MCP(Model Context Protocol),一个开放协议,旨在为 AI 模型提供标准化的接口,用于调用外部工具与数据源,从而生成更准确、更具上下文理解的响应。
7/1/2025 12:00:00 AM
CUGGZ

亚马逊云科技全球首席企业战略总经理谈AI转型:85% 的 IT 预算都可能花错了地方;最大挑战并非技术,而是文化

编辑 | 云昭 嘉宾 | Phil Le-Brun“我是做技术出身的,但大多数时候听起来更像是心理学家。 ”当 Phil Le-Brun 被问及如何推动企业进行全球转型时,半开玩笑得把自己比喻成“心理学家”。 在他看来,无论是数字化转型还是现在的AI转型,其实真正要改变的是思维方式,而然后辅之以技术的配合。
6/30/2025 6:08:50 PM
云昭

OpenAI人才防线崩塌:被Meta一周内两度挖角七人

当 OpenAI 首席执行官萨姆・奥特曼还在坚持声称 "核心团队无人离职" 时,扎克伯格的挖角大军已在其研发阵营撕开巨大缺口。 6 月 29 日消息,Meta 在一周内第二次从 OpenAI 批量挖角 —— 继周一将苏黎世实验室三位核心研究员收入麾下后,本周五又签下感知团队负责人于佳慧及赵盛佳、毕树超、任泓宇四位骨干,七人全部加入 Meta"超级智能"(superintelligence)团队。 这场持续的人才突袭战,不仅让 OpenAI 的 AGI 研发力量遭遇重创,更暴露了生成式 AI 领域最残酷的生存法则:顶级人才储备已成为比模型参数更脆弱的防线。
6/30/2025 5:21:13 PM

Claude 开便利亏麻了!AI 被忽悠商品、打折成瘾,最后精神错乱…

近日,人工智能公司 Anthropic 进行了一项实验。 他们让自家的人工智能模型Claude,在办公室里经营一家小型实体商店,目标是测试人工智能在现实经济中自主运行的能力。 该实验是 Anthropic 与人工智能安全评估公司 Andon Labs 合作,他们将这个项目命名为“Project Vend”。
6/30/2025 2:04:56 PM

用好视觉Attention局部性,清华、字节提出Token Reorder,无损实现5倍稀疏、4比特量化

赵天辰,清华大学电子工程系高能效计算实验室研究生,研究方向主要是:面向视觉生成的高效算法,与软硬件协同设计近年来,随着视觉生成模型的发展,视觉生成任务的输入序列长度逐渐增长(高分辨率生成,视频多帧生成,可达到 10K-100K)。 与输入序列长度呈平方复杂度的 Attention 操作,成为主要的性能瓶颈(可占据全模型的 60-80% 的开销),有明显的效率优化需求。 注意力的稀疏化(Sparse Attention)与低比特量化(Attention Quantization)为常用的 Attention 优化技巧,在许多现有应用中取得优秀的效果。
6/30/2025 2:02:00 PM

ChatGPT化身生活操作系统:奥特曼预告下一代顶级AI

OpenAI计划发布一个非常强大的开源模型。 它能够让人们在本地运行极其强大的模型,重新认识“本地部署”的可能性。 在旧金山AI初创学校对话中,奥特曼宣布了以上消息。
6/30/2025 2:00:36 PM

AI编程里程碑!谷歌AI自己写代码惊呆工程师,GPU内核算法反超人类21%

谷歌的AlphaEvolve,还在不断创造新的奇迹。 在5月中旬,谷歌扔出的这个炸弹(号称是数学界AlphaGo的「第37步」时刻),就在不断冲击人们的认知——AI,已经拥有了自我进化能力! 随后,不断有开发者用代码证实,AlphaEvolve的矩阵乘法突破为真!
6/30/2025 2:00:14 PM