AI在线 AI在线

资讯列表

一文读懂AI应用上下文工程(Context Engineering)

或许你已是一名AI应用提示工程高手,但随着对话的推进,你的聊天机器人常常会忘记你最初且最重要的指令内容,你的代码助手会丢失项目架构的线索,而你的检索增强生成(RAG)工具无法在复杂文档与不同领域间建立信息关联。 随着AI应用场景日益复杂,编写精妙的提示词只是更大挑战中的一小部分——这个挑战就是上下文工程。 在本指南中,我将阐释什么是上下文工程、它如何运作、何时应替代常规提示工程使用它,以及能让AI系统更智能、更具上下文感知能力的实用技巧。
10/14/2025 1:55:00 AM
旺知识

深层网络通过分层抽象能够学习到更复杂的特征表示,从而提升模型对复杂数据的建模能力

神经网络层数越多效果越好这一观点,在特定条件下成立,其核心逻辑在于深层网络通过分层抽象能够学习到更复杂的特征表示,从而提升模型对复杂数据的建模能力。 图片理论机制:分层抽象与特征表示能力增强特征抽象的层次化神经网络通过堆叠层数实现特征的逐层抽象。 以图像识别为例:底层:学习边缘、纹理等简单特征(如卷积核检测水平/垂直边缘);中层:组合底层特征形成形状、部件(如检测车轮、车窗);高层:整合中层特征构成完整对象(如识别整辆汽车)。
10/14/2025 1:11:00 AM
幻风magic

思考不是免费的,大型语言模型推理的收益与代价

对于人工智能智能体,谈判是一场最接近人类智慧的“角斗”,它不仅仅是语言的堆砌,更是策略的博弈、心理的揣摩和利益的权衡。 人类社会和经济活动中,谈判无处不在,从商场里的价格讨价还价,到国际政治的桌面博弈,都是智慧与策略的交锋。 对于AI代理来说,能否在谈判中表现出色,直接决定了它们能否真正走向自主决策的未来。
10/14/2025 1:00:00 AM
波动智能

让AI说"人话":TypeChat.NET如何用强类型驯服大语言模型的"野性"

引言:当AI开始"听懂人话"时发生了什么? 想象一下这样的场景:你走进咖啡厅,对着智能点餐系统说:"来杯大杯拿铁,少糖,加燕麦奶,要热的。 "系统不仅准确理解了你的需求,还把订单转换成了结构化数据——饮品类型、尺寸、温度、配料,一个都没落下。
10/14/2025 12:25:00 AM
许泽宇

官宣定档11月13日!百度世界2025将于北京举办

10月13日,百度官方公众号宣布,百度世界2025将于11月13日在北京·国家会议中心二期举办,大会官网()现已开启售票通道。 作为百度一年一度最重要的技术和产品发布会,本届百度世界或将全面展示百度在AI应用、大模型、AI生态、出海等方面的最新进展。 据悉,百度世界2025以「效果涌现|AI in Action」为主题,设置1 6场顶尖论坛。
10/13/2025 7:33:35 PM
henry

网约车元老入局自动驾驶:川大校友,前滴滴SVP

出行领域大牛,加盟车联网明星。 智能车参考获悉,前滴滴高级副总裁付强已出任蘑菇车联首任总裁,负责公司AI业务和商业化落地。 蘑菇车联专注于车路云一体化赛道,是在车路协同方向上探索Robotaxi的玩家之一,此前开发了路侧基站、云端智慧平台、Robobus等多项产品,打造了交通大模型MogoMind。
10/13/2025 7:05:30 PM
一凡

大模型赋能文化遗产数字化:古籍修复与知识挖掘的技术实践

在文化遗产数字化领域,大模型的核心应用难点在于如何处理古籍中大量的异体字、残缺文本与模糊语义,尤其是面对明清时期的手写残卷,传统的文字识别技术不仅准确率低下,更无法理解古籍中蕴含的历史语境与专业术语。 我在参与某博物馆古籍数字化项目时,首先遭遇的便是大模型对古籍文字的“识别盲区”—初期使用通用大模型识别一本明代医学残卷,发现其将“癥瘕”误判为“症痕”,把“炮制”错解为“泡制”,更无法关联“君臣佐使”等中医方剂配伍逻辑,导致提取的知识完全偏离原意。 为解决这一困境,我没有直接进行模型微调,而是先搭建“古籍文字与语境知识库”:通过整理《说文解字》《康熙字典》等权威字书,以及近现代古籍整理学术成果,构建包含5000 异体字、通假字的对照词典,每个文字标注字形演变、常见语境与释义差异;同时,针对医学、天文、历法等专业领域古籍,收集对应的行业术语库,标注术语的历史用法与现代对应概念(如“勾陈”对应天文领域的“小熊座”)。
10/13/2025 6:10:28 PM
许辉

推理速度10倍提升,蚂蚁集团开源业内首个高性能扩散语言模型推理框架dInfer

近日,蚂蚁集团正式开源业界首个高性能扩散语言模型(Diffusion Large Language Model,dLLM)推理框架 dInfer。 在基准测试中,dInfer 将 dLLM 的推理速度相比于 Fast-dLLM 提升了 10 倍以上,并在关键的单批次(batch size=1)推理场景下,作为首个开源框架实现了大幅超越经过高度优化的自回归(AR)模型的性能里程碑,在 HumanEval 上达到 1011 tokens / 秒的吞吐量 。 dInfer 通过一系列算法与系统协同创新,攻克了 dLLM 的推理瓶颈,兑现了其内生并行生成带来的推理效率潜力。
10/13/2025 5:40:00 PM
机器之心

​OpenAI 与微软达成重磅交易:股权结构再变,投资者面临稀释风险

《金融时报》报道了 OpenAI 近期一系列重要交易,这些交易让公司的股权结构变得更加复杂,也令投资者对于未来的回报更加不确定。 根据这些交易,OpenAI 成为了全球最有价值的非上市公司,估值高达5000亿美元。 这一成果主要得益于与芯片制造商英伟达和 AMD 签订的数十亿美元合同,这些资金将助力 OpenAI 在未来几年实现部署1万亿美元算力的目标。
10/13/2025 5:32:05 PM
AI在线

蘑菇车联加速AI商业化 前滴滴高管付强加盟任总裁

近日,智能交通与AI基础设施公司蘑菇车联发布内部公开信,宣布重大人事任命:原滴滴高级副总裁付强正式加入公司,出任总裁一职。 他将全面负责蘑菇车联AI业务的战略落地与商业化布局。 付强在智能出行领域拥有超过十年的丰富经验。
10/13/2025 5:32:05 PM
AI在线

OpenAI联手阿根廷,投资250亿美元打造超级数据中心

近日,OpenAI 与阿根廷能源公司 Sur Energy 签署了一项意向书,计划在阿根廷投资高达250亿美元,建设一个规模庞大的数据中心。 这一项目不仅是阿根廷历史上最大的信息技术和能源基础设施项目之一,还将为该国的科技发展注入新的动力。 根据协议,这座数据中心将具备500兆瓦的计算能力,专门支持先进的人工智能计算。
10/13/2025 5:32:03 PM
AI在线

Perplexity CEO 宣布告别 PPT,借助 AI 实现投资者路演新模式

在人工智能技术不断发展的今天,许多传统商业活动也在悄然发生变化。 近日,AI 搜索工具 Perplexity 的联合创始人兼 CEO 阿拉文德・斯里尼瓦斯在伯克利哈斯商学院的采访中表示,他已经放弃了传统的融资演示文稿(PPT),转而使用人工智能来完成投资者路演。 图源备注:图片由AI生成,图片授权服务商Midjourney斯里尼瓦斯提到,自己在 A 轮融资时仅制作了一次路演幻灯片,而之后的融资活动都依赖于 AI 的协助。
10/13/2025 5:32:01 PM
AI在线

马来西亚迎来 AI 新纪元,ChatGPT Go 助力数字化转型

近日,OpenAI 在马来西亚推出了全新的 ChatGPT Go 订阅服务,月费仅为38.99马币(约9.25美元),大幅降低了 AI 高级功能的使用门槛。 此次推出的 ChatGPT Go 不仅包括了最新的 GPT-5模型,还提供了丰富的功能,如图片生成、文件上传及记忆功能,极大地提升了用户的体验。 这一举措正值马来西亚 AI 用户数量在过去一年中激增的背景下进行,OpenAI 希望通过更亲民的价格吸引中端用户和学生,进而扩展用户基础。
10/13/2025 5:31:58 PM
AI在线

拒绝“熵崩塌”和“熵爆炸”!这项研究让大模型推理成绩飙升

大语言模型在RLVR训练中面临的“熵困境”,有解了! 2024年以来,以OpenAI o1、DeepSeek-R1、Kimi K1、Qwen3等为代表的大模型,在数学、代码和科学推理任务上取得了显著突破。 这些进展很大程度上得益于一种名为RLVR (基于可验证奖励的强化学习)的方法。
10/13/2025 5:12:43 PM
一水

Sora2“复活”已故名人,家属强烈反对

时令 发自 凹非寺. 量子位 | 公众号 QbitAISora 2的迅速走红,让肖像权问题再次成为焦点。 毕竟有的人为了博取流量和讨论度,甚至不惜用已故名人生成视频。
10/13/2025 5:06:50 PM
时令

推理性能提升10倍!蚂蚁集团开源业内首个高性能扩散语言模型推理框架dInfer

10月13日,蚂蚁集团正式开源业界首个高性能扩散语言模型推理框架dInfer。 在基准测试中,dInfer将扩散语言模型的推理速度相比于英伟达扩散模型框架Fast-dLLM提升了10.7倍;在代码生成任务HumanEval上,dInfer在单批次推理中创造了1011Tokens/秒的速度,首次在开源社区中实现扩散语言模型的单批次推理速度显著超越自回归模型。 dInfer的工作表明,扩散语言模型具备显著的效率潜力,可以通过系统性的创新工程兑现,为通往AGI的架构路径提供极具竞争力的选项。
10/13/2025 5:04:05 PM
henry

谷歌重磅发布Gemini 2.5 Computer Use - AI代理首次实现真正的计算机控制

就在今年早些时候,谷歌曾承诺要通过Gemini API为开发者带来计算机使用能力。 如今,这个承诺终于兑现了。 谷歌DeepMind正式发布了Gemini 2.5 Computer Use模型,这是一个基于Gemini 2.5 Pro视觉理解和推理能力构建的专用模型,能够驱动AI代理与用户界面进行真正的交互。
10/13/2025 3:54:12 PM
阿丸笔记

刚得诺奖的成果被做成芯片了

谁说获得诺贝尔化学奖的MOF(金属有机框架)“无用”? 这种几十年前被嫌弃“只有理论但缺乏实际应用”的新材料,前脚刚获得诺奖认可,后脚就被做成芯片! 这就是莫纳什大学的科学家们刚刚发布的最新成果——用MOF制造超迷你的流体芯片。
10/13/2025 3:53:23 PM