AI在线 AI在线

理论

构建切实有用的机器学习模型的七个提示

译者 | 布加迪审校 | 重楼这篇实用指南帮助你从概念验证迈入到生产就绪的机器学习。 构建能够切实解决实际问题的机器学习模型不仅仅需要在测试时取得高准确率得分,更需要构建能够在生产环境中持续运行的系统。 本文介绍了七个实用技巧,帮助你专注于构建能够提供可靠业务价值而非仅仅追求出色指标的模型。
9/4/2025 8:06:34 AM
布加迪

当RAG遇上MCP...

随着基础模型能力的不断增强,现实世界中的应用场景对人工智能提出了更高的要求,推动其向更具上下文感知能力、依赖外部信息检索以及由智能智能体驱动的方向发展。 为了满足这些需求,诸如检索增强生成(RAG)和MCP等关键技术正逐步成为构建现代AI系统的核心组成部分。 简要回顾检索增强生成(RAG)是一种结合语言模型与外部知识库的方法,使模型能够在生成回答之前,先通过向量搜索或语义搜索技术检索相关的文档内容。
9/4/2025 7:52:16 AM
曹洪伟

大语言模型为何难以突破科学瓶颈——每位快消行业的高管必须了解的真相

我们正处在一个时代,GenAI能够在几分钟内起草复杂的法律协议,在几秒钟内设计出合理的营销活动,并可按需在数十种语言之间自由切换。 从早期的机器学习模型到如今的GPT-4、Claude、Gemini等大型语言模型(LLM),能力的跃升堪称惊人。 因此,企业高管提出一个合理的疑问:如果AI能写出一篇令人信服的研究论文,或者模拟一场技术对话,为什么不能开展科学实验?在某些圈子里,甚至流传着一种说法:科学家可能很快会像旅行社代理人或电影放映员一样,被“颠覆”到无关紧要。
9/4/2025 7:00:00 AM
Kumar

AI能否像人类一样“按步骤”推理?一项数学证明的答案

在过去几年里,大语言模型(LLM)与深度学习的浪潮席卷了几乎所有计算领域。 从医学诊断到金融建模,从化学分子设计到物理模拟,这些模型在推理任务上的表现一次次刷新了人们的认知。 它们不仅能处理复杂的自然语言,还能跨越模态边界,将图像、语音、代码等信息融会贯通,展现出惊人的“多才多艺”。
9/4/2025 1:45:00 AM
FleakenS

一步步教你用 Streamlit + Pydantic AI 搭建深度研究智能体应用

如果你曾经好奇如何通过结合智能的后端 Agent 和流畅的交互式前端来释放人工智能的真正力量,那你来对地方了! 今天,我们将把你的知识提升到一个新高度,通过将强大的 Pydantic AI 研究 Agent 作为后端,与动态的 Streamlit 界面作为前端进行整合。 AI 的世界发展得快如闪电。
9/4/2025 1:44:00 AM
AI研究生

构建AI工作流与智能体的信任:持续评估与优化指南

在人工智能技术飞速发展的当下,开发并部署一款AI驱动的应用已不再是遥不可及的目标。 开发者们耗费数小时打造智能体或复杂工作流,经过有限的手动测试后,便满怀信心地认为其概念可行。 然而,初始测试结束后,故事往往并未迎来圆满结局——许多AI应用被直接部署,随后便陷入“自生自灭”的境地,性能无声且往往灾难性的衰退也自此开始。
9/4/2025 1:35:00 AM
大模型之路

Hinton最新警告:杀手机器人或将带来更多战争,最大担忧是AI接管人类

Couric:如果你能把奥特曼和马斯克请到同一张桌子上,你会对他们说什么?   Hinton:我会说:你们很清楚,你们正在开发的东西,很可能把人类毁灭掉。 近期,「AI教父」Geoffrey Hinton,在与《Next Question》主持人Katie Couric对话时,直言不讳地说出了内心对AI安全的忧虑。
9/4/2025 1:25:11 AM
新智元

推理大模型机制解析!为什么Qwen3要把脑子一分为二?

近期,Qwen3模型的一个重大转变,让整个行业都在重新思考一个根本问题:推理大模型到底应该什么时候思考,什么时候直接给答案? 这已不再是技术问题,也是关乎AI产品体验的核心议题...Qwen3的"分家"背后:理想很丰满,现实很骨感回到今年4月,Qwen3刚发布时,阿里团队雄心勃勃地推出了"混合思考模式"。 听起来很美好:一个模型既能快速响应简单问题,又能深度思考复杂任务。
9/4/2025 1:00:00 AM
大数据AI智能圈

ICLR 2025|KGExplainer:让新知识的发现“有理可循”

你是否想过,基于知识图谱的知识发现模型不仅能告诉你“答案”,还能解释“为什么”? 设想一下,当 AI 系统预测“某种药物可能治疗某种疾病”时,它不仅给出结果,还能同时展示背后的逻辑路径——涉及的分子、关系和机制。 这听起来像是科研人员梦寐以求的“透明 AI”,但在实际中,却是一道长期悬而未解的难题。
9/3/2025 2:36:00 PM
新闻资讯

UCSD首个智能体浏览器发布!多页面设计,颠覆传统交互

我们早已习惯那排拥挤的标签页,这种线性堆叠在信息发现与跨页整合时不仅加重负担,也制造了高昂的管理成本。 预订旅行酒店便是例子:用户需在多个选项间权衡比较、了解均价,并结合机票与活动随时调整计划,而单页式浏览器迫使用户反复切换界面,频频丢失上下文。 即便是基于传统范式的AI浏览器,如Arc的Dia或Perplexity的Comet,也只是在单页框架下加入了智能体功能。
9/3/2025 2:05:11 PM

用“因果规划”解决多智能体协作中的任务依赖难题|港科广&腾讯

在长周期、多步骤的协作任务中,传统单智能体往往面临着任务成功率随步骤长度快速衰减,错误级联导致容错率极低等问题。 为了应对这些问题,就需要构建具备全局规划与因果依赖管理能力的分布式智能体框架,并在真实游戏中验证效能。 基于此,来自港科广和腾讯的研究团队提出了CausalMACE方法,通过将因果推理机制系统性地引入开放世界多智能体系统,为复杂任务协同提供了可扩展的工程化解决方案。
9/3/2025 2:05:11 PM

大模型“记性差一点”反而更聪明!金鱼损失随机剔除token,让AI不再死记硬背

训练大模型时,有时让它“记性差一点”,反而更聪明! 大语言模型如果不加约束,很容易把训练数据原封不动地复刻出来。 为解决这个问题,来自马里兰大学、图宾根大学和马普所的研究团队提出了一个新方法——金鱼损失(Goldfish Loss)。
9/3/2025 2:02:08 PM

Claude Code之父爆料设计理念!“尽量简单”和“黑客性”是原则!新手甭上来就写代码!手工代码不会消失!

编辑 | 伊风刚刚,Anthropic 完成了 130 亿美元 F 轮融资! 估值一举飙升至 1830 亿美元,距离竞对 OpenAI 的 3000 亿美元大关又逼近了一步。 图片在这条资本狂飙曲线背后,一个关键词不容忽视:Claude Code。
9/3/2025 2:01:58 PM
伊风

Nano Banana官方提示词来了,附完整代码示例

Nano banana正火爆全球,谷歌立马推出官方提示词指南。 下面先进行一些效果展示,看看它的强大之处。 借助Nano-banana、Seedance和Kling,梵高、蒙娜丽莎、戴珍珠耳环的少女都能在纽约中央公园里合照。
9/3/2025 2:01:41 PM

语音分离最全综述来了!清华等团队深度分析200+文章,系统解析「鸡尾酒会问题」研究

语音分离领域针对具有挑战性的 “鸡尾酒会问题”,随着深度神经网络 (DNN) 的发展,该领域取得了革命性的进展。 语音分离可以用于独立应用,在复杂的声学环境中提高语音清晰度。 此外,它还可以作为其他语音处理任务(如语音识别和说话人识别)的重要预处理方法。
9/3/2025 2:00:08 PM

其实,扩散语言模型在最终解码之前很久,就已确定最终答案

随着扩散语言模型(DLM)在各个领域的快速发展,其已成为自回归(AR)模型有力的替代方案。 与 AR 模型相比,DLMs 的主要优势包括但不限于:高效的并行解码和灵活的生成顺序。 尽管 DLMs 具有加速潜力,但在实际应用中,其推理速度仍慢于 AR 模型,原因在于缺乏 KV-cache 机制,以及快速并行解码所带来的显著性能下降。
9/3/2025 1:59:34 PM

从复刻魔术开始,RoboMirage打开了机器人仿真的新世界

在具身智能的发展路径中,如何获得海量且高质量的数据是行业绕不开的核心问题。 如果说大语言模型依赖于互联网规模的语料库,那么具身智能的成长同样需要规模化的交互经验。 现实中,收集这些数据的代价极高:机械臂等硬件部署成本高,单台投入就需数万元,且难以规模化;数据采集环节依赖经验丰富的数采员且耗时漫长。
9/3/2025 1:59:02 PM

苹果机器人负责人也被小扎挖走了!浙大校友,任职Meta机器人技术一号位

苹果又失去了四名AI研究员,其中三人是华人。 彭博社长期跟踪苹果公司的古尔曼称,苹果机器人研究小组首席AI研究员Jian Zhang将跳槽到Meta,且消息已获Meta证实。 除了已经实锤的Jian Zhang,古尔曼还爆料,基础模型团队也有三人即将离职。
9/3/2025 1:58:18 PM