AI在线 AI在线

理论

RL 驱动 LLM 智能体:ML-Agent 创新自主机器学习工程

大家好,我是肆〇柒。 这两天看到一篇关于自主进化智能体的论文,本篇就让我们一起了解一下这个机器学习工程的的研究 ——ML-Agent。 在当下,机器学习工程已成为科技创新的关键驱动力。
6/10/2025 4:00:00 AM
肆零柒

小红书hi lab首次开源文本大模型,14个checkpoint覆盖Pretrain与Instruct阶段

01、简介小红书hi lab(Humane Intelligence Lab,人文智能实验室)团队首次开源文本大模型 dots.llm1。 dots.llm1是一个中等规模的Mixture of Experts (MoE)文本大模型,在较小激活量下取得了不错的效果。 该模型充分融合了团队在数据处理和模型训练效率方面的技术积累,并借鉴了社区关于 MoE 的最新开源成果。
6/10/2025 3:30:00 AM

多模态推理模型(LMRM):从感知到推理的演变

大家好,我是肆〇柒。 当下,人工智能正以前所未有的速度改变着我们的生活与工作方式。 其中,推理作为人工智能的核心能力之一,赋予了智能体在复杂环境中做出决策、得出结论以及进行知识泛化的能力。
6/10/2025 3:30:00 AM
肆零柒

我们一起聊聊聊聊智能体的基础架构

2023年下半年,智能体这个概念开始随着AI的突进式发展而被很多人关注起来。 到了2024年,大模型的能力进一步增强,为智能体快速发展提供了底层能力支撑。 随着2025年DeepSeek的爆火,智能体在各行各业的落地应用案例开始明显增加。
6/10/2025 3:00:00 AM
写文章的老张

盘点RAG中最容易犯的五个错误

我大部分时间都在构建和改进 Retrieval-Augmented Generation (RAG) 应用。 我相信 RAG 可能是最受欢迎的 AI 应用之一。 它无处不在,从聊天机器人到文档摘要。
6/10/2025 3:00:00 AM
AI研究生

告别 RAG 还太早?听听 Anthropic 怎么说

你有没有向你的RAG系统问过一个具体问题,却得到一个令人沮丧的模糊答案? 你并不孤单。 以下是一个巧妙的改进方法如何改变游戏规则。
6/10/2025 2:44:00 AM
AI研究生

智能体式推理与工具集成:ARTIST 基于强化学习的新思路

大家好,我是肆〇柒。 这两天,我看到一篇论文《Agentic Reasoning and Tool Integration for LLMs via Reinforcement Learning》讲述的是ARTIST 框架,为 LLM 赋予智能体式推理与工具集成的全新维度。 今天,就一起了解一下这个 ARTIST 框架,看看 LLM 如何借助强化学习突破局限,开启智能体式推理与工具集成。
6/10/2025 2:30:00 AM
肆零柒

AI疯狂进化6个月,一张天梯图全浓缩!30+模型混战,大神演讲爆火

半年之期已到,AI龙王归位! (AI卷成啥样了? )就在刚刚,AI圈大神Simon Willison在旧金山AI工程师世博会(AI Engineer World’s Fair)上带来爆笑又干货满满的主题演讲:「过去六个月中的LLM——由骑自行车的鹈鹕来解释」。
6/10/2025 2:10:00 AM

一文讲清楚大模型中六个关键词及原理:LLM、Transformer、Bert、预训练、微调FineTuning、机器学习

什么是大模型,相信每个人都能说上一个一二三点来。 比如:OpenAI、ChatGPT、DeepSeek、豆包、Manus等。 也知道大模型需要做训练与推理。
6/10/2025 1:00:00 AM
Zack之云原生

AI成为企业勒索软件防御的关键角色

支付赎金并不总是能带来预期的结果,约四分之一支付赎金的受访者表示,他们没有拿回所有数据,在英国这一比例上升到了三分之一,即使他们拿回了数据,对手仍可能会尝试将其变现。 “勒索软件已经演变成一种形态多变、AI驱动的威胁,任何企业都不能掉以轻心,”Delinea的CEO Art . Gilliland表示,“为了应对当今攻击的复杂性,企业必须利用AI对抗AI,并采取主动的身份安全策略,如零信任架构、特权访问管理和持续的凭证监控,以保持领先。
6/10/2025 12:20:00 AM
D1net编译

83% 员工用 AI 却工资不变,NBER研究揭露:AI 带来的时间红利被谁吞了?

2025 年,ChatGPT 已进入千行百业。 但一项来自丹麦的研究提醒我们,流行并不等于变革。 图注:论文标题“Large Language Models, Small Labor Market Effects”这项覆盖 2.5 万名员工、7000 家公司的调研数据显示:即便像 ChatGPT 这样的生成式 AI 已被广泛使用,它对员工工资、工作时长、雇佣状况等核心劳动指标的影响几乎为零。
6/10/2025 12:00:00 AM

奇作!现在的AI脚本僵化臃肿、万金油、一遇混乱就崩溃!骑单车荷兰一日游,竟然改变了我对AI的看法:MCP、A2A应该是这样!

作者 | Natasha Wijesekare编译 |  云昭智慧总是藏在自然之中。 而作为人工制造的AI,更不例外。 然而对于感悟 AI 而言,有时候却需要我们换个环境去散散心。
6/9/2025 5:35:59 PM
云昭

AI 成本直降 90%!女股神 Cathie Wood 圈定 3 条迁徙线:Robotaxi、端侧大模型、AI 医药

(视频来源:对话ARK Invest创始人Cathie Wood)北京时间 6 月 5 日,在《The Diary of a CEO》最新一期节目中,ARK Invest 创始人、掌管 300 亿美元资产的‘女股神’  Cathie Wood(凯茜·伍德),用三组数据划出 AI 落地的爆发路径:训练侧:过去两年,GPT-3 级别模型的训练成本从 460 万美元跌到 45 万美元,年降幅约 70%,堪称“断崖式”跳水;应用侧:ARK 测算 Robotaxi 单英里成本可低至 0.25 美元,比现有网约车便宜近 90%;消费侧:AI 代理激发的新消费行为,2030 年线上支出或达 9 万亿美元,改写全球最大产业链的资金流。 在同一天,特朗普在 Truth Social 威胁“取消特斯拉全部政府合同”,引发政商关系骤然紧张。 但 Cathie Wood 的判断更冷静、更本质:“Robotaxi 的成败,关键不是谁在互呛,而是成本模型能不能跑通。
6/9/2025 5:32:09 PM

奥特曼ChatGPT用法错了!最新研究:要求“直接回答”降低准确率,思维链提示作用也在下降

奥特曼使用大模型的方法,竟然是错的? 来自沃顿商学院等机构的最新研究发现,备受奥特曼喜爱的“直接回答”提示,竟然会显著降低模型准确率。 图片不过另一方面,这项研究也发现,在提示词中加入思维链(CoT)命令同样不好用——CoT提示对于推理模型非但没有效果提升,反而会增加时间和计算成本。
6/9/2025 3:26:53 PM

影视级3D生成新王:Direct3D-S2全面开源!8块GPU超越闭源登顶HF

HuggingFace是全球最大的开源大模型社区,汇集了来自世界各地的上百个开源大模型。 其趋势榜(HuggingFace Trending)展示了各类开源大模型在全球开发者中的受欢迎程度,DeepSeek、Qwen等大模型就因曾登顶HuggingFace榜单而获得了全球开发者的关注与热议。 可以说,这是当前最具权威性的榜单之一。
6/9/2025 3:25:43 PM

3B超越DeepSeek,大模型终于理解时间了!Time-R1一统过去/未来/生成

时间,是我们日常生活中最基础的概念。 但对于大语言模型(LLM)来说,它们或许能写诗作画、通晓古今,但在真正理解和运用时间概念时,却常常显得力不从心。 这个技术短板来自于大模型的底层设计,无法避免:训练语料库是静态的,存在知识截断时间;在按非时间顺序的语料训练过程中,跨越不同时期的时间信息是同时处理的,不像人类逐步接收知识,阻碍了在事件与其对应时间之间建立可靠的逻辑映射。
6/9/2025 3:25:03 PM

高考作文“抽象”上热搜,大模型来战能拿几分?

6月7日上午,2025年全国高考正式拉开帷幕。 首场语文考试结束后,作文题目便迅速成为众人讨论的焦点。 有网友表示,今年的高考作文太难了,甚至是有些抽象。
6/9/2025 3:23:26 PM
Yu

Cursor1.0 发布引热议!高风险后台智能体埋雷点,网友:用VS Code分叉是战略性错误!最多150万付费用户!

作者 | Tim Anderson出品 | 51CTO技术栈(微信号:blog51cto)上周周末,Anysphere 正式发布了其 AI 编辑器 Cursor 的 1.0 版本,并引入了多项新功能,包括自动审查 Pull Request(PR)并发现问题的 BugBot 预览版、可在远程环境中修改代码的 Background Agent(后台智能体)功能、能记忆并引用 AI 对话信息的 Memories(记忆)功能以及一键安装MCP的功能。 然而,在真实的开发者当中,人们对于 Cursor 的评价开始出现了不一样的声音,不少网友认为 Cursor 单 IDE 的孤岛打法有违开发者的习惯,开发者更喜欢“多 IDE 多任务 多 AI”无缝接入现有工具链的产品;另有一些网友认为 Cursor 最好的归宿是被七大 AI 巨头收购。 此外,本文还带领大家梳理了目前海外AI编程产品的竞争格局。
6/9/2025 2:13:54 PM