AI在线 AI在线

资讯列表

斯坦福7B智能体全面超越GPT-4o,推理流登顶HF

当前AI Agent的发展正陷入两难的境地:一方面,训练「全能型」大模型让其同时承担推理、规划与工具调用,虽具一体化优势,但在长链推理中往往训练不稳定、扩展性受限;另一方面,基于prompt的智能体系统虽具灵活性,却缺乏学习与自我优化能力,无法从交互中持续进化。 如何突破这一瓶颈? 斯坦福大学联合德州农工大学(Texas A&M)、加州大学圣地亚哥分校(UC San Diego)和Lambda的研究团队给出了新答案:让智能体系统在推理「流」中进行在线强化学习,从而实现持续的自我提升与能力进化。
11/4/2025 8:42:27 AM

我为马斯克扮演机器人!擎天柱背后竟是最贵「演员团」

万圣节当天,特斯拉擎天柱(Optimus)亮相纽约时代广场,为现场观众分发糖果。 在特斯拉餐厅里,它还为马斯克卖苦力,亲自为顾客递上了一份爆米花。 这些光鲜演示的背后,是由一支血肉之躯组成的「数据大军」在默默支撑。
11/4/2025 8:39:35 AM

实战:SpringBoot+MCP 让你的系统秒变AI助手

在人工智能技术快速演进的今天,大语言模型正在重新定义软件与用户的交互方式。 传统的图形界面和复杂API正在被一种更加直观的交互模式所补充——自然语言对话。 用户不再需要翻阅冗长的技术文档或在多层菜单中导航,只需用日常语言表达需求,比如"请帮我筛选去年出版的所有编程类书籍"或"创建一个新用户,姓名为张三,邮箱为[email protected]"。
11/4/2025 7:52:48 AM

LangChain 大模型应用开发框架:从 RAG 到 Agent 的完整指南

在AI大模型时代,Python以23.08%的市场份额连续五年稳居编程语言榜首,在AI、数据科学、深度学习等前沿技术中的应用尤为广泛。 而LangChain作为一个基于大语言模型(LLM)的应用程序开发框架,提供了一整套工具、组件和接口,简化了创建大模型应用程序的过程,已经成为大模型应用开发的事实标准。 本文将从零到一地介绍如何使用LangChain构建从检索增强生成(RAG)到智能代理(Agent)的完整应用。
11/4/2025 7:15:00 AM
用户007

AI聊天机器人正滑向隐私危机

AI聊天工具正逐渐占据办公室场景,但隐私成本几何?用户在聊天界面中常感到匿名,可能会在未意识到风险的情况下分享个人数据。 网络犯罪分子也发现了同样的漏洞,AI聊天对话中分享的信息最终引发重大数据泄露事件可能只是时间问题。 当工作场所工具缺乏监管时专家警告称,用户在使用ChatGPT或Gemini等平台时应保持警惕,因为看似简单的交流仍可能留下持久的数据痕迹。
11/4/2025 7:00:00 AM
Sinisa

超多案例!深度测评 Lovart 全新图像分层功能和2个AI视频模型

嗨大家好! 我是阿真! 前段时间就有朋友每天催我说海螺2.3视频模型在内测了,可惜我没有内测机会,只能等上线了再测试。
11/4/2025 5:05:01 AM
阿真Irene

别慌,为什么人工智能无法取代你

在人工智能驱动的世界中,发现那些让你保持价值的独特人类特质。 如今,人人都在担忧:“人工智能会不会抢走我的饭碗? ” 事实上,人工智能领域充斥着大量的炒作。
11/4/2025 5:00:00 AM
晓晓

AI驱动的漏洞搜寻正在颠覆赏金行业

安全研究人员正利用大语言模型实现侦察自动化、逆向工程API,并以前所未有的速度扫描代码库。 通过将AI工具应用于从模糊测试、漏洞利用自动化到跨代码库和网站的模式识别等各种技术,研究人员正以更快的速度发现漏洞。 HackerOne高级漏洞赏金计划经理Crystal Hazen表示:“过去一年,我们进入了所谓的‘仿生黑客’时代,即人类研究人员利用自主式AI系统收集数据、进行分类并推进发现。
11/4/2025 5:00:00 AM
John

RAG系统文本分块实用指南:借助ChunckerFlow突破分块困境

检索增强生成(RAG)已成为现代AI应用的核心,从问答系统到智能文档检索均有广泛应用。 但一个常被忽视的关键问题正悄然破坏RAG性能:文本分块质量低下。 分块决策会贯穿整个RAG流水线——分块过大导致检索精度下降,过小则丢失关键上下文,边界不当则割裂完整语义。
11/4/2025 4:15:00 AM
大模型之路

Ditto:用百万级合成数据破解指令视频编辑的“不可能三角”

大家好,我是肆〇柒。 今天我们来探索一下来自香港科技大学(HKUST)与蚂蚁集团联合团队的最新研究成果——Ditto框架。 这项工作直面当前AIGC领域最棘手的挑战之一:为什么我们能轻松用一句话修改图片,却难以对视频做同样操作?
11/4/2025 4:00:00 AM
肆零柒

Spring AI Agents 震撼发布:下一代 AI 开发范式已来!

在刚刚落幕的 GitHub Universe 2025 大会上,GitHub 发布了其平台的颠覆性进化——Agent HQ(智能体中控)。 它为开发者提供了一个统一的工作流,使其能够在任何时间、任何地点协调任何智能体。 3NjV1kAgent HQ 旨在将 GitHub 转变为一个开放的 AI 生态系统,在单一平台上整合所有主流智能体。
11/4/2025 3:20:00 AM
JAVA架构日记

整体生成 × 精准控制:HoloCine 如何实现分钟级电影叙事?

大家好,我是肆〇柒。 今天我们一起了解一项来自香港科技大学(HKUST)与蚂蚁集团(Ant Group)联合团队的创新研究——HoloCine。 这项研究首次实现了分钟级、多镜头、高一致性的电影级视频整体生成,不仅在Transition Control指标上达到0.9837(远超现有方法),更展现出对镜头语言、角色记忆甚至电影术语的“理解”能力。
11/4/2025 3:00:00 AM
肆零柒

2025 年最火的五大 MCP 服务器,打造极致「Vibe Coding」体验

如果你还在手动把上下文贴给 AI,或者把数据库 schema 复制给 Cursor 帮它理解项目,你真的做多了。 我最近在折腾这些新的 MCP 工具,哇——它们_彻底_改变了我用 AI 搭建项目的方式。 来分析下为什么——以及为什么这些工具能让 AI 从“看着挺可爱”变成“真的有用”。
11/4/2025 2:35:00 AM
AI研究生

Agentic AI:单智能体 vs 多智能体系统的核心差异

在 LangGraph 中基于结构化数据源构建。 在 LangGraph 中构建不同的 agent 系统 | Image by author如果你不是会员但想阅读原文,请点击这里。 如果你刚开始搭建不同的 agentic 系统,一个有趣的切入点是比较单智能体工作流与多智能体工作流,或者说更灵活的系统与更可控的系统之间的差异。
11/4/2025 2:22:00 AM
AI研究生

从AI到泰勒·斯威夫特——源于生活的案例与启示

《金融时报》与三家最大的案例出版商——哈佛商企影响出版社、毅伟商学院出版社和案例中心——合作,确定了近期在全球范围内使用最广泛的单个案例,并对近年来产出最受欢迎案例的商学院予以认可。 总体而言,随着各机构适应瞬息万变的世界,特别是随着AI的出现,商学院案例研究的主题正变得更加多样化,也更加聚焦于数字化。 一些使用最为频繁的案例表明,AI已不再是一个小众主题,该技术涵盖迪士尼等媒体企业、星展银行等银行,以及科技竞争——包括一份聚焦于从生成式AI中获利这一挑战的“AI战争”论文。
11/4/2025 2:00:00 AM
Javier

构建企业级多智能体系统:精通LangChain中间件框架与深度智能体架构

做AI智能体开发久了,每个开发者都会遇到一个转折点:一开始,你搭建的简单智能体能调用工具、处理响应,循环往复,应对几个查询时顺风顺水。 可一旦面向真实业务场景,问题就会集中爆发——要分析一整年的数据该怎么办? 合规要求严禁特定查询通过该怎么拦截?
11/4/2025 1:55:00 AM
大模型之路

循环语言模型:提升参数效率的潜在推理新范式

现代大型语言模型(LLM)主要通过显式文本生成方式进行"思考",例如思维链(Chain-of-Thought, CoT),这种方法将推理延迟到训练后阶段,未能充分利用预训练数据。 本文介绍了一种名为Ouro的开源预训练循环语言模型(LoopLM)家族,其命名灵感来自递归的衔尾蛇(Ouroboros),通过三种关键创新将推理能力直接构建到预训练阶段:(1)潜在空间中的迭代计算,(2)用于学习深度分配的熵正则化目标函数,以及(3)扩展到7.7万亿token的训练规模。 核心创新与技术亮点Ouro模型展现了卓越的参数效率,其1.4B和2.6B参数规模的模型性能可以匹配甚至超越12B参数的SOTA模型。
11/4/2025 1:43:00 AM
可可

谷歌 CEO 皮查伊确认:下一代 AI 模型 Gemini 3 今年发布

11 月 2 日消息,据 THE DECODER 报道,谷歌正准备推出其下一代人工智能模型 Gemini 3,公司 CEO 桑达尔・皮查伊(Sundar Pichai)在最新财报电话会议上确认,该模型将于 2025 年发布。 据悉,Gemini 3 将超越当前的 Gemini 2.5 Pro,在性能上进一步缩小与 OpenAI 的 GPT-5 之间的差距,并更加强调“智能代理”(agent-like)能力,以应对复杂、多模态的任务处理需求。 不过,皮查伊也提醒,Gemini 3 不会带来立竿见影的突破性进展。
11/4/2025 1:00:00 AM
远洋