AI在线 AI在线

资讯列表

智能体 Agent 与工作流构建实战指南:从选型决策到高效实施

作者 | fred历经多个业务系统的构建,我深感Anthropic的《Build effective agents》一文与自身实战经历高度契合。 本文在详解工作流与Agent的技术选型标准、设计模式应用及实施要点的同时,也融入了我的实战心得与实践经验总结。 无论您正考虑构建工作流系统还是Agent系统,都能在此找到适合场景的最佳实践方案。
4/28/2025 9:10:00 AM
腾讯技术工程

毛骨悚然!o3精准破译照片位置,只靠几行Python代码?人类在AI面前已裸奔

OpenAI的o3发布以来,这个功能让不少网友觉得毛骨悚然——它能准确破解你的地理位置! 就在刚刚,Lanyrd联创、Django Web框架缔造者Simon Wilson专门发了一篇博客,详尽推敲了o3究竟是如何猜测照片拍摄地点的。 他将整个过程评价为:既超现实,又反乌托邦,仿佛几十年前的科幻小说突然变成现实!
4/28/2025 9:08:00 AM
新智元

一行代码不用写,AI看论文自己「生」出代码库!科研神器再+1

这几年,AI领域的科研人员遇到一个问题。 那就是机器学习的论文实在是多到看不过来,更别说还要用代码实现论文中逻辑。 HuggingFace上的「每日论文」板块每天都有十几篇新出的研究论文这导致一个问题,研究者往往「重视结果」而没有精力来用用代码验证,并且复现很多先前的工作有点「重复造轮子」,浪费研究者的精力。
4/28/2025 9:06:00 AM
新智元

理解 RAG 第五部分:管理上下文长度

传统的大型语言模型 (LLM)存在上下文长度限制,这限制了单次用户与模型交互中处理的信息量,这是其主要局限性之一。 解决这一限制一直是 LLM 开发社区的主要工作方向之一,提高了人们对增加上下文长度在生成更连贯、更准确响应方面优势的认识。 例如,2020 年发布的 GPT-3 上下文长度为 2048 个 token,而其更年轻但功能更强大的兄弟 GPT-4 Turbo(诞生于 2023 年)允许在单个提示中处理高达 128K 个 token。
4/28/2025 9:02:14 AM

科大讯飞:重回双位数增长,AI 大模型竞赛展现强劲实力

近日,科大讯飞发布了其2024年财报,令人振奋的是,该公司营收达到了233.43亿元,同比增长18.79%。 这标志着科大讯飞时隔两年后重新回到了双位数的增长轨道。 同时,归母净利润也达到了5.6亿元,显示出其盈利能力的稳步回升。
4/28/2025 9:00:41 AM
AI在线

全球最快推理速度模型!Qafind Labs 发布 ChatDLM 技术

近日,Qafind Labs发布了其最新研发的ChatDLM模型,这一创新成果在人工智能领域引起了广泛关注。 ChatDLM是首个将“区块扩散(Block Diffusion)”和“专家混合(MoE)”深度融合的模型,其在GPU上实现了惊人的2,800tokens/s超高推理速度,支持131,072tokens的超大上下文窗口,开启了文档级生成和实时对话的新纪元。 ChatDLM的核心亮点在于其独特的技术架构。
4/28/2025 9:00:40 AM
AI在线

ICLR 2025 | 无需训练加速20倍,清华朱军组提出用于图像翻译的扩散桥模型推理算法DBIM

论文有两位共同一作。 郑凯文为清华大学计算机系三年级博士生,何冠德为德州大学奥斯汀分校(UT Austin)一年级博士生。 扩散模型(Diffusion Models)近年来在生成任务上取得了突破性的进展,不仅在图像生成、视频合成、语音合成等领域都实现了卓越表现,推动了文本到图像、视频生成的技术革新。
4/28/2025 9:00:00 AM
机器之心

基于奖励驱动和自组织演化机制,全新框架ReSo重塑复杂推理任务中的智能协作

本文由上海人工智能实验室,悉尼大学,牛津大学联合完成。 第一作者周恒为上海 ailab 实习生和 Independent Researcher 耿鹤嘉。 通讯作者为上海人工智能实验室青年科学家白磊和牛津大学访问学者,悉尼大学博士生尹榛菲,团队其他成员还有 ailab 实习生薛翔元。
4/28/2025 8:50:00 AM
机器之心

过于追求人性化:奥尔特曼称 GPT-4o 出现“谄媚烦人”倾向,OpenAI 计划在一周内修复

OpenAI 在 4 月 25 日发布更新,对 GPT-4o 的对话响应模式进行了细微调整,使其在交互中更加主动,并能更精准地引导对话达成有效结论。
4/28/2025 8:45:28 AM
问舟

AI无边界:通过MCP实现不同智能体框架的协作(含代码)

在人工智能飞速发展的当下,智能体框架如雨后春笋般不断涌现。 从LangChain利用高度抽象的方式构建智能体,到CAMEL - AI为用户提供细致配置选项来创建智能体,不同框架各显神通。 但这些框架之间就像说着不同“方言”的个体,彼此沟通困难重重。
4/28/2025 8:29:04 AM
大模型之路

搜索引擎后的下一个战场,广告服务商已尝试在 AI 回复中植入广告

ChatGPT 等 AI 问答产品的应用在 2022 年底开始爆发,这类提供直接答案而非链接列表的对话式 AI 对谷歌基于链接的广告模式构成了重大挑战。FT 报道称,广告集团和技术初创公司也没有放弃这个新战场,他们正在积极开发新工具,帮助品牌确保广告出现在由 AI 生成的回复中。
4/28/2025 7:40:42 AM
汪淼

我国已形成完整人工智能产业体系,专利申请量位居全球首位

据央视新闻报道,我国今年以来持续加强人工智能基础研究,同时突出应用导向,新技术正不断向具体应用场景纵深渗透,目前已形成覆盖基础层、框架层、模型层、应用层的完整人工智能产业体系。 最新数据显示,截至 2025 年 4 月 9 日,我国人工智能专利申请量达 1576379 件,占全球申请量的 38.58%,位居全球首位。
4/28/2025 7:30:41 AM
归泷

美国银行对AI的大力押注始于小规模

今年,美国银行将投资40亿美元用于AI及相关技术创新,但这家金融服务巨头七年前自主研发的AI助手Erica,如今依然是关键的投资回报率来源、客户与员工体验的核心,也是其引以为傲的成果。 2018年时,很少有人使用“助手”一词,更不用说“自主式AI”了,但美国银行组建了一个由软件工程师、语言学家和银行业专家组成的团队,打造了这款小型语言模型,该模型多年来根据呼叫中心收集的客户反馈数据不断优化。 美国银行消费者、商业和财富管理技术部门负责人哈里·戈帕尔克里什南(Hari Gopalkrishnan)表示,Erica之所以能够成功且经久不衰,关键在于其规模较小。
4/28/2025 7:05:00 AM
Paula Rooney

全国首个黑土侵蚀阻控技术智慧配置平台上线试运行

近日,由中国科学院东北地理与农业生态研究所牵头,西北农林科技大学、中国科学院南京土壤研究所、中国农业科学院农业资源与农业区划研究所、吉林农业大学、吉林省水土保持科学院等联合开发的“智保黑土”上线试运行,这是全国首个大语言模型驱动的黑土侵蚀阻控技术智慧配置平台。
4/28/2025 6:56:21 AM
归泷

清华大学成立人工智能医院,培育新一代“AI 协同型医生”

清华大学人工智能医院揭牌清华大学人工智能医院(IT之家注:Tsinghua AI Agent Hospital)建设将分阶段进行,初期将在学校 AI 全面布局和多学科医工交叉的基础上建设 AI 医院系统,依托北京清华长庚医院及北京清华长庚互联网医院试运行,以全科医学科和眼科、放射诊断科、呼吸科等专科为试点。
4/28/2025 6:49:33 AM
汪淼

AAAI2025 | 频域+注意力双加持!SNN性能飙升33%,刷新多项SOTA纪录!

一眼概览FSTA-SNN 提出了一种频域驱动的时空注意力模块(FSTA),显著提升脉冲神经网络(SNN)的特征学习能力与能效,在多个数据集上实现了更优性能和更低的脉冲发放率。 核心问题当前 SNN 在信息稀疏表示方面虽具能效优势,但其中间脉冲输出存在冗余且缺乏系统分析,导致特征提取能力受限、性能不稳定。 论文核心关注的问题是:如何在不增加能耗的前提下,抑制冗余脉冲、增强关键特征提取能力,从而提升 SNN 的整体性能与鲁棒性。
4/28/2025 3:45:00 AM
萍哥学AI

AI图像分割新王者:BiRefNet如何重新定义视觉精度边界?

一、当“抠图”变成毫米级手术:BiRefNet的技术突破你是否想过,为什么电商商品图能精准抠出发丝? 为什么自动驾驶车辆能瞬间识别行人轮廓? 答案可能藏在一种名为BiRefNet的AI模型中。
4/28/2025 3:22:45 AM
智Echo

大模型重复生成内容:根因剖析与优化策略

前言最近在调试大模型应用过程中,遇到了如下问题:复制大模型首次生成内容与「重新生成」两次返回的内容近乎完全相同,几乎没有体现出任何差异性。 面对这种情况,造成大模型输出高度相似的原因是什么呢? 我们又该采取怎样的调整策略,才能使重新生成的内容与前次存在明显差异,提升输出的多样性呢?
4/28/2025 2:22:00 AM
张张