AI在线 AI在线

自动化

告别人工写脚本!多模态大模型驱动携程UI自动化测试迈入“描述即生成”阶段

作者简介Jessi Peng,携程资深后端开发工程师,关注AI技术在测试领域的应用。 一、引言    在传统的UI自动化测试流程中,测试人员需要构建完整的开发环境,包括Python运行环境、PyCharm集成开发环境、自动化测试框架等工具链的配置与部署。 在用例编写过程中,测试人员必须通过人工方式精确定位目标UI元素,并基于自动化框架封装的底层方法,手工编写测试代码。
8/19/2025 10:47:17 AM
Jessi Peng

微软发布五大AI Agent模式:一键解锁AI员工,打造智能体工厂

今天凌晨,微软在官网发布了Agent常见的设计模式和用例,以帮助用户快速开发出功能强大的自动化AI员工。 与传统的RPA、自动化脚本相比,智能体除了提供自动化之外,还能根据实际业务场景进行推理、协作、弥合知识与成果之间的差距,挖掘出全新的见解,提供更高的商业价值。 以下是微软根据实际业务场景总结出的5种常用的Agent模式:1、工具使用模式如今的智能体能直接与企业系统交互,能检索数据、调用应用程序编程接口(API)、触发工作流和执行交易。
8/14/2025 9:15:00 AM

自主式AI如何颠覆营销技术决策规则

要点概述:• 旧规则失效。 传统的基于规则的系统缺乏学习或适应能力,限制了实时营销中的决策制定。 • 分析技术陷入瓶颈。
7/29/2025 7:07:00 AM
Jonathan

AI 如何帮你 “挑” 出适合自动化生成的代码?新手也能轻松上手

一、为什么 AI 生成代码总是 “水土不服”? 当你让 AI 生成 “用户注册” 功能时,是否遇到过这些问题:生成的工具类包名错误(如com.foreign.utils而非项目规范的com.xxx.utils)。 重复编写已有功能(如项目已存在UserConverter,AI 却重新实现)。
7/24/2025 1:00:00 AM
宗赫

大模型转行土木工程!首个「打灰人」评估基准:检验读、改工程图纸能力

在AI竞速的今天,大语言模型(LLM)早已不满足只在象牙塔里「背书解题」。 当GPT-4o刷题通过物理奥赛、DeepSeek熟练搭建网站之后,LLM必须直面一个更现实的问题:这些号称「专家级」的大模型,能不能真的下工地? 能不能帮工程打工人减负?
7/18/2025 10:08:17 AM

加速AI技术落地的有效方法

GenAI的迅速崛起揭示了一个职场现实:一线员工往往比管理人员更快地接受新技术。 AI技术的发展速度之快,令人难以跟上其改变人们工作方式的众多新途径,然而,对于大多数企业而言,技术可能性与实际应用之间的差距正在不断扩大。 2024年麦肯锡全球调查发现,90%的员工在工作中使用GenAI,其中21%的员工是重度用户,然而,尽管员工热情高涨,但大多数企业对AI工具的正式采用却滞后:只有13%的受访员工认为自己的企业是早期采用者。
7/17/2025 2:26:06 PM
Bob

关于智能体和RPA 企业决策者需要了解的事项

在当今关于业务自动化的讨论中,经常出现的两个术语是“智能体”和“机器人流程自动化(RPA)”。 它们经常被一起提及,因为两者都旨在简化传统上由人类处理的重复性、基于规则的任务。 然而,尽管它们在自动化和使用“机器人”方面有一些共同点,但它们代表了解决不同类型问题的截然不同方法。
7/14/2025 7:06:00 AM
Bernard Marr

同时监督和强化的单阶段大模型微调,告别“先背书再刷题”,推理泛化双提升|中科院&美团等

通过单阶段监督微调与强化微调结合,让大模型在训练时能同时利用专家演示和自我探索试错,有效提升大模型推理性能。 中国科学院自动化研究所深度强化学习团队联合美团,提出一种单阶段监督-强化微调方法——SRFT (Supervised Reinforcement Fine-Tuning)。 该方法通过基于熵的动态加权机制,将两种训练范式结合。
7/3/2025 8:33:00 AM

全模态RAG突破文本局限,港大构建跨模态一体化系统

突破传统检索增强生成(RAG)技术的单一文本局限,实现对文档中文字、图表、表格、公式等复杂内容的统一智能理解。 香港大学黄超教授团队开源多模态智能处理系统RAG-Anything,将碎片化的信息孤岛转化为结构化的知识网络,为智能多模态文档分析开辟了全新技术路径。 RAG-Anything 是专门针对复杂多模态文档设计的新一代RAG系统,致力于破解现代信息处理中的多模态理解难题。
6/26/2025 3:11:41 PM

大模型掌握人类空间思考能力!三阶段训练框架学会“边画边想”,5个基准平均提升18.4%

“边看边画,边画边想”,让大模型掌握空间思考能力,结果直接实现空间推理任务新SOTA。 来自蚂蚁技术研究院自然语言组联合中科院自动化所和香港中文大学开源ViLaSR-7B。 它在包括迷宫导航、静态图像理解和视频空间推理等5个基准上平均提升18.4%。
6/23/2025 8:47:00 AM

专家揭示构建稳健AI编排层的最佳实践

随着企业加速采用人工智能技术,如何有效管理复杂的AI工作流程成为关键挑战。 最新行业分析指出,建立稳健的AI编排层是解决"提示词混乱"问题的有效方案。 AI编排框架的选择困境.
6/19/2025 2:01:28 PM
AI在线

12年博士研究,AI两天爆肝完成!科研效率狂飙3000倍,惊动学术圈

多伦多大学、哈佛MIT等机构联手AI,短短2天内,竟干完了科学家12年的活! 研究一出,在全网掀起了巨震。 沃顿商学院CS教授Ethan Mollick大受震撼,「AI综述论文体量越来越大,而准确性超越了人类」。
6/16/2025 9:12:00 AM

AI自动写学术综述:10分钟生成6万字,成本不到四块钱

学术综述论文在科学研究中发挥着至关重要的作用,特别是在研究文献快速增长的时代。 传统的人工驱动综述写作需要研究者审阅大量文章,既耗时又难以跟上最新进展。 而现有的自动化综述生成方法面临诸多挑战:AI生成的综述结构往往缺乏连贯逻辑,组织结构较差,存在宽度和深度的结构失衡问题;在参考文献方面,经常无法引用真正相关和有影响力的文献,容易引用无关文献而忽略核心贡献;评估方式主要依赖LLM整体质量评估,缺乏对大纲质量、参考文献相关性等关键方面的细粒度分析。
6/13/2025 9:08:00 AM

RPA的未来与智能体紧密相关

RPA正加速走向一个十字路口,IT领导者和专家们对该技术的未来展开了越来越多的辩论。 一些IT领导者认为,更强大、更自主的智能体最终将取代这项已有二十年历史的AI前体技术,而另一些人则预测,智能体和RPA将携手合作,实现更高水平的自动化。 RPA仍在制造业、医疗保健和金融等多个行业广泛使用,随着企业开始部署智能体和其他下一代AI工具,未来几年RPA可能会被重新审视,但如果供应商和IT领导者能够通过连接RPA和智能体来创造新的业务流程自动化方式,这项技术可能不会走向末路。
6/12/2025 8:08:00 AM
Grant Gross

智能体自己出现问题自己找!首次提出“自动化失败归因”课题 | ICML2025 Spotlight

近年来,LLM Multi-Agent系统引起广泛关注。 它们各显神通,协同作战解决复杂难题。 然而,一顿操作猛如虎,最终结果却“惨不忍睹”,一整个任务失败。
6/11/2025 1:44:44 PM

AI数据自动化如何克服供应链数据挑战

当今的供应链比以往任何时候都更加互联互通且复杂,公司经常求助于AI来提高可见性、效率和韧性,但许多企业发现,它们的AI计划并未达到高期望值,真正的问题并不总是技术本身,而是为这些系统提供数据的数据的质量和可用性。 现代供应链中的数据挑战供应链产生海量数据,这些数据来自众多系统、格式和合作伙伴。 根据IBM的研究,大约80%的供应链数据仍是非结构化的,因此难以分析,这种碎片化的方法导致了重大的运营问题。
6/11/2025 7:11:00 AM
Deepak

ACL2025 | 传统符号语言传递知识太低效?探索LLM高效参数迁移可行性

论文第一作者谭宇乔来自中国科学院自动化研究所的自然语言处理和知识工程研究组,导师为何世柱老师。 目前研究方向主要在利用大语言模型参数知识增强大模型能力。 1 跨规模参数知识迁移 PKT 的全面分析人类的思维是非透明的,没有继承的记忆,因此需要通过语言交流的环境来学习。
6/4/2025 8:35:00 AM

AI竟会「自己认错」?破解多智能体协作「罗生门」,斩获ICML 2025 Spotlight

你打造了一支「超级AI战队」——战队里每个AI都各司其职:有的收集信息、有的负责判断,还有的协调执行,一起协作攻克复杂任务。 这个愿望看似天衣无缝,结果却往往以失败告终。 问题就出在:当「问题」出现的时候,如何知道是哪个AI干的?
6/3/2025 9:08:00 AM