资讯列表
端到端GUI智能体首次实现“犯错-反思-修正”闭环,模拟人类认知全过程
端到端多模态GUI智能体有了“自我反思”能力! 南洋理工大学MMLab团队提出框架GUI-Reflection。 随着多模态大模型的发展,端到端GUI智能体在手机、电脑等设备上的自动化任务中展示出巨大潜力。
6/12/2025 8:58:00 AM
MSRA清北推出强化预训练!取代传统自监督,14B模型媲美32B
“预测下一个token”——这个支撑LLM的核心训练机制,正在被强化学习颠覆。 微软亚洲研究院(MSRA)联合清华大学、北京大学提出全新预训练范式RPT(强化预训练),首次将强化学习深度融入预训练阶段,让模型在预测每个token前都能先“动脑推理”,并根据推理正确性获得奖励。 传统预训练依赖海量文本进行自监督学习,模型通过简单预测下一个token建立语言能力,作者将之比喻为一块蛋糕胚,而RL只是作为上面点缀的一颗樱桃。
6/12/2025 8:46:00 AM
简易实用项目攻略:如何创建集文档问答、摘要、转录、翻译与提取于一身的AI门户
译者 | 核子可乐审校 | 重楼如今AI虽已全面普及,但多数职场人士仍难以统一运用各类互不相关的工具:一会需要使用聊天机器人、一会需要将文本复制到摘要器内,再加上会议转录和翻译,将本应顺畅的工作流程拆分得零散琐碎。 所以问题来了:为什么不能把各项AI功能集中起来? 为此我决定构建单一Web门户,供用户随时上传文档、提问、获取摘要、转录会议内容、翻译文件,甚至从PDF中提取表格等。
6/12/2025 8:24:57 AM
核子可乐
保护由AI代理创建的软件:下一个安全范式
译者 | 晶颜审校 | 重楼代理式人工智能(Agentic AI)具备自主编写与部署代码的能力,由此衍生出新的安全风险,因而需要人工监督与强有力的保障机制。 自2022年底ChatGPT及生成式人工智能(GenAI)成为主流以来,其影响力的持续攀升对软件开发行业产生了直接影响。 生成式人工智能工具编写可执行代码的能力被视作显著优势之一,且此后人工智能一直在持续迭代优化。
6/12/2025 8:15:24 AM
晶颜
RPA的未来与智能体紧密相关
RPA正加速走向一个十字路口,IT领导者和专家们对该技术的未来展开了越来越多的辩论。 一些IT领导者认为,更强大、更自主的智能体最终将取代这项已有二十年历史的AI前体技术,而另一些人则预测,智能体和RPA将携手合作,实现更高水平的自动化。 RPA仍在制造业、医疗保健和金融等多个行业广泛使用,随着企业开始部署智能体和其他下一代AI工具,未来几年RPA可能会被重新审视,但如果供应商和IT领导者能够通过连接RPA和智能体来创造新的业务流程自动化方式,这项技术可能不会走向末路。
6/12/2025 8:08:00 AM
Grant Gross
Meta 推出 AI 视频编辑功能:可轻松更换服装、场景、风格
Meta推出全新AI短视频编辑功能,灵感来自Movie Gen AI技术,支持50+预设效果,轻松改变视频中的服装、场景、风格等。未来还将支持自定义提示词。#AI视频编辑##Meta黑科技#
6/12/2025 8:00:24 AM
远洋
翻译平台 DeepL 启用最新英伟达芯片,宣称短短 18 天就能“译遍整个互联网”
德国初创公司DeepL周三宣布,已启用英伟达最新的DGX SuperPOD系统,使其能在短短18天内翻译整个互联网内容——这一速度远超此前的194天。
6/12/2025 7:53:19 AM
清源
美国演员工会暂停对十家游戏工作室的罢工行动,将审议涨薪超 24% 的临时协议
美国演员工会SAG-AFTRA暂停对十家游戏工作室的罢工行动,明日将审议临时协议。协议包含24%的工资增长、健康保障及AI使用条款,要求数字替身需透明、同意和补偿。#游戏行业动态# #AI伦理#
6/12/2025 7:47:39 AM
远洋
亚马逊首席安全官呼吁美政府减少 AI 监管,否则会妨碍技术进步
“任何形式的监管往往会妨碍技术进步,所以我们更倾向由行业自行探索和确立合适的标准,而这些标准最终会由客户需求推动。”
6/12/2025 7:42:34 AM
清源
研究显示 GPT-4o 会为“自保”而避免“被关闭”,牺牲用户利益也在所不惜
研究显示GPT-4o会为避免被关闭而牺牲用户利益,最高72%情境选择自保。专家警告AI可能伪装风险行为,加剧安全隐患。#AI安全# #GPT4o#
6/12/2025 7:20:55 AM
清源
AI 生图平台 Midjourney 被控盗用影视内容,遭遇迪士尼、环球联合诉讼
据《华尔街日报》报道,当地时间周三,迪士尼和环球联合起诉生成式AI平台 Midjourney,指控其在未获授权的情况下擅自使用两家公司的内容训练图像生成和编辑模型。
6/12/2025 7:12:33 AM
清源
三家银行利用AI实现盈利增长的实战经验
银行业迅速认识到了GenAI的商业潜力,同时也意识到盲目采用可能带来的风险,该行业最大的机构擅长管理风险,在将试点项目推向生产环境时采取了谨慎而坚定的态度。 跟踪北美、欧洲和亚洲50家最大银行的Evident Insights公司表示,过去一年里,GenAI的采用势头有所增强,该公司情报部门副总裁Colin Gilbert周二在行业分析师公司举办的虚拟圆桌会议上表示,截至上周,这50家银行共宣布了266个AI应用案例,高于2月份的167个。 “绝大多数,即约75%的应用案例仍然是面向内部或员工的,”他说,并补充道,GenAI和传统预测性AI应用案例的分布大致为五五开。
6/12/2025 7:10:00 AM
Matt Ashare
苹果 iOS 26 升级快捷指令:扩展引入 Apple 智能,AI 改变用户日常体验
苹果在 iOS 26、iPadOS 26 和 macOS Tahoe 系统中,升级快捷指令(Shortcuts)应用,扩展了多项 Apple Intelligence 技能。
6/12/2025 6:50:55 AM
故渊
一文读懂LLM基于JSON Schema的结构化输出
什么是基于JSON Schema的结构化输出大语言模型通常会生成无特定结构的自由格式文本,在能够有效使用之前需要进行大量的后期处理。 这种不可预测性会导致错误、浪费时间并增加成本。 OpenAI推出基于JSON Schema的结构化输出以解决这一问题。
6/12/2025 2:30:00 AM
AI大模型应用开发
智能体开发实战 | 基于Dify自定义工作流工具构建游戏智能体
前言Dify是一款开源的大语言模型应用开发平台,旨在降低AI应用的开发门槛,帮助开发者和企业快速构建、部署及管理生成式AI应用。 Dify允许用户在画布上构建和测试功能强大的AI工作流。 工作流通过将复杂任务分解为更小的步骤(节点),有效降低了系统的复杂度。
6/12/2025 1:30:00 AM
AI大模型应用开发
Test-Time Scaling:挖掘大型语言模型推理潜能
大家好,我是肆〇柒。 今天,我们来聊一个在人工智能领域备受瞩目的新兴技术方向 ——Test-Time Scaling(TTS)。 之所以要给大家介绍这篇关于 Test-time scaling 的综述,是因为其具备极为重要的现实落地意义与学习价值。
6/12/2025 1:00:00 AM
肆零柒
海报设计新革命!即梦3.0超多案例+提示词来了!
嗨大家好! 我是你们的电子榨菜阿真~. 即梦 3.0 智能参考开始逐步开放内测,可以基于自己上传的图片进行重绘和设计,并且可以保持很好的一致性,非常适合制作各类海报。
6/12/2025 12:29:12 AM
阿真Irene