自动化

全模态RAG突破文本局限，港大构建跨模态一体化系统

突破传统检索增强生成（RAG）技术的单一文本局限，实现对文档中文字、图表、表格、公式等复杂内容的统一智能理解。香港大学黄超教授团队开源多模态智能处理系统RAG-Anything，将碎片化的信息孤岛转化为结构化的知识网络，为智能多模态文档分析开辟了全新技术路径。 RAG-Anything 是专门针对复杂多模态文档设计的新一代RAG系统，致力于破解现代信息处理中的多模态理解难题。

6/26/2025 3:11:41 PM

大模型掌握人类空间思考能力！三阶段训练框架学会“边画边想”，5个基准平均提升18.4%

“边看边画，边画边想”，让大模型掌握空间思考能力，结果直接实现空间推理任务新SOTA。来自蚂蚁技术研究院自然语言组联合中科院自动化所和香港中文大学开源ViLaSR-7B。它在包括迷宫导航、静态图像理解和视频空间推理等5个基准上平均提升18.4%。

6/23/2025 8:47:00 AM

专家揭示构建稳健AI编排层的最佳实践

随着企业加速采用人工智能技术，如何有效管理复杂的AI工作流程成为关键挑战。最新行业分析指出，建立稳健的AI编排层是解决"提示词混乱"问题的有效方案。 AI编排框架的选择困境.

6/19/2025 2:01:28 PM AI在线

12年博士研究，AI两天爆肝完成！科研效率狂飙3000倍，惊动学术圈

多伦多大学、哈佛MIT等机构联手AI，短短2天内，竟干完了科学家12年的活！研究一出，在全网掀起了巨震。沃顿商学院CS教授Ethan Mollick大受震撼，「AI综述论文体量越来越大，而准确性超越了人类」。

6/16/2025 9:12:00 AM

AI自动写学术综述：10分钟生成6万字，成本不到四块钱

学术综述论文在科学研究中发挥着至关重要的作用，特别是在研究文献快速增长的时代。传统的人工驱动综述写作需要研究者审阅大量文章，既耗时又难以跟上最新进展。而现有的自动化综述生成方法面临诸多挑战：AI生成的综述结构往往缺乏连贯逻辑，组织结构较差，存在宽度和深度的结构失衡问题；在参考文献方面，经常无法引用真正相关和有影响力的文献，容易引用无关文献而忽略核心贡献；评估方式主要依赖LLM整体质量评估，缺乏对大纲质量、参考文献相关性等关键方面的细粒度分析。

6/13/2025 9:08:00 AM

6/12/2025 8:08:00 AM Grant Gross

智能体自己出现问题自己找！首次提出“自动化失败归因”课题 | ICML2025 Spotlight

近年来，LLM Multi-Agent系统引起广泛关注。它们各显神通，协同作战解决复杂难题。然而，一顿操作猛如虎，最终结果却“惨不忍睹”，一整个任务失败。

6/11/2025 1:44:44 PM

AI数据自动化如何克服供应链数据挑战

当今的供应链比以往任何时候都更加互联互通且复杂，公司经常求助于AI来提高可见性、效率和韧性，但许多企业发现，它们的AI计划并未达到高期望值，真正的问题并不总是技术本身，而是为这些系统提供数据的数据的质量和可用性。现代供应链中的数据挑战供应链产生海量数据，这些数据来自众多系统、格式和合作伙伴。根据IBM的研究，大约80%的供应链数据仍是非结构化的，因此难以分析，这种碎片化的方法导致了重大的运营问题。

6/11/2025 7:11:00 AM Deepak

ACL2025 | 传统符号语言传递知识太低效？探索LLM高效参数迁移可行性

论文第一作者谭宇乔来自中国科学院自动化研究所的自然语言处理和知识工程研究组，导师为何世柱老师。目前研究方向主要在利用大语言模型参数知识增强大模型能力。 1 跨规模参数知识迁移 PKT 的全面分析人类的思维是非透明的，没有继承的记忆，因此需要通过语言交流的环境来学习。

6/4/2025 8:35:00 AM

AI竟会「自己认错」？破解多智能体协作「罗生门」，斩获ICML 2025 Spotlight

你打造了一支「超级AI战队」——战队里每个AI都各司其职：有的收集信息、有的负责判断，还有的协调执行，一起协作攻克复杂任务。这个愿望看似天衣无缝，结果却往往以失败告终。问题就出在：当「问题」出现的时候，如何知道是哪个AI干的？

6/3/2025 9:08:00 AM

代码世界风云突变：Anthropic 报告揭秘 AI 正从“助手”变“主导”，初创公司抢占先机！

人工智能在软件开发领域的渗透，正以前所未有的速度和深度演进。 AI 巨头 Anthropic 最新发布的第二份经济指数报告，犹如一颗投入平静湖面的石子，激起了层层涟漪。这份基于其 Claude AI 及专业编码工具 Claude Code 上高达50万次交互数据的深度研究，清晰地描绘出一幅惊人图景:人工智能正迅速脱离仅仅辅助编码的角色，朝着自动化编码大步迈进，尤其在 Claude Code 这类“专精”工具的加持下，这一趋势愈发明显。

4/29/2025 11:00:55 AM AI在线

AI顾问成企业智能转型的战略军师与未来黄金职业

AI顾问协助公司识别、评估和盈利性地实施可能的AI应用场景。他们不仅要考虑技术层面，还要考虑战略和企业层面要求——同时熟悉快节奏的AI领域中的最新趋势、创新和可能性。但他们日常工作到底做什么呢?AI咨询：定义AI咨询涉及就AI解决方案提供建议、设计和实施。

4/3/2025 3:26:06 PM René Kessler

AI安全的头等大事：建立AI资产清单

随着人工智能（AI）技术的迅猛发展，企业首席信息安全官（CISOs）正面临前所未有的挑战，既要满足企业业务快速迈向智能化的需求，同时又要防御爆炸式增长的AI安全威胁。风靡全球的DeepSeek只是AI工具潮的一朵浪花，未来还将有更多类似工具快速涌现。这些未经授权的（消费级）AI应用如同一颗颗定时炸弹，潜伏在企业内部，威胁着数据安全与合规性。

3/13/2025 1:38:28 PM 佚名

Microsoft Dragon Copilot：医疗领域的 AI 革命

在医疗行业，医生和护士们常常被繁重的文书工作压得喘不过气来，这不仅影响了他们的工作效率，还可能影响到患者体验。现在，Microsoft 推出了一款名为 Dragon Copilot 的 AI 助手，旨在帮助医疗专业人员简化临床工作流程，让他们能够更多地关注患者护理。下面，就让我们一起来了解一下这款革命性的产品。

3/5/2025 8:56:31 AM 深海幽光

阿里PC-Agent重构人机交互，精准拆解跨应用指令，自动化办公更进一步

面向复杂PC任务的多模态智能体框架PC-Agent，来自阿里通义实验室。从Office到浏览器，跨APP工作流都可以交给AI来完成了。指令1（翻译）：在记事本应用程序中，打开“文档”中的“备忘录”文件，查看上午的第二项活动。

3/4/2025 9:10:00 AM 量子位

23个超强的DeepSeek提示词指令，一看就懂

给大家分享几个超强的DeepSeek提示词，大家也可以模仿提示词的结构去书写自己需要的DeepSeek指令。文中[...]内的只是示例，大家可以根据自己实际需求进行替换。一、知识管理类请用康奈尔笔记法整理[会议记录/课程内容]，左侧提炼关键词，右侧记录案例证据，底部总结行动要点，最后将知识关联绘制成概念网络图。

3/4/2025 2:00:00 AM 丶平凡世界

副业要赚翻？这六款 AI 代理简直像开挂

AI 代理（AI Agents）能够让繁琐的人工工作实现高度自动化，而且速度快、准确度高。它们在写代码、做营销、创作视频以及其他创意或业务领域都越来越出色。如果现在还不使用 AI 代理，可能很快就会落后。

3/3/2025 8:10:00 AM dev

企业级 AI 编程 “神兵利器” 降世！Factory 横空出世：三大模块赋能开发者效率狂飙！

一款名为 “Factory” 的 AI 编程工具正式亮相，犹如一颗重磅炸弹般在科技圈引爆!这款工具并非面向个人开发者，而是精准定位企业用户，旨在为企业级软件开发提供全方位、智能化、高效便捷的解决方案。 Factory 一经发布，便以其颠覆性的功能设计和强大的技术实力，瞬间引发业内高度关注和热烈讨论。根据社交平台 X 上的最新消息，用户 @op7418在今日19:01（太平洋标准时间）发帖称:“FACTORY:又一个针对企业的 AI 编程员工，看起来非常强大”，并详细介绍了 Factory 的三大核心模块，揭示了这款 AI 编程工具的强大功能和巨大潜力。

2/26/2025 11:53:00 AM AI在线

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ Mac也能跑Qwen3，一文看懂本地部署qwen 3配置要求

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉

自动化

全模态RAG突破文本局限，港大构建跨模态一体化系统

大模型掌握人类空间思考能力！三阶段训练框架学会“边画边想”，5个基准平均提升18.4%

专家揭示构建稳健AI编排层的最佳实践

12年博士研究，AI两天爆肝完成！科研效率狂飙3000倍，惊动学术圈

AI自动写学术综述：10分钟生成6万字，成本不到四块钱

RPA的未来与智能体紧密相关

智能体自己出现问题自己找！首次提出“自动化失败归因”课题 | ICML2025 Spotlight

AI数据自动化如何克服供应链数据挑战

ACL2025 | 传统符号语言传递知识太低效？探索LLM高效参数迁移可行性

AI竟会「自己认错」？破解多智能体协作「罗生门」，斩获ICML 2025 Spotlight

代码世界风云突变：Anthropic 报告揭秘 AI 正从“助手”变“主导”，初创公司抢占先机！

AI顾问成企业智能转型的战略军师与未来黄金职业

AI安全的头等大事：建立AI资产清单

Microsoft Dragon Copilot：医疗领域的 AI 革命

阿里PC-Agent重构人机交互，精准拆解跨应用指令，自动化办公更进一步

23个超强的DeepSeek提示词指令，一看就懂

副业要赚翻？这六款 AI 代理简直像开挂

企业级 AI 编程 “神兵利器” 降世！Factory 横空出世：三大模块赋能开发者效率狂飙！