自动化
全模态RAG突破文本局限,港大构建跨模态一体化系统
突破传统检索增强生成(RAG)技术的单一文本局限,实现对文档中文字、图表、表格、公式等复杂内容的统一智能理解。 香港大学黄超教授团队开源多模态智能处理系统RAG-Anything,将碎片化的信息孤岛转化为结构化的知识网络,为智能多模态文档分析开辟了全新技术路径。 RAG-Anything 是专门针对复杂多模态文档设计的新一代RAG系统,致力于破解现代信息处理中的多模态理解难题。
6/26/2025 3:11:41 PM
大模型掌握人类空间思考能力!三阶段训练框架学会“边画边想”,5个基准平均提升18.4%
“边看边画,边画边想”,让大模型掌握空间思考能力,结果直接实现空间推理任务新SOTA。 来自蚂蚁技术研究院自然语言组联合中科院自动化所和香港中文大学开源ViLaSR-7B。 它在包括迷宫导航、静态图像理解和视频空间推理等5个基准上平均提升18.4%。
6/23/2025 8:47:00 AM
专家揭示构建稳健AI编排层的最佳实践
随着企业加速采用人工智能技术,如何有效管理复杂的AI工作流程成为关键挑战。 最新行业分析指出,建立稳健的AI编排层是解决"提示词混乱"问题的有效方案。 AI编排框架的选择困境.
6/19/2025 2:01:28 PM
AI在线
12年博士研究,AI两天爆肝完成!科研效率狂飙3000倍,惊动学术圈
多伦多大学、哈佛MIT等机构联手AI,短短2天内,竟干完了科学家12年的活! 研究一出,在全网掀起了巨震。 沃顿商学院CS教授Ethan Mollick大受震撼,「AI综述论文体量越来越大,而准确性超越了人类」。
6/16/2025 9:12:00 AM
AI自动写学术综述:10分钟生成6万字,成本不到四块钱
学术综述论文在科学研究中发挥着至关重要的作用,特别是在研究文献快速增长的时代。 传统的人工驱动综述写作需要研究者审阅大量文章,既耗时又难以跟上最新进展。 而现有的自动化综述生成方法面临诸多挑战:AI生成的综述结构往往缺乏连贯逻辑,组织结构较差,存在宽度和深度的结构失衡问题;在参考文献方面,经常无法引用真正相关和有影响力的文献,容易引用无关文献而忽略核心贡献;评估方式主要依赖LLM整体质量评估,缺乏对大纲质量、参考文献相关性等关键方面的细粒度分析。
6/13/2025 9:08:00 AM
RPA的未来与智能体紧密相关
RPA正加速走向一个十字路口,IT领导者和专家们对该技术的未来展开了越来越多的辩论。 一些IT领导者认为,更强大、更自主的智能体最终将取代这项已有二十年历史的AI前体技术,而另一些人则预测,智能体和RPA将携手合作,实现更高水平的自动化。 RPA仍在制造业、医疗保健和金融等多个行业广泛使用,随着企业开始部署智能体和其他下一代AI工具,未来几年RPA可能会被重新审视,但如果供应商和IT领导者能够通过连接RPA和智能体来创造新的业务流程自动化方式,这项技术可能不会走向末路。
6/12/2025 8:08:00 AM
Grant Gross
智能体自己出现问题自己找!首次提出“自动化失败归因”课题 | ICML2025 Spotlight
近年来,LLM Multi-Agent系统引起广泛关注。 它们各显神通,协同作战解决复杂难题。 然而,一顿操作猛如虎,最终结果却“惨不忍睹”,一整个任务失败。
6/11/2025 1:44:44 PM
AI数据自动化如何克服供应链数据挑战
当今的供应链比以往任何时候都更加互联互通且复杂,公司经常求助于AI来提高可见性、效率和韧性,但许多企业发现,它们的AI计划并未达到高期望值,真正的问题并不总是技术本身,而是为这些系统提供数据的数据的质量和可用性。 现代供应链中的数据挑战供应链产生海量数据,这些数据来自众多系统、格式和合作伙伴。 根据IBM的研究,大约80%的供应链数据仍是非结构化的,因此难以分析,这种碎片化的方法导致了重大的运营问题。
6/11/2025 7:11:00 AM
Deepak
ACL2025 | 传统符号语言传递知识太低效?探索LLM高效参数迁移可行性
论文第一作者谭宇乔来自中国科学院自动化研究所的自然语言处理和知识工程研究组,导师为何世柱老师。 目前研究方向主要在利用大语言模型参数知识增强大模型能力。 1 跨规模参数知识迁移 PKT 的全面分析人类的思维是非透明的,没有继承的记忆,因此需要通过语言交流的环境来学习。
6/4/2025 8:35:00 AM
AI竟会「自己认错」?破解多智能体协作「罗生门」,斩获ICML 2025 Spotlight
你打造了一支「超级AI战队」——战队里每个AI都各司其职:有的收集信息、有的负责判断,还有的协调执行,一起协作攻克复杂任务。 这个愿望看似天衣无缝,结果却往往以失败告终。 问题就出在:当「问题」出现的时候,如何知道是哪个AI干的?
6/3/2025 9:08:00 AM
代码世界风云突变:Anthropic 报告揭秘 AI 正从“助手”变“主导”,初创公司抢占先机!
人工智能在软件开发领域的渗透,正以前所未有的速度和深度演进。 AI 巨头 Anthropic 最新发布的第二份经济指数报告,犹如一颗投入平静湖面的石子,激起了层层涟漪。 这份基于其 Claude AI 及专业编码工具 Claude Code 上高达50万次交互数据的深度研究,清晰地描绘出一幅惊人图景:人工智能正迅速脱离仅仅辅助编码的角色,朝着自动化编码大步迈进,尤其在 Claude Code 这类“专精”工具的加持下,这一趋势愈发明显。
4/29/2025 11:00:55 AM
AI在线
AI顾问成企业智能转型的战略军师与未来黄金职业
AI顾问协助公司识别、评估和盈利性地实施可能的AI应用场景。 他们不仅要考虑技术层面,还要考虑战略和企业层面要求——同时熟悉快节奏的AI领域中的最新趋势、创新和可能性。 但他们日常工作到底做什么呢?AI咨询:定义AI咨询涉及就AI解决方案提供建议、设计和实施。
4/3/2025 3:26:06 PM
René Kessler
AI安全的头等大事:建立AI资产清单
随着人工智能(AI)技术的迅猛发展,企业首席信息安全官(CISOs)正面临前所未有的挑战,既要满足企业业务快速迈向智能化的需求,同时又要防御爆炸式增长的AI安全威胁。 风靡全球的DeepSeek只是AI工具潮的一朵浪花,未来还将有更多类似工具快速涌现。 这些未经授权的(消费级)AI应用如同一颗颗定时炸弹,潜伏在企业内部,威胁着数据安全与合规性。
3/13/2025 1:38:28 PM
佚名
Microsoft Dragon Copilot:医疗领域的 AI 革命
在医疗行业,医生和护士们常常被繁重的文书工作压得喘不过气来,这不仅影响了他们的工作效率,还可能影响到患者体验。 现在,Microsoft 推出了一款名为 Dragon Copilot 的 AI 助手,旨在帮助医疗专业人员简化临床工作流程,让他们能够更多地关注患者护理。 下面,就让我们一起来了解一下这款革命性的产品。
3/5/2025 8:56:31 AM
深海幽光
阿里PC-Agent重构人机交互,精准拆解跨应用指令,自动化办公更进一步
面向复杂PC任务的多模态智能体框架PC-Agent,来自阿里通义实验室。 从Office到浏览器,跨APP工作流都可以交给AI来完成了。 指令1(翻译):在记事本应用程序中,打开“文档”中的“备忘录”文件,查看上午的第二项活动。
3/4/2025 9:10:00 AM
量子位
23个超强的DeepSeek提示词指令,一看就懂
给大家分享几个超强的DeepSeek提示词,大家也可以模仿提示词的结构去书写自己需要的DeepSeek指令。 文中[...]内的只是示例,大家可以根据自己实际需求进行替换。 一、知识管理类请用康奈尔笔记法整理[会议记录/课程内容],左侧提炼关键词,右侧记录案例证据,底部总结行动要点,最后将知识关联绘制成概念网络图。
3/4/2025 2:00:00 AM
丶平凡世界
副业要赚翻?这六款 AI 代理简直像开挂
AI 代理(AI Agents)能够让繁琐的人工工作实现高度自动化,而且速度快、准确度高。 它们在写代码、做营销、创作视频以及其他创意或业务领域都越来越出色。 如果现在还不使用 AI 代理,可能很快就会落后。
3/3/2025 8:10:00 AM
dev
企业级 AI 编程 “神兵利器” 降世!Factory 横空出世:三大模块赋能开发者效率狂飙!
一款名为 “Factory” 的 AI 编程工具正式亮相,犹如一颗重磅炸弹般在科技圈引爆!这款工具并非面向个人开发者,而是 精准定位企业用户 ,旨在 为企业级软件开发提供全方位、智能化、高效便捷的解决方案 。 Factory 一经发布,便以其 颠覆性的功能设计和强大的技术实力 , 瞬间引发业内高度关注和热烈讨论 。 根据社交平台 X 上的最新消息,用户 @op7418在今日19:01(太平洋标准时间)发帖称:“FACTORY:又一个针对企业的 AI 编程员工,看起来非常强大”,并 详细介绍了 Factory 的三大核心模块 , 揭示了这款 AI 编程工具的强大功能和巨大潜力 。
2/26/2025 11:53:00 AM
AI在线
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
机器人
数据
AI新词
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
技术
智能体
Gemini
马斯克
Anthropic
英伟达
图像
AI创作
训练
LLM
论文
代码
算法
苹果
AI for Science
Agent
Claude
腾讯
芯片
Stable Diffusion
蛋白质
开发者
具身智能
xAI
生成式
神经网络
机器学习
3D
人形机器人
AI视频
RAG
大语言模型
研究
百度
Sora
生成
GPU
工具
华为
字节跳动
计算
AGI
大型语言模型
AI设计
搜索
生成式AI
视频生成
DeepMind
特斯拉
场景
AI模型
深度学习
亚马逊
架构
Transformer
MCP
编程
视觉
预测