AI在线 AI在线

理论

一些银行高管预测,GenAI可能承担高达40%的工作量

根据毕马威四月份发布的一项调查,60%的银行高管将GenAI列为今年的首要投资重点。 毕马威最近对银行高管进行的一项调查显示,近一半的受访者预计,到今年年底,GenAI将能够处理其团队21%至40%的日常任务。 银行在AI方面的投入巨大:根据毕马威四月份发布的一份报告,60%的银行高管表示,尽管经济存在不确定性,GenAI仍是他们今年的首要投资重点。
5/21/2025 7:05:00 AM
Caitlin

RAG与微调,大语言模型的“大脑升级”,该选哪条路?(小白科普)

最近在做项目时,我发现有些甲方对RAG和模型微调分区的不太清楚,明明大语言模型(LLM)加挂RAG就可以解决的问题,却坚持要微调,但是具体沟通后发现,其实只是不太了解二者的实际用途。 其实,Retrieval-Augmented Generation (RAG) 和微调 (Fine-Tuning) 是两种最常用的LLM的“大脑升级”技术,虽然它们都能提升模型的性能,但工作原理和适用场景却大相径庭。 今天,我就来深入聊聊这两种技术,弄清楚在不同情况下,到底该选 RAG 还是微调。
5/21/2025 3:00:00 AM
贝塔街的万事屋

AI幻觉引爆网络安全危机 专家揭示了三大防御策略

对现实世界的影响“如果一家公司的智能体利用了过时或不准确的数据,AI幻觉可能会虚构出并不存在的漏洞,或错误解读威胁情报,导致不必要的警报或忽视真正的风险。 此类错误可能会分散对真正威胁的注意力,创造新的漏洞,并浪费本已紧张的安全运营团队资源。 ”Tanium的AI副总裁HarmanKaur在接受采访时表示。
5/21/2025 1:00:00 AM
Mirko Zorz

几行代码让自家网站秒变ChatGPT!微软Build上神秘开源协议,掀起第四次计算革命!网友:OpenAI的霸主时代被终结?

编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)昨天的微软 Build 2025 开发者大会,用一句话总结就是:信息密度爆表,炸点不断! 如果你是开源党的信徒——这次微软几乎把压箱底的宝贝都掏了出来:GitHub Copilot for VS Code 项目正式开源! 而且直接采用了 MIT 协议,意味着全球开发者不仅能免费访问源码、研究核心逻辑,还能亲自下场参与改进,Copilot 从此变成了真正意义上的“全民AI助手”。
5/20/2025 6:33:37 PM
伊风

60+头部企业关于AI的思想碰撞,都在这场大会里

最近由150位全球顶尖AI创始人参与的红杉资本AI峰会刷爆AI产业圈,关于大热的智能体经济、大模型、机器人商业化...来自OpenAI、英伟达、谷歌等公司的AI大佬们给出了他们的洞察——AI不再卖工具,而是卖收益。 它正在从“技术产品”进化为一种新的经济运行方式。 这一观点通俗来讲,就是客户不会因为你的AI产品功能好不好来买单,他们只为能帮他挣钱的产品买单。
5/20/2025 3:36:54 PM

手机流畅处理128K长文本,vivo端侧新算法突破内存限制 | ACL 2025

在端侧设备上处理长文本常常面临计算和内存瓶颈。 vivo AI研究院推出的EdgeInfinite算法专为端侧设备设计,让设备处理超长文本时更加高效流畅,该方法能够在不到10GB GPU内存的设备上处理长达128K tokens的输入。 该研究成果已中稿ACL 2025。
5/20/2025 3:14:39 PM

急于实施AI时被忽视的八个安全风险

在追求GenAI带来的生产力提升的过程中,大多数企业都忽视了这样做可能带来的安全影响,转而倾向于寄希望于具有变革性的创新,而非采用可靠的安全实践。 根据世界经济论坛与埃森哲合作进行的一项研究,63%的企业在部署AI工具之前未能评估其安全性,从而给企业带来了一系列风险。 这既包括现成的AI解决方案,也包括与软件开发团队合作创建的内部实现。
5/20/2025 2:37:33 PM
John

老黄唱衰编程,GitHub CEO硬刚:放弃写代码等于放弃智能体未来话语权

在最新的媒体采访中,GitHub CEO托马斯·多姆克正面battle最近甚嚣尘上的“编程无用论”。 在他的构想中,2025年是属于编程智能体的一年,但未来仍然属于全体人类程序员。 网友们纷纷表示:终于!
5/20/2025 1:57:42 PM

黄仁勋最新访谈:中国 AI 人才“制霸”全球,人工智能开启1万亿→50万亿级别市场

最近,Nvidia的 CEO 黄仁勋,人称“黄教主”,在科技圈又发表了一系列引人注目的观点。 这次是在知名科技博主Ben Thompson的“Stratechery”访谈里,黄教主分享了他的诸多见解,从中美AI聊到自家公司的发展方向,信息量不小。 图片一、中国AI实力?
5/20/2025 1:55:28 PM

Build大会最硬核发布:微软把RAG技术塞进Windows,结构化检索让AI拥有"超忆症"

科技圈的目光无疑高度聚焦于微软的年度Build开发者大会。 正如许多人预期的那样,微软一开场就亮出了其核心主题——智能体(Agent)。 微软的意图很明确:将自身定位在“开放智能体网络”(Open Agentic Web)的中心。
5/20/2025 1:45:19 PM

多模态检索大升级!智源三大SOTA模型,代码、图文理解能力拉满

检索增强技术在代码及多模态场景中的发挥着重要作用,而向量模型是检索增强体系中的重要组成部分。 针对这一需求,近日,智源研究院联合多所高校研发了三款向量模型,包括代码向量模型BGE-Code-v1,多模态向量模型BGE-VL-v1.5以及视觉化文档向量模型BGE-VL-Screenshot。 这些模型取得了代码及多模态检索的最佳效果,并以较大优势登顶CoIR、Code-RAG、MMEB、MVRB等领域内主要测试基准。
5/20/2025 1:02:23 PM
新智元

AI发现新物质,仅用200小时!不写一行代码,筛选36.7万种物质

一行代码都不用写,全靠AI,在200小时内发现一种全新物质! 如果使用传统方法,这个过程可能需要花费几个月甚至几年时间。 这个立大功的AI,就是微软刚刚在Build大会上推出的Microsoft Discovery。
5/20/2025 11:56:08 AM

一文读懂 Vision RAG 模型

众所周知,检索增强生成(RAG)技术已在大语言模型(LLM)应用中证明了其巨大价值,通过从外部知识库检索相关文本信息,显著提升了模型回复的准确性、时效性和可追溯性。 然而,我们所感知和理解的世界并非只由文本构成:大量的现实信息和复杂语境,深刻地蕴含在图像、图表、视频等视觉内容之中。 传统的 RAG 模型难以直接“看”懂并利用这些丰富的视觉信息。
5/20/2025 11:55:22 AM
Luga Lee

代码智能体占领GitHub!自动修bug、加功能、写文档,一台手机就能指挥

GitHub上新代码智能体Copilot Coding Agent,从此可以bug自动修,功能自动加,文档自动写。 有开发者表示真的很棒,已经用它解决了一个拖延很久的小问题。 甚至在手机版APP就能完成全部操作。
5/20/2025 9:59:15 AM

深入了解如何通过 LM Studio 优化本地 LLM 性能

Hello folks,我是 Luga,今天我们来聊一下人工智能应用场景 - 如何通过 LM Studio 优化本地 LLM 性能。 在人工智能浪潮席卷全球的 2025年,本地大语言模型(LLM)的性能优化已成为开发者和企业关注的焦点。 随着计算资源需求激增,如何在本地环境中提升模型的效率、降低延迟并释放其最大潜力,成为了亟待解决的关键挑战。
5/20/2025 9:24:15 AM
Luga Lee

字节提出从单一主题发展到多主题定制的通用框架UNO,通过情境生成释放更多可控性

字节跳动的智能创作团队提出了一个从单一主题发展到多主题定制的通用框架UNO,从少到多的泛化:通过情境生成释放更多可控性。 能够将不同的任务统一在一个模型下。 在单主题和多主题驱动的生成中都能实现高度一致性,同时确保可控性。
5/20/2025 9:13:45 AM
AIGC Studio

谢赛宁团队提出BLIP3-o:融合自回归与扩散模型的统一多模态架构,开创CLIP特征驱动的图像理解与生成新范式!

BLIP3-o 是一个统一的多模态模型,它将自回归模型的推理和指令遵循优势与扩散模型的生成能力相结合。 与之前扩散 VAE 特征或原始像素的研究不同,BLIP3-o 扩散了语义丰富的CLIP 图像特征,从而为图像理解和生成构建了强大而高效的架构。 此外还发布了包含 2000 万张带详细标题的图片(BLIP3o Pretrain Long Caption)和 400 万张带短标题的图片(BLIP3o Pretrain Short Caption)的数据集。
5/20/2025 9:08:59 AM

震撼全网,AlphaEvolve矩阵乘法突破被证明为真!开发者用代码证实

就在刚刚,有人用Claude写代码证实——谷歌DeepMind的AlphaEvolve求解矩阵乘法的突破,100%正确! 即使已经过去好几天,AI圈依然有许多人沉浸在这个AI的余震中。 在时隔半个世纪(56年)后,AlphaEvolve将4×4的复数矩阵计算次数,从1969年Strassen的49次减少到了48次。
5/20/2025 9:07:00 AM