资讯列表
ICML 2025 | 注意力机制中的极大值:破解大语言模型上下文理解的关键
大型语言模型(LLMs)在上下文知识理解方面取得了令人瞩目的成功。 近日,一项来自 ICML 2025 的新研究《Massive Values in Self-Attention Modules are the Key to Contextual Knowledge Understanding》揭示了大型语言模型中一个重要现象:在注意力机制的查询 (Q) 和键 (K) 表示中存在非常集中的极大值,而在值 (V) 表示中却没有这种模式。 这一现象在使用旋转位置编码 (RoPE) 的现代 Transformer 模型中普遍存在,对我们理解 LLM 内部工作机制具有重要意义。
5/7/2025 9:12:00 AM
GPT-4o图像生成的「核燃料」找到了!万字长文拆解潜在变量,网友:原来AI在另一个维度作画
上个月, GPT-4o 的图像生成功能爆火,掀起了以吉卜力风为代表的广泛讨论,生成式 AI 的热潮再次席卷网络。 而在这股浪潮背后,潜在空间(Latent Space)作为生成模型的核心驱动力,点燃了图像与视频创作的无限想象。 知名研究者 Andrej Karpathy 最近转发了一篇来自 Google DeepMind 研究科学家 Sander Dielman 的博客文章,探讨了生成模型(如图像、音频和视频生成模型)如何通过利用潜在空间来提高生成效率和质量。
5/7/2025 9:06:00 AM
微软将大量AI功能、智能体集成在Windows11,全民AI时代来了
今天凌晨,微软在官网发布了以AI为主题的新版Windows 11。 本次集成的AI功能非常多,涵盖搜索、设置、文件管理、画图、截图、Copilot等,同时还推出了以Copilot PC为主的全新Surface商务笔记本。 下面「AIGC开放社区」将根据官方内容为大家详细解读这些功能。
5/7/2025 9:01:00 AM
Hugging Face 发布免费云端 AI 助手,功能初现但表现不佳
Hugging Face 团队近日推出了一款名为 “Open Computer Agent” 的免费云端 AI 助手,用户可以通过网络访问并使用这款助手。 该工具允许用户通过自然语言指令操作一台预装了多个应用程序的虚拟计算机。 例如用户可以指示助手 “使用 Google 地图查找巴黎的 Hugging Face 总部”,助手随后会尝试执行该任务。
5/7/2025 9:00:53 AM
AI在线
三星One UI Watch 8即将发布:音效升级、图标焕新、引入 Gemini AI
在数字手表界,三星的 One UI Watch8正在悄然崭露头角。 根据最近泄露的信息,三星对这一新系统进行了全面的音效升级,并引入了众多令人期待的变化。 通过网络上的音频文件,我们得以一窥 One UI Watch8的音效细节,这些音效不仅涵盖了相机快门声、充电提示音和低电量提醒音等常见声音,还包括了三星最新版本的经典旋律 “Over the Horizon”。
5/7/2025 9:00:53 AM
AI在线
360开源升级自研7B参数模型360Zhinao3-7B 各项能力全面提升
360集团宣布开源升级了自研的7B参数模型360Zhinao3-7B,并已上线Github开源社区,可供免费商用。 这一模型不仅在数学和科学领域表现出色,更在通用能力上展现了强大的潜力,尤其在端侧应用上具有显著优势。 在本次升级中,360Zhinao3-7B模型仅通过增量训练700B的高质量token,就取得了显著的效果提升,这相比前代模型360Zhinao2-7B的10.1T token成本大幅降低,且不会增加模型的推理成本。
5/7/2025 9:00:53 AM
AI在线
理想汽车李想宣布 AI Talk 第二季:探讨人工智能的未来与发展
理想汽车创始人兼 CEO 李想在社交平台上宣布,《AI Talk 第二季》将于5月7日晚上8点正式上线。 在这一季中,他将与观众分享自己对人工智能最新的思考,尤其是理想 VLA 司机大模型的创新理念。 李想表示,VLA 司机大模型不仅是技术的结晶,更是生物进化的延续,从动物智能到人类智慧的跃迁。
5/7/2025 9:00:53 AM
AI在线
全球 IT 预算 2025 年:生成式 AI 超越网络安全成首选投资
根据亚马逊网络服务(AWS)最新发布的报告,全球 IT 领导者在2025年的预算中,生成式 AI 的投资优先级已超过网络安全。 该报告的数据显示,45% 的企业计划优先考虑生成式 AI 支出,而网络安全工具的预算仅为30%。 这一转变标志着企业在追求 AI 转型潜力的过程中,策略发生了显著变化。
5/7/2025 9:00:53 AM
AI在线
Google 发布升级版 Gemini 2.5 Pro AI 模型 助力开发者提升编码能力
近日,Google 宣布推出其最新的 AI 模型 ——Gemini2.5Pro Preview(I/O 版)。 这一升级版是在即将召开的 Google I/O2025开发者大会前发布的,标志着公司在 AI 领域的持续创新。 根据 Google 的说法,Gemini2.5Pro Preview 在多项广泛使用的基准测试中表现优异,力求在激烈的市场竞争中占据一席之地。
5/7/2025 9:00:53 AM
AI在线
H-MBA层次化MamBa模型如何突破自动驾驶视频理解瓶颈?这三大创新亮点揭示答案!
一眼概览:H-MBA (Hierarchical MamBa Adaptation) 提出了一个创新的多模态视频理解框架,通过结合高低时域分辨率,显著提升了自动驾驶场景中的视频理解和风险物体检测性能。 核心问题:现有的多模态大语言模型(MLLMs)在处理自动驾驶中复杂的时空动态视频时,性能有限。 特别是在捕捉背景变化、车辆和行人运动等方面,现有方法难以做到准确的时空理解。
5/7/2025 8:49:17 AM
萍哥学AI
RAG 中的语义分块:实现更优的上下文检索
检索增强生成(RAG)技术异军突起,席卷了整个大语言模型领域。 通过将大语言模型(LLMs)的强大能力与外部知识检索相结合,RAG使得模型能够生成准确且有依据的回复,即便在专业领域也不例外。 在每一个表现卓越的RAG流程背后,都有一个默默发挥关键作用的 “英雄”:分块技术,尤其是语义分块。
5/7/2025 8:35:11 AM
大模型之路
SmallRye大模型简介:使用Langchain4J轻松向应用内引入AI服务
译者 | 核子可乐审校 | 重楼Langchain4J解决了哪些问题? Langchain4J 本质上是为 Java 开发者打造的工具箱,旨在简化向高级语言中集成 AI 功能(如聊天机器人或文本生成器)的过程,同时屏蔽底层复杂细节。 想象一下:我们想要构建一个能回答问题、生成内容或模拟人类对话的智能应用。
5/7/2025 8:14:58 AM
核子可乐
当人工智能脱离人类监督:自维持系统的网络安全风险
译者 | 晶颜审校 | 重楼人工智能正从执行预定义指令的工具,进化为具备自我修改、参数重写及实时反馈进化能力的复杂系统。 这种被称为“自创生”的自维持特性,使其能动态适应环境以提升效率,但也带来不可预测性。 对网络安全团队而言,传统安全模型基于“威胁来自外部”的假设——即恶意行为者利用稳定系统漏洞实施攻击。
5/7/2025 8:07:09 AM
晶颜
100个Python机器学习小技巧,让你速通ML
构建机器学习模型是数据科学的关键环节,涉及运用算法进行数据预测或挖掘数据中的模式。 本文分享一系列简洁的代码片段,涵盖机器学习过程的各个阶段,从数据准备、模型选择,到模型评估和超参数调优。 这些代码示例能帮助你使用诸如Scikit-Learn、XGBoost、CatBoost、LightGBM等库,完成常见的机器学习任务,还包含使用Hyperopt进行超参数优化、利用SHAP值进行模型解释等高级技术。
5/7/2025 7:17:18 AM
学研君
比人类更有说服力,AI被滥用成舆论操控隐形推手?
近年来,人工智能(AI)技术飞速发展,给人类社会带来诸多便利。 特别是大模型的飞速发展,对医疗、教育、交通等诸多领域带来了深刻变革。 然而,如同硬币的两面,AI在给人类社会带来诸多便利的同时,其滥用现象也逐渐浮出水面。
5/7/2025 6:00:00 AM
Yu
2025年的CIO现状:CIO制定AI议程
如今,随着对AI的关注,Tractor . Supply公司再次凭借其在AI领域的早期投资占据了领先地位,这些投资包括用于销售和商品预测以及优化商品补货的AI技术。 最近,Tractor .
5/7/2025 5:00:00 AM
Beth Stackpole
IT领导者如何将自主式AI用于业务工作流程
自主式AI是AI演进的新前沿,已成为当今企业讨论的核心话题。 自主式AI在Forrester的2024年趋势榜单中名列前茅,Salesforce预计到2026财年末将有10亿个自主式AI投入使用。 尽管“自主式AI”这一术语应用较为宽泛,但它通常指的是赋予智能体更多自主权,以优化任务并串联起日益复杂的行动。
5/7/2025 4:00:00 AM
Bill Doerrfeld
Java 开发者必看!用 Quarkus + LangChain4j 实现本地 Ollama 的 AI 深度集成
在探索AI与现代技术栈融合的道路上,搭建一个能在本地高效运行的智能交互应用是个不错的实践方向。 本文介绍如何构建 Quarkus 应用程序。 该程序会设置 REST 端点,借助 LangChain4j 调用本地 Ollama 模型,用户调用端点发问题,即可获取模型响应。
5/7/2025 1:01:00 AM
学研妹