AI在线 AI在线

理论

OpenAI新模型,被曝秘密训练中!万字硬核长文直指o4核心秘密

OpenAI的o4,已经在训练了? 就在最近,SemiAnalysis发表了一篇硬核长文博客,爆料了不少大模型圈的内幕消息。 其中,一些最核心的亮点,先一睹为快:OpenAI正在训练一个规模介于GPT-4.1和GPT-4.5之间的新模型下一代推理模型o4将基于GPT-4.1展开RL训练强化学习改变了实验室结构,甚至是大厂未来研究的侧重方向和优先级定义奖励函数难上加难,往往AI钻空子之后,漏洞才能被发现不牺牲LLM任何性能,不用合并权重,RL另一条路——数据混合与预训练不同,RL可持续更新Scaling模型能力,DeepSeek-R1是典例高质量数据是Scaling强化学习的护城河训练小模型,蒸馏效果要比RL更好新一轮预训练已开始首先,让我们看看其中最硬的内容——关于OpenAI的全新模型。
6/11/2025 8:54:52 AM

大模型是「躲在洞穴里」观察世界? 强化学习大佬「吹哨」提醒LLM致命缺点

「我一直很困惑,语言模型怎么能从下一个 token 预测中学到这么多,而视频模型从下一帧预测中学到的却那么少? 难道是因为大模型(LLM)其实是伪装的大脑扫描仪? 」近日,加州大学伯克利分校副教授、强化学习大牛 Sergey Levine 发出了一记灵魂拷问。
6/11/2025 8:45:00 AM

从 LangChain 到企业级应用:RAG 中 Fixed-Size Chunking 的最佳实践揭秘

众所周知,在构建 RAG(Retrieval-Augmented Generation,检索增强生成)系统的过程中,文档切块策略往往决定了模型检索质量的上限。 切得好,信息命中更精准,生成回答更有上下文逻辑;切得差,模型则容易“答非所问”。 在众多策略中,Fixed-Size Chunking(固定切块)可谓最简单直接,却也是最常被忽视的一种。
6/11/2025 8:40:00 AM
Luga Lee

信息化,数字化,智能化是三种不同的概念吗?

信息化转型什么是信息化转型企业信息化实质上是将企业的生产过程、物料移动、事务处理、现金流动、客户交互等业务过程数字化,通过各种信息系统网络加工生成新的信息资源,提供给各层次的人们洞悉、观察各类动态业务中的一切信息,以作出有利于生产要素组合优化的决策,使企业资源合理配置,以使企业能适应瞬息万变的市场经济竞争环境,求得最大的经济效益。 信息化转型目的企业间的竞争应当包括产品竞争、价格竞争、品种竞争、服务竞争、市场竞争和信誉竞争等诸多方面。 随着我们一边完成工业化进程,一边步入信息时代,这种种竞争的方面也都不可避免地被打上了信息化的烙印。
6/11/2025 8:38:08 AM
一个数据人的自留地

告别中心云:构建分布式联邦AI的三大技术支柱​

译者 | 朱先忠审校 | 重楼传统云计算依赖集中式数据训练模型,但边缘计算的普及催生了新范式——去中心化机器学习。 其核心代表——联邦学习正在颠覆传统流程。 本文将对联邦学习概念及其三个关键技术展开讨论。
6/11/2025 8:32:44 AM
朱先忠

谷歌推出的AI Overview和AI Mode对内容创作者来说意味着什么?

译者 | 李睿审校 | 重楼谷歌推出了AI Overview和AI Mode这两项新功能,通过人工智能生成摘要和对话式聊天机器人响应用户查询,以减少用户点击其他网站的需求,而这对于依赖谷歌自然流量的网站构成生存威胁。 内容创作者需要调整策略应对AI Overview和AI Mode带来的冲击,例如优化人工智能概览内容、建立直接流量等。 谷歌搜索(Google Search)日前推出了两项新的人工智能功能,改变了其响应用户查询的方式。
6/11/2025 8:28:34 AM
李睿

你必须领先掌握的九项AI技能(否则将被淘汰)

下一波AI浪潮不仅仅属于技术宅。 想象一下,仅仅一年后,AI带来最大财富的人不再只是程序员、营销人员或销售高手。 真正的赢家,是那些掌握了几项关键AI技能的普通人。
6/11/2025 8:10:45 AM
前端小智

AI数据自动化如何克服供应链数据挑战

当今的供应链比以往任何时候都更加互联互通且复杂,公司经常求助于AI来提高可见性、效率和韧性,但许多企业发现,它们的AI计划并未达到高期望值,真正的问题并不总是技术本身,而是为这些系统提供数据的数据的质量和可用性。 现代供应链中的数据挑战供应链产生海量数据,这些数据来自众多系统、格式和合作伙伴。 根据IBM的研究,大约80%的供应链数据仍是非结构化的,因此难以分析,这种碎片化的方法导致了重大的运营问题。
6/11/2025 7:11:00 AM
Deepak

IT领导者阻碍AI成功的五大障碍

AI,尤其是GenAI,正迅速成为提高整个企业生产力的有效解决方案,但成功的几个常见障碍仍然存在。 IT领导者越早识别并克服这些问题,他们的企业就能越快地从基于AI的系统中获得更多价值。 以下是企业在实现AI价值过程中需要克服的一些更具挑战性的障碍,以及IT领导者可以采取的应对措施。
6/11/2025 7:00:00 AM
Bob Violino

上下文窗口错觉:为什么你的 128K token 不起作用

一、当理论容量遭遇现实困境在大语言模型(LLM)的技术竞赛中,上下文窗口长度早已成为各家标榜的核心指标。 从GPT-4o的128K到Gemini 1.5的1M,模型厂商不断突破Token容量的上限,仿佛更长的上下文就意味着更强的信息处理能力。 然而,这场“军备竞赛”背后却隐藏着一个残酷的现实:模型对长上下文的利用率远低于理论预期。
6/11/2025 4:25:00 AM
大模型之路

构建AI Agent的最优学习路线总结:MCP、CrewAI和Streamlit

如何通过 MCP(Model Context Protocol) 创建一个结合网络搜索、AI 代理和图像生成的现代研究助手引言:AI 驱动的研究未来已来想象一下,您拥有一个个人研究助手,可以即时搜索网络、分析信息、生成全面的总结,甚至创建相关图像——所有这些都通过一个美观的 Web 界面完成。 如果这个助手还能由尖端的 AI 代理驱动,与外部工具和 API 无缝协作,会怎样? 欢迎体验 MCP-Powered Study Assistant —— 一款结合现代 AI 技术的革命性应用:• 🤖 CrewAI 代理,用于智能研究和写作• 📡 Model Context Protocol (MCP),实现无缝工具集成• 🌐 Streamlit,提供直观的 Web 界面• 🔍 通过 Brave Search API 实现实时网络搜索• 🎨 通过 Segmind API 进行 AI 图像生成这不仅仅是另一个 ChatGPT 包装器——它是一个完整的研究生态系统,展示了 AI 驱动应用的未来。
6/11/2025 3:22:00 AM
AI研究生

OCR 识别质量如何影响 RAG 系统的性能?有何解决办法?

检索增强生成(RAG)已成为连接大语言模型与企业数据的标准范式,但该方法存在一个鲜少被讨论的致命缺陷:当前生产环境中的 RAG 系统几乎全部依赖光学字符识别(OCR)技术处理 PDF、扫描件、演示文稿等文档,并默认假设识别结果足以支撑下游 AI 任务。 我们的深度分析表明,这一假设存在根本性缺陷。 OCR 的识别质量形成了一个隐形的天花板,甚至限制了最先进 RAG 系统的性能。
6/11/2025 3:10:00 AM
Baihai IDP

AI Agent!一个万亿市场正在觉醒

"你能帮我订个周末的餐厅吗? " 这句话,你可能每周都要说一遍。 打开手机,搜索餐厅,对比评分,查看菜单,打电话预订...整个流程下来,至少要花15分钟。
6/11/2025 3:00:00 AM
大数据AI智能圈

什么时候GraphRAG超越传统RAG:突破医学等知识密集任务的AI新范式和GraphRAG-Bench评估框架

核心速览研究背景研究问题:这篇文章要解决的问题是如何在检索增强生成(RAG)系统中有效利用图结构来提升大型语言模型(LLMs)的性能,特别是在知识密集型任务中。 研究难点:该问题的研究难点包括:现有基准测试(如HotpotQA、MultiHopRAG和UltraDomain)未能充分评估图结构在RAG系统中的有效性;现有数据集缺乏领域特定知识和明确的逻辑连接;现有基准测试的任务复杂度划分不细致,无法全面评估模型的复杂推理能力。 相关工作:该问题的研究相关工作有:传统的RAG系统通过将文本分块进行索引和检索,但这种方法会牺牲上下文信息;GraphRAG系统通过构建外部结构化图来改进LLMs的上下文理解能力,但其在实际任务中的表现不一致。
6/11/2025 2:55:00 AM
知识图谱科技

LLM 推理引擎综述:优化与效率的多维探索

大家好,我是肆〇柒,玩开源模型蛮久了,做开源模型项目的各位,应该都了解推理引擎在工程落地上的重要性。 一个好的推理引擎,不仅要具备算力的精准调度能力,还需要符合工程基线的稳定性指标,更重要的,还要保障模型的推理精度符合业务标准。 然而,随着模型规模的指数级膨胀,如何高效地部署和运行这些模型,成为了技术发展道路上的关键挑战。
6/11/2025 2:30:00 AM
肆零柒

Chrome内置AI多模态提示功能详解与实战

距离我上次撰写关于Chrome内置AI功能的博客已经过去了几周,随着本周Google IO大会的召开,涌现了许多新公告和更新。 您可以在Chrome开发者博客上找到近期变化的详细说明:"AI API现已进入稳定版和原始试用阶段,并推出新的早期预览计划API"。 最让我期待的一项功能终于发布了——多模态提示。
6/11/2025 2:13:00 AM
前端小石匠

两万字详解,如何为开放平台设计一个安全好用的 OpenAPI

前言为了确保软件接口的标准化和规范化,实现业务模块的重用性和灵活性,并提高接口的易用性和安全性,OpenAPI规范应运而生。 这一规范通过制定统一的接口协议,规定了接口的格式、参数、响应和使用方法等内容,从而提高了接口的可维护性和可扩展性。 同时,为了也需要考虑接口的安全性和稳定性,本文将针对这些方面介绍一些具体的实践方式。
6/11/2025 2:11:00 AM

Qwen:PARSCALE 让语言模型在并行中飞跃

大家好,我是肆〇柒。 今天,我们来聊聊大型语言模型(LLM)领域的一项研究——PARSCALE。 在人工智能快速发展的当下,大型语言模型应用前景无比广阔,然而,随着模型规模的不断膨胀,我们正面临着前所未有的挑战。
6/11/2025 2:00:00 AM
肆零柒