AI在线 AI在线

理论

OpenAI要Open了!奥特曼开源首个推理模型,ChatGPT一小时暴增百万用户

OpenAI终于要Open AI了! 一大早,奥特曼郑重官宣,「未来几个月,将开源一款强大的推理模型」。 这是自GPT-2以来,OpenAI首个开源的模型。
4/1/2025 9:46:08 AM
新智元

中科大提出动作价值表征学习新方法,率先填补长期决策信息的缺失

在视觉强化学习中,许多方法未考虑序列决策过程,导致所学表征缺乏关键的长期信息的空缺被填补上了。 来自中科大的研究人员在信息瓶颈(Information Bottleneck)框架下,提出了一种新颖的鲁棒动作价值表征学习方法ROUSER。 作者从理论上证明了ROUSER能够使用学习到的鲁棒表征准确估计动作价值,从而避免了智能体在测试环境中的决策能力遭到削弱。
4/1/2025 9:32:00 AM
量子位

使用PyTorch和Hugging Face构建一个自动语音识别系统

译者 | 布加迪审校 | 重楼从语音助手到转录服务,自动语音识别(ASR)是许多应用中的一项关键技术。 我们在本教程中旨在使用Hugging Face的预训练模型构建一条能够将语音转录为文本的ASR管道。 我们将使用轻量级数据集来提高效率,并使用Wav2Vec2这种强大的语音识别自监督模型。
4/1/2025 9:31:34 AM
布加迪

RAG(八)自反思检索增强生成--Self-RAG

大语言模型具有显著的能力,但它们常常因为仅依赖于其参数化知识而产生包含事实错误的响应。 传统的检索增强生成(Retrieval-Augmented Generation, RAG)方法虽然能减少这些问题,但是存在无差别地检索和结合固定数量的段落,没有考虑检索是否必要或检索结果的相关性,都会削弱语言模型的灵活性,或者导致无益的响应生成。 现在LLM RAG(检索增强)的技术方案已成为LLM在众多应用场景的主流。
4/1/2025 9:25:09 AM
Goldma

奥赛级AI基准来了:难倒所有模型,GPT-4o仅考34分,上海交大出品

为了进一步挑战AI系统,大家已经开始研究一些最困难的竞赛中的问题,特别是国际奥林匹克竞赛和算法挑战。 但目前尚无奥林匹克级别的、多学科的基准,能够全面评估综合解决问题的能力,以全面检验人工智能的综合认知能力。 上海交通大学生成式人工智能实验室 (GAIR Lab) 的研究团队推出多学科认知推理基准OlympicArena,即使是GPT-4o 也只达到了 34.01% 的整体准确率,而其他开源模型的整体准确率也难以达到20%。
4/1/2025 9:25:00 AM
量子位

OpenAI惊人内幕曝光!赶走奥特曼的PDF,是Ilya发的

奥特曼宫斗事件的背后推手,果然是Ilya! 他发出的两份PDF,掀起了此后OpenAI的惊天巨浪。 奥特曼的3个谎言被戳穿后,Ilya找到Murati和董事会成员,策划了一场「政变」。
4/1/2025 9:23:00 AM
新智元

推荐场景Scaling Law来了!中科大&华为诺亚方舟联合推出

当Scaling Law应用于推荐场景,模型又将如何表现? 中科大认知智能全国重点实验室陈恩红团队联合华为诺亚方舟实验室推出推荐模型性能定律,首次对模型的性能与模型、数据的规模和质量进行了定量分析。 针对现有工作只能对推荐大模型Scaling Law(扩展定律)做定性分析的局限性,论文首次尝试对推荐大模型性能扩展定律给出明确的定量预测。
4/1/2025 9:20:00 AM
量子位

别只看LLM!为什么知识图谱才是通往AGI的关键一步

智能时代,我们已经习惯让AI为我们提供各种服务。  当你问DeepSeek:"北京的天气怎么样"时,它能精准回答;当你让ChatGPT"用简单语言解释相对论",它能流畅作答...  这些AI能力的背后,除了神经网络的感知能力,还有一个关键支撑技术——知识图谱。
4/1/2025 9:17:10 AM
大数据AI智能圈

刚刚,谷歌最强Gemini 2.5 Pro免费了!数学碾压人类研究生,拿下全球TOP 1

虽然又被GPT-4o吉卜力生图的光芒掩盖了,但毫无疑问,上周的另一技术核弹Gemini 2.5 Pro,也是无可争议的强! 在试用过程中,网友们逐渐发现,这个模型真的强到发指。 在门萨Norway的IQ测试中,它已经突破了130。
4/1/2025 9:17:00 AM
新智元

生成式AI正将员工转化为无意识的内鬼威胁:企业安全新挑战

根据Netskope最新研究,企业向生成式AI(GenAI)应用共享的数据量呈现爆炸式增长,一年内激增30倍。 目前平均每家企业每月向AI工具传输的数据量已达7.7GB,较一年前的250MB实现跨越式增长。 这些数据包含源代码、受监管数据、密码密钥和知识产权等敏感信息,大幅增加了数据泄露、合规违规和知识产权盗窃的风险。
4/1/2025 8:50:00 AM
AI小蜜蜂

LangGraph:如何用“图思维”轻松管理多Agent协作?

引言当AI任务变得复杂时,我们需要更好的“调度员”。 随着智能应用场景的深化,单一 Agent 在处理复杂任务(如电商智能客服、金融数据分析流水线)时显现出明显局限性。 传统链式调用框架(如 LangChain)依赖开发者手动编排流程,在面对任务分支、动态决策和资源复用等场景时,往往陷入维护成本高、扩展性差的困境。
4/1/2025 8:48:34 AM
张张

MCP 和 Function Calling:概念

随着人工智能的快速发展,大型语言模型(LLMs)逐渐深入到我们生活与工作的各个方面。 然而,尽管模型强大,但其能力仍存在局限性,比如在实时信息获取和复杂任务执行方面仍有不足。 RAG(检索增强生成)现在在企业的 AI 应用中使用很广泛,就是为了解决模型的信息不够实时,且没有垂直领域知识的问题。
4/1/2025 8:45:56 AM
不止dotNET

OpenAI重新开源!第一弹就推理模型,还不限制商用,“冲着DeepSeek来的”

一夜之间,OpenAI更新三大动向,开源、融资、用户暴增。 第一,将开源一个具备推理能力的大语言模型,包含参数权重那种。 上一次这样开源还是6年前推出GPT-2。
4/1/2025 8:45:15 AM

模型上下文协议(MCP)开发实战——构建LangChain代理客户端

译者 | 朱先忠审校 | 重楼简介什么是模型上下文协议(Model Context Protocol)? 让我们深入了解MCP背后的概念。 以下是官方MCP文档对MCP的介绍:“MCP是一种开放协议,它标准化了应用程序向LLM提供上下文的方式。
4/1/2025 8:38:25 AM
朱先忠

MCP 协议:大模型构建 Agent 智能体的桥梁

大模型技术的发展日新月异,但关于大模型的应用却步履维艰;自从2024年开始市场开始把大模型应用提上日程,但到底怎么把大模型应用于各行各业是很多人都在思考的问题。 随着时间的推移,RAG,Agent智能体的概念被提出,特别是智能体技术被称为人工智能的未来,也是大模型被应用于其它领域的途径。 但到底怎么打造智能体,却是业界一直在思考的问题;虽然后来提出了思维链以及function call,然后结合工作流技术(如coz平台),但大模型在实际应用中依然存在各种各样的问题,而且效果也并不太好。
4/1/2025 8:05:00 AM
DFires

如何通过GenAI实现B2B业务的盈利增长

B2B领域的领导者习惯于利用技术帮助他们实现盈利增长。 最近,他们正在关注一种有望在整个销售流程中加速销售转型的技术——GenAI。 GenAI可以通过提高收入、增加销售效率和精简内部流程,推动超额盈利增长。
4/1/2025 8:00:00 AM
Alexander

如何克服GenAI采用方面的障碍

大多数CIO都欣然接受GenAI,认为它已不是企业IT领域的过客。 无论喜欢与否,该技术迅速在云平台、软件包和PC上普及,出现在聊天机器人、协同助手以及最近新出现的智能工具中。 “我们到处都在使用AI,”波士顿咨询公司董事总经理兼合伙人阿曼达·路德在3月12日的活动上表示。
4/1/2025 7:10:00 AM
Matt Ashare

DeepSeek能否超越ChatGPT?营销人员应该关注什么

在关于创业的商业课程中,初创企业进入市场时面临一个战略决策,即要与竞争对手保持同步。 对于一项新产品,你必须快速推向市场,或者为市场带来与众不同的东西。 如今,AI初创企业面临着比大多数初创企业更短的跑道来做出这一选择,因为当前领导者之间的竞争依然激烈——包括Perplexity、Claude、谷歌的Gemini和OpenAI的ChatGPT。
4/1/2025 7:00:00 AM
Pierre DeBois