AI在线 AI在线

大语言模型

重大突破!研究团队揭示大语言模型内部潜藏的 “奖励机制”

近日,南京大学的周志华教授团队发布了一项重要研究,首次理论证明了在大语言模型中可以发现内源性奖励模型,并有效应用强化学习(RL)来提升模型表现。 当前,许多对齐方法依赖于人类反馈强化学习(RLHF),这种方法需要大量高质量的人类偏好数据来训练奖励模型。 然而,构建这样一个数据集不仅耗时费力,还面临成本高昂的挑战。
7/2/2025 6:00:45 PM
AI在线

字节跳动推出 ProtoReasoning 框架:提升大语言模型的逻辑推理能力

近日,字节跳动的研究与上海交通大学的团队共同推出了名为 ProtoReasoning 的新框架,旨在通过逻辑原型来增强大语言模型(LLMs)的推理能力。 该框架利用结构化的原型表示,如 Prolog 和 PDDL,推动了跨领域推理的进展。 近年来,大语言模型在跨领域推理方面取得了显著突破,尤其是在长链推理技术的应用下。
6/25/2025 11:00:54 AM
AI在线

法拉第未来重磅发布FF AI2.0:与OpenAI深度融合,支持50种语言智能交互

6月24日,法拉第未来正式宣布推出FF AI2.0智能座舱操作系统,这是自2023年FF91发布以来最重大的智能座舱升级。 新系统将通过OTA软件更新首先部署到FF912.0车型,并计划未来扩展至FX系列。 FF AI2.0实现了整个AI架构的全面重构,其最大亮点是与OpenAI的深度融合。
6/24/2025 4:00:42 PM
AI在线

Anthropic 警告:包括 Claude 在内的大多数 AI 模型会实施“勒索”行为

在数周前发布研究指出其 Claude Opus 4 模型在受控测试中试图通过勒索手段阻止被关闭后,Anthropic 近日再度公布新研究,显示此类行为在多个主流 AI 模型中可能更为普遍。
6/21/2025 8:01:06 AM
清源

AM-Thinking-v1:解锁 32B 模型推理潜力的密码

大家好,我是肆〇柒。 本篇想和大家分享一个后训练的模型案例 ——AM-Thinking-v1 模型。 这个模型是由贝壳(Ke.com)公司旗下的 a-m-team 团队开发的,他们一直致力于探索 AGI 技术。
6/18/2025 2:30:00 AM
肆零柒

一文读懂LLM基于JSON Schema的结构化输出

什么是基于JSON Schema的结构化输出大语言模型通常会生成无特定结构的自由格式文本,在能够有效使用之前需要进行大量的后期处理。 这种不可预测性会导致错误、浪费时间并增加成本。 OpenAI推出基于JSON Schema的结构化输出以解决这一问题。
6/12/2025 2:30:00 AM
AI大模型应用开发

Qwen:PARSCALE 让语言模型在并行中飞跃

大家好,我是肆〇柒。 今天,我们来聊聊大型语言模型(LLM)领域的一项研究——PARSCALE。 在人工智能快速发展的当下,大型语言模型应用前景无比广阔,然而,随着模型规模的不断膨胀,我们正面临着前所未有的挑战。
6/11/2025 2:00:00 AM
肆零柒

苹果再轰AI推理能力,GitHub大佬怒怼:这不是推理能力的真实面貌!

最近,苹果公司发布了一篇引发热议的论文,指出当前的大语言模型(LLM)在推理方面存在重大缺陷。 这一观点迅速在社交媒体上引起热议,尤其是 GitHub 的高级软件工程师 Sean Goedecke 对此提出了强烈反对。 他认为,苹果的结论过于片面,并不能全面反映推理模型的能力。
6/10/2025 5:00:56 PM
AI在线

美团王兴详解AI布局:No Code平台免费开放,1680个应用已上线

在近日于北京美团总部恒电大厦举行的股东大会上,美团创始人王兴首次系统阐述了公司在人工智能领域的战略布局和发展规划,揭示了美团在AI浪潮中的深度思考与大胆实践。 王兴将美团的AI发展划分为不同阶段。 早期,公司已在外卖配送的路由和派单系统中应用深度神经网络算法。
6/10/2025 3:00:56 PM
AI在线

文档解析LLM MonkeyOCR震撼登场:3B小模型完胜Gemini

随着大语言模型(LLM)技术的迅猛发展,文档解析领域迎来了一位新星——MonkeyOCR。 这款轻量级文档解析模型以其卓越的性能和高效的处理速度,迅速成为业界关注的焦点。 MonkeyOCR:小模型,大能量MonkeyOCR以仅3B参数的轻量级架构,在英文文档解析任务中展现出惊艳的性能。
6/9/2025 12:00:56 PM
AI在线

400+AI模型解锁网络搜索!Exa联手OpenRouter引爆RAG革命

Exa与OpenRouter宣布达成合作,为超过400种大语言模型(LLMs)提供实时网络搜索功能。 这一突破性进展将显著提升AI模型的实用性和信息获取能力,为开发者、研究人员以及普通用户带来全新的交互体验。 以下是AIbase对这一合作的深度解读与分析。
6/4/2025 9:01:04 AM
AI在线

微信自研高性能推理计算引擎 XNet-DNN:跨平台 GPU 部署大语言模型及优化实践

作者 | yannicXNet-DNN 是微信高性能计算团队自主研发的一款全平台神经网络推理引擎。 我们在 XNet 的 RCI 基础设施之上构建了全平台的 GPU LLM . 推理能力。
6/3/2025 9:25:00 AM
腾讯技术工程

通义实验室、北大发布新技术ZeroSearch 让LLM检索能力激活,成本降低88%

最近,通义实验室和北京大学的研究团队推出了一项名为 ZeroSearch 的创新框架,这一新技术可以在不需要真实搜索的情况下,激活大语言模型的检索能力,并且训练成本降低了惊人的88%。 这一突破为大语言模型的训练和应用提供了全新的思路。 传统的训练方法通常依赖于真实的搜索引擎来获取信息,这不仅造成了高昂的 API 调用成本,还可能因搜索结果的质量不稳定而影响模型的表现。
5/29/2025 2:00:56 PM
AI在线

谷歌放大招!LMEval开源评测框架上线,AI模型比拼从此更透明

近日,谷歌正式发布了开源框架 LMEval,旨在为大语言模型(LLM)和多模态模型提供标准化的评测工具。 这一框架的推出,不仅简化了跨平台模型性能比较,还支持文本、图像和代码等多领域的评估,展现了谷歌在AI评测领域的最新突破。 AIbase为您整理了LMEval的最新动态及其对AI行业的影响。
5/29/2025 12:01:03 PM
AI在线

新神器LocAgent发布,代码定位准确率高达92.7%,程序员的福音!

程序员们又有新工具可以欢呼了!由 OpenHands、耶鲁大学、南加州大学和斯坦福大学的研究团队联手推出的 LocAgent,正是一个专门为代码定位而设计的图索引大语言模型(LLM)代理框架。 令人振奋的是,LocAgent 的代码定位准确率达到了92.7%,这一新高度将在2025年 ACL 会议上正式亮相。 程序员在工作中常常会遇到难以定位代码问题的困扰。
5/29/2025 10:01:21 AM
AI在线

正式开源!DeepSeek-R1-0528震撼发布,性能直逼OpenAI o3,免费API已上线

近日,AI领域迎来重磅消息!中国AI初创公司DeepSeek正式发布了其开源大语言模型 DeepSeek-R1-0528的最新版本。 这一更新不仅在性能上实现了重大突破,还通过免费API的提供进一步推动了AI技术的普及与应用。 以下,AIbase将为您详细解析此次更新的亮点与意义。
5/29/2025 10:01:21 AM
AI在线

快速理解热门 LLM 大语言模型

作者 | masonpy本文尽量用最简单的方式, 帮读者理解 LLM,Transformer, Prompt, Function calling, MCP, Agent, A2A 等这些基本概念。 表述时不追求绝对准确,尽量通俗易懂,部分内容有个人理解的成份,内容难免疏漏, 欢迎指正。 注意:本文需要你有基本的代码阅读能力,当然非开发阅读也不会很困难。
5/29/2025 8:30:00 AM
腾讯技术工程

北大团队首次系统性评估大语言模型心理特征,推动AI评估新标准

在人工智能迅猛发展的今天,大语言模型(LLM)展现出了超凡的能力,但如何科学评估它们的 “心智” 特征,比如价值观、性格和社交智能,依旧是一个亟待解决的难题。 近期,北京大学的宋国杰教授团队发布了一篇全面的综述论文,系统梳理了大语言模型心理测量学的研究进展,为 AI 的评估提供了新视角。 这篇论文名为《大语言模型心理测量学:评估、验证与增强的系统综述》,长达63页,引用了500篇相关文献。
5/27/2025 4:01:00 PM
AI在线