大语言模型
OpenAI回归开源:gpt-oss-120b和gpt-oss-20b完整指南
译者 | 陈峻审校 | 重楼本文将向你介绍OpenAI新发布的两个开源模型--gpt-oss-120b和gpt-oss-20b,它们的特点,以及在何种场景下该使用哪个模型。 近期,OpenAI发布了两个开源的大语言模型(LLM)--gpt-oss-120b和gpt-oss-20b。 它们是自GPT-2以来,由OpenAI第一个公开许可的LLM。
8/15/2025 8:17:41 AM
陈峻
AI能替你写代码,但近半数代码可能暗藏安全漏洞
Veracode发布的《2025年GenAI代码安全报告》显示,虽然GenAI擅长编写可运行的代码,但在45%的情况下会引入安全漏洞,该报告分析了80个真实编程任务中100多个大语言模型(LLM)生成的代码。 氛围编程Veracode首席技术官延斯·韦斯林(Jens Wessling)表示:“氛围编程(vibe coding)的兴起,标志着软件开发方式的根本转变。 在氛围编程中,开发者通常依赖AI生成代码,且不明确规定安全要求,这种趋势的主要问题在于,开发者无需指定安全约束就能得到想要的代码,实际上是将安全编码决策交给了大语言模型。
8/11/2025 7:30:00 AM
Bill Inmon:为什么你的数据湖需要的是 BLM,而不是 LLM
当你尝试使用文本生成 AI 解决结构化数据问题时,你投资的数据湖就变成了‘污水池’ 。 ” —— Bill Inmon根据 Gartner 的研究,85% 的大数据项目都失败了。 2023 年,规模达 152 亿美元的数据湖市场增长了 20% 以上,但大多数企业却无法从文本数据中提取价值。
7/31/2025 3:00:00 AM
晓晓
英伟达全新开源模型:三倍吞吐、单卡可跑,还拿下推理SOTA
henry 发自 凹非寺. 量子位 | 公众号 QbitAI众所周知,老黄不仅卖铲子(GPU),还自己下场开矿(造模型)。 英伟达最新推出的Llama Nemotron Super v1.5开源模型就专为复杂推理和agnet任务量身打造。
7/29/2025 3:05:03 PM
henry
多模态大语言模型(LLM) 和视频语言预训练的关键进展、应用、数据集和方法
随着视频应用的发展,大量视频被上传到网上。 因此,如何利用视频及其对应的弱字幕进行表征学习成为近期的热门话题。 本文将回顾大规模视频语言预训练任务的最新进展、后续应用、基础数据集和技术。
7/24/2025 2:00:00 AM
晓晓
数据治理对人工智能的成功至关重要
自 ChatGPT 发布以来,大语言模型 (LLM) 已进入主流,促使各行各业和公司纷纷探索其在业务转型中的潜力。 此后,许多技术应运而生,帮助团队构建更强大的 AI 系统:RAG、向量数据库、重排序器、推理模型、工具使用、MCP、代理框架等等。 这些工具和技术显然很有用;然而,提升 AI 系统业务影响力的最有效方法依然是数据。
7/21/2025 8:19:13 AM
晓晓
重大突破!研究团队揭示大语言模型内部潜藏的 “奖励机制”
近日,南京大学的周志华教授团队发布了一项重要研究,首次理论证明了在大语言模型中可以发现内源性奖励模型,并有效应用强化学习(RL)来提升模型表现。 当前,许多对齐方法依赖于人类反馈强化学习(RLHF),这种方法需要大量高质量的人类偏好数据来训练奖励模型。 然而,构建这样一个数据集不仅耗时费力,还面临成本高昂的挑战。
7/2/2025 6:00:45 PM
AI在线
字节跳动推出 ProtoReasoning 框架:提升大语言模型的逻辑推理能力
近日,字节跳动的研究与上海交通大学的团队共同推出了名为 ProtoReasoning 的新框架,旨在通过逻辑原型来增强大语言模型(LLMs)的推理能力。 该框架利用结构化的原型表示,如 Prolog 和 PDDL,推动了跨领域推理的进展。 近年来,大语言模型在跨领域推理方面取得了显著突破,尤其是在长链推理技术的应用下。
6/25/2025 11:00:54 AM
AI在线
法拉第未来重磅发布FF AI2.0:与OpenAI深度融合,支持50种语言智能交互
6月24日,法拉第未来正式宣布推出FF AI2.0智能座舱操作系统,这是自2023年FF91发布以来最重大的智能座舱升级。 新系统将通过OTA软件更新首先部署到FF912.0车型,并计划未来扩展至FX系列。 FF AI2.0实现了整个AI架构的全面重构,其最大亮点是与OpenAI的深度融合。
6/24/2025 4:00:42 PM
AI在线
Anthropic 警告:包括 Claude 在内的大多数 AI 模型会实施“勒索”行为
在数周前发布研究指出其 Claude Opus 4 模型在受控测试中试图通过勒索手段阻止被关闭后,Anthropic 近日再度公布新研究,显示此类行为在多个主流 AI 模型中可能更为普遍。
6/21/2025 8:01:06 AM
清源
AM-Thinking-v1:解锁 32B 模型推理潜力的密码
大家好,我是肆〇柒。 本篇想和大家分享一个后训练的模型案例 ——AM-Thinking-v1 模型。 这个模型是由贝壳(Ke.com)公司旗下的 a-m-team 团队开发的,他们一直致力于探索 AGI 技术。
6/18/2025 2:30:00 AM
肆零柒
一文读懂LLM基于JSON Schema的结构化输出
什么是基于JSON Schema的结构化输出大语言模型通常会生成无特定结构的自由格式文本,在能够有效使用之前需要进行大量的后期处理。 这种不可预测性会导致错误、浪费时间并增加成本。 OpenAI推出基于JSON Schema的结构化输出以解决这一问题。
6/12/2025 2:30:00 AM
AI大模型应用开发
Qwen:PARSCALE 让语言模型在并行中飞跃
大家好,我是肆〇柒。 今天,我们来聊聊大型语言模型(LLM)领域的一项研究——PARSCALE。 在人工智能快速发展的当下,大型语言模型应用前景无比广阔,然而,随着模型规模的不断膨胀,我们正面临着前所未有的挑战。
6/11/2025 2:00:00 AM
肆零柒
苹果再轰AI推理能力,GitHub大佬怒怼:这不是推理能力的真实面貌!
最近,苹果公司发布了一篇引发热议的论文,指出当前的大语言模型(LLM)在推理方面存在重大缺陷。 这一观点迅速在社交媒体上引起热议,尤其是 GitHub 的高级软件工程师 Sean Goedecke 对此提出了强烈反对。 他认为,苹果的结论过于片面,并不能全面反映推理模型的能力。
6/10/2025 5:00:56 PM
AI在线
美团王兴详解AI布局:No Code平台免费开放,1680个应用已上线
在近日于北京美团总部恒电大厦举行的股东大会上,美团创始人王兴首次系统阐述了公司在人工智能领域的战略布局和发展规划,揭示了美团在AI浪潮中的深度思考与大胆实践。 王兴将美团的AI发展划分为不同阶段。 早期,公司已在外卖配送的路由和派单系统中应用深度神经网络算法。
6/10/2025 3:00:56 PM
AI在线
文档解析LLM MonkeyOCR震撼登场:3B小模型完胜Gemini
随着大语言模型(LLM)技术的迅猛发展,文档解析领域迎来了一位新星——MonkeyOCR。 这款轻量级文档解析模型以其卓越的性能和高效的处理速度,迅速成为业界关注的焦点。 MonkeyOCR:小模型,大能量MonkeyOCR以仅3B参数的轻量级架构,在英文文档解析任务中展现出惊艳的性能。
6/9/2025 12:00:56 PM
AI在线
400+AI模型解锁网络搜索!Exa联手OpenRouter引爆RAG革命
Exa与OpenRouter宣布达成合作,为超过400种大语言模型(LLMs)提供实时网络搜索功能。 这一突破性进展将显著提升AI模型的实用性和信息获取能力,为开发者、研究人员以及普通用户带来全新的交互体验。 以下是AIbase对这一合作的深度解读与分析。
6/4/2025 9:01:04 AM
AI在线
微信自研高性能推理计算引擎 XNet-DNN:跨平台 GPU 部署大语言模型及优化实践
作者 | yannicXNet-DNN 是微信高性能计算团队自主研发的一款全平台神经网络推理引擎。 我们在 XNet 的 RCI 基础设施之上构建了全平台的 GPU LLM . 推理能力。
6/3/2025 9:25:00 AM
腾讯技术工程
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
大模型
机器人
数据
AI新词
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
技术
智能体
Gemini
马斯克
Anthropic
英伟达
图像
AI创作
训练
LLM
论文
代码
算法
苹果
AI for Science
Agent
Claude
芯片
腾讯
Stable Diffusion
蛋白质
开发者
具身智能
xAI
生成式
神经网络
机器学习
3D
AI视频
人形机器人
RAG
大语言模型
研究
百度
Sora
生成
GPU
工具
华为
计算
字节跳动
AGI
大型语言模型
AI设计
搜索
生成式AI
视频生成
DeepMind
特斯拉
场景
深度学习
AI模型
架构
亚马逊
Transformer
MCP
编程
视觉
预测