文心大模型
开源即登顶!文心思考模型ERNIE-4.5-21B-A3B-Thinking登顶HuggingFace全球模型趋势榜
据HuggingFace官网数据,截至2025年9月11日,百度最新开源的文心思考模型ERNIE-4.5-21B-A3B-Thinking,在HuggingFace文本模型趋势榜上排名第一,模型总榜排名第三。 据介绍,ERNIE-4.5-21B-A3B-Thinking 采用了混合专家(MoE) 架构,总参数规模达21B,每个 token 激活 3B参数,通过指令微调及强化学习训练。 ERNIE-4.5-21B-A3B-Thinking 是在 ERNIE-4.5-21B-A3B 基础上训练的深度思考模型,支持 128K 的上下文窗口,适用于需要长上下文的复杂推理任务。
9/11/2025 6:04:23 PM
量子位的朋友们
文心新出的推理大模型,给了我们信心
当下的大语言模型,不怕它搞不定,就怕它胡说八道:有「幻觉」存在,我们经常会下意识地不信任 AI 输出的结果。 就在上周,OpenAI 的论文《Why Language Models Hallucinate》广为流传。 研究人员指出,要想消除幻觉,需要修正模型训练时的评分机制并开发全新的技术。
9/9/2025 8:26:00 PM
机器之心
WAVE SUMMIT深度学习开发者大会2025举行 文心大模型X1.1、飞桨框架v3.2、文心快码3.5S发布
9月9日,由深度学习技术及应用国家工程研究中心主办,百度飞桨、文心大模型联合承办的WAVE SUMMIT 深度学习开发者大会2025在京举行。 会上,百度重磅发布文心大模型X1.1,并公布文心和飞桨的一系列技术、产品、生态最新成果。 文心X1.1深度思考模型上线,多个基准测试达到SOTA会上,百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰正式发布文心大模型X1.1深度思考模型,该模型在事实性、指令遵循、智能体等能力上均有显著提升。
9/9/2025 11:57:47 AM
百度AICA第9期开课:18大行业96位首席AI架构师齐探AI产业落地
8月15日,由百度与深度学习技术及应用国家工程研究中心联合发起的AICA首席AI架构师培养计划(以下简称“AICA”)在北京举办第九期开学典礼。 经过半年的预科班课程学习、严格的项目技术评审以及面评等多重筛选,96位企业CTO、技术高管学员从近500位报名者中脱颖而出,将开展为期半年的 AI 大模型研发和应用共创学习。 茅台、麦当劳、奔驰等90余家来自18个行业的企业技术管理者将与百度一起围绕大模型、多模态、智能体和产业链协同等前沿方向,开启为期半年的共学之旅。
8/15/2025 5:11:55 PM
鹭羽
英特尔助力百度文心大模型 4.5,实现端侧部署
6月30日,百度正式开源了其最新的文心大模型4.5系列,包含了多达10款模型,其中包括47B 和3B 激活参数的混合专家模型(MoE)以及0.3B 参数的稠密型模型。 这次开源不仅让开发者能够免费使用这些强大的模型,还提供了预训练权重和推理代码,方便开发者进行各种应用。 而在此次发布中,英特尔也展现了其强大的技术支持。
7/1/2025 10:01:01 AM
AI在线
百度重磅开源文心大模型 4.5 系列,国内大模型市场再掀波澜!
近日,百度正式宣布开源其文心大模型4.5系列,共推出了十款模型,包括47B、3B 激活参数的混合专家(MoE)模型,以及0.3B 参数的稠密型模型。 此次开源不仅实现了预训练权重的完整公开,还提供了推理代码,标志着百度在大模型领域的重大进展。 这些新发布的模型可以在飞桨星河社区、Hugging Face 等平台上下载和部署,同时,百度智能云千帆大模型平台也提供了相应的 API 服务。
6/30/2025 3:00:50 PM
AI在线
百度正式开源文心大模型 4.5 系列模型
百度今日正式开源文心大模型 4.5 系列模型,涵盖 47B、3B 激活参数的混合专家(MoE)模型,与 0.3B 参数的稠密型模型等 10 款模型,并实现预训练权重和推理代码的完全开源。
6/30/2025 10:42:34 AM
汪淼
百度发布文心大模型 4.5 Turbo 与 X1 Turbo:降价提速,强力进化
在4月25日举行的百度 Create 开发者大会上,百度创始人李彦宏隆重发布了最新的文心大模型系列 —— 文心4.5Turbo 和 X1Turbo。 这两款新模型在速度和成本方面都进行了显著优化,标志着百度在人工智能领域的进一步突破。 据悉,文心4.5Turbo 相比于之前的版本,其速度提升显著,处理效率更高,同时价格下降了整整80%。
4/25/2025 3:00:48 PM
AI在线
百度王海峰:详解文心4.5 Turbo、X1 Turbo两大模型背后技术
4月25日,Create2025百度AI开发者大会在武汉举办。 百度创始人李彦宏发布了文心大模型4.5 Turbo及深度思考模型X1 Turbo两大模型,以及多款AI应用。 百度首席技术官王海峰现场详细解读了背后的技术。
4/25/2025 2:53:09 PM
百度发布文心大模型 4.5 Turbo / X1 Turbo:主打多模态、强推理、低成本
其对比文心 4.5,速度更快、价格下降 80%,每百万 token 的输入价格仅为 0.8 元,输出价格 3.2 元,仅为 DeepSeek-V3 的 40%。
4/25/2025 10:29:37 AM
清源
百度:文心大模型 4.5 Turbo 4 月 25 日见
文心大模型4.5 Turbo将于4月25日的Create大会上正式亮相,但官方并未详细描述这款新模型将带来的升级。
4/10/2025 11:44:30 AM
清源
百度文小言全面升级,推出多模型融合调度与新语音大模型
在刚刚结束的百度 AI DAY 上,百度文小言正式宣布了品牌焕新和功能升级的消息。 此次升级不仅包括全新的视觉形象,更重要的是引入了多模型融合调度技术,这将极大增强其语音识别和图片问答的能力。 文小言的多模型融合调度是本次升级的核心亮点。
3/31/2025 4:32:00 PM
AI在线
DeepSeek概念股今日走强,百度、金山云、阿里巴巴领涨
港股DeepSeek概念股今日表现抢眼,多数个股强势上涨。 截至发稿,百度集团-SW上涨9.18%,金山云上涨5.03%,阿里巴巴-W上涨4.58%。 这一波行情背后,既有百度文心大模型技术迭代的催化,也受腾讯加速布局大模型引发的算力需求激增推动,叠加政策与市场情绪共振,科技板块热度持续升温。
3/18/2025 1:52:00 PM
AI在线
百度发布文心4.5与X1大模型,价格大幅降低引关注
近日,百度正式推出其最新的文心大模型4.5及文心大模型 X1,用户可在文心一言官网免费体验这两款先进的模型。 文心4.5是百度首个原生多模态大模型,专注于多模态理解和逻辑推理,其性能在多项基准测试中超越了 GPT-4.5,API 调用价格仅为后者的1%。 这一显著的价格优势,无疑会吸引更多开发者和企业的关注。
3/16/2025 11:35:00 AM
AI在线
消息称百度文心 4.5 模型计划 3 月中旬发布,推理及多模态能力将获提升
知情人士表示,升级后的文心 4.5 将具备更强的多模态能力。多模态AI系统能够处理和整合文本、视频、图像、音频等不同类型的数据,并能在不同格式之间进行转换。
2/27/2025 2:43:37 PM
清源
百度APP全面焕新:上线AI入口 DeepseekR1深度搜索不卡顿
今日,百度App宣布了一项重大更新,正式全量上线了全新的AI入口,并将文心大模型与DeepSeek的模型能力进行了深度整合,为用户带来了全面升级的使用体验。 此次升级的核心亮点在于集成了多项前沿的智能功能,包括“AI搜索”、“全网信息提炼”、“捏一下AI总结”以及“数字人智能体”等。 这些功能的加入,使得百度App能够更加精准地理解用户需求,提供更加个性化的搜索结果和智能总结。
2/24/2025 2:37:00 PM
AI在线
李彦宏解读文心大模型 4.5 开源的意义:开源促进技术普及
在最近的财报电话会上,百度创始人李彦宏就文心大模型4.5系列的开源决策进行了深入的分析。 他表示,从其自主研发的 DeepSeek 项目中,百度深刻认识到开源的最佳模型将大大推动用户的使用和接受程度。 当一个强大的模型实现开源时,自然会吸引更多的人出于好奇心进行尝试,这样的行为不仅能够促进技术的普及,也会带来更广泛的应用。
2/19/2025 10:02:00 AM
AI在线
李彦宏回应开源文心4.5:DeepSeek让我们明白要开源
近日,百度创始人李彦宏在百度2024年四季度及全年财报电话会上,就公司决定开源文心大模型4.5系列的原因进行了详细阐述。 李彦宏指出,百度从DeepSeek项目中汲取了宝贵经验,即开源最佳模型能够极大地促进用户对该模型的采用和认可。 他解释称,当一个模型被开源后,人们的好奇心会驱使他们进行尝试,这种自然的探索行为有助于模型更广泛地应用于实际场景中。
2/19/2025 9:00:24 AM
AI在线
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
Meta
用户
微软
GPT
学习
技术
图像
Gemini
智能体
马斯克
AI新词
AI创作
Anthropic
英伟达
论文
训练
代码
算法
LLM
Stable Diffusion
芯片
腾讯
苹果
蛋白质
Claude
开发者
AI for Science
Agent
生成式
神经网络
机器学习
3D
xAI
研究
人形机器人
生成
AI视频
百度
计算
工具
Sora
GPU
大语言模型
华为
RAG
AI设计
字节跳动
具身智能
搜索
大型语言模型
场景
深度学习
AGI
视频生成
预测
视觉
伟达
架构
Transformer
神器推荐
DeepMind
亚马逊
特斯拉
编程
AI模型