百度
文心4.5最强衍生模型发布 PaddleOCR-VL登顶OCR综合性能全球第一
10月16日晚,百度正式发布并开源自研多模态文档解析模型PaddleOCR-VL。 在全球权威文档解析评测榜单OmniBenchDoc V1.5中,PaddleOCR-VL以92.6分取得综合性能全球第一成绩,四大核心能力(文本、表格、公式、阅读顺序)全线SOTA,超越 GPT-4o、Gemini-2.5 Pro、Qwen2.5-VL-72B等主流多模态大模型,以及MonkeyOCR-Pro-3B、MinerU2.5、dots.ocr等OCR专业模型,刷新全球OCR VL模型性能天花板。 据了解,PaddleOCR-VL其核心模型参数仅0.9B,轻量高效,能够在极低计算开销下,精准识别文本、手写汉字、表格、公式、图表等复杂元素,支持109 种语言,覆盖中文、英语、法语、日语、俄语、阿拉伯语、西班牙语等多语场景,广泛适用于政企文档管理、知识检索、档案数字化、科研信息抽取等文档智能任务。
10/17/2025 11:35:00 AM
新闻助手
官宣定档11月13日!百度世界2025将于北京举办
10月13日,百度官方公众号宣布,百度世界2025将于11月13日在北京·国家会议中心二期举办,大会官网()现已开启售票通道。 作为百度一年一度最重要的技术和产品发布会,本届百度世界或将全面展示百度在AI应用、大模型、AI生态、出海等方面的最新进展。 据悉,百度世界2025以「效果涌现|AI in Action」为主题,设置1 6场顶尖论坛。
10/13/2025 7:33:35 PM
henry
AI视频进入蒸汽机时代
AI 视频生成行业天花板再次被拉高。 百度杀入 AI 视频生成赛道后,就一直加班加点卷个不停。 7 月初,百度第一次正式官宣蒸汽机 1.0 模型,以极致指令遵循能力惊艳亮相;8 月底,百度又发布全球首个中文音视频一体化模型百度蒸汽机 2.0,实现生成视频中人物口型、表情、动作的毫秒级同步。
9/25/2025 11:49:00 PM
机器之心
百度开源视觉理解模型Qianfan-VL!全尺寸领域增强+全自研芯片计算
今天,百度智能云千帆正式推出全新视觉理解模型——Qianfan-VL,并全面开源! 该系列包含3B、8B和70B三个尺寸版本,是面向企业级多模态应用场景,进行了深度优化的视觉理解大模型。 Qianfan-VL不仅具备出色的基础通用能力,还针对产业落地中的高频需求,如OCR和教育垂直场景做了专项强化,使其在实际应用中表现更加卓越。
9/23/2025 1:23:00 AM
鱼羊
科研学术,现在可以百度AI一下了
让人熬到头秃的毕业论文有救了! 刚刚,在第12届AI Day开放日上,百度学术官宣全面“AI重构”——. 它将从我们熟悉的查文献、找引用格式的资料库,升级为覆盖论文全生命周期的“搜、读、创、编”的Research平台。
9/14/2025 5:41:55 PM
henry
开源即登顶!文心思考模型ERNIE-4.5-21B-A3B-Thinking登顶HuggingFace全球模型趋势榜
据HuggingFace官网数据,截至2025年9月11日,百度最新开源的文心思考模型ERNIE-4.5-21B-A3B-Thinking,在HuggingFace文本模型趋势榜上排名第一,模型总榜排名第三。 据介绍,ERNIE-4.5-21B-A3B-Thinking 采用了混合专家(MoE) 架构,总参数规模达21B,每个 token 激活 3B参数,通过指令微调及强化学习训练。 ERNIE-4.5-21B-A3B-Thinking 是在 ERNIE-4.5-21B-A3B 基础上训练的深度思考模型,支持 128K 的上下文窗口,适用于需要长上下文的复杂推理任务。
9/11/2025 6:04:23 PM
量子位的朋友们
文心新出的推理大模型,给了我们信心
当下的大语言模型,不怕它搞不定,就怕它胡说八道:有「幻觉」存在,我们经常会下意识地不信任 AI 输出的结果。 就在上周,OpenAI 的论文《Why Language Models Hallucinate》广为流传。 研究人员指出,要想消除幻觉,需要修正模型训练时的评分机制并开发全新的技术。
9/9/2025 8:26:00 PM
机器之心
WAVE SUMMIT深度学习开发者大会2025举行 文心大模型X1.1、飞桨框架v3.2、文心快码3.5S发布
9月9日,由深度学习技术及应用国家工程研究中心主办,百度飞桨、文心大模型联合承办的WAVE SUMMIT 深度学习开发者大会2025在京举行。 会上,百度重磅发布文心大模型X1.1,并公布文心和飞桨的一系列技术、产品、生态最新成果。 文心X1.1深度思考模型上线,多个基准测试达到SOTA会上,百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰正式发布文心大模型X1.1深度思考模型,该模型在事实性、指令遵循、智能体等能力上均有显著提升。
9/9/2025 11:57:47 AM
百度ALL IN AI:李彦宏现场签发百万美元巨奖,直言AI大模型已达“临界点”
今日,百度秋日嘉年华暨最高奖颁奖典礼在百度科技园隆重举行。 百度创始人、董事长兼首席执行官李彦宏亲临现场,为获奖团队颁发了每支团队100万美元的奖金支票,以表彰其杰出贡献。 在颁奖典礼上,李彦宏就AI的未来发展发表了深刻见解。
9/9/2025 9:01:23 AM
AI在线
百度搜索AI助手全量上线极速模型 搜索结果生成速度大提升
百度宣布其搜索 AI 助手全面上线了全新的极速模型。 这一自研技术的推出,意味着百度在搜索结果的生成速度上有了质的飞跃。 根据最新的数据与测试,与之前的 DeepSeek V3.1相比,新的极速模型在效果保持相同的情况下,搜索结果的生成速度提升了5倍,而调用成本则降低至仅70%。
8/29/2025 6:27:05 PM
AI在线
百度未来五年计划培养 1000 万 AI 人才
近日,国务院常务会议审议通过了《关于深入实施 “人工智能 ” 行动的意见》,为中国人工智能技术与产业的深度融合以及规模化商业应用指明了方向。 百度副总裁石清华表示,《意见》的出台标志着中国在人工智能领域迈入全面融合、深化应用的新阶段。 作为国内领先的人工智能公司,百度在过去十年中已累计投入超过1800亿元人民币用于研发。
8/29/2025 9:27:06 AM
AI在线
百度沈抖:一个企业可以只有一个官网,但一定会有大量的Agents
“智能经济时代,一定要有新的基础设施来支撑,这就是智能优先的AI云。 ”8月28日的2025百度云智大会上,百度集团执行副总裁、百度智能云事业群总裁沈抖给出了云厂商在AI原生时代的新定位。 从个人调用AI聊天、独立开发者使用AI打造“一人公司”,到企业借力AI重构传统业务,不同用户群体共同催生了AI云需求的大爆发。
8/28/2025 1:32:00 PM
郑佳美
百度AI搜索APP“梯子AI”发布:由Tizzy.ai改名而来 主打无广告
近日,百度旗下AI搜索应用在完成前期紧密测试后,正式以全新名称“梯子AI”上架应用市场,标志着百度在人工智能搜索领域迈出了重要一步。 据悉,这款应用最初于8月10日以“Tizzy.ai”之名发布,迅速吸引了众多科技爱好者的关注。 经过一系列优化与迭代,其版本号从初版的1.0.0直接跃升至1.2.0,不仅名称焕然一新,功能与服务也实现了全面升级。
8/27/2025 9:21:13 AM
AI在线
多人有声视频一体化生成!用百度最新AI生成营销视频,现在1.4元/5秒
最初说不做视频生成模型的百度,现在在视频生成的路上一路狂奔! 就在刚刚,百度蒸汽机(MuseSteamer)视频生成大模型升级至2.0版本,主打多人有声音视频一体化生成。 话不多说,直接来看效果:视频链接:.
8/22/2025 10:54:47 AM
西风
刚刚,好莱坞特效师展示AI生成的中文科幻大片,成本只有330元
多模态的生成,是 AI 未来的方向。 最近,AI 领域的气氛正在发生微妙的变化。 比如,刚刚推出了 Grok 4 的 xAI 却在重点宣传他们的视频生成模型 Grok Image。
8/21/2025 9:49:00 PM
机器之心
仅50天!百度蒸汽机视频生成大模型升级2.0版本,价格低至行业70%
8月21日,百度蒸汽机(MuseSteamer)音视频一体化模型完成重大升级,Turbo版、Lite版、Pro版,及有声版全面开放,在行业内首次实现多人有声音视频一体化生成。 百度蒸汽机通过五大技术突破实现“需求即成片”,在生成电影级高清视频画面的同时,实现逼真环境音效、自然人物语音的同步输出。 即日起,用户可通过百度搜索“百度蒸汽机”或登录“绘想”平台体验,企业用户可在千帆平台享受高性能视频生成服务。
8/21/2025 6:33:48 PM
云昭
百度智能云重磅发布“AI创投加速计划” 为入选企业提供亿级算力补贴!
8月12日,百度AI DAY在北京举办。 活动以「AI新势力的商业进化」为主题,聚焦电商、游戏、可穿戴设备、具身智能等创新和重点赛道,全面展现百度智能云的全栈AI赋能方案及实践成果。 心影随形、李未可科技、灵生科技、述信科技、VAST等AI创企代表受邀出席,集中分享企业商业落地的实战经验。
8/12/2025 8:02:18 PM
直击WAIC:萝卜快跑入选「国家队」,AI数字人技术升级,百度全栈自研杀疯了
前几天,奥特曼在采访中透露,亲自体验 GPT-5 后,被其强大的能力吓到。 有个自己都搞不懂的问题,模型却能一下答出来,那一刻他甚至觉得自己在擅长的领域也有些「无力」。 尽管 AI 进展飞快,但总有人质疑:真正落地的 AI 不多,很多所谓的新技术,可能只是炒作。
7/26/2025 11:08:00 PM
机器之心
资讯热榜
OpenAI 宣布印度用户可享受一年免费 ChatGPT Go 服务
软银豪掷225亿美元加码OpenAI,AI音乐与超级融资计划全面提速
全网刷屏的「电影感」三宫格图片,教你用AI快速生成!
LangChain V1.0 深度解析:手把手带你跑通全新智能体架构
消息称软银批准对 OpenAI 追加 225 亿美元投资,助力未来上市
LLM 应用评估综合指南(多轮对话系统、RAG、AI Agent)
LLM近一半回答在扭曲真相!ChatGPT、Gemini,全部顶流模型统统中招!BBC研究:AI系统性错误把媒体拖下水,信任滑坡
红杉资本注资Rogo Technologies,AI 工具或将颠覆初级银行家角色
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
机器人
大模型
数据
Midjourney
开源
Meta
智能
微软
用户
AI新词
GPT
学习
技术
智能体
马斯克
Gemini
图像
Anthropic
英伟达
AI创作
训练
LLM
论文
代码
算法
Agent
AI for Science
芯片
苹果
腾讯
Stable Diffusion
Claude
蛋白质
开发者
生成式
神经网络
xAI
机器学习
3D
RAG
人形机器人
研究
AI视频
生成
大语言模型
具身智能
Sora
工具
GPU
百度
华为
计算
字节跳动
AI设计
AGI
大型语言模型
搜索
视频生成
场景
深度学习
DeepMind
架构
生成式AI
编程
视觉
Transformer
预测
AI模型
伟达
亚马逊
MCP