AI在线 AI在线

小米 Mi-BRAG 智能引擎亮相:用 AI 问答代替产品说明书,登上评测榜首

小米官方今日介绍了 Mi-BRAG 知识库问答框架,该框架通过四大核心技术体系重构知识处理范式,已在公司多个场景中落地应用,包括小爱同学的个人信息问答、汽车问答助手、商品问答等。
感谢小米官方今日介绍了 Mi-BRAG 知识库问答框架,该框架通过四大核心技术体系重构知识处理范式,已在公司多个场景中落地应用,包括小爱同学的个人信息问答、汽车问答助手、商品问答等
  • 全格式兼容:搭载智能解析引擎,可无损处理 PDF、Word、Excel 等十余种文档格式,为企业构建统一知识库奠定基础;

  • 全模态解析:突破传统文本局限,精准解析复杂图片、表格、图文混排等多元信息;

  • 多语种问答:支持主流语言的文档解析与交互问答,打破知识流通的语种壁垒;

  • 细粒度溯源:采用动态溯源定位技术,对每个生成结果标注原始文档及引用位置,一键追溯信息源头,构建可信知识生态。

图片

小米官方介绍称,大模型(LLM)虽具备强大的生成能力,但仍面临诸多挑战:知识更新成本高、企业私有知识理解不足、数据安全隐患等。RAG(Retrieval-Augmented Generation,检索增强生成)技术的引入为这些问题提供了有效的解决方案。

  • 弥补大模型的时新性大模型基于历史数据进行训练,无法获取最新信息。RAG 通过检索最新的文档或数据库,可为生成过程注入实时信息,确保输出内容的准确性与时效性;

  • 增强特定领域知识的准确性:大模型基于互联网公开数据,难以涵盖特点领域或者企业私有知识。RAG 技术通过构建外部知识库,实现特定知识注入,从而增强其在特定领域的表现;

  • 数据隐私与安全性:大模型直接处理企业敏感数据(如内部文档)可能引发隐私泄露风险。RAG 通过检索阶段调用私有数据库(如本地化存储的企业知识库),在生成答案时仅基于检索到的相关片段进行加工,避免原始数据被模型存储或泄露。

小米在场景上 TOC(小爱个人信息问答、智能文档问答等)和 TOB(集团内部提效:新产品研发、员工助手、智能客服)等大量应用场景亟须自研的 RAG 框架提供领域安全高可靠的智能知识中枢提升产品的智能化及用户体验。

图片

小米大模型团队认为,一个完整的知识问答框架应该包含如上图所示的四个部分:知识库创建(B)、知识检索(R)、知识增强(A)和回复生成(G)。而知识库创建(B)模块其实特别重要,对问答效果会产生至关重要的影响,不应被忽视,所以小米大模型团队将框架命名为 Mi-BRAG 。Mi-BRAG 支持多种格式文档解析和图文混合的多模态问答,为用户提供更多应用选项。

在 RAG 的基础框架下,自研框架 Mi-BRAG 的技术创新主要分布在:

  • 知识库创建(B):跨模态的知识融合及构建“金字塔型”动态知识体系等;

  • 知识检索(R-A):用户 Query 理解的增强,多维语义增强等;

  • 回复生成(G):为知识注入场景定制模型,强化无关信息的拒答、精细化的溯源的能力。

第三方评测机构 SuperCLUE 通过单文档问答、多文档问答及搜索问答三大典型场景的综合评估,小米 2025 年 4 月在 SuperCLUE-RAG 生成能力评测中登上榜首。这主要归功于 Mi-BRAG 在抗噪声数据处理与信息整合方面的创新数据构建方法,以及其突破性的模型训练范式。

图片

ASQA 是一个长格式的事实类数据集,测试集中的每个问题,需要多个简短答案来涵盖对问题的不同解释。因此,模型要综合多份文件中的信息进行回答。小米团队测试了 Mi-BRAG 和业界大模型在 ASQA 测试集上的表现,评测过程主要关注多文档生成溯源准召率。

图片

AI在线从小米官方公告获悉,目前小米 Mi-BRAG 已在小爱同学个人信息问答,汽车问答助手,商品问答等场景落地,未来小米大模型团队将持续攻坚端侧算力优化与云边协同架构,内存压缩、功耗控制等关键技术领域实现突破;同时将深化多模态技术整合,打造覆盖文本、语音、视觉的全模态智能问答体系,持续拓展智能家居、汽车问答等应用场景,全面赋能小米「人车家全生态」战略体系。

相关资讯

消息称小米成立 AI 平台部,张铎担任负责人

小米上周进行一系列人事变动,其中基础技术平台部成立 AI 平台部,张铎担任 AI 平台部负责人,向基础技术平台部总经理冯宏华汇报,组织上基础技术平台部属于小米技术委员会。(雷峰网)
11/13/2024 3:14:09 PM
汪淼

调查:超72% 的企业选择 AI 工具时最看重易用性

根据最近的一项 CIO 报告,企业在人工智能(AI)领域的投资高达2.5亿美元,尽管在证明投资回报率(ROI)方面面临挑战。 商业领袖们正努力提高生产力,但新技术的集成往往需要重构现有应用、更新流程并激励员工学习,以适应现代商业环境。 QuickBlox 首席执行官 Nate MacLeitch 对136位高管进行了调查,以揭示 AI 采用的现实情况,探讨领导者的首要任务、主要担忧以及他们在2025年寻找可信工具的信息来源。
3/18/2025 10:02:00 AM
AI在线

可保护作品免遭 AI 训练,Adobe 推出 Content Authenticity 应用

Adobe 推出全新应用 Content Authenticity,用于保护创意工作者的作品署名权,即使有人截屏并在网络二次传播也不受影响。这款网页应用于今日面向公众开放测试,用户上传需要保护的图像,应用就能嵌入隐形元数据和添加“禁止 AI 训练”标签,帮助确认作品归属和保护作品免遭 AI 训练。
4/24/2025 9:32:18 PM
准泽(实习)
  • 1