AI在线 AI在线

钉钉与OpenDataLab联合推出文档解析工具DLU

在快速发展的人工智能领域,OpenDataLab 与钉钉携手推出了一款名为 DLU 的文档解析工具,旨在帮助企业用户更高效地处理和理解专业内容。 这款工具基于强大的智能文档解析引擎 MinerU 开发,预计将在近期开源,助力 AI 应用的普及与落地。 MinerU 在 GitHub 上已有超过 4 万的星标,其 2.0 版本更是以优异的解析性能受到广泛赞誉。

在快速发展的人工智能领域,OpenDataLab 与钉钉携手推出了一款名为 DLU 的文档解析工具,旨在帮助企业用户更高效地处理和理解专业内容。这款工具基于强大的智能文档解析引擎 MinerU 开发,预计将在近期开源,助力 AI 应用的普及与落地。

MinerU 在 GitHub 上已有超过 4 万的星标,其 2.0 版本更是以优异的解析性能受到广泛赞誉。DLU 不仅继承了 MinerU 的技术优势,还支持多种文档格式,能够精准提取复杂元素,将其转化为高质量的语料。这对于需要处理大量文档的企业用户来说,无疑是一项重大的利好。

未来,DLU 将深度融入钉钉的办公协同生态系统,形成完整的闭环流程。这意味着企业用户在使用钉钉进行日常办公时,可以轻松利用 DLU 进行文档解析,进一步提升工作效率。相关负责人表示,开源 DLU 的举措将极大助力企业的智能化转型以及行业的数字化升级。

在数字经济蓬勃发展的今天,企业对于高效信息处理的需求日益增强。DLU 的推出,正是响应了这一需求,通过降低 AI 应用的开发门槛,帮助企业更快地融入智能化的浪潮。相信随着 DLU 的推广,更多企业将能够利用这项技术,提升自身的竞争力。

OpenDataLab 与钉钉的合作,将推动文档解析技术的应用落地,为企业的数字化转型提供强有力的支持。我们期待 DLU 在未来的表现,也希望更多企业能够借此机会,拥抱 AI 技术,开创更美好的工作方式。

相关资讯

MinerU部署实践:从零开始搭建你的专属PDF解析服务

在多模态RAG(Retrieval-Augmented Generation)系统中,PDF文件的高效、安全解析与处理是实现高质量知识检索和生成的关键环节。 PDF文件通常包含丰富的文本、图像和表格信息,这些多模态数据的有效提取和整合对于提升RAG系统的性能至关重要。 然而,传统的PDF解析工具往往存在解析精度不足、无法处理复杂格式(如图像和表格)等问题,尤其是在涉及私密文档时,数据安全和隐私保护也是一大挑战。
4/23/2025 3:00:00 AM
Goldma

MinerU vs DeepDoc:集成方案+图片显示优化

如上篇文章最后所言,进一步优化原始文档解析和分块策略是控制变量法下,提高最后检索效果天花板的务实做法。 从这篇开始,在对历史项目进行迭代的同时,会陆续对不同的文档解析方法和动态分块策略给出更多的原理解析和案例参考。 图片来源:,试图说清楚文档解析工具大致构成,MinerU 和 Deepdoc 对比,MinerU 部署,以及如何和图片服务方案结合使用。
5/6/2025 9:38:50 AM
韦东东

MinerU 2.0部署教程!

1、MinerU简介MinerU 2带来了诸多重要更新,主要涵盖架构、性能、体验、模型、兼容性等方面。 在架构上,深度重构代码组织与交互方式,去除对pymupdf的依赖,无需手动编辑JSON配置文件,新增模型自动下载与更新机制。 性能优化显著,大幅提升特定分辨率文档的预处理速度、pipeline后端批量处理少量页数文档时的后处理速度以及layout分析速度,在满足一定配置的设备上整体解析速度提升超50%。
7/24/2025 3:00:00 AM
Goldma
  • 1