AI在线 AI在线

文档

我用这两个提示在 ChatGPT 中创建了 7 万多个提示

当发现越来越多的人喜欢自己的提示时,便萌生了产出更多高品质提示的想法。 为了深入了解他人都在设计哪些提示,不得不上网搜索各种示例和灵感。 最终,灵光一现:为何不先定义一组“超大角色提示”模板,再配套一套“后续跟进提示”模板,以此批量生成所需内容?
6/16/2025 1:33:00 AM
前端小智

GraphRAG太慢LightRAG延迟高?华东师大新方法一招破解双重难题

GraphRAG的索引速度慢,LightRAG的查询延迟高? 这些影响效率的难题,现在终于迎来改进——由华东师范大学李翔老师带领的的Planing Lab团队推出高效解决方法E²GraphRAG。 该方法在大部分测试中接近了最优的GraphRAG方法。
6/13/2025 1:33:00 AM

万人在看,用Deepseek根据需求定制化写文档并导出,你一定用的上!

需求分析前几天工程立项,主要批量写功能点用于新一年的工程预算。 但是工作量大,共计20000 行左右,要求3天之内完成。 图片文档主要结构及表头信息如下(提供模版部分字段)图片由于工作量太大,手工敲需要消耗大量的人力,于是借助deepseek大模型实现,让AI帮忙干活。
5/30/2025 2:10:00 AM
微微一笑

AI神器LlamaParse:一键解锁PDF表格与文档,效率飙升的秘密武器!

PDF文档的复杂表格和文本处理一直是许多行业的痛点,而一款名为LlamaParse的人工智能工具正在改变这一现状。 凭借先进的AI技术,LlamaParse能够高效解析PDF中的复杂内容,自动将表格转为Markdown格式,并支持发票、合同等多种文档的自动化处理。 AIbase综合最新信息,为您深度解析LlamaParse如何为企业和开发者带来革命性体验。
5/26/2025 11:00:50 AM
AI在线

百度飞桨PaddleOCR 3.0开源发布 OCR精度跃升13%

2025年5月20日,百度飞桨团队正式发布了PaddleOCR3.0版本,并对外开源。 这一新版本在文字识别精度、多语种支持、手写体识别以及高精度文档解析等方面取得了显著进展,进一步提升了PaddleOCR在OCR领域的技术实力和应用价值。 PaddleOCR自发布以来,凭借其学术前沿算法和产业落地实践,受到了产学研各方的喜爱,并被广泛应用于众多知名开源项目。
5/22/2025 10:00:56 AM
AI在线

阿里通义实验室推出 ZeroSearch:让大模型无需 API 自我 “搜索”

在人工智能的迅速发展中,如何提升大语言模型(LLM)的检索和推理能力成为研究的热门话题。 近日,阿里通义实验室提出了一个名为 “ZeroSearch” 的新框架,它能够使大型语言模型自己模拟搜索引擎,从而在没有实际搜索引擎的情况下,提升其推理能力。 传统的搜索引擎虽然强大,但在训练大模型时,它们的输出质量常常不可预测,可能导致训练过程中的噪声和不稳定。
5/19/2025 11:01:05 AM
AI在线

合合信息推出 MCP 服务,助力大模型高效智能文档处理

在人工智能和大模型技术飞速发展的今天,如何高效调用外部工具已成为开发者们面临的新挑战。 不同大模型的调用结构和参数格式各不相同,导致开发者不得不为每种模型单独编写工具调用逻辑,进而影响了集成的效率。 为了解决这一难题,合合信息近日推出了文档处理领域首批 MCP(Model Context Protocol)服务,为企业和开发者提供了一个 “万能接口”。
5/13/2025 9:00:52 AM
AI在线

文档智能新突破:ContextGem开源工具上线,几行代码实现专业级文档解析

一款备受期待的AI文档处理工具ContextGem日前正式亮相,凭借其强大的结构化数据提取能力和极简编程体验,迅速吸引了开发者社区的广泛关注。 作为完全免费、开源的大型语言模型框架,ContextGem通过简洁代码实现复杂文档分析,核心优势在于精准理解用户意图,自动定位并提取文档中的关键信息。 ContextGem的设计理念围绕简化文档处理流程展开。
5/12/2025 10:01:16 AM
AI在线

首个智能文档处理基准发布:Gemini领跑但短板待补,多模态AI面临现实挑战

5月11日,智能文档处理领域迎来重大进展——首个针对视觉-语言模型的统一基准测试"IDP Leaderboard"正式推出。 该基准通过16个数据集、9229份文档,全面评估了当前主流模型在OCR、关键信息提取、视觉问答、表格提取、分类和长文档处理六大核心任务上的表现,为行业发展提供了可量化参考。 测试结果显示,Gemini2.5Flash在综合实力上力压群雄,但却在OCR和分类任务中出现意外"滑铁卢",表现甚至不如上一代的Gemini2.0Flash,分别下降了1.84%和0.05%。
5/12/2025 9:01:02 AM
AI在线

PDF总结神器SmartPDFs上线 上传秒出精炼总结,论文党感动哭!

5月7日,一款名为SmartPDFs的AI驱动PDF文档总结工具正式上线。 该工具通过先进的AI技术,能够快速分析PDF文档内容,并生成简洁、分段的核心总结,为需要处理大量长篇PDF的用户提供了高效解决方案。 SmartPDFs完全免费且开源,项目地址:。
5/8/2025 11:00:55 AM
AI在线

SmartPDFs:PDF文档快速总结AI工具 分段总结核心内容

一款名为 SmartPDFs 的 AI 驱动 PDF 处理工具在社交媒体上引发热议。 这款免费且开源的工具通过先进的 AI 技术,自动将 PDF 文档内容总结并划分为逻辑清晰的章节,为用户提供高效的信息提取与浏览体验。 智能总结与结构化:重塑 PDF 阅读体验SmartPDFs 的核心功能在于其 AI 驱动的文档总结与结构化能力。
5/8/2025 11:00:55 AM
AI在线

​Devin AI推出DeepWiki:AI驱动的GitHub代码库理解新工具

Devin AI 近期推出了 DeepWiki,这是一款免费的工具,能够自动生成任何 GitHub 代码库的结构化维基风格文档。 DeepWiki 采用了该公司自研的 DeepResearch 智能代理,旨在简化开发者对不熟悉代码库的理解过程,用户只需提供代码库的 URL,即可获得详尽且互动的概述。 该工具解决了软件开发中的一个常见痛点:如何在大型、往往文档不完善的代码库中进行有效导航。
4/28/2025 3:00:50 PM
AI在线

号称全球性能最高!Mistral 发布全新 OCR API 全方位解析文档

在AI模型竞争的浪潮中,法国初创公司Mistral另辟蹊径,亮出了一款名为Mistral OCR的光学字符识别(OCR)API,旨在赋予企业更高级的文档理解能力。 这款新工具承诺将杂乱无章的PDF和图像文件中的内容——无论是潦草的手写笔记,清晰的打印文本,还是复杂的图片、表格和公式——都精准地提取出来,并整理成结构化的数据呈现。 对于那些被海量非结构化数据困扰的企业来说,这无疑是一场及时雨。
3/7/2025 9:31:00 AM
AI在线

阿里通义实验室开源视觉文档RAG系统ViDoRAG,准确率达79.4%

近日,阿里巴巴通义实验室宣布开源其最新研发成果——ViDoRAG,这是一款专为视觉文档理解设计的检索增强生成(RAG)系统。 ViDoRAG在GPT-4o模型上的测试显示,其准确率达到了令人瞩目的79.4%,相较传统RAG系统提升了10%以上。 这一突破标志着视觉文档处理领域迈出了重要一步,为人工智能在复杂文档理解上的应用提供了新的可能性。
3/3/2025 4:29:00 PM
AI在线

开源OCR工具olmOCR:高效实现 PDF 转文本,支持表格与手写识别

olmOCR 是一款开源的光学字符识别(OCR)工具,旨在高效地将 PDF 及其他文档转换为纯文本,同时保留自然的阅读顺序。 这款工具不仅支持普通文本的提取,还能处理表格、数学公式和手写内容,极大地方便了用户对文档的处理需求。 这款工具的核心优势在于其高准确率。
3/3/2025 9:25:00 AM
AI在线

大模型是否有自知之明?新研究发现LLM可以知晓自己的知识范围

对于人工智能,有一个话题总会时而冒出来:「AI 是否或能否具有自我意识」? 对于这个问题,目前还没人能给出非常确切的答案,但近日 Chandar Research Lab 和 Mila - 魁北克人工智能研究所等机构的一项研究却揭开了这神秘问题的一角。 他们发现,大型语言模型(LLM)有自知之明,也就是说,只要规模够大,它们就能够知道自己对某个主题的了解程度。
3/1/2025 9:04:00 PM
机器之心

昆仑万维发布天工 AI 高级搜索功能,升级分析推理、金融 / 科研能力

感谢昆仑万维天工 AI 今日发布最新版本的 AI 高级搜索功能,迎来四个方面的升级:全面升级多层次分析推理能力升级的金融投资专业 AI 搜索升级的科研学术专业 AI 搜索针对文档 AI 阅读分析的智能优化全面升级多层次分析推理能力在处理复杂任务时,天工 AI 推理能力支持难题拆解 自动规划 主动扩展 深度回答 图文交织。 智能搜索 Agent 把复杂的难题拆解为多个简单的问题,自动规划路径,一边思考一边执行。 自研大模型搜索 Agent,面对用户输入的问题,能够模拟人的思考和推理过程,自动生成任务规划并逐步完成预设任务路径,并在每一步检查任务的执行情况,确保最终结果的准确性。
11/5/2024 11:10:25 AM
汪淼

揭秘提示词压缩技术

提示工程是一种在机器学习模型,尤其是预训练语言模型中,通过精心设计输入提示(prompt)来引导模型输出期望结果的技术。在大语言模型的使用中,提示词通常是一段文本,用来引导模型生成特定的输出或完成特定的任务。在多文档搜索、问答系统、文档自动摘要生成以及阅读理解等多样化且复杂的应用场景中,往往会面临输入提示(prompt)长度显著增加的挑战。这种超长prompt不仅加大了大型语言模型(LLM)的推理成本,还显著延长了推理时间,从而严重限制了其在需要即时响应的实时应用场景中的适用性。为了克服这一难题,优化prompt设
10/8/2024 11:44:00 AM
机器之心