AI在线 AI在线

资讯列表

OCR技术选型:数据提取哪家强?

数据是企业运营的核心资产之一。 然而,超过 85% 的商业信息以非结构化数据的形式存在,如电子邮件、报告、发票和合同等,这给计算机处理带来了极大挑战。 为解决这一问题,光学字符识别(OCR)技术(Mistral OCR:文档处理领域的革新者)应运而生。
4/2/2025 4:00:00 AM
大模型之路

RAG分块优化之语义分块方法CrossFormer模型技术思路

笔者在前期文章中总结了RAG的分块《RAG常见13种分块策略大总结(一览表)》,本文介绍一个语义分段的工作,该工作解决的问题是文本语义分割,即将文档分割成多个具有连续语义的段落。 传统方法通常依赖于预处理文档以分段来解决输入长度限制问题,但这会导致段间关键语义信息的丢失。 RAG系统中的文本分块方法主要分为基于规则和基于LLM的方法。
4/2/2025 4:00:00 AM
余俊晖

深度解析 MCP 与 AI 工具的未来

自 2023 年 OpenAI 发布函数调用功能以来,我一直在思考如何构建一个智能体与工具协同的生态系统。 随着基础模型的智能化程度提升,智能体与外部工具、数据和 API 的交互能力变得日益碎片化:开发者需要为每个集成系统单独实现包含特定业务逻辑的智能体。 显然,我们需要一个执行、数据获取和工具调用的标准接口。
4/2/2025 3:55:00 AM
MCP

「DeepSeek-V3 技术解析」:无辅助损失函数的负载均衡

在混合专家模型(MoE)的实践中,负载不均衡俨然已成为制约模型性能提升的关键瓶颈之一。 传统的均衡策略往往需要引入复杂的辅助损失函数,不仅增加了训练的复杂度,还可能干扰模型的核心学习目标。 工程师们在提升模型效率的道路上,一直苦苦追寻着一个优雅而高效的平衡解决方案。
4/2/2025 2:17:00 AM
追求卓越的

大模型应用的能力分级

对大模型应用的能力分级就像给学生打分一样,能让我们更清楚它的本事有多大。 能力分级能帮我们设定目标,知道AI现在能干什么,未来还要学什么。 有了统一的分级方式,大家就能公平比较不同AI的水平,推动技术进步。
4/2/2025 1:25:00 AM
曹洪伟

SpringAI用嵌入模型操作向量数据库!

嵌入模型(Embedding Model)和向量数据库(Vector Database/Vector Store)是一对亲密无间的合作伙伴,也是 AI 技术栈中紧密关联的两大核心组件,两者的协同作用构成了现代语义搜索、推荐系统和 RAG(Retrieval Augmented Generation,检索增强生成)等应用的技术基础。 “PS:准确来说 Vector Database 和 Vector Store 不完全相同,前者主要用于“向量”数据的存储,而 Vector Store 是用于存储和检索向量数据的组件。 在 Spring AI 中,嵌入模型 API 和 Spring AI Model API 和嵌入模型的关系如下:系统整体交互流程如下:接下来我们使用以下技术:Spring AI阿里云文本嵌入模型 text-embedding-v3SimpleVectorStore(内存级别存储和检索向量数据组件)实现嵌入模型操作内存级别向量数据库的案例。
4/2/2025 12:00:00 AM
磊哥

自动学会工具解题,RL扩展催化奥数能力激增17%

在大模型推理能力提升的探索中,工具使用一直是克服语言模型计算局限性的关键路径。 不过,当今的大模型在使用工具方面还存在一些局限,比如预先确定了工具的使用模式、限制了对最优策略的探索、实现透明度不足等。 为了解决这些难题,来自上海交通大学、SII 和 GAIR 的研究团队提出了一种全新框架 ToRL(Tool-Integrated Reinforcement Learning),该方法允许模型直接从基座模型开始,通过强化学习自主探索最优工具使用策略,而非受限于预定义的工具使用模式。
4/1/2025 6:48:00 PM
机器之心

广东:人工智能和机器人单个外资项目最高奖励 1.5 亿元

广东省有关部门于 3 月 9 日印发《广东省推动人工智能与机器人产业创新发展若干政策措施》,并于今天举办相应《措施》新闻发布会,主要提出一系列政策,激励广东省内人工智能与机器人公司发展。
4/1/2025 6:21:27 PM
漾仔

AI 搜索企业 Perplexity:公司资金充裕,2028 年前无 IPO 规划

Perplexity 联合创始人兼首席执行官 Aravind Srinivas 表示此前推出的 Auto 自动选择模型搜索模式不是为了节约成本,而是为了让产品更好。
4/1/2025 6:06:59 PM
溯波(实习)

硅基战队来袭,联想中国誓师大会宣布智能体矩阵已成

联想将再一次以 AI 服务加速中国千行百业、千家万户快速踏入 AI 应用之门。
4/1/2025 5:36:00 PM
机器之心

小米SU7高速上碰撞爆燃,细节披露!事故发生前车辆处于NOA智能辅助驾驶状态,曾触发“脱手预警”

就“小米SU7高速上碰撞爆燃”事件,小米公司发言人官微发文回应。 称“2025年3月29日22时44分,一辆小米SU7标准版在德上高速公路池祁段行驶过程中遭遇严重交通事故。 ”据公告内容,“事故发生前车辆处于NOA智能辅助驾驶状态,以116km/h时速持续行驶。
4/1/2025 5:05:10 PM

GPT-4o生图免费!吉卜力版《甄嬛传》续集来了,终于让安陵容对上口型

编辑 | 杨文好消息! 好消息! ChatGPT 图像生成功能现已对所有用户开放啦!
4/1/2025 4:30:00 PM
AI好好用

国家天文台基于通义千问打造国际首个太阳大模型“金乌”

阿里云今日发文称,继大模型接入天文望远镜后,国家天文台再次联合阿里云发布国际首个太阳大模型 ——“金乌”。据称,该模型基于通义千问系列开源模型打造,目前在 M5 级太阳耀斑预报上准确率超 91%,为该级别太阳预报最高水平。 #太阳大模型金乌##科技前沿##AI大模型#
4/1/2025 4:21:54 PM
归泷

DeepSeek-R1之后推理模型发展如何?Raschka长文梳理后R1时代14篇重要论文

近日,Deepseek R1 等一系列推理大语言模型已成为 2025 年最热门的话题之一。 在过去的几周里,研究人员推出了许多改进推理的新策略,包括扩展简单测试 - 时间规模化(S1)、关联思维链(Chain of Associated thoughts)、Inner Transformer 等方法。 不仅如此,还有来自腾讯实验室的研究人员探索了 Thoughts Are All Over the Place,通过衡量不正确答案中的 token 效率来鼓励模型对每条推理路径进行更深入的探索;来自美国马里兰大学和橡树岭国家实验室等机构联合提出了 Recurrent Block,通过重复调用同一个循环体的方式,在推理阶段可以迭代任意多次;以及来自美国 Zoom 视频通讯公司的研究团队提出了 Chain of Draft(CoD),基于更接近人类推理的提示策略提出了草稿图,这是一种优先考虑效率和推理的提示词策略。
4/1/2025 4:14:00 PM
机器之心

联想公布 AI 服务三大品牌,面向消费客户的“想帮帮”首次亮相

联想中国区 FY25/26 财年誓师大会日前在北京举办。在大会现场,联想集团执行副总裁兼中国区总裁刘军集中公布了联想 AI 服务三大品牌:联想擎天、联想百应与想帮帮。
4/1/2025 3:17:54 PM
汪淼

TPAMI 2025 | 国防科大提出RGBT-Tiny数据集与SAFit指标,推动小目标检测技术发展

项目地址::、自动驾驶、夜间搜救等场景中,小目标检测(如远处行人、微型无人机)一直是技术难点——目标尺寸小、背景干扰多、光照条件复杂。 现有数据集多聚焦单一模态(可见光或红外成像),且目标尺寸偏大、场景单一,难以满足实际需求,针对可见光-红外双模态(Visible-Thermal, RGBT)小目标检测的研究却鲜有突破。 为了填补这一空白,国防科技大学团队最新发布RGBT-Tiny基准数据集和SAFit评价指标,填补领域空白,为RGBT小目标检测提供了一个全新的基准和评估工具。
4/1/2025 2:43:00 PM
新闻助手

微软 Security Copilot 立功,AI 揪出三大开源引导程序 20 个关键漏洞

微软公司借助 AI 工具 Security Copilot,在 GRUB2、U-Boot 和 Barebox 三大开源引导程序中,发现了 20 个此前未知的漏洞。
4/1/2025 2:41:29 PM
故渊

我下下决心再给老板发哈哈哈

编辑 | 萝卜皮原子结构的高分辨率可视化对于理解材料微观结构与宏观性质之间的关系具有重要意义。 然而,在原子分辨率显微镜中,快速、准确、稳健地自动解析复杂模式的方法仍然难以实现。 北京大学、厦门大学、中南大学以及深势科技等组成的研究团队,提出了一种基于 Trident 策略增强的解缠结表示学习方法(生成模型)。
4/1/2025 2:30:00 PM
ScienceAI