AI在线 AI在线

理论

由浅入深,带大家了解什么是 Agent

大家好! 最近你可能经常听到一个词——“Agent”,尤其是在聊人工智能(AI)的时候。 听起来有点高大上,甚至有点神秘?
4/2/2025 8:00:00 AM
用户007

从零到一,用 Dify 打造 NL2SQL

近期 AI 大火,朋友圈很多都在晒成果。 我也禁不住尝试,使用Dify这一开发平台做了第一个 AI 应用。 整体感觉下来还是非常方便的,也是由于Dify的出现大大降低了构建 AI 应用的门槛,相信未来真的可以解放人的双手,让 AI 帮助我们解决更多的问题。
4/2/2025 7:30:37 AM
韩锋

如何识别和预防深度伪造诈骗

这些被篡改的内容在社交媒体、即时通讯应用和视频分享平台上广泛传播,模糊了现实与虚构之间的界限。 “Deepfake”一词是在2017年由一位Reddit用户创造的,当时该用户创建了一个以此命名的子论坛(subreddit)。 这个子论坛被用来分享AI生成的视频,其中经常包含名人换脸的色情内容。
4/2/2025 7:30:00 AM
Sinisa

GenAI将员工变成无意的内部威胁

根据Netskope的数据,企业与GenAI应用共享的数据量激增,一年内增长了30倍。 现在,平均每个企业每月与AI工具共享的数据超过7.7GB,而一年前仅为250MB,这一数字大幅增长。 这包括源代码、受监管数据、密码和密钥以及知识产权等敏感数据,从而极大地增加了发生昂贵的数据泄露事件、合规性违规和知识产权被盗的风险。
4/2/2025 7:10:00 AM

成功采用AI需要具备两个条件

企业不应回避利用AI工具,但需要找到最大化效率和缓解企业风险之间的平衡点。 他们需要做到以下几点:制定无缝的AI安全政策以往,AI可能只是开发人员或专家交互的技术,但如今,公司各层级的员工都使用AI来协助他们完成各种任务。 因此,企业必须教育所有员工,让他们了解哪些大型语言模型和智能体应用程序是他们被授权使用的,以及他们可以与这些系统共享哪些类型的数据。
4/2/2025 7:00:00 AM
Mike Erquitt

随着OpenAI每小时新增一百万用户,企业AI主导地位的竞争进入新阶段

这一里程碑式的投资凸显了AI日益上升的重要性,也标志着企业技术格局的转变。 有了如此庞大的资金储备,OpenAI在与谷歌、AWS等巨头的较量中,将有更强的持久力,在与合作伙伴微软的敏感关系中也将拥有更大的筹码,更不用说还有资金与Anthropic和马斯克创办的新公司xAI等强劲对手抗衡。 在这轮融资结束之前,OpenAI是否有资金继续在顶级行列中竞争,仍是个未知数。
4/2/2025 7:00:00 AM
Matt Marshall

RAG分块优化之语义分块方法CrossFormer模型技术思路

笔者在前期文章中总结了RAG的分块《RAG常见13种分块策略大总结(一览表)》,本文介绍一个语义分段的工作,该工作解决的问题是文本语义分割,即将文档分割成多个具有连续语义的段落。 传统方法通常依赖于预处理文档以分段来解决输入长度限制问题,但这会导致段间关键语义信息的丢失。 RAG系统中的文本分块方法主要分为基于规则和基于LLM的方法。
4/2/2025 4:00:00 AM
余俊晖

OCR技术选型:数据提取哪家强?

数据是企业运营的核心资产之一。 然而,超过 85% 的商业信息以非结构化数据的形式存在,如电子邮件、报告、发票和合同等,这给计算机处理带来了极大挑战。 为解决这一问题,光学字符识别(OCR)技术(Mistral OCR:文档处理领域的革新者)应运而生。
4/2/2025 4:00:00 AM
大模型之路

深度解析 MCP 与 AI 工具的未来

自 2023 年 OpenAI 发布函数调用功能以来,我一直在思考如何构建一个智能体与工具协同的生态系统。 随着基础模型的智能化程度提升,智能体与外部工具、数据和 API 的交互能力变得日益碎片化:开发者需要为每个集成系统单独实现包含特定业务逻辑的智能体。 显然,我们需要一个执行、数据获取和工具调用的标准接口。
4/2/2025 3:55:00 AM
MCP

「DeepSeek-V3 技术解析」:无辅助损失函数的负载均衡

在混合专家模型(MoE)的实践中,负载不均衡俨然已成为制约模型性能提升的关键瓶颈之一。 传统的均衡策略往往需要引入复杂的辅助损失函数,不仅增加了训练的复杂度,还可能干扰模型的核心学习目标。 工程师们在提升模型效率的道路上,一直苦苦追寻着一个优雅而高效的平衡解决方案。
4/2/2025 2:17:00 AM
追求卓越的

大模型应用的能力分级

对大模型应用的能力分级就像给学生打分一样,能让我们更清楚它的本事有多大。 能力分级能帮我们设定目标,知道AI现在能干什么,未来还要学什么。 有了统一的分级方式,大家就能公平比较不同AI的水平,推动技术进步。
4/2/2025 1:25:00 AM
曹洪伟

SpringAI用嵌入模型操作向量数据库!

嵌入模型(Embedding Model)和向量数据库(Vector Database/Vector Store)是一对亲密无间的合作伙伴,也是 AI 技术栈中紧密关联的两大核心组件,两者的协同作用构成了现代语义搜索、推荐系统和 RAG(Retrieval Augmented Generation,检索增强生成)等应用的技术基础。 “PS:准确来说 Vector Database 和 Vector Store 不完全相同,前者主要用于“向量”数据的存储,而 Vector Store 是用于存储和检索向量数据的组件。 在 Spring AI 中,嵌入模型 API 和 Spring AI Model API 和嵌入模型的关系如下:系统整体交互流程如下:接下来我们使用以下技术:Spring AI阿里云文本嵌入模型 text-embedding-v3SimpleVectorStore(内存级别存储和检索向量数据组件)实现嵌入模型操作内存级别向量数据库的案例。
4/2/2025 12:00:00 AM
磊哥

小米SU7高速上碰撞爆燃,细节披露!事故发生前车辆处于NOA智能辅助驾驶状态,曾触发“脱手预警”

就“小米SU7高速上碰撞爆燃”事件,小米公司发言人官微发文回应。 称“2025年3月29日22时44分,一辆小米SU7标准版在德上高速公路池祁段行驶过程中遭遇严重交通事故。 ”据公告内容,“事故发生前车辆处于NOA智能辅助驾驶状态,以116km/h时速持续行驶。
4/1/2025 5:05:10 PM

DeepSeek-R1之后推理模型发展如何?Raschka长文梳理后R1时代14篇重要论文

近日,Deepseek R1 等一系列推理大语言模型已成为 2025 年最热门的话题之一。 在过去的几周里,研究人员推出了许多改进推理的新策略,包括扩展简单测试 - 时间规模化(S1)、关联思维链(Chain of Associated thoughts)、Inner Transformer 等方法。 不仅如此,还有来自腾讯实验室的研究人员探索了 Thoughts Are All Over the Place,通过衡量不正确答案中的 token 效率来鼓励模型对每条推理路径进行更深入的探索;来自美国马里兰大学和橡树岭国家实验室等机构联合提出了 Recurrent Block,通过重复调用同一个循环体的方式,在推理阶段可以迭代任意多次;以及来自美国 Zoom 视频通讯公司的研究团队提出了 Chain of Draft(CoD),基于更接近人类推理的提示策略提出了草稿图,这是一种优先考虑效率和推理的提示词策略。
4/1/2025 4:14:00 PM
机器之心

我下下决心再给老板发哈哈哈

编辑 | 萝卜皮原子结构的高分辨率可视化对于理解材料微观结构与宏观性质之间的关系具有重要意义。 然而,在原子分辨率显微镜中,快速、准确、稳健地自动解析复杂模式的方法仍然难以实现。 北京大学、厦门大学、中南大学以及深势科技等组成的研究团队,提出了一种基于 Trident 策略增强的解缠结表示学习方法(生成模型)。
4/1/2025 2:30:00 PM
ScienceAI

关于大模型智能体意图识别不准确问题:function call 的缺陷

最近在研究大模型智能体也就是Agent的过程中,遇到了一个很严重的问题,直接影响到Agent的质量和效果;那就是意图识别不准确,也可以说是Agent的幻觉问题。 其产生的原因就在于大模型有时无法准确识别出用户意图,无法准确调用相应的函数。 意图识别不准确现在大模型技术在应用方面,主要有两大方向;其一就是大模型的创作能力,简单来说就是内容生成方面,如生成图片,文字,视频,也包括RAG等。
4/1/2025 12:10:00 PM
DFires

GPT-2后首次!OpenAI将开源带推理能力的开源权重模型!网友:能比DeepSeek R1强吗?

出品 | 51CTO技术栈(微信号:blog51cto)奥特曼发布X文,宣布了一个重磅推理开源权重模型:长话短说:我们即将在未来几个月发布一个强大的开源语言模型,具备推理能力,并希望与开发者交流如何让它更有用:! 我们计划发布自 GPT-2 以来的首个开源语言模型。 我们已经考虑了很久,但之前有其他优先事项。
4/1/2025 10:35:37 AM

打工人必看!5步解锁Coze黑科技:文本秒变专业流程图/脑图

前言在很多工作场景中,尤其是项目管理、团队协作和知识整理时,流程图和思维导图已经成为不可或缺的工具。 然而,尽管市面上有许多绘图软件,如XMind、MindManager、Draw.io等,它们依然要求用户花费大量时间进行手动绘制和调整。 对于很多人来说,每次绘制图表时,不仅要花费时间去整理布局,还要在多个细节上不断修改,才能确保图表清晰、逻辑准确。
4/1/2025 10:11:12 AM
后端小肥肠