AI在线 AI在线

理论

GenAI将员工变成无意的内部威胁

根据Netskope的数据,企业与GenAI应用共享的数据量激增,一年内增长了30倍。 现在,平均每个企业每月与AI工具共享的数据超过7.7GB,而一年前仅为250MB,这一数字大幅增长。 这包括源代码、受监管数据、密码和密钥以及知识产权等敏感数据,从而极大地增加了发生昂贵的数据泄露事件、合规性违规和知识产权被盗的风险。
4/2/2025 7:10:00 AM

成功采用AI需要具备两个条件

企业不应回避利用AI工具,但需要找到最大化效率和缓解企业风险之间的平衡点。 他们需要做到以下几点:制定无缝的AI安全政策以往,AI可能只是开发人员或专家交互的技术,但如今,公司各层级的员工都使用AI来协助他们完成各种任务。 因此,企业必须教育所有员工,让他们了解哪些大型语言模型和智能体应用程序是他们被授权使用的,以及他们可以与这些系统共享哪些类型的数据。
4/2/2025 7:00:00 AM
Mike Erquitt

随着OpenAI每小时新增一百万用户,企业AI主导地位的竞争进入新阶段

这一里程碑式的投资凸显了AI日益上升的重要性,也标志着企业技术格局的转变。 有了如此庞大的资金储备,OpenAI在与谷歌、AWS等巨头的较量中,将有更强的持久力,在与合作伙伴微软的敏感关系中也将拥有更大的筹码,更不用说还有资金与Anthropic和马斯克创办的新公司xAI等强劲对手抗衡。 在这轮融资结束之前,OpenAI是否有资金继续在顶级行列中竞争,仍是个未知数。
4/2/2025 7:00:00 AM
Matt Marshall

OCR技术选型:数据提取哪家强?

数据是企业运营的核心资产之一。 然而,超过 85% 的商业信息以非结构化数据的形式存在,如电子邮件、报告、发票和合同等,这给计算机处理带来了极大挑战。 为解决这一问题,光学字符识别(OCR)技术(Mistral OCR:文档处理领域的革新者)应运而生。
4/2/2025 4:00:00 AM
大模型之路

RAG分块优化之语义分块方法CrossFormer模型技术思路

笔者在前期文章中总结了RAG的分块《RAG常见13种分块策略大总结(一览表)》,本文介绍一个语义分段的工作,该工作解决的问题是文本语义分割,即将文档分割成多个具有连续语义的段落。 传统方法通常依赖于预处理文档以分段来解决输入长度限制问题,但这会导致段间关键语义信息的丢失。 RAG系统中的文本分块方法主要分为基于规则和基于LLM的方法。
4/2/2025 4:00:00 AM
余俊晖

深度解析 MCP 与 AI 工具的未来

自 2023 年 OpenAI 发布函数调用功能以来,我一直在思考如何构建一个智能体与工具协同的生态系统。 随着基础模型的智能化程度提升,智能体与外部工具、数据和 API 的交互能力变得日益碎片化:开发者需要为每个集成系统单独实现包含特定业务逻辑的智能体。 显然,我们需要一个执行、数据获取和工具调用的标准接口。
4/2/2025 3:55:00 AM
MCP

「DeepSeek-V3 技术解析」:无辅助损失函数的负载均衡

在混合专家模型(MoE)的实践中,负载不均衡俨然已成为制约模型性能提升的关键瓶颈之一。 传统的均衡策略往往需要引入复杂的辅助损失函数,不仅增加了训练的复杂度,还可能干扰模型的核心学习目标。 工程师们在提升模型效率的道路上,一直苦苦追寻着一个优雅而高效的平衡解决方案。
4/2/2025 2:17:00 AM
追求卓越的

大模型应用的能力分级

对大模型应用的能力分级就像给学生打分一样,能让我们更清楚它的本事有多大。 能力分级能帮我们设定目标,知道AI现在能干什么,未来还要学什么。 有了统一的分级方式,大家就能公平比较不同AI的水平,推动技术进步。
4/2/2025 1:25:00 AM
曹洪伟

SpringAI用嵌入模型操作向量数据库!

嵌入模型(Embedding Model)和向量数据库(Vector Database/Vector Store)是一对亲密无间的合作伙伴,也是 AI 技术栈中紧密关联的两大核心组件,两者的协同作用构成了现代语义搜索、推荐系统和 RAG(Retrieval Augmented Generation,检索增强生成)等应用的技术基础。 “PS:准确来说 Vector Database 和 Vector Store 不完全相同,前者主要用于“向量”数据的存储,而 Vector Store 是用于存储和检索向量数据的组件。 在 Spring AI 中,嵌入模型 API 和 Spring AI Model API 和嵌入模型的关系如下:系统整体交互流程如下:接下来我们使用以下技术:Spring AI阿里云文本嵌入模型 text-embedding-v3SimpleVectorStore(内存级别存储和检索向量数据组件)实现嵌入模型操作内存级别向量数据库的案例。
4/2/2025 12:00:00 AM
磊哥

小米SU7高速上碰撞爆燃,细节披露!事故发生前车辆处于NOA智能辅助驾驶状态,曾触发“脱手预警”

就“小米SU7高速上碰撞爆燃”事件,小米公司发言人官微发文回应。 称“2025年3月29日22时44分,一辆小米SU7标准版在德上高速公路池祁段行驶过程中遭遇严重交通事故。 ”据公告内容,“事故发生前车辆处于NOA智能辅助驾驶状态,以116km/h时速持续行驶。
4/1/2025 5:05:10 PM

DeepSeek-R1之后推理模型发展如何?Raschka长文梳理后R1时代14篇重要论文

近日,Deepseek R1 等一系列推理大语言模型已成为 2025 年最热门的话题之一。 在过去的几周里,研究人员推出了许多改进推理的新策略,包括扩展简单测试 - 时间规模化(S1)、关联思维链(Chain of Associated thoughts)、Inner Transformer 等方法。 不仅如此,还有来自腾讯实验室的研究人员探索了 Thoughts Are All Over the Place,通过衡量不正确答案中的 token 效率来鼓励模型对每条推理路径进行更深入的探索;来自美国马里兰大学和橡树岭国家实验室等机构联合提出了 Recurrent Block,通过重复调用同一个循环体的方式,在推理阶段可以迭代任意多次;以及来自美国 Zoom 视频通讯公司的研究团队提出了 Chain of Draft(CoD),基于更接近人类推理的提示策略提出了草稿图,这是一种优先考虑效率和推理的提示词策略。
4/1/2025 4:14:00 PM
机器之心

我下下决心再给老板发哈哈哈

编辑 | 萝卜皮原子结构的高分辨率可视化对于理解材料微观结构与宏观性质之间的关系具有重要意义。 然而,在原子分辨率显微镜中,快速、准确、稳健地自动解析复杂模式的方法仍然难以实现。 北京大学、厦门大学、中南大学以及深势科技等组成的研究团队,提出了一种基于 Trident 策略增强的解缠结表示学习方法(生成模型)。
4/1/2025 2:30:00 PM
ScienceAI

关于大模型智能体意图识别不准确问题:function call 的缺陷

最近在研究大模型智能体也就是Agent的过程中,遇到了一个很严重的问题,直接影响到Agent的质量和效果;那就是意图识别不准确,也可以说是Agent的幻觉问题。 其产生的原因就在于大模型有时无法准确识别出用户意图,无法准确调用相应的函数。 意图识别不准确现在大模型技术在应用方面,主要有两大方向;其一就是大模型的创作能力,简单来说就是内容生成方面,如生成图片,文字,视频,也包括RAG等。
4/1/2025 12:10:00 PM
DFires

GPT-2后首次!OpenAI将开源带推理能力的开源权重模型!网友:能比DeepSeek R1强吗?

出品 | 51CTO技术栈(微信号:blog51cto)奥特曼发布X文,宣布了一个重磅推理开源权重模型:长话短说:我们即将在未来几个月发布一个强大的开源语言模型,具备推理能力,并希望与开发者交流如何让它更有用:! 我们计划发布自 GPT-2 以来的首个开源语言模型。 我们已经考虑了很久,但之前有其他优先事项。
4/1/2025 10:35:37 AM

打工人必看!5步解锁Coze黑科技:文本秒变专业流程图/脑图

前言在很多工作场景中,尤其是项目管理、团队协作和知识整理时,流程图和思维导图已经成为不可或缺的工具。 然而,尽管市面上有许多绘图软件,如XMind、MindManager、Draw.io等,它们依然要求用户花费大量时间进行手动绘制和调整。 对于很多人来说,每次绘制图表时,不仅要花费时间去整理布局,还要在多个细节上不断修改,才能确保图表清晰、逻辑准确。
4/1/2025 10:11:12 AM
后端小肥肠

RAG回答准确率暴涨300%!用Coze工作流进行数据结构化(附完整提示词)

前言在生成式人工智能(Generative AI)快速发展的当下,大语言模型(LLMs)的幻觉问题始终是制约其落地应用的关键瓶颈。 检索增强生成(RAG)技术通过引入外部知识库,将动态检索与生成能力结合,为解决这一难题提供了重要思路。 然而,RAG系统的核心性能——数据召回率,高度依赖于底层数据的质量与组织形式。
4/1/2025 10:01:42 AM
后端小肥肠

AI算法 | 如何训练自己的大模型?

1、第一阶段:二次预训练模型选择与转换在开始训练之前,需要选择一个合适的基础模型。 本文以LLaMA-7B为例,简单介绍下。 为了方便后续的操作,将LLaMA-7B模型转换为Hugging Face格式。
4/1/2025 9:54:09 AM
Goldma

打工人自救指南:Manus+DeepSeek+Coze破局AI淘汰

前言2025年的中国AI竞技场中,三股技术浪潮正深度重构普通人的生存法则——DeepSeek让普通人年也能享受硅谷级智囊服务;Manus让小微企业人力成本直降70%(简历筛选、财务核算等);Coze的智能体孵化出了新兴职业(智能体架构师、智能体调教师等)。 当人们还在争论AI是否替代人类时,这三个现象级工具已悄然定义了智能技术的三种进化路径:认知突破、执行闭环与生态革命。 这场技术革命的核心分野,在于三者对人类能力的增强坐标差异:• DeepSeek强化认知维度:用强化学习与模型蒸馏技术,将专业决策的颗粒度细化至人类难以企及的层级(如投资策略模拟准确率达97.3%);• Manus重构执行范式:通过规划-执行-验证(PEV)架构,替代HR筛选、财务核算等流程性工作,实现企业人力成本大幅度降低;• Coze激活创新生态:其插件市场增长率达200%,催生“智能体调教师”“智能体架构师”等新职业,让技术民主化从口号变为现实。
4/1/2025 9:49:06 AM
后端小肥肠