AI在线 AI在线

理论

超低成本复现QwQ!数学推理模型训练迎来RL暴击,数据代码模型全开源 | 蚂蚁&清华出品

用上这个开源框架,2天时间就能刷新7B数学推理纪录! 蚂蚁清华联手开源的强化学习框架AReaL-boba,直接把推理模型训练带到了Next Level——训练成本下降的同时,训练速率、推理能力还大幅提升的那种。 除了前面提到的7B模型,在32B模型上,只需两百美元、200条数据,就可以轻松复现QwQ-32B,就是数学推理能力媲美DeepSeek-R1,一战封神的那个。
4/2/2025 9:00:00 AM
量子位

DeepSeek R1本地训练全流程实操指南,手把手教你打通其“任督二脉”

作者 | asher许多关于 DeepSeek R1 的复现文章,主要聚焦在“rewards的设计、训练指标的变化、benchmark测评”这些内容,但是对于“本地训练”这个开启深度探索的关键前置步骤,却很少有人深挖。 可能有人觉得,照着readme操作就能轻松训练了吧? 太天真啦!
4/2/2025 9:00:00 AM
腾讯技术工程

如何利用人工智能和事件驱动设计实现播客推广的自动化

译者 | 李睿审校 | 重楼为了普及知识和推广技术,人工智能专家、本文作者Sean Falconer主持着两个播客——《Software Engineering Daily》和《Software Huddle》,并经常以嘉宾身份亮相于其他节目。 无论是主持播客还是作为嘉宾,他推广的节目都有助于凸显其精彩的对话内容。 然而对他来说,在紧张的工作和生活中腾出时间为每期节目撰写一篇具有思想深度的LinkedIn帖子是一项挑战,并非每次都能实现。
4/2/2025 8:55:13 AM
李睿

OpenAI重新开源!第一弹就推理模型,还不限制商用,“冲着DeepSeek来的” 关注前沿科技 量子位 2025年04月01日 08:38

一夜之间,OpenAI更新三大动向,开源、融资、用户暴增。 第一,将开源一个具备推理能力的大语言模型,包含参数权重那种。 上一次这样开源还是6年前推出GPT-2。
4/2/2025 8:40:00 AM
量子位

人工智能应用就是大模型能力+场景,基于大模型构建应用,首先要了解大模型的能力圈

在关于大模型应用方面,虽然也了解和应用过其中的一些技术;但经过这段时间的实践和思考发现,对大模型应用的认识还很浅显,因此在此记录一下自己的思考。 大模型应用的思考大模型作为人工智能应用的底座技术,所有应用场景和技术都是构建在大模型之上;但很多时候我们都搞错了一件事,那就是我们没有搞清楚大模型能力和其它技术的关联和区别。 因此,在这里我们要搞清楚一个概念,那就是大模型能力;所谓大模型的能力,就是模型开发人员怎么把模型做的更好更强,其中设计到模型的设计,训练等;具体有神经网络架构,模型蒸馏等等。
4/2/2025 8:40:00 AM
DFires

人工智能冲击“外包大国”,影响印度3500亿美元产业

印度的外包服务业是其经济的重要支柱之一,也是全球知名的“外包大国”。 然而,随着人工智能的崛起,这一产业正面临前所未有的挑战。 德国科技杂志《t3n》近日引述美国投行伯恩斯坦的报告报道称,由于AI能够以更快、更便宜、更精准的方式完成许多人类工作,将冲击印度未来20年进入劳动力市场的5亿年轻人。
4/2/2025 8:28:26 AM

突发,Meta人工智能研究副总裁发帖:5月离职!

编辑|云昭出品 | 51CTO技术栈(微信号:blog51cto)很突然,Meta 人工智能研究副总裁Joelle Pineau表示下月将离职Meta。 就在发稿7小时前,她在Facebook帖子中宣布了这一消息。 Pineau表示,她将在5月离职,此前她已负责管理Meta内部由Yann LeCun领导的人工智能研究实验室FAIR超过两年。
4/2/2025 8:27:41 AM
云昭

AI在主数据中的十大应用|用例和优势

一 概述在当今数字化环境中,企业面临的挑战不仅包括管理海量数据,还包括处理各种复杂数据,尤其是来自物联网 (IoT) 设备和联网技术等新兴来源的数据。 云技术的重大转变使这一情况更加复杂,促使企业不再仅仅采购基础设施,而是更加战略性地利用技术和服务,以最大限度地提高数据资产价值。 “数据敏捷性”概念应运而生,成为应对这种情况的关键。
4/2/2025 8:00:00 AM
晓晓

由浅入深,带大家了解什么是 Agent

大家好! 最近你可能经常听到一个词——“Agent”,尤其是在聊人工智能(AI)的时候。 听起来有点高大上,甚至有点神秘?
4/2/2025 8:00:00 AM
用户007

从零到一,用 Dify 打造 NL2SQL

近期 AI 大火,朋友圈很多都在晒成果。 我也禁不住尝试,使用Dify这一开发平台做了第一个 AI 应用。 整体感觉下来还是非常方便的,也是由于Dify的出现大大降低了构建 AI 应用的门槛,相信未来真的可以解放人的双手,让 AI 帮助我们解决更多的问题。
4/2/2025 7:30:37 AM
韩锋

如何识别和预防深度伪造诈骗

这些被篡改的内容在社交媒体、即时通讯应用和视频分享平台上广泛传播,模糊了现实与虚构之间的界限。 “Deepfake”一词是在2017年由一位Reddit用户创造的,当时该用户创建了一个以此命名的子论坛(subreddit)。 这个子论坛被用来分享AI生成的视频,其中经常包含名人换脸的色情内容。
4/2/2025 7:30:00 AM
Sinisa

GenAI将员工变成无意的内部威胁

根据Netskope的数据,企业与GenAI应用共享的数据量激增,一年内增长了30倍。 现在,平均每个企业每月与AI工具共享的数据超过7.7GB,而一年前仅为250MB,这一数字大幅增长。 这包括源代码、受监管数据、密码和密钥以及知识产权等敏感数据,从而极大地增加了发生昂贵的数据泄露事件、合规性违规和知识产权被盗的风险。
4/2/2025 7:10:00 AM

成功采用AI需要具备两个条件

企业不应回避利用AI工具,但需要找到最大化效率和缓解企业风险之间的平衡点。 他们需要做到以下几点:制定无缝的AI安全政策以往,AI可能只是开发人员或专家交互的技术,但如今,公司各层级的员工都使用AI来协助他们完成各种任务。 因此,企业必须教育所有员工,让他们了解哪些大型语言模型和智能体应用程序是他们被授权使用的,以及他们可以与这些系统共享哪些类型的数据。
4/2/2025 7:00:00 AM
Mike Erquitt

随着OpenAI每小时新增一百万用户,企业AI主导地位的竞争进入新阶段

这一里程碑式的投资凸显了AI日益上升的重要性,也标志着企业技术格局的转变。 有了如此庞大的资金储备,OpenAI在与谷歌、AWS等巨头的较量中,将有更强的持久力,在与合作伙伴微软的敏感关系中也将拥有更大的筹码,更不用说还有资金与Anthropic和马斯克创办的新公司xAI等强劲对手抗衡。 在这轮融资结束之前,OpenAI是否有资金继续在顶级行列中竞争,仍是个未知数。
4/2/2025 7:00:00 AM
Matt Marshall

OCR技术选型:数据提取哪家强?

数据是企业运营的核心资产之一。 然而,超过 85% 的商业信息以非结构化数据的形式存在,如电子邮件、报告、发票和合同等,这给计算机处理带来了极大挑战。 为解决这一问题,光学字符识别(OCR)技术(Mistral OCR:文档处理领域的革新者)应运而生。
4/2/2025 4:00:00 AM
大模型之路

RAG分块优化之语义分块方法CrossFormer模型技术思路

笔者在前期文章中总结了RAG的分块《RAG常见13种分块策略大总结(一览表)》,本文介绍一个语义分段的工作,该工作解决的问题是文本语义分割,即将文档分割成多个具有连续语义的段落。 传统方法通常依赖于预处理文档以分段来解决输入长度限制问题,但这会导致段间关键语义信息的丢失。 RAG系统中的文本分块方法主要分为基于规则和基于LLM的方法。
4/2/2025 4:00:00 AM
余俊晖

深度解析 MCP 与 AI 工具的未来

自 2023 年 OpenAI 发布函数调用功能以来,我一直在思考如何构建一个智能体与工具协同的生态系统。 随着基础模型的智能化程度提升,智能体与外部工具、数据和 API 的交互能力变得日益碎片化:开发者需要为每个集成系统单独实现包含特定业务逻辑的智能体。 显然,我们需要一个执行、数据获取和工具调用的标准接口。
4/2/2025 3:55:00 AM
MCP

「DeepSeek-V3 技术解析」:无辅助损失函数的负载均衡

在混合专家模型(MoE)的实践中,负载不均衡俨然已成为制约模型性能提升的关键瓶颈之一。 传统的均衡策略往往需要引入复杂的辅助损失函数,不仅增加了训练的复杂度,还可能干扰模型的核心学习目标。 工程师们在提升模型效率的道路上,一直苦苦追寻着一个优雅而高效的平衡解决方案。
4/2/2025 2:17:00 AM
追求卓越的