AI在线 AI在线

理论

奖励推理模型(RRM):革新奖励模型的新范式

大家好,我是肆〇柒。 在人工智能领域,大型语言模型(LLM)的出现,如 GPT 系列模型,彻底改变了我们对机器智能的认知。 这些模型通过海量数据预训练,能生成自然、流畅且富有逻辑的文本,广泛应用于聊天机器人、文本生成、自动翻译等场景。
5/30/2025 2:00:00 AM
肆零柒

AI公司禁止用AI申请工作?Anthropic又改口了!

最近,一则关于AI公司的新闻引发了热议:全球领先的AI初创公司 Anthropic 宣布,他们将 取消禁止求职者在申请中使用AI工具的规定。 这条消息让人不禁感叹,连AI公司都在重新定义AI的使用边界,难道我们真的已经进入了“人机共生”的新时代? 禁止用AI申请工作?
5/30/2025 1:30:00 AM
云原生SRE

一文教你玩转 RAG 大模型应用开发

Part.1.RAG这么火,你会用吗? 自从大模型技术走向市场以来,“幻觉”现象总是对用户造成困扰,而RAG(Retrieval-Augmented Generation,检索增强生成)技术正在成为解决这一难题的利器。 国内众多科技大厂在实践RAG技术时都取得了阶段性的成果。
5/30/2025 1:00:00 AM
三笠

深夜突袭!DeepSeek-R1 重磅升级:媲美 OpenAl 最高 o3 模型,编码能力直逼 Claude 4

5月28日凌晨,DeepSeek 在 Hugging Face 上开源了其更新版的 R1 模型。 此次更新并未更改名称,只在模型路径中标注“0528”以作区分。 图源deepseek官方称这是一次“minor update”,但社区反馈却指向另一种结论:在代码生成、长时推理、格式控制等任务上,这个版本的 R1 的能力已经“近乎o3级别”。
5/30/2025 1:00:00 AM

数据架构师在人工智能支持中的作用

不可避免的人工智能炒作周期除非你一直生活在与世隔绝的地方,或者试图通过电话预约全科医生,否则你不可能注意到有关人工智能及其各种用途的炒作已经达到了狂热的程度。 现在,每个有价值的 PowerPoint 演示文稿都至少三次提到DeepSeek,两次提到“转型机遇”,以及至少一次关于 Agentic 涅槃的诱人承诺。 不可避免的是,在这种膨胀的期望达到顶峰之后,我们会进入沮丧的低谷,然后最终走出困境,虽然伤痕累累,但更加睿智,迈入生产力的高地。
5/30/2025 12:20:00 AM
晓晓

Dify搭建AI图片生成助手中的坑!

使用 Dify 搭建 AI 图片生成助手并不是什么难事,而且不需要你会编程知识,也能轻松实现。 但是,Dify 在搭建 AI 图片生成助手的过程中会遇到很多坑,例如以下这些:有些组件随着时间的推移,已经不能正常调用了;有些组件在国内需要魔法才能使用;有些组件需要复杂的本地部署才能正常调用;有些组件虽然能用,但生成的速度、成本、质量,是无法应用于生产环境的。 所以,接下来本文就带你来避开这些坑。
5/30/2025 12:00:00 AM
磊哥

Anthropic CEO失业暴论引争议!AI将在5年内消灭一半白领入门岗,失业率或飙升至20%!阿莫多:该征收Token税了

今天刷 Reddit,刷到一条炸裂热帖。 没错,Anthropic 的 CEO 阿莫多(Dario Amodei),也就是“Claude 之父”,又放出重磅发言了:人工智能可能在未来一到五年内消灭一半的初级白领岗位——导致10%-20%的失业率飙升他直言,AI 公司和政府必须停止“粉饰太平”,正视现实:技术、金融、法律、咨询等多个白领行业,尤其是年轻人刚起步的岗位,正在被AI逼向悬崖。 顺着这张图,小编顺藤摸瓜挖到了原出处——知名美媒 Axios 的一篇深度报道,题目也是相当血腥——《幕后:AI引发的白领大屠杀》。
5/29/2025 6:45:37 PM
伊风

全面解读:新版R1低调升级!编程强到起飞直追o3-high,支持30分钟以上长思考,推理、写作都进化了!

出品 | 51CTO技术栈(微信号:blog51cto)DeepSeek 于 5 月 28 日晚间在微信平台低调宣布——R1 模型完成“小版本试升级”! 图片这波有多低调呢? DeepSeek 又是“0 宣发”出手,连一句英文公告都没有。
5/29/2025 1:05:32 PM
伊风

AI 大脑如何被 “套路”?— 揭秘大模型提示词攻防

在人工智能技术爆发式发展的当下,大模型(Large Language Models, 以下简称LLM)凭借其强大的自然语言处理能力,广泛渗透于智能助手、内容创作、代码生成等诸多关键领域,深度重塑着人们的生活与工作范式。 然而,随着 LLM 应用场景的持续拓展与深化,一系列严峻的安全挑战接踵而至,其中提示词攻击已逐渐演变为威胁人工智能系统安全的核心隐患,亟待深入剖析与应对。 一、提示词攻击定义与影响提示词攻击是指攻击者精心构思并输入恶意构造的文本内容,意图干扰和操纵LLM的内部运行逻辑,使其偏离既定的正常行为模式。
5/29/2025 10:32:32 AM
大模型应用防火墙

模型吞噬代码,Agent重构世界:当AI Agent与模型协同进化

大家好,我是肆〇柒。 AI 圈的进化速度之快,已是不争的事实。 去年,MCP(模型上下文协议)发布,随后 AI Coding 赛道愈发热闹,Cursor、Cline、Devin、MGX 等产品层出不穷。
5/29/2025 9:57:38 AM
肆零柒

如何使用 LLM实现电子表格规范化

一、如何使用 LLM实现电子表格规范化请观察以下电子表格:图片从“为什么”开始图片让我们看一下这个Excel电子表格,其中包含电影奖项的信息。 这是一个典型的、常见的电子表格,每个人都可能在日常工作中使用它。 但它有什么问题呢?
5/29/2025 9:48:22 AM
晓晓

CVPR 2025 | 字节提出个性化多人图像生成新方法ID-Patch,可生成多人合影、姿势可控

相信扩散模型(DMs)大家一定都不陌生了,目前已经成为文本生成图像的核心方法,凭借强大的图像生成能力,正重塑艺术创作、广告设计、社交媒体内容生产格局。 现在,用一段文字生成个性化头像都不算啥新鲜事儿了。 不过仍然会有这样一个问题,目前我们看到的基于人物的文生图大多还是生成一个人的,对于多人同时生成的目前还没有很好的样例。
5/29/2025 9:34:14 AM
AIGC Studio

搜索Agent最新高效推理框架:吞吐量翻3倍、延迟降至1/5,还不牺牲答案质量丨南开& UIUC研究

AI越来越聪明,但如果它们反应慢,效率低,也难以满足我们的需求。 大语言模型(LLM)驱动的搜索智能体,通过动态拆解问题、交错执行“思考”(推理)和“查找”(检索)来解决复杂任务,展现了惊人能力。 然而,这种深度交互的背后,也隐藏着显著的效率痛点。
5/29/2025 9:21:28 AM

港科大Apple新研究:Tokens使用量减少,模型推理还更强了

1 1等于几? 现在的大推理模型(LRMs)已经展现出了非凡的推理能力。 但是面对这样最简单的数学问题,现有的LRMs仍需要花费1400 的tokens来思考。
5/29/2025 9:20:00 AM

准确率92.7%逼近Claude 3.5、成本降低86%,开源代码定位新神器LocAgent来了

又是一个让程序员狂欢的研究! 来自 OpenHands、耶鲁、南加大和斯坦福的研究团队刚刚发布了 LocAgent—— 一个专门用于代码定位的图索引 LLM Agent 框架,直接把代码定位准确率拉到了 92.7% 的新高度。 该研究已被 ACL 2025 录用。
5/29/2025 9:18:20 AM

爆火论文颠覆RL认知!「错误奖励」让LLM推理暴涨24.6%,学界惊了

今早的一篇爆火论文,彻底颠覆了人们对「强化学习」的传统认知。 仅用随机奖励,甚至是错误答案,也能让AI在数学推理中性能暴涨! 来自华盛顿大学、AI2、UC伯克利研究团队证实,「伪奖励」(Spurious Rewards)也能带来LLM推理能力提升的惊喜。
5/29/2025 9:14:17 AM

阿里通义发布并行计算新策略:1.6B等效4.4B,内存消耗骤降95%

既能提升模型能力,又不显著增加内存和时间成本,LLM第三种Scaling Law被提出了。 对于1.6B模型,能实现性能接近4.4B模型,内存占用仅为后者的1/22,延迟增加量为1/6。 并且可直接应用于现有模型(如Qwen-2.5),无需从头训练。
5/29/2025 9:14:00 AM

19岁少年用计算机炼出「神药」,斩获全球大奖!大厂看了都沉默

「少年药神」来了! 来自斯洛伐克的19岁少年Adam Kovalčík,凭借计算机模拟设计的新分子,一举夺得全球顶级大奖! 这些分子有望像广谱抗病毒药物Galidesivir一样有效阻止病毒复制。
5/29/2025 9:10:18 AM