AI在线 AI在线

理论

DeepSeek-R1小升级!体验后有被惊艳到

今年1月,DeepSeek-R1横空出世,凭借在性能和成本方面展现出的巨大优势,迅速成为全球人工智能(AI)领域瞩目的焦点。 时隔四个月,这款大模型迎来了小升级。 5月28日,DeepSeek正式发布了R1的最新版本——DeepSeek-R1-0528。
5/30/2025 6:57:53 AM
Yu

随着经济压力加大,零售商利用AI来优化成本

面对关税和消费者支出模式带来的压力,零售企业正依赖AI和其他技术来优化成本,以保持竞争力。 随着许多零售商为今年剩余时间内的增长放缓做准备,因为市场波动仍在持续,Ralph Lauren Corporation、Revolve . Group和Williams-Sonoma正优先考虑对AI工具的投资,希望这些工具能减轻经济逆风的影响,并改善客户和员工的体验。
5/30/2025 6:00:00 AM
Lindsey

【一文读懂AI核心要点】什么是大模型?你真的知道“大模型”和“大语言模型”的区别吗?

在人工智能领域,“大模型”和“大语言模型”这两个词经常被提及,很多人甚至把它们当成了同义词。 其实,这两者之间存在本质的区别。 今天,我就带你深入剖析什么是大模型,什么是大语言模型(LLM),它们的区别在哪里,以及如何利用这些模型提升你的项目效率。
5/30/2025 5:00:00 AM
爱学习的蝌蚪

IBM 研究:可验证奖励强化学习(RLVR)通过 GRPO 提升模型推理能力

大家好,我是肆〇柒。 今天,我们来探讨一篇来自IBM Research的前沿论文《REINFORCEMENT LEARNING WITH VERIFIABLE REWARDS: GRPO’S EFFECTIVE LOSS, DYNAMICS, AND SUCCESS AMPLIFICATION》。 这篇论文由Youssef Mroueh撰写,聚焦于强化学习(Reinforcement Learning, RL)领域中一个极具潜力的研究方向——如何通过可验证奖励(RLVR)来优化大型语言模型(LLM)的训练。
5/30/2025 4:00:00 AM
肆零柒

当测试遇见 AI:用 Streamlit+AutoGen+Deepseek 构建智能用例生成器

一、引言: 测试用例的 AI 进化之路1.1 行业困境:手工用例的三重效率枷锁在软件测试领域,测试用例是质量保障的核心载体。 据 ISTQB 2024 全球测试报告揭示:测试用例承担着 70%的质量决策责任,但是传统手工编写方式正面临三大痛点:1.1.1 痛点一:效率瓶颈 —— 百级用例的时间黑洞数据支撑:腾讯云测试效能调研显示:某电商平台年编写用例 1.2w 条,其中 68.3% 因需求变更需重复修改。 某金融 APP 密码修改功能开发中,23 条用例编写耗时占项目周期 42% (相当于 1 个资深测试工程师 80 工时)。
5/30/2025 3:33:00 AM
魏文晏

AI连电路图都看不懂?SeePhys新基准暴击多模态短板,正确率低至55%

当前顶尖AI模型是否真能“看懂”物理图像? 全谱系多模态物理推理新基准来了,结果SOTA级模型准确率都不足55%。 新基准名为SeePhys,强调了图形感知对于模型认识和理解物理世界的重要性。
5/30/2025 3:10:00 AM

RAGFlow v0.19图文混排:详细拆解+预处理增强案例

RAGFlow在5/26 正式更新了v0.19版本,其中有两点值得关注。 首当其冲的是在 Agent 模块(也就是工作流)新增了代码执行组件,这个被吐槽了很久了 RAGFlow工作流编排功能,终于可以处理更加复杂的任务了。 第二点比较大的更新,是这篇文章主要要讨论的,也就是在 Chat 和 Agent 模块中改变以往图片作为引用的展示方式,直接在正文中进行显示。
5/30/2025 3:00:00 AM
韦东东

RAG、AI工作流一键搞定!一文带你看懂 Dify

曾以为AI应用是程序员的专利? Dify 彻底颠覆了! 它就像把复杂AI变成了乐高积木,人人都能动手搭建。
5/30/2025 2:21:00 AM
九歌

万人在看,用Deepseek根据需求定制化写文档并导出,你一定用的上!

需求分析前几天工程立项,主要批量写功能点用于新一年的工程预算。 但是工作量大,共计20000 行左右,要求3天之内完成。 图片文档主要结构及表头信息如下(提供模版部分字段)图片由于工作量太大,手工敲需要消耗大量的人力,于是借助deepseek大模型实现,让AI帮忙干活。
5/30/2025 2:10:00 AM
微微一笑

使用Agno实现AI代理设计的五个层级,由易到难

AI代理设计指南本指南将代理设计分解为五个实际难度级别,每个级别均提供可运行的代码示例。 无论开发者是初学者还是处理现实世界的复杂任务,本指南都能帮助避免常见陷阱,构建真正有效的代理。 这些级别包括:•级别1:带工具和指令的代理•级别2:带知识和记忆的代理•级别3:带长期记忆和推理的代理•级别4:多代理团队•级别5:代理系统以下逐一介绍各级别。
5/30/2025 2:10:00 AM
AI研究生

奖励推理模型(RRM):革新奖励模型的新范式

大家好,我是肆〇柒。 在人工智能领域,大型语言模型(LLM)的出现,如 GPT 系列模型,彻底改变了我们对机器智能的认知。 这些模型通过海量数据预训练,能生成自然、流畅且富有逻辑的文本,广泛应用于聊天机器人、文本生成、自动翻译等场景。
5/30/2025 2:00:00 AM
肆零柒

AI公司禁止用AI申请工作?Anthropic又改口了!

最近,一则关于AI公司的新闻引发了热议:全球领先的AI初创公司 Anthropic 宣布,他们将 取消禁止求职者在申请中使用AI工具的规定。 这条消息让人不禁感叹,连AI公司都在重新定义AI的使用边界,难道我们真的已经进入了“人机共生”的新时代? 禁止用AI申请工作?
5/30/2025 1:30:00 AM
云原生SRE

一文教你玩转 RAG 大模型应用开发

Part.1.RAG这么火,你会用吗? 自从大模型技术走向市场以来,“幻觉”现象总是对用户造成困扰,而RAG(Retrieval-Augmented Generation,检索增强生成)技术正在成为解决这一难题的利器。 国内众多科技大厂在实践RAG技术时都取得了阶段性的成果。
5/30/2025 1:00:00 AM
三笠

深夜突袭!DeepSeek-R1 重磅升级:媲美 OpenAl 最高 o3 模型,编码能力直逼 Claude 4

5月28日凌晨,DeepSeek 在 Hugging Face 上开源了其更新版的 R1 模型。 此次更新并未更改名称,只在模型路径中标注“0528”以作区分。 图源deepseek官方称这是一次“minor update”,但社区反馈却指向另一种结论:在代码生成、长时推理、格式控制等任务上,这个版本的 R1 的能力已经“近乎o3级别”。
5/30/2025 1:00:00 AM

数据架构师在人工智能支持中的作用

不可避免的人工智能炒作周期除非你一直生活在与世隔绝的地方,或者试图通过电话预约全科医生,否则你不可能注意到有关人工智能及其各种用途的炒作已经达到了狂热的程度。 现在,每个有价值的 PowerPoint 演示文稿都至少三次提到DeepSeek,两次提到“转型机遇”,以及至少一次关于 Agentic 涅槃的诱人承诺。 不可避免的是,在这种膨胀的期望达到顶峰之后,我们会进入沮丧的低谷,然后最终走出困境,虽然伤痕累累,但更加睿智,迈入生产力的高地。
5/30/2025 12:20:00 AM
晓晓

Dify搭建AI图片生成助手中的坑!

使用 Dify 搭建 AI 图片生成助手并不是什么难事,而且不需要你会编程知识,也能轻松实现。 但是,Dify 在搭建 AI 图片生成助手的过程中会遇到很多坑,例如以下这些:有些组件随着时间的推移,已经不能正常调用了;有些组件在国内需要魔法才能使用;有些组件需要复杂的本地部署才能正常调用;有些组件虽然能用,但生成的速度、成本、质量,是无法应用于生产环境的。 所以,接下来本文就带你来避开这些坑。
5/30/2025 12:00:00 AM
磊哥

Anthropic CEO失业暴论引争议!AI将在5年内消灭一半白领入门岗,失业率或飙升至20%!阿莫多:该征收Token税了

今天刷 Reddit,刷到一条炸裂热帖。 没错,Anthropic 的 CEO 阿莫多(Dario Amodei),也就是“Claude 之父”,又放出重磅发言了:人工智能可能在未来一到五年内消灭一半的初级白领岗位——导致10%-20%的失业率飙升他直言,AI 公司和政府必须停止“粉饰太平”,正视现实:技术、金融、法律、咨询等多个白领行业,尤其是年轻人刚起步的岗位,正在被AI逼向悬崖。 顺着这张图,小编顺藤摸瓜挖到了原出处——知名美媒 Axios 的一篇深度报道,题目也是相当血腥——《幕后:AI引发的白领大屠杀》。
5/29/2025 6:45:37 PM
伊风

全面解读:新版R1低调升级!编程强到起飞直追o3-high,支持30分钟以上长思考,推理、写作都进化了!

出品 | 51CTO技术栈(微信号:blog51cto)DeepSeek 于 5 月 28 日晚间在微信平台低调宣布——R1 模型完成“小版本试升级”! 图片这波有多低调呢? DeepSeek 又是“0 宣发”出手,连一句英文公告都没有。
5/29/2025 1:05:32 PM
伊风