AI在线 AI在线

资讯列表

【一文读懂AI核心要点】什么是大模型?你真的知道“大模型”和“大语言模型”的区别吗?

在人工智能领域,“大模型”和“大语言模型”这两个词经常被提及,很多人甚至把它们当成了同义词。 其实,这两者之间存在本质的区别。 今天,我就带你深入剖析什么是大模型,什么是大语言模型(LLM),它们的区别在哪里,以及如何利用这些模型提升你的项目效率。
5/30/2025 5:00:00 AM
爱学习的蝌蚪

IBM 研究:可验证奖励强化学习(RLVR)通过 GRPO 提升模型推理能力

大家好,我是肆〇柒。 今天,我们来探讨一篇来自IBM Research的前沿论文《REINFORCEMENT LEARNING WITH VERIFIABLE REWARDS: GRPO’S EFFECTIVE LOSS, DYNAMICS, AND SUCCESS AMPLIFICATION》。 这篇论文由Youssef Mroueh撰写,聚焦于强化学习(Reinforcement Learning, RL)领域中一个极具潜力的研究方向——如何通过可验证奖励(RLVR)来优化大型语言模型(LLM)的训练。
5/30/2025 4:00:00 AM
肆零柒

当测试遇见 AI:用 Streamlit+AutoGen+Deepseek 构建智能用例生成器

一、引言: 测试用例的 AI 进化之路1.1 行业困境:手工用例的三重效率枷锁在软件测试领域,测试用例是质量保障的核心载体。 据 ISTQB 2024 全球测试报告揭示:测试用例承担着 70%的质量决策责任,但是传统手工编写方式正面临三大痛点:1.1.1 痛点一:效率瓶颈 —— 百级用例的时间黑洞数据支撑:腾讯云测试效能调研显示:某电商平台年编写用例 1.2w 条,其中 68.3% 因需求变更需重复修改。 某金融 APP 密码修改功能开发中,23 条用例编写耗时占项目周期 42% (相当于 1 个资深测试工程师 80 工时)。
5/30/2025 3:33:00 AM
魏文晏

AI连电路图都看不懂?SeePhys新基准暴击多模态短板,正确率低至55%

当前顶尖AI模型是否真能“看懂”物理图像? 全谱系多模态物理推理新基准来了,结果SOTA级模型准确率都不足55%。 新基准名为SeePhys,强调了图形感知对于模型认识和理解物理世界的重要性。
5/30/2025 3:10:00 AM

RAGFlow v0.19图文混排:详细拆解+预处理增强案例

RAGFlow在5/26 正式更新了v0.19版本,其中有两点值得关注。 首当其冲的是在 Agent 模块(也就是工作流)新增了代码执行组件,这个被吐槽了很久了 RAGFlow工作流编排功能,终于可以处理更加复杂的任务了。 第二点比较大的更新,是这篇文章主要要讨论的,也就是在 Chat 和 Agent 模块中改变以往图片作为引用的展示方式,直接在正文中进行显示。
5/30/2025 3:00:00 AM
韦东东

RAG、AI工作流一键搞定!一文带你看懂 Dify

曾以为AI应用是程序员的专利? Dify 彻底颠覆了! 它就像把复杂AI变成了乐高积木,人人都能动手搭建。
5/30/2025 2:21:00 AM
九歌

万人在看,用Deepseek根据需求定制化写文档并导出,你一定用的上!

需求分析前几天工程立项,主要批量写功能点用于新一年的工程预算。 但是工作量大,共计20000 行左右,要求3天之内完成。 图片文档主要结构及表头信息如下(提供模版部分字段)图片由于工作量太大,手工敲需要消耗大量的人力,于是借助deepseek大模型实现,让AI帮忙干活。
5/30/2025 2:10:00 AM
微微一笑

使用Agno实现AI代理设计的五个层级,由易到难

AI代理设计指南本指南将代理设计分解为五个实际难度级别,每个级别均提供可运行的代码示例。 无论开发者是初学者还是处理现实世界的复杂任务,本指南都能帮助避免常见陷阱,构建真正有效的代理。 这些级别包括:•级别1:带工具和指令的代理•级别2:带知识和记忆的代理•级别3:带长期记忆和推理的代理•级别4:多代理团队•级别5:代理系统以下逐一介绍各级别。
5/30/2025 2:10:00 AM
AI研究生

奖励推理模型(RRM):革新奖励模型的新范式

大家好,我是肆〇柒。 在人工智能领域,大型语言模型(LLM)的出现,如 GPT 系列模型,彻底改变了我们对机器智能的认知。 这些模型通过海量数据预训练,能生成自然、流畅且富有逻辑的文本,广泛应用于聊天机器人、文本生成、自动翻译等场景。
5/30/2025 2:00:00 AM
肆零柒

AI公司禁止用AI申请工作?Anthropic又改口了!

最近,一则关于AI公司的新闻引发了热议:全球领先的AI初创公司 Anthropic 宣布,他们将 取消禁止求职者在申请中使用AI工具的规定。 这条消息让人不禁感叹,连AI公司都在重新定义AI的使用边界,难道我们真的已经进入了“人机共生”的新时代? 禁止用AI申请工作?
5/30/2025 1:30:00 AM
云原生SRE

一文教你玩转 RAG 大模型应用开发

Part.1.RAG这么火,你会用吗? 自从大模型技术走向市场以来,“幻觉”现象总是对用户造成困扰,而RAG(Retrieval-Augmented Generation,检索增强生成)技术正在成为解决这一难题的利器。 国内众多科技大厂在实践RAG技术时都取得了阶段性的成果。
5/30/2025 1:00:00 AM
三笠

深夜突袭!DeepSeek-R1 重磅升级:媲美 OpenAl 最高 o3 模型,编码能力直逼 Claude 4

5月28日凌晨,DeepSeek 在 Hugging Face 上开源了其更新版的 R1 模型。 此次更新并未更改名称,只在模型路径中标注“0528”以作区分。 图源deepseek官方称这是一次“minor update”,但社区反馈却指向另一种结论:在代码生成、长时推理、格式控制等任务上,这个版本的 R1 的能力已经“近乎o3级别”。
5/30/2025 1:00:00 AM

数据架构师在人工智能支持中的作用

不可避免的人工智能炒作周期除非你一直生活在与世隔绝的地方,或者试图通过电话预约全科医生,否则你不可能注意到有关人工智能及其各种用途的炒作已经达到了狂热的程度。 现在,每个有价值的 PowerPoint 演示文稿都至少三次提到DeepSeek,两次提到“转型机遇”,以及至少一次关于 Agentic 涅槃的诱人承诺。 不可避免的是,在这种膨胀的期望达到顶峰之后,我们会进入沮丧的低谷,然后最终走出困境,虽然伤痕累累,但更加睿智,迈入生产力的高地。
5/30/2025 12:20:00 AM
晓晓

Dify搭建AI图片生成助手中的坑!

使用 Dify 搭建 AI 图片生成助手并不是什么难事,而且不需要你会编程知识,也能轻松实现。 但是,Dify 在搭建 AI 图片生成助手的过程中会遇到很多坑,例如以下这些:有些组件随着时间的推移,已经不能正常调用了;有些组件在国内需要魔法才能使用;有些组件需要复杂的本地部署才能正常调用;有些组件虽然能用,但生成的速度、成本、质量,是无法应用于生产环境的。 所以,接下来本文就带你来避开这些坑。
5/30/2025 12:00:00 AM
磊哥

“一天内完成更新”:腾讯多款产品接入 DeepSeek R1-0528 最新版

腾讯官方今日发文宣布,腾讯元宝、ima、搜狗输入法、QQ 浏览器等产品迎来升级,率先接入深度思考模型 DeepSeek R1-0528 最新版,多项能力全面提升。具体如下: · 推理能力大幅提升,代码水平更强 · 写作表现更有人味,格式更规范 · 思考不仅快,还有条理、讲逻辑,同时支持长时间思考
5/29/2025 11:13:14 PM
归泷

百度智能云千帆大模型平台、文小言宣布接入 DeepSeek-R1-0528 最新模型

百度智能云千帆大模型平台和文小言App宣布全面接入DeepSeek-R1-0528最新模型,该模型在复杂逻辑推理、长文本处理稳定性、代码生成质量等方面有显著提升。企业用户和开发者可通过千帆平台体验新模型,并利用全流程工具链构建专属大模型。文小言App用户也可体验最新的AI问答和创作能力。#百度智能云##DeepSeek#
5/29/2025 10:09:54 PM
远洋

教育部发布 2025 年高考预警信息:靠 AI 或所谓“专家”押中题目可能性极小

教育部指出,一些不法分子受利益驱使,散布高考相关虚假信息,制造贩卖焦虑,组织实施诈骗,甚至诱导考生作弊,严重损害考生和家长切身利益,严重扰乱考试招生秩序。
5/29/2025 9:32:14 PM
清源

国家新型工业化操作系统“鸿道”发布:用于具身智能机器人,支持华为、龙芯、英伟达、英特尔等 GPU / NPU 架构

据上证报报道,鸿道操作系统实现了芯片-系统-应用的垂直整合,支持包括龙芯,华为、海光、英伟达、英特尔、高通等在内的一众GPU/NPU架构。
5/29/2025 9:21:39 PM
清源