理论
RAG回答准确率暴涨300%!用Coze工作流进行数据结构化(附完整提示词)
前言在生成式人工智能(Generative AI)快速发展的当下,大语言模型(LLMs)的幻觉问题始终是制约其落地应用的关键瓶颈。 检索增强生成(RAG)技术通过引入外部知识库,将动态检索与生成能力结合,为解决这一难题提供了重要思路。 然而,RAG系统的核心性能——数据召回率,高度依赖于底层数据的质量与组织形式。
4/1/2025 10:01:42 AM
后端小肥肠
AI算法 | 如何训练自己的大模型?
1、第一阶段:二次预训练模型选择与转换在开始训练之前,需要选择一个合适的基础模型。 本文以LLaMA-7B为例,简单介绍下。 为了方便后续的操作,将LLaMA-7B模型转换为Hugging Face格式。
4/1/2025 9:54:09 AM
Goldma
打工人自救指南:Manus+DeepSeek+Coze破局AI淘汰
前言2025年的中国AI竞技场中,三股技术浪潮正深度重构普通人的生存法则——DeepSeek让普通人年也能享受硅谷级智囊服务;Manus让小微企业人力成本直降70%(简历筛选、财务核算等);Coze的智能体孵化出了新兴职业(智能体架构师、智能体调教师等)。 当人们还在争论AI是否替代人类时,这三个现象级工具已悄然定义了智能技术的三种进化路径:认知突破、执行闭环与生态革命。 这场技术革命的核心分野,在于三者对人类能力的增强坐标差异:• DeepSeek强化认知维度:用强化学习与模型蒸馏技术,将专业决策的颗粒度细化至人类难以企及的层级(如投资策略模拟准确率达97.3%);• Manus重构执行范式:通过规划-执行-验证(PEV)架构,替代HR筛选、财务核算等流程性工作,实现企业人力成本大幅度降低;• Coze激活创新生态:其插件市场增长率达200%,催生“智能体调教师”“智能体架构师”等新职业,让技术民主化从口号变为现实。
4/1/2025 9:49:06 AM
后端小肥肠
OpenAI要Open了!奥特曼开源首个推理模型,ChatGPT一小时暴增百万用户
OpenAI终于要Open AI了! 一大早,奥特曼郑重官宣,「未来几个月,将开源一款强大的推理模型」。 这是自GPT-2以来,OpenAI首个开源的模型。
4/1/2025 9:46:08 AM
新智元
中科大提出动作价值表征学习新方法,率先填补长期决策信息的缺失
在视觉强化学习中,许多方法未考虑序列决策过程,导致所学表征缺乏关键的长期信息的空缺被填补上了。 来自中科大的研究人员在信息瓶颈(Information Bottleneck)框架下,提出了一种新颖的鲁棒动作价值表征学习方法ROUSER。 作者从理论上证明了ROUSER能够使用学习到的鲁棒表征准确估计动作价值,从而避免了智能体在测试环境中的决策能力遭到削弱。
4/1/2025 9:32:00 AM
量子位
使用PyTorch和Hugging Face构建一个自动语音识别系统
译者 | 布加迪审校 | 重楼从语音助手到转录服务,自动语音识别(ASR)是许多应用中的一项关键技术。 我们在本教程中旨在使用Hugging Face的预训练模型构建一条能够将语音转录为文本的ASR管道。 我们将使用轻量级数据集来提高效率,并使用Wav2Vec2这种强大的语音识别自监督模型。
4/1/2025 9:31:34 AM
布加迪
RAG(八)自反思检索增强生成--Self-RAG
大语言模型具有显著的能力,但它们常常因为仅依赖于其参数化知识而产生包含事实错误的响应。 传统的检索增强生成(Retrieval-Augmented Generation, RAG)方法虽然能减少这些问题,但是存在无差别地检索和结合固定数量的段落,没有考虑检索是否必要或检索结果的相关性,都会削弱语言模型的灵活性,或者导致无益的响应生成。 现在LLM RAG(检索增强)的技术方案已成为LLM在众多应用场景的主流。
4/1/2025 9:25:09 AM
Goldma
奥赛级AI基准来了:难倒所有模型,GPT-4o仅考34分,上海交大出品
为了进一步挑战AI系统,大家已经开始研究一些最困难的竞赛中的问题,特别是国际奥林匹克竞赛和算法挑战。 但目前尚无奥林匹克级别的、多学科的基准,能够全面评估综合解决问题的能力,以全面检验人工智能的综合认知能力。 上海交通大学生成式人工智能实验室 (GAIR Lab) 的研究团队推出多学科认知推理基准OlympicArena,即使是GPT-4o 也只达到了 34.01% 的整体准确率,而其他开源模型的整体准确率也难以达到20%。
4/1/2025 9:25:00 AM
量子位
OpenAI惊人内幕曝光!赶走奥特曼的PDF,是Ilya发的
奥特曼宫斗事件的背后推手,果然是Ilya! 他发出的两份PDF,掀起了此后OpenAI的惊天巨浪。 奥特曼的3个谎言被戳穿后,Ilya找到Murati和董事会成员,策划了一场「政变」。
4/1/2025 9:23:00 AM
新智元
推荐场景Scaling Law来了!中科大&华为诺亚方舟联合推出
当Scaling Law应用于推荐场景,模型又将如何表现? 中科大认知智能全国重点实验室陈恩红团队联合华为诺亚方舟实验室推出推荐模型性能定律,首次对模型的性能与模型、数据的规模和质量进行了定量分析。 针对现有工作只能对推荐大模型Scaling Law(扩展定律)做定性分析的局限性,论文首次尝试对推荐大模型性能扩展定律给出明确的定量预测。
4/1/2025 9:20:00 AM
量子位
别只看LLM!为什么知识图谱才是通往AGI的关键一步
智能时代,我们已经习惯让AI为我们提供各种服务。 当你问DeepSeek:"北京的天气怎么样"时,它能精准回答;当你让ChatGPT"用简单语言解释相对论",它能流畅作答... 这些AI能力的背后,除了神经网络的感知能力,还有一个关键支撑技术——知识图谱。
4/1/2025 9:17:10 AM
大数据AI智能圈
刚刚,谷歌最强Gemini 2.5 Pro免费了!数学碾压人类研究生,拿下全球TOP 1
虽然又被GPT-4o吉卜力生图的光芒掩盖了,但毫无疑问,上周的另一技术核弹Gemini 2.5 Pro,也是无可争议的强! 在试用过程中,网友们逐渐发现,这个模型真的强到发指。 在门萨Norway的IQ测试中,它已经突破了130。
4/1/2025 9:17:00 AM
新智元
生成式AI正将员工转化为无意识的内鬼威胁:企业安全新挑战
根据Netskope最新研究,企业向生成式AI(GenAI)应用共享的数据量呈现爆炸式增长,一年内激增30倍。 目前平均每家企业每月向AI工具传输的数据量已达7.7GB,较一年前的250MB实现跨越式增长。 这些数据包含源代码、受监管数据、密码密钥和知识产权等敏感信息,大幅增加了数据泄露、合规违规和知识产权盗窃的风险。
4/1/2025 8:50:00 AM
AI小蜜蜂
LangGraph:如何用“图思维”轻松管理多Agent协作?
引言当AI任务变得复杂时,我们需要更好的“调度员”。 随着智能应用场景的深化,单一 Agent 在处理复杂任务(如电商智能客服、金融数据分析流水线)时显现出明显局限性。 传统链式调用框架(如 LangChain)依赖开发者手动编排流程,在面对任务分支、动态决策和资源复用等场景时,往往陷入维护成本高、扩展性差的困境。
4/1/2025 8:48:34 AM
张张
MCP 和 Function Calling:概念
随着人工智能的快速发展,大型语言模型(LLMs)逐渐深入到我们生活与工作的各个方面。 然而,尽管模型强大,但其能力仍存在局限性,比如在实时信息获取和复杂任务执行方面仍有不足。 RAG(检索增强生成)现在在企业的 AI 应用中使用很广泛,就是为了解决模型的信息不够实时,且没有垂直领域知识的问题。
4/1/2025 8:45:56 AM
不止dotNET
OpenAI重新开源!第一弹就推理模型,还不限制商用,“冲着DeepSeek来的”
一夜之间,OpenAI更新三大动向,开源、融资、用户暴增。 第一,将开源一个具备推理能力的大语言模型,包含参数权重那种。 上一次这样开源还是6年前推出GPT-2。
4/1/2025 8:45:15 AM
模型上下文协议(MCP)开发实战——构建LangChain代理客户端
译者 | 朱先忠审校 | 重楼简介什么是模型上下文协议(Model Context Protocol)? 让我们深入了解MCP背后的概念。 以下是官方MCP文档对MCP的介绍:“MCP是一种开放协议,它标准化了应用程序向LLM提供上下文的方式。
4/1/2025 8:38:25 AM
朱先忠
MCP 协议:大模型构建 Agent 智能体的桥梁
大模型技术的发展日新月异,但关于大模型的应用却步履维艰;自从2024年开始市场开始把大模型应用提上日程,但到底怎么把大模型应用于各行各业是很多人都在思考的问题。 随着时间的推移,RAG,Agent智能体的概念被提出,特别是智能体技术被称为人工智能的未来,也是大模型被应用于其它领域的途径。 但到底怎么打造智能体,却是业界一直在思考的问题;虽然后来提出了思维链以及function call,然后结合工作流技术(如coz平台),但大模型在实际应用中依然存在各种各样的问题,而且效果也并不太好。
4/1/2025 8:05:00 AM
DFires
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
模型
数据
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Gemini
Stable Diffusion
马斯克
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
Sora
3D
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
Claude
模态
字节跳动
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
Copilot
LLaMA
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
亚马逊
科技
智能体
AGI
DeepMind