理论
SEARCH-R1: 基于强化学习的大型语言模型多轮搜索与推理框架
这个研究提出了一种新型强化学习(RL)框架SEARCH-R1,该框架使大型语言模型(LLM)能够实现多轮、交错的搜索与推理能力集成。 不同于传统的检索增强生成(RAG)或工具使用方法,SEARCH-R1通过强化学习训练LLM自主生成查询语句,并优化其基于搜索引擎结果的推理过程。 该模型的核心创新在于完全依靠强化学习机制(无需人工标注的交互轨迹)来学习最优的搜索查询策略及基于检索知识的推理方法,从而显著提升问答任务的性能表现。
3/21/2025 1:00:54 PM
佚名
25万GPU,估值350亿美元冲刺IPO!财务定时炸弹,GenAI不祥之兆
美国云服务公司CoreWeave,已提交上市文件,即将IPO。 这是美国近期首个有意义的科技IPO,也是首个直接与AI热潮相关的IPO。 CoreWeave虽然有25万GPU,却频频受到质疑。
3/21/2025 12:56:44 PM
新智元
马斯克加入Agent争霸赛!Grok DeeperSearch上场,对决Gemini Deep Research
2025年Agent大战,Deep Research「研究智能体」率先开打! 第一个登场的谷歌Gemini,随后OpenAI、Perplexity等也相继推出了自己的同名功能。 Grok是个例外,与Grok 3一同发布的是「DeepSearch」,没有「Research」只有「Search」。
3/21/2025 9:50:56 AM
新智元
万字长文:说清MCP的前世今生+RAGFlow整合应用示例
上篇文章给大家预告了我在研究些 RAG MCP(大模型上下文协议)的事,前后断断续续写了四天,终于完成了这篇稿子,这篇试图说清楚两个事情:1、从复杂提示词引导模型调用工具开始,到 MCP 作为统一协议标准的变化过程;2、小试牛刀的演示下在传统 RAG 基础上,针对机械加工场景结合 MCP 的一些功能延展示例。 以下,enjoy:1、先说说大模型 API 调用先简单回顾下最简单的大模型基础聊天应用开发,也就是直接按照目标 LLM 的官方 API 文档进行请求的做法。 例如,如果我们要通过 Python 调用 DeepSeek-R1 模型进行问答,按照官方文档说明示例如下:因为大多数模型厂商都是兼容 OpenAI 规范的,也就是说在使用 OpenAI SDK 请求方式下,直接替换上述的 base_url 换成其他模型地址,都是可以实现请求响应的。
3/21/2025 9:00:00 AM
韦东东
视觉语言指令微调数据如何构建?
1、构建策略视觉语言指令微调数据构建策略主要有以下两种:标注适配由于视觉模型的发展,已有规模巨大、多样性且高质量的标注数据。 这些数据适合于广泛的下游任务,并可容易地改造为指令数据。 许多工作将已有的标注数据转化为标准的指令数据格式。
3/21/2025 8:00:00 AM
Goldma
保护LLM的身份和访问管理解决方案IAM
译者 | 李睿审校 | 重楼在人工智能时代,大型语言模型(LLM)的应用正在迅速增长。 这些模型提供了大量的机会,但同时也带来了新的隐私和安全挑战。 应对这些挑战的基本安全措施之一是保护对LLM的访问,以确保只有经过授权的人员才能访问数据和执行任何操作的权限。
3/21/2025 8:00:00 AM
李睿
RAG(五)BGE-M3,最流行的开源text embedding模型
项目地址: embedding? Text Embedding 是一种将文本数据映射到高维向量空间的技术,这些向量能够捕捉文本的语义信息。 通过将文本嵌入到向量空间中,我们可以利用向量之间的距离或相似性来衡量文本之间的语义相关性。
3/21/2025 7:00:00 AM
Glodma
华为诺亚综述:生成式模型如何用于决策?
机构:华为诺亚决策推理实验室作者:李银川、郝建业等人近年来,生成模型在内容生成(AIGC)领域蓬勃发展,同时也逐渐引起了在智能决策中的应用关注。 由于生成模型能够处理复杂的数据分布,并具备强大的建模能力,它们可以被引入决策系统,用于生成引导代理进入高奖励状态的轨迹或中间子目标。 本综述系统性地梳理了生成模型在决策任务中的应用,并提供了全面的分类框架。
3/20/2025 2:33:00 PM
机器之心
一个算法让LLM创新能力暴增,原来是AI学会了进化
如果你让当今的 LLM 给你生成一个创意时钟设计,使用提示词「a creative time display」,它可能会给出这样的结果:或许我们能在其中看到一些创新点,但整体来说这些设计并无特别出彩之处,依然还在预期之内。 但近日的一项研究成果却可以让 LLM 设计出下面这些让人眼前一亮的时钟,而使用的提示词却和上面的一样:这是怎么做到的呢? 简而言之:一种基于 LLM 的进化算法。
3/20/2025 2:18:57 PM
机器之心
剑桥团队革新RNA速率分析:AI算法突破基因动态追踪
编辑丨&RNA 速率模型利用剪接和未剪接的 RNA 计数中包含的时间信息来推断转录动力学,但现有的速率模型通常依赖于粗略的生物物理简化或数值近似来求解基础常微分方程(ODE)。 英国剑桥大学主导的团队提出了 cell2fate,它允许以完全贝叶斯方式求解生物物理学上更准确的模型。 通过将 RNA 速率解决方案分解为模块,cell2fate 在 RNA 速率和统计降维之间建立了生物物理联系。
3/20/2025 2:12:00 PM
ScienceAI
迄今为止最大最全面!人类专家级准确性,AI数据驱动的生物医学知识图谱
编辑 | 萝卜皮为了应对生物医学研究中科学出版物和数据的快速增长,知识图谱(KG)已成为整合大量异构数据以实现高效信息检索和自动知识发现的重要工具。 然而,将非结构化的科学文献转化为知识图谱仍然是一项艰巨的挑战,之前的方法无法达到人类水平的准确率。 在最新的研究中,佛罗里达州立大学(Florida State University)和 Insilicom LLC 的研究人员使用了在 LitCoin 自然语言处理挑战赛 (2022) 中获得第一名的信息提取流程,利用所有 PubMed 摘要构建了一个名为 iKraph 的大规模知识图谱。
3/20/2025 2:08:00 PM
ScienceAI
导致大多数企业AI项目失败的致命错误
在企业中的某个领域,或许正有一个AI项目正在走向失败,可能它是一个旨在将销售额提升30%的推荐引擎,可能它是一个旨在大幅减少停机时间的预测性维护系统,又可能是一个本打算彻底改变响应时间的客户服务聊天机器人。 这些雄心勃勃的计划上落满的灰尘,代表的不仅仅是资源的浪费,还有期望的破灭,这让未来推动创新变得更加困难。 期望与现实之间的差距把AI项目想象成冰山。
3/20/2025 1:25:36 PM
Bernard Marr
Atlas机器人越来越像人了!强化学习加持爬行、翻跟头、跳街舞,已安排进厂打工
最近,国内各种人形机器人轮番上阵,效果一个比一个炸裂。 作为人形机器人的老牌玩家,波士顿动力终于还是出手了! 就在昨天,他们放出了一段长达一分钟的演示,只见Atlas不仅能跑、能爬,而且还能翻跟头、跳街舞。
3/20/2025 1:19:04 PM
新智元
HuggingFace、a16z向白宫谏言,激辩OpenAI:开源才是美国最大的AI竞争优势,垄断不是!
编辑 | 言征出品 | 51CTO技术栈(微信号:blog51cto)近日OpenAI提交有关禁止使用中国模型的提案引起了大家的注意。 不过这也只是提议,包括美国在内的很多企业和大佬对此表示并不赞同——在华盛顿的政策环境中,越来越多地呼吁对人工智能进行最低限度的监管,而Hugging Face则向特朗普政府提出了截然不同的观点:开源和协作的人工智能开发可能是美国最强大的竞争优势。 目前,Hugging Face已经在自家平台上拥有超过 150 万个公共模型,它已向白宫人工智能行动计划提交了建议,认为开源模型的最新突破表明,它们可以以极低的成本达到甚至超越封闭商业系统的能力。
3/20/2025 1:07:11 PM
言征
生活机器人最后考验!杨笛一团队发布EgoNormia:现实中能否符合社会规范?
随着人工智能技术日益成熟,社会各界对AI或机器人能否学习并遵循社会规范的问题越来越关注。 从早期的科幻小说到如今的现实应用,人类始终期望机器能够理解并内化这些根植于社会生活中的「规范」。 随着视觉语言模型(VLMs)不断进步,研究者们陆续推出了诸多基准和数据集,用以评估其第一视角下的视频理解能力。
3/20/2025 1:02:34 PM
新智元
腾讯超预期成绩单发布!双位数增长,微信收入翻倍!刘炽平:资本支出增长三倍,猛追AI基建,今年将支出千亿投入AI!
出品 | 51CTO技术栈(微信号:blog51cto)3月19日,腾讯公布了2024财年Q4的成绩单。 收入同比增长11%,而利润同比增长90%。 可以说非常亮眼:收入和利润都超出了最高预期,以下是腾讯在2024年第四季度与Refinitiv估计相比的表现:收入:1724亿元人民币(23.9亿美元),预期为168.9亿元。
3/20/2025 12:56:19 PM
宇树机器人侧空翻惊呆网友:“我**想要一个!”
这下特效视频和机器人实拍真的傻傻分不清楚了…前几天机器人卷的还是前后空翻呢,宇树现在连侧空翻都曝出来了。 干拔起跳,落地都不带晃的:以上动作,由宇树的Unitree G1呈现,就是身高1米3,售价9.9万起的那个型号。 宇树官方是酱婶描述的:这是世界上第一款征服站立侧空翻的人形机器人。
3/20/2025 12:11:42 PM
量子位
OpenAI史上最贵模型来了!比DeepSeek贵270倍,100万输出token 600美元
比DeepSeek-R1贵270倍,OpenAI史上最贵模型来了! 就在刚刚,OpenAI上线了推理模型o1-pro的API。 本来大家还挺高兴,结果一看到价格,悬着的心终于死了。
3/20/2025 11:58:29 AM
资讯热榜
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
AI创作
马斯克
论文
智能体
Anthropic
英伟达
代码
算法
训练
Stable Diffusion
芯片
蛋白质
开发者
腾讯
生成式
LLM
苹果
Claude
神经网络
AI新词
3D
研究
机器学习
生成
AI for Science
Agent
xAI
计算
人形机器人
Sora
AI视频
GPU
AI设计
百度
华为
搜索
大语言模型
工具
场景
字节跳动
具身智能
RAG
大型语言模型
预测
深度学习
伟达
视觉
Transformer
AGI
视频生成
神器推荐
亚马逊
Copilot
DeepMind
架构
模态
应用