理论
基于代理知识蒸馏技术克服文档提取和RAG策略失败问题
译者 | 朱先忠审校 | 重楼简介当下,许多生成式AI应用场景仍然围绕检索增强生成(RAG)展开,但始终未能满足用户的期望。 尽管对RAG改进的研究越来越多,甚至在流程中添加了代理技术,但许多解决方案仍然无法返回详尽的结果,遗漏了文档中很少提及的关键信息,需要多次搜索迭代,并且通常难以协调多个文档中的关键主题。 最糟糕的是,许多实现方案仍然依赖于将尽可能多的“相关”信息与详细的系统和用户提示一起塞入模型的上下文窗口。
3/24/2025 8:20:39 AM
朱先忠
数据越多越好?错了!关键在于如何“喂”给模型
咱们今天聊聊机器学习里的一个重点概念——特征工程。 我们人看东西、做判断,是不是得先抓住事物的关键特点? 比如说,你要判断一个苹果好不好吃,你会看它颜色、闻它香味、摸它硬度,甚至尝一口。
3/24/2025 6:40:00 AM
Python数智工坊
提升自我的十款顶级AI工具推荐
今天为大家精选了10款能帮助我们提升自我的AI工具,让成长变得更加高效。 1️⃣ BeforeSunset AI:你的专属生产力管家image.png时间总是不够用? BeforeSunset AI通过智能规划你的日程表,帮助你高效利用每一分钟,让你清晰有序地安排一天的任务。
3/24/2025 12:00:00 AM
dev
RAG(六)大语言模型应用中的分块策略详解
1、分块在不同应用场景的作用语义搜索在语义搜索中,索引一组文档,每个文档包含特定主题的有价值信息。 通过应用有效的分块策略,可以确保搜索结果准确捕捉用户查询的核心。 分块的大小和方式直接影响搜索结果的准确性和相关性:分块过小:可能会丢失上下文信息,导致搜索结果无法准确理解用户查询的意图。
3/21/2025 2:34:17 PM
Goldma
北欧初创企业IntuiCell发布全球首套人工智能数字神经系统
译者 | 涂承烨审校 | 重楼一家北欧深度科技初创公司宣布在人工智能领域取得突破性进展,成功创建了首个具备自主学习功能的“数字神经系统”。 2025年3月19日,隆德大学的衍生企业IntuiCell正式宣布,他们已成功研发出能够像生物有机体般学习和适应的人工智能,这项技术可能使当前众多应用场景中的传统AI范式面临淘汰。 这项创新技术彻底颠覆了传统的静态机器学习模型,通过模拟生物神经系统学习的核心原理实现突破。
3/21/2025 2:14:01 PM
涂承烨
AI浪潮下,对DeepSeek发展的哲学新思考
作者 | 黄宇审校 | 重楼2025年新春伊始,DeepSeek火爆全球,国产大模型横空出世,以“免费 易用 高性能”的组合成功破圈,震动全球科技界。 3月1日,DeepSeek官方披露,按照DeepSeek-R1的token定价水平,公司一日之内总收入为562027美元,成本利润率高达545%。 国产之光DeepSeek的朋友圈持续“扩容”,阿里、百度、腾讯等国内企业,微软、英伟达、亚马逊等国际科技巨头纷纷向DeepSeek抛出橄榄枝,“满血版DeepSeek”一时间成了互联网最新流量密码。
3/21/2025 2:11:19 PM
黄宇
生信工具评测方法:基于蛋白质对的计算机预测工具评估
编辑 | 白菜叶计算机模拟蛋白质功能注释对于缩小因测序加速而导致的对蛋白质活性理解的差距至关重要。 存在多种功能注释方法,而且它们的数量一直在增长,尤其是随着深度学习技术的发展。 但是,目前尚不清楚这些工具是否真的具有预测性。
3/21/2025 2:06:00 PM
ScienceAI
成效初显!基于DeepSeek强化学习的医疗VLM策略来了
编辑 | ScienceAI在人工智能跨界医疗的浪潮中,如何赋能视觉语言模型(VLM)去 “看懂” 多种类型的医学影像,并在疾病诊断、病灶分析等任务中给出可信解释,已成关键挑战。 近期,来自埃默里大学、南加州大学等机构的联合研究团队基于 DeepSeek 强化学习提出了一套医疗 VLM 策略,称之为 “Med-R1”,通过鼓励模型在 “推理过程” 上不断探索,大大提升了跨模态、跨任务的泛化能力。 本文将结合实验结果和推理案例,为大家展示 DeepSeek 在医疗 VLM 中的实战成效。
3/21/2025 2:05:00 PM
ScienceAI
13年后,AlexNet源代码终于公开:带注释的原版
想知道 AlexNet 2012 年的原始代码长什么样吗? 现在,机会来了! 刚刚,谷歌首席科学家 Jeff Dean 宣布,他们与计算机历史博物馆(CHM)合作,共同发布了 AlexNet 的源代码,并将长期保存这些代码。
3/21/2025 1:17:38 PM
机器之心
微软腾讯合体开大!上千网红爆款涌进桌面,PC手机次元壁崩塌
你,是否曾这样设想过:如果某一天,移动应用能和Windows PC无缝集成,就太好了。 如今,这个梦想可以成真了。 3月17日,微软应用商店(Microsoft Store)正式上线「腾讯应用宝专区」,1000 精选安卓应用和游戏强势入驻Windows生态。
3/21/2025 1:06:17 PM
新智元
原有的模型评测基准OUT了!12岁高中生建立了一个网站, 让AI模型发起 Minecraft 挑战
编辑 | 言征出品 | 51CTO技术栈(微信号:blog51cto)由于传统的AI 基准测试技术已被证明不够充分,AI 开发者开始采用更具创造性的方式来评估生成式 AI 模型的能力。 对于一组开发者来说,这就是微软旗下的沙盒建造游戏 Minecraft。 Minecraft Benchmark (或 MC-Bench)网站是合作开发的,目的是让人工智能模型在面对面的挑战中相互竞争,用 Minecraft 创作来回答提示。
3/21/2025 1:05:18 PM
言征
SEARCH-R1: 基于强化学习的大型语言模型多轮搜索与推理框架
这个研究提出了一种新型强化学习(RL)框架SEARCH-R1,该框架使大型语言模型(LLM)能够实现多轮、交错的搜索与推理能力集成。 不同于传统的检索增强生成(RAG)或工具使用方法,SEARCH-R1通过强化学习训练LLM自主生成查询语句,并优化其基于搜索引擎结果的推理过程。 该模型的核心创新在于完全依靠强化学习机制(无需人工标注的交互轨迹)来学习最优的搜索查询策略及基于检索知识的推理方法,从而显著提升问答任务的性能表现。
3/21/2025 1:00:54 PM
佚名
25万GPU,估值350亿美元冲刺IPO!财务定时炸弹,GenAI不祥之兆
美国云服务公司CoreWeave,已提交上市文件,即将IPO。 这是美国近期首个有意义的科技IPO,也是首个直接与AI热潮相关的IPO。 CoreWeave虽然有25万GPU,却频频受到质疑。
3/21/2025 12:56:44 PM
新智元
马斯克加入Agent争霸赛!Grok DeeperSearch上场,对决Gemini Deep Research
2025年Agent大战,Deep Research「研究智能体」率先开打! 第一个登场的谷歌Gemini,随后OpenAI、Perplexity等也相继推出了自己的同名功能。 Grok是个例外,与Grok 3一同发布的是「DeepSearch」,没有「Research」只有「Search」。
3/21/2025 9:50:56 AM
新智元
万字长文:说清MCP的前世今生+RAGFlow整合应用示例
上篇文章给大家预告了我在研究些 RAG MCP(大模型上下文协议)的事,前后断断续续写了四天,终于完成了这篇稿子,这篇试图说清楚两个事情:1、从复杂提示词引导模型调用工具开始,到 MCP 作为统一协议标准的变化过程;2、小试牛刀的演示下在传统 RAG 基础上,针对机械加工场景结合 MCP 的一些功能延展示例。 以下,enjoy:1、先说说大模型 API 调用先简单回顾下最简单的大模型基础聊天应用开发,也就是直接按照目标 LLM 的官方 API 文档进行请求的做法。 例如,如果我们要通过 Python 调用 DeepSeek-R1 模型进行问答,按照官方文档说明示例如下:因为大多数模型厂商都是兼容 OpenAI 规范的,也就是说在使用 OpenAI SDK 请求方式下,直接替换上述的 base_url 换成其他模型地址,都是可以实现请求响应的。
3/21/2025 9:00:00 AM
韦东东
视觉语言指令微调数据如何构建?
1、构建策略视觉语言指令微调数据构建策略主要有以下两种:标注适配由于视觉模型的发展,已有规模巨大、多样性且高质量的标注数据。 这些数据适合于广泛的下游任务,并可容易地改造为指令数据。 许多工作将已有的标注数据转化为标准的指令数据格式。
3/21/2025 8:00:00 AM
Goldma
保护LLM的身份和访问管理解决方案IAM
译者 | 李睿审校 | 重楼在人工智能时代,大型语言模型(LLM)的应用正在迅速增长。 这些模型提供了大量的机会,但同时也带来了新的隐私和安全挑战。 应对这些挑战的基本安全措施之一是保护对LLM的访问,以确保只有经过授权的人员才能访问数据和执行任何操作的权限。
3/21/2025 8:00:00 AM
李睿
RAG(五)BGE-M3,最流行的开源text embedding模型
项目地址: embedding? Text Embedding 是一种将文本数据映射到高维向量空间的技术,这些向量能够捕捉文本的语义信息。 通过将文本嵌入到向量空间中,我们可以利用向量之间的距离或相似性来衡量文本之间的语义相关性。
3/21/2025 7:00:00 AM
Glodma
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
机器人
数据
大模型
Midjourney
开源
智能
Meta
用户
微软
GPT
学习
技术
图像
Gemini
AI新词
智能体
马斯克
AI创作
Anthropic
英伟达
论文
训练
代码
算法
LLM
Stable Diffusion
芯片
腾讯
苹果
蛋白质
Claude
开发者
AI for Science
Agent
生成式
神经网络
机器学习
3D
xAI
研究
人形机器人
生成
AI视频
百度
计算
工具
Sora
GPU
华为
大语言模型
RAG
AI设计
字节跳动
具身智能
搜索
大型语言模型
场景
AGI
深度学习
视频生成
预测
视觉
伟达
架构
Transformer
神器推荐
编程
DeepMind
亚马逊
特斯拉
AI模型