理论

3/24/2025 12:00:00 AM dev

RAG（六）大语言模型应用中的分块策略详解

1、分块在不同应用场景的作用语义搜索在语义搜索中，索引一组文档，每个文档包含特定主题的有价值信息。通过应用有效的分块策略，可以确保搜索结果准确捕捉用户查询的核心。分块的大小和方式直接影响搜索结果的准确性和相关性：分块过小：可能会丢失上下文信息，导致搜索结果无法准确理解用户查询的意图。

3/21/2025 2:34:17 PM Goldma

北欧初创企业IntuiCell发布全球首套人工智能数字神经系统

译者 | 涂承烨审校 | 重楼一家北欧深度科技初创公司宣布在人工智能领域取得突破性进展，成功创建了首个具备自主学习功能的“数字神经系统”。 2025年3月19日，隆德大学的衍生企业IntuiCell正式宣布，他们已成功研发出能够像生物有机体般学习和适应的人工智能，这项技术可能使当前众多应用场景中的传统AI范式面临淘汰。这项创新技术彻底颠覆了传统的静态机器学习模型，通过模拟生物神经系统学习的核心原理实现突破。

3/21/2025 2:14:01 PM 涂承烨

AI浪潮下，对DeepSeek发展的哲学新思考

作者 | 黄宇审校 | 重楼2025年新春伊始，DeepSeek火爆全球，国产大模型横空出世，以“免费易用高性能”的组合成功破圈，震动全球科技界。 3月1日，DeepSeek官方披露，按照DeepSeek-R1的token定价水平，公司一日之内总收入为562027美元，成本利润率高达545%。国产之光DeepSeek的朋友圈持续“扩容”，阿里、百度、腾讯等国内企业，微软、英伟达、亚马逊等国际科技巨头纷纷向DeepSeek抛出橄榄枝，“满血版DeepSeek”一时间成了互联网最新流量密码。

3/21/2025 2:11:19 PM 黄宇

生信工具评测方法：基于蛋白质对的计算机预测工具评估

编辑 | 白菜叶计算机模拟蛋白质功能注释对于缩小因测序加速而导致的对蛋白质活性理解的差距至关重要。存在多种功能注释方法，而且它们的数量一直在增长，尤其是随着深度学习技术的发展。但是，目前尚不清楚这些工具是否真的具有预测性。

3/21/2025 2:06:00 PM ScienceAI

成效初显！基于DeepSeek强化学习的医疗VLM策略来了

编辑 | ScienceAI在人工智能跨界医疗的浪潮中，如何赋能视觉语言模型（VLM）去 “看懂” 多种类型的医学影像，并在疾病诊断、病灶分析等任务中给出可信解释，已成关键挑战。近期，来自埃默里大学、南加州大学等机构的联合研究团队基于 DeepSeek 强化学习提出了一套医疗 VLM 策略，称之为 “Med-R1”，通过鼓励模型在 “推理过程” 上不断探索，大大提升了跨模态、跨任务的泛化能力。本文将结合实验结果和推理案例，为大家展示 DeepSeek 在医疗 VLM 中的实战成效。

3/21/2025 2:05:00 PM ScienceAI

13年后，AlexNet源代码终于公开：带注释的原版

想知道 AlexNet 2012 年的原始代码长什么样吗？现在，机会来了！刚刚，谷歌首席科学家 Jeff Dean 宣布，他们与计算机历史博物馆（CHM）合作，共同发布了 AlexNet 的源代码，并将长期保存这些代码。

3/21/2025 1:17:38 PM 机器之心

微软腾讯合体开大！上千网红爆款涌进桌面，PC手机次元壁崩塌

你，是否曾这样设想过：如果某一天，移动应用能和Windows PC无缝集成，就太好了。如今，这个梦想可以成真了。 3月17日，微软应用商店（Microsoft Store）正式上线「腾讯应用宝专区」，1000 精选安卓应用和游戏强势入驻Windows生态。

3/21/2025 1:06:17 PM 新智元

原有的模型评测基准OUT了！12岁高中生建立了一个网站，让AI模型发起 Minecraft 挑战

编辑 | 言征出品 | 51CTO技术栈（微信号：blog51cto）由于传统的AI 基准测试技术已被证明不够充分，AI 开发者开始采用更具创造性的方式来评估生成式 AI 模型的能力。对于一组开发者来说，这就是微软旗下的沙盒建造游戏 Minecraft。 Minecraft Benchmark （或 MC-Bench）网站是合作开发的，目的是让人工智能模型在面对面的挑战中相互竞争，用 Minecraft 创作来回答提示。

3/21/2025 1:05:18 PM 言征

SEARCH-R1: 基于强化学习的大型语言模型多轮搜索与推理框架

这个研究提出了一种新型强化学习(RL)框架SEARCH-R1，该框架使大型语言模型(LLM)能够实现多轮、交错的搜索与推理能力集成。不同于传统的检索增强生成(RAG)或工具使用方法，SEARCH-R1通过强化学习训练LLM自主生成查询语句，并优化其基于搜索引擎结果的推理过程。该模型的核心创新在于完全依靠强化学习机制（无需人工标注的交互轨迹）来学习最优的搜索查询策略及基于检索知识的推理方法，从而显著提升问答任务的性能表现。

3/21/2025 1:00:54 PM 佚名

25万GPU，估值350亿美元冲刺IPO！财务定时炸弹，GenAI不祥之兆

美国云服务公司CoreWeave，已提交上市文件，即将IPO。这是美国近期首个有意义的科技IPO，也是首个直接与AI热潮相关的IPO。 CoreWeave虽然有25万GPU，却频频受到质疑。

3/21/2025 12:56:44 PM 新智元

马斯克加入Agent争霸赛！Grok DeeperSearch上场，对决Gemini Deep Research

2025年Agent大战，Deep Research「研究智能体」率先开打！第一个登场的谷歌Gemini，随后OpenAI、Perplexity等也相继推出了自己的同名功能。 Grok是个例外，与Grok 3一同发布的是「DeepSearch」，没有「Research」只有「Search」。

3/21/2025 9:50:56 AM 新智元

万字长文：说清MCP的前世今生+RAGFlow整合应用示例

上篇文章给大家预告了我在研究些 RAG MCP（大模型上下文协议）的事，前后断断续续写了四天，终于完成了这篇稿子，这篇试图说清楚两个事情：1、从复杂提示词引导模型调用工具开始，到 MCP 作为统一协议标准的变化过程；2、小试牛刀的演示下在传统 RAG 基础上，针对机械加工场景结合 MCP 的一些功能延展示例。以下，enjoy:1、先说说大模型 API 调用先简单回顾下最简单的大模型基础聊天应用开发，也就是直接按照目标 LLM 的官方 API 文档进行请求的做法。例如，如果我们要通过 Python 调用 DeepSeek-R1 模型进行问答，按照官方文档说明示例如下：因为大多数模型厂商都是兼容 OpenAI 规范的，也就是说在使用 OpenAI SDK 请求方式下，直接替换上述的 base_url 换成其他模型地址，都是可以实现请求响应的。

3/21/2025 9:00:00 AM 韦东东

视觉语言指令微调数据如何构建?

1、构建策略视觉语言指令微调数据构建策略主要有以下两种：标注适配由于视觉模型的发展，已有规模巨大、多样性且高质量的标注数据。这些数据适合于广泛的下游任务，并可容易地改造为指令数据。许多工作将已有的标注数据转化为标准的指令数据格式。

3/21/2025 8:00:00 AM Goldma

保护LLM的身份和访问管理解决方案IAM

译者 | 李睿审校 | 重楼在人工智能时代，大型语言模型（LLM）的应用正在迅速增长。这些模型提供了大量的机会，但同时也带来了新的隐私和安全挑战。应对这些挑战的基本安全措施之一是保护对LLM的访问，以确保只有经过授权的人员才能访问数据和执行任何操作的权限。

3/21/2025 8:00:00 AM 李睿

RAG（五）BGE-M3，最流行的开源text embedding模型

项目地址： embedding？ Text Embedding 是一种将文本数据映射到高维向量空间的技术，这些向量能够捕捉文本的语义信息。通过将文本嵌入到向量空间中，我们可以利用向量之间的距离或相似性来衡量文本之间的语义相关性。

3/21/2025 7:00:00 AM Glodma

华为诺亚综述：生成式模型如何用于决策？

机构：华为诺亚决策推理实验室作者：李银川、郝建业等人近年来，生成模型在内容生成（AIGC）领域蓬勃发展，同时也逐渐引起了在智能决策中的应用关注。由于生成模型能够处理复杂的数据分布，并具备强大的建模能力，它们可以被引入决策系统，用于生成引导代理进入高奖励状态的轨迹或中间子目标。本综述系统性地梳理了生成模型在决策任务中的应用，并提供了全面的分类框架。

3/20/2025 2:33:00 PM 机器之心

一个算法让LLM创新能力暴增，原来是AI学会了进化

如果你让当今的 LLM 给你生成一个创意时钟设计，使用提示词「a creative time display」，它可能会给出这样的结果：或许我们能在其中看到一些创新点，但整体来说这些设计并无特别出彩之处，依然还在预期之内。但近日的一项研究成果却可以让 LLM 设计出下面这些让人眼前一亮的时钟，而使用的提示词却和上面的一样：这是怎么做到的呢？简而言之：一种基于 LLM 的进化算法。

3/20/2025 2:18:57 PM 机器之心

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ OmniParser V2 在 Windows 系统上的详细安装与运行指南

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉

理论

提升自我的十款顶级AI工具推荐

RAG（六）大语言模型应用中的分块策略详解

北欧初创企业IntuiCell发布全球首套人工智能数字神经系统

AI浪潮下，对DeepSeek发展的哲学新思考

生信工具评测方法：基于蛋白质对的计算机预测工具评估

成效初显！基于DeepSeek强化学习的医疗VLM策略来了

13年后，AlexNet源代码终于公开：带注释的原版

微软腾讯合体开大！上千网红爆款涌进桌面，PC手机次元壁崩塌

原有的模型评测基准OUT了！12岁高中生建立了一个网站， 让AI模型发起 Minecraft 挑战

SEARCH-R1: 基于强化学习的大型语言模型多轮搜索与推理框架

25万GPU，估值350亿美元冲刺IPO！财务定时炸弹，GenAI不祥之兆

马斯克加入Agent争霸赛！Grok DeeperSearch上场，对决Gemini Deep Research

万字长文：说清MCP的前世今生+RAGFlow整合应用示例

视觉语言指令微调数据如何构建?

保护LLM的身份和访问管理解决方案IAM

RAG（五）BGE-M3，最流行的开源text embedding模型

华为诺亚综述：生成式模型如何用于决策？

一个算法让LLM创新能力暴增，原来是AI学会了进化

原有的模型评测基准OUT了！12岁高中生建立了一个网站，让AI模型发起 Minecraft 挑战