大语言模型

如何估算大语言模型LLM 的 GPU 内存：用于本地运行 LLM 的 GPU 内存

随着 DeepSeek、GPT、Llama、Mistral 等大规模 LLM 的兴起，AI 从业者面临的最大挑战之一是确定需要多少 GPU 内存才能高效地服务于这些模型。 GPU 资源昂贵且稀缺，因此优化内存分配至关重要。本指南将引导您使用一个简单而有效的公式来估算服务 LLM 所需的 GPU 内存。

5/9/2025 1:00:00 AM 晓晓

模型越新幻觉越重！AI幻觉扣住产业发展命脉

自诞生以来，人工智能大模型始终被“幻觉”问题困扰。这里的“幻觉”，指的是大语言模型会将虚构信息当作真实事实输出。实际上，“幻觉”这一表述相当委婉，它实则暴露出AI的核心缺陷——当前的大语言模型尚未达到真正意义上的智能水平。

5/8/2025 6:00:00 AM 小刀

Gemini 2.5 Pro再更新！编程能力屠榜！一句话、一张草图变应用

出品 | 51CTO技术栈（微信号：blog51cto）AI 编码模型的新王者登基了！今天，Google 旗下的 DeepMind AI 研究部门正式发布了 Gemini 2.5 Pro “I/O” 版，这是今年 3 月推出的 Gemini 2.5 Pro 多模态大语言模型（LLM）的更新版本。 DeepMind CEO Demis Hassabis 在 X 上表示：“这是我们迄今为止打造的最佳编码模型！

5/7/2025 10:09:08 AM

SmallRye大模型简介：使用Langchain4J轻松向应用内引入AI服务

译者 | 核子可乐审校 | 重楼Langchain4J解决了哪些问题？ Langchain4J 本质上是为 Java 开发者打造的工具箱，旨在简化向高级语言中集成 AI 功能（如聊天机器人或文本生成器）的过程，同时屏蔽底层复杂细节。想象一下：我们想要构建一个能回答问题、生成内容或模拟人类对话的智能应用。

5/7/2025 8:14:58 AM 核子可乐

智谱与生数科技达成战略合作专注大模型联合创新

4月27日，清华大学旗下的两家明星人工智能公司智谱（Z.ai）和生数科技(shengshu.com)宣布达成重大战略合作。此次合作旨在通过双方在大语言模型和多模态生成模型的技术积累与优势，共同推进国产大模型的技术创新与产业落地。智谱和生数科技的合作涵盖了联合研发、产品联动、解决方案整合以及行业协同等多个方面。

4/27/2025 3:00:38 PM AI在线

通付盾CRM智能体“招财猫”，AI Agent助力企业销售智能化

传统CRM系统因数据分散、销售人员难以管理、客户隐私数据担忧、缺乏智能分析等痛点，很难满足企业高效管理客户关系与提升业务绩效的需求。大语言模型和Agent技术的蓬勃发展，让智能CRM时代真正到来，实现从线索获取到客户转化、项目管理及财务数据处理的全流程自动化，提升企业运营效率，创造增量价值。通付盾CRM智能体“招财猫”—————————————————AI Agent助力企业销售智能化通付盾推出CRM智能体（CRM Agent），代号“招财猫(CAT)”，助力企业从销售线索到客户成单全程智能化。

4/27/2025 2:00:49 PM AI在线

结构化提示词驱动开发实践

最近有幸参加了公司组织的关于AI实践的对外直播，我分享的内容是《结构化提示词驱动开发实践》。现在将其记录成一篇博客，在此与大家分享我们团队在提示词驱动开发领域的一些实践与思考。随着大语言模型的不断成熟，我们逐步认识到，如何高效运用结构化提示词，引导AI生成高质量代码，已成为提升软件开发效率与质量的关键所在。

4/27/2025 9:00:00 AM Thoughtworks洞见

豆包 1.5 · 深度思考模型上线边缘大模型网关可免费领百万Tokens

4月25日，字节跳动旗下的火山引擎宣布，其最新发布的豆包1.5·深度思考模型已全面上线边缘大模型网关，并为用户提供高达500万tokens的免费使用额度，这一举措在AI领域引起了广泛关注。豆包1.5·深度思考模型是火山引擎推出的高性能AI模型，它在数学、代码和科学等专业领域的推理任务中表现卓越，已达到或接近全球顶尖水平。该模型不仅在推理任务中表现出色，在创意写作等非推理任务中也展现出强大的泛化能力，能够应对更广泛和复杂的使用场景。

4/25/2025 3:00:48 PM AI在线

揭秘 RAG：为什么说它是让大语言模型（LLM）更聪明的秘密武器？

现在人工智能（AI）很火，尤其是像 ChatGPT 这样的大语言模型（LLM），它们能聊天、写文章、写代码，感觉无所不能。但有时候，它们也会犯一些小错误，比如信息过时了，或者一本正经地胡说八道（这叫“幻觉”），或者你问它一些你们公司内部的事情，它就完全不知道了。为了解决这些问题，科学家们想出了一个聪明的办法，叫做RAG。

4/25/2025 10:03:12 AM 用户007

RAG增强系统Node：AI检索革命，效率飙升30%！

随着生成式人工智能技术的飞速发展，检索增强生成（Retrieval-Augmented Generation， RAG）系统正成为提升大语言模型(LLM)准确性和上下文相关性的关键技术。近日，一款名为NodeRAG的创新RAG增强系统引起了业界广泛关注，其独特的异构图结构为RAG工作流带来了革命性突破。 NodeRAG:异构图驱动的RAG新范式NodeRAG是一个以图结构为核心的RAG框架，通过引入异构图（Heterogeneous Graph）技术，将文档分解信息与大语言模型提取的洞察力统一为图中的节点。

4/22/2025 2:00:41 PM AI在线

Anthropic 发布 Claude Code 最佳实践指南，助力开发者无缝集成 AI 编程工作流

Anthropic 近日发布了一份详尽的 Claude Code 最佳实践指南，为开发者提供了一个以命令行界面（CLI）为核心的低层次工具，旨在将 Claude 大语言模型无缝融入日常编程任务中。这一指南基于 Anthropic 内部的实践经验，强调灵活、安全且高效的编码模式，为希望将 AI 融入现有开发环境的工程师提供了重要参考。 Claude Code:极简主义与代理开发的融合Claude Code 是一个原生集成于命令行环境的开发助手，设计上避免了强制性的工作流框架，而是通过提供上下文丰富的交互工具，让开发者能够根据需求自由定制工作方式。

4/22/2025 10:01:03 AM AI在线

AI模型蒸馏：大语言模型的“瘦身革命”

译者 | 朱先忠审校 | 重楼简介模型蒸馏是一种机器学习新技术，其基本思想是让较小的模型（学生）模仿较大的模型（老师）的行为。当前，已经存在几种方法可以实现这一技术（将在下文中展开具体介绍），但其目标都是在学生模型中获得比从头开始训练更好的泛化能力。模型蒸馏示例：学生（较小）模型使用蒸馏损失函数从教师模型中学习，该函数使用“软标签”和预测（使用OpenAI GPT4o生成的图表）一、为什么模型蒸馏很重要？

4/22/2025 8:08:37 AM 朱先忠

谷歌利用 AI 技术去年封停 3920 万广告账号，效果显著

谷歌近期宣布，2022年该公司成功封停了3920万个广告主账号，数量是2023年的三倍。这一成绩主要归功于谷歌在广告审核中应用的先进人工智能技术。通过大语言模型的辅助，谷歌能够在广告投放前识别出商业冒充、非法支付信息等违规行为，从而快速暂停大部分广告账户。

4/17/2025 11:01:15 AM AI在线

MCP 协议深度解读：技术创新正以前所未有的速度突破

作者 | rianOpenAI 官宣全面支持MCP协议，至此MCP已得到业界广泛的认可。正逐步成为AI应用架构的基础协议。做为AI应用架构的USB-C,MCP原理是怎样的？

4/15/2025 10:16:12 AM 腾讯技术工程

智谱AI启用全新域名Z.ai 并开源 32B/9B 系列 GLM 模型

智谱技术团队宣布开源32B 和9B 系列的 GLM（General Language Model）模型，并正式上线了全新的交互体验平台 Z.ai。这一系列模型包括基座模型、推理模型和沉思模型，均遵循宽松的 MIT 许可协议，为开发者提供了极大的使用和开发自由度，可免费用于商业用途和自由分发。此次开源的32B 基座模型 GLM-4-32B-0414拥有320亿参数，利用15T 高质量数据进行预训练，特别纳入了丰富的推理类合成数据。

4/15/2025 10:01:27 AM AI在线

北大研发全球首个基因挖掘大模型 SYMPLEX，助力生物制造新时代

近日，北京大学定量生物学中心的钱珑团队成功研发出全球首个专门用于功能基因挖掘的大语言模型 SYMPLEX。这一创新的模型能够从海量的生物文献中高效筛选出具有特定功能的关键基因，推动生物科技的发展。 SYMPLEX 的问世，标志着基因挖掘技术进入了一个全新的阶段。

4/14/2025 11:01:07 AM AI在线

字节跳动推出Seed-Thinking-v1.5:推理AI竞赛中的新力量

字节跳动加入了快速发展的AI推理模型竞争，推出了专注于科学、技术、数学和工程（STEM）领域的新型大语言模型Seed-Thinking-v1.5。这款采用混合专家(MoE)架构的模型在多项基准测试中表现优异，甚至在某些指标上超越了行业巨头的产品。推理AI的演进历程推理AI竞赛始于2024年9月OpenAI的o1模型发布，而后在2025年1月DeepSeek R1的推出后真正加速。

4/14/2025 10:01:18 AM AI在线

大语言模型（LLM）是如何思考的？讲讲推动下一代人工智能推理的五种途径

译者 | 张哲刚审校 | 重楼大语言模型（LLMs）最早时期只是具备自动完成的功能，迄今为止，进步巨大，与当初已经不可同日而语。然而，仅仅是生成流畅的文本并不足以体现真正的智能——真正的智能是需要推理能力的。这意味着，大语言模型需要能够解决数学问题、能够调试代码、能够得出合乎逻辑的结论，还要能够检查和改正自身的错误。

4/8/2025 8:18:38 AM 张哲刚

资讯热榜

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉

大语言模型

如何估算大语言模型LLM 的 GPU 内存：用于本地运行 LLM 的 GPU 内存

模型越新幻觉越重！AI幻觉扣住产业发展命脉

Gemini 2.5 Pro再更新！编程能力屠榜！一句话、一张草图变应用

SmallRye大模型简介：使用Langchain4J轻松向应用内引入AI服务

智谱与生数科技达成战略合作 专注大模型联合创新

通付盾CRM智能体“招财猫”，AI Agent助力企业销售智能化

结构化提示词驱动开发实践

豆包 1.5 · 深度思考模型上线边缘大模型网关 可免费领百万Tokens

揭秘 RAG：为什么说它是让大语言模型（LLM）更聪明的秘密武器？

RAG增强系统Node：AI检索革命，效率飙升30%！

Anthropic 发布 Claude Code 最佳实践指南，助力开发者无缝集成 AI 编程工作流

AI模型蒸馏：大语言模型的“瘦身革命”​

谷歌利用 AI 技术去年封停 3920 万广告账号，效果显著

MCP 协议深度解读：技术创新正以前所未有的速度突破

智谱AI启用全新域名Z.ai 并开源 32B/9B 系列 GLM 模型

北大研发全球首个基因挖掘大模型 SYMPLEX，助力生物制造新时代

字节跳动推出Seed-Thinking-v1.5:推理AI竞赛中的新力量

大语言模型（LLM）是如何思考的？讲讲推动下一代人工智能推理的五种途径

智谱与生数科技达成战略合作专注大模型联合创新

豆包 1.5 · 深度思考模型上线边缘大模型网关可免费领百万Tokens

AI模型蒸馏：大语言模型的“瘦身革命”