大语言模型
苹果研究破解 AI“英语口音”难题,提升多语言自然性
为了缩小差距,研究人员通过“ 回译法”自动生成训练样本,将人工撰写的流畅中文内容先翻译成英文,再逆向翻译成带有 "翻译腔" 的“反面”样本。利用这类对比数据训练模型加强自然表达能力,在保持基准性能的前提下显著改善语言输出质量。
5/17/2025 6:42:15 AM
问舟
HippoRAG:基于海马体记忆索引理论的知识密集型任务新突破
在自然语言处理领域,大语言模型(LLMs)已经取得了令人瞩目的成就。 然而,当面对知识密集型任务时,例如科学文献综述、法律案件简报或医疗诊断,这些模型往往显得力不从心。 它们难以有效地整合新的或特定领域的知识,而现有的检索增强生成(RAG)方法也因无法满足复杂的跨段落或文档的知识整合需求而受到限制。
5/13/2025 1:00:00 AM
Goldma
如何估算大语言模型LLM 的 GPU 内存:用于本地运行 LLM 的 GPU 内存
随着 DeepSeek、GPT、Llama、Mistral 等大规模 LLM 的兴起,AI 从业者面临的最大挑战之一是确定需要多少 GPU 内存才能高效地服务于这些模型。 GPU 资源昂贵且稀缺,因此优化内存分配至关重要。 本指南将引导您使用一个简单而有效的公式来估算服务 LLM 所需的 GPU 内存。
5/9/2025 1:00:00 AM
晓晓
模型越新幻觉越重!AI幻觉扣住产业发展命脉
自诞生以来,人工智能大模型始终被“幻觉”问题困扰。 这里的“幻觉”,指的是大语言模型会将虚构信息当作真实事实输出。 实际上,“幻觉”这一表述相当委婉,它实则暴露出AI的核心缺陷——当前的大语言模型尚未达到真正意义上的智能水平。
5/8/2025 6:00:00 AM
小刀
Gemini 2.5 Pro再更新!编程能力屠榜!一句话、一张草图变应用
出品 | 51CTO技术栈(微信号:blog51cto)AI 编码模型的新王者登基了! 今天,Google 旗下的 DeepMind AI 研究部门正式发布了 Gemini 2.5 Pro “I/O” 版,这是今年 3 月推出的 Gemini 2.5 Pro 多模态大语言模型(LLM)的更新版本。 DeepMind CEO Demis Hassabis 在 X 上表示:“这是我们迄今为止打造的最佳编码模型!
5/7/2025 10:09:08 AM
SmallRye大模型简介:使用Langchain4J轻松向应用内引入AI服务
译者 | 核子可乐审校 | 重楼Langchain4J解决了哪些问题? Langchain4J 本质上是为 Java 开发者打造的工具箱,旨在简化向高级语言中集成 AI 功能(如聊天机器人或文本生成器)的过程,同时屏蔽底层复杂细节。 想象一下:我们想要构建一个能回答问题、生成内容或模拟人类对话的智能应用。
5/7/2025 8:14:58 AM
核子可乐
智谱与生数科技达成战略合作 专注大模型联合创新
4月27日,清华大学旗下的两家明星人工智能公司智谱(Z.ai)和生数科技(shengshu.com)宣布达成重大战略合作。 此次合作旨在通过双方在大语言模型和多模态生成模型的技术积累与优势,共同推进国产大模型的技术创新与产业落地。 智谱和生数科技的合作涵盖了联合研发、产品联动、解决方案整合以及行业协同等多个方面。
4/27/2025 3:00:38 PM
AI在线
通付盾CRM智能体“招财猫”,AI Agent助力企业销售智能化
传统CRM系统因数据分散、销售人员难以管理、客户隐私数据担忧、缺乏智能分析等痛点,很难满足企业高效管理客户关系与提升业务绩效的需求。 大语言模型和Agent技术的蓬勃发展,让智能CRM时代真正到来,实现从线索获取到客户转化、项目管理及财务数据处理的全流程自动化,提升企业运营效率,创造增量价值。 通付盾CRM智能体“招财猫”—————————————————AI Agent助力企业销售智能化通付盾推出CRM智能体(CRM Agent),代号“招财猫(CAT)”,助力企业从销售线索到客户成单全程智能化。
4/27/2025 2:00:49 PM
AI在线
结构化提示词驱动开发实践
最近有幸参加了公司组织的关于AI实践的对外直播,我分享的内容是《结构化提示词驱动开发实践》。 现在将其记录成一篇博客,在此与大家分享我们团队在提示词驱动开发领域的一些实践与思考。 随着大语言模型的不断成熟,我们逐步认识到,如何高效运用结构化提示词,引导AI生成高质量代码,已成为提升软件开发效率与质量的关键所在。
4/27/2025 9:00:00 AM
Thoughtworks洞见
豆包 1.5 · 深度思考模型上线边缘大模型网关 可免费领百万Tokens
4月25日,字节跳动旗下的火山引擎宣布,其最新发布的豆包1.5·深度思考模型已全面上线边缘大模型网关,并为用户提供高达500万tokens的免费使用额度,这一举措在AI领域引起了广泛关注。 豆包1.5·深度思考模型是火山引擎推出的高性能AI模型,它在数学、代码和科学等专业领域的推理任务中表现卓越,已达到或接近全球顶尖水平。 该模型不仅在推理任务中表现出色,在创意写作等非推理任务中也展现出强大的泛化能力,能够应对更广泛和复杂的使用场景。
4/25/2025 3:00:48 PM
AI在线
揭秘 RAG:为什么说它是让大语言模型(LLM)更聪明的秘密武器?
现在人工智能(AI)很火,尤其是像 ChatGPT 这样的大语言模型(LLM),它们能聊天、写文章、写代码,感觉无所不能。 但有时候,它们也会犯一些小错误,比如信息过时了,或者一本正经地胡说八道(这叫“幻觉”),或者你问它一些你们公司内部的事情,它就完全不知道了。 为了解决这些问题,科学家们想出了一个聪明的办法,叫做RAG。
4/25/2025 10:03:12 AM
用户007
RAG增强系统Node:AI检索革命,效率飙升30%!
随着生成式人工智能技术的飞速发展,检索增强生成(Retrieval-Augmented Generation, RAG)系统正成为提升大语言模型(LLM)准确性和上下文相关性的关键技术。 近日,一款名为NodeRAG的创新RAG增强系统引起了业界广泛关注,其独特的异构图结构为RAG工作流带来了革命性突破。 NodeRAG:异构图驱动的RAG新范式NodeRAG是一个以图结构为核心的RAG框架,通过引入异构图(Heterogeneous Graph)技术,将文档分解信息与大语言模型提取的洞察力统一为图中的节点。
4/22/2025 2:00:41 PM
AI在线
Anthropic 发布 Claude Code 最佳实践指南,助力开发者无缝集成 AI 编程工作流
Anthropic 近日发布了一份详尽的 Claude Code 最佳实践指南,为开发者提供了一个以命令行界面(CLI)为核心的低层次工具,旨在将 Claude 大语言模型无缝融入日常编程任务中。 这一指南基于 Anthropic 内部的实践经验,强调灵活、安全且高效的编码模式,为希望将 AI 融入现有开发环境的工程师提供了重要参考。 Claude Code:极简主义与代理开发的融合Claude Code 是一个原生集成于命令行环境的开发助手,设计上避免了强制性的工作流框架,而是通过提供上下文丰富的交互工具,让开发者能够根据需求自由定制工作方式。
4/22/2025 10:01:03 AM
AI在线
AI模型蒸馏:大语言模型的“瘦身革命”
译者 | 朱先忠审校 | 重楼简介模型蒸馏是一种机器学习新技术,其基本思想是让较小的模型(学生)模仿较大的模型(老师)的行为。 当前,已经存在几种方法可以实现这一技术(将在下文中展开具体介绍),但其目标都是在学生模型中获得比从头开始训练更好的泛化能力。 模型蒸馏示例:学生(较小)模型使用蒸馏损失函数从教师模型中学习,该函数使用“软标签”和预测(使用OpenAI GPT4o生成的图表)一、为什么模型蒸馏很重要?
4/22/2025 8:08:37 AM
朱先忠
谷歌利用 AI 技术去年封停 3920 万广告账号,效果显著
谷歌近期宣布,2022年该公司成功封停了3920万个广告主账号,数量是2023年的三倍。 这一成绩主要归功于谷歌在广告审核中应用的先进人工智能技术。 通过大语言模型的辅助,谷歌能够在广告投放前识别出商业冒充、非法支付信息等违规行为,从而快速暂停大部分广告账户。
4/17/2025 11:01:15 AM
AI在线
MCP 协议深度解读:技术创新正以前所未有的速度突破
作者 | rianOpenAI 官宣全面支持MCP协议,至此MCP已得到业界广泛的认可。 正逐步成为AI应用架构的基础协议。 做为AI应用架构的USB-C,MCP原理是怎样的?
4/15/2025 10:16:12 AM
腾讯技术工程
智谱AI启用全新域名Z.ai 并开源 32B/9B 系列 GLM 模型
智谱技术团队宣布开源32B 和9B 系列的 GLM(General Language Model)模型,并正式上线了全新的交互体验平台 Z.ai。 这一系列模型包括基座模型、推理模型和沉思模型,均遵循宽松的 MIT 许可协议,为开发者提供了极大的使用和开发自由度,可免费用于商业用途和自由分发。 此次开源的32B 基座模型 GLM-4-32B-0414拥有320亿参数,利用15T 高质量数据进行预训练,特别纳入了丰富的推理类合成数据。
4/15/2025 10:01:27 AM
AI在线
北大研发全球首个基因挖掘大模型 SYMPLEX,助力生物制造新时代
近日,北京大学定量生物学中心的钱珑团队成功研发出全球首个专门用于功能基因挖掘的大语言模型 SYMPLEX。 这一创新的模型能够从海量的生物文献中高效筛选出具有特定功能的关键基因,推动生物科技的发展。 SYMPLEX 的问世,标志着基因挖掘技术进入了一个全新的阶段。
4/14/2025 11:01:07 AM
AI在线
资讯热榜
标签云
人工智能
AI
OpenAI
AIGC
ChatGPT
DeepSeek
AI绘画
模型
数据
机器人
谷歌
大模型
Midjourney
智能
用户
开源
微软
学习
GPT
Meta
图像
AI创作
技术
Gemini
论文
马斯克
Stable Diffusion
算法
芯片
代码
生成式
蛋白质
英伟达
腾讯
神经网络
研究
Anthropic
开发者
3D
计算
Sora
机器学习
AI设计
AI for Science
GPU
AI视频
苹果
场景
华为
百度
人形机器人
预测
搜索
Claude
伟达
训练
深度学习
生成
xAI
Transformer
大语言模型
字节跳动
模态
具身智能
文本
驾驶
智能体
神器推荐
Copilot
LLaMA
视觉
算力
安全
应用
视频生成
干货合集
API
大型语言模型
亚马逊
科技