大语言模型
豆包 1.5 · 深度思考模型上线边缘大模型网关 可免费领百万Tokens
4月25日,字节跳动旗下的火山引擎宣布,其最新发布的豆包1.5·深度思考模型已全面上线边缘大模型网关,并为用户提供高达500万tokens的免费使用额度,这一举措在AI领域引起了广泛关注。 豆包1.5·深度思考模型是火山引擎推出的高性能AI模型,它在数学、代码和科学等专业领域的推理任务中表现卓越,已达到或接近全球顶尖水平。 该模型不仅在推理任务中表现出色,在创意写作等非推理任务中也展现出强大的泛化能力,能够应对更广泛和复杂的使用场景。
4/25/2025 3:00:48 PM
AI在线
揭秘 RAG:为什么说它是让大语言模型(LLM)更聪明的秘密武器?
现在人工智能(AI)很火,尤其是像 ChatGPT 这样的大语言模型(LLM),它们能聊天、写文章、写代码,感觉无所不能。 但有时候,它们也会犯一些小错误,比如信息过时了,或者一本正经地胡说八道(这叫“幻觉”),或者你问它一些你们公司内部的事情,它就完全不知道了。 为了解决这些问题,科学家们想出了一个聪明的办法,叫做RAG。
4/25/2025 10:03:12 AM
用户007
RAG增强系统Node:AI检索革命,效率飙升30%!
随着生成式人工智能技术的飞速发展,检索增强生成(Retrieval-Augmented Generation, RAG)系统正成为提升大语言模型(LLM)准确性和上下文相关性的关键技术。 近日,一款名为NodeRAG的创新RAG增强系统引起了业界广泛关注,其独特的异构图结构为RAG工作流带来了革命性突破。 NodeRAG:异构图驱动的RAG新范式NodeRAG是一个以图结构为核心的RAG框架,通过引入异构图(Heterogeneous Graph)技术,将文档分解信息与大语言模型提取的洞察力统一为图中的节点。
4/22/2025 2:00:41 PM
AI在线
Anthropic 发布 Claude Code 最佳实践指南,助力开发者无缝集成 AI 编程工作流
Anthropic 近日发布了一份详尽的 Claude Code 最佳实践指南,为开发者提供了一个以命令行界面(CLI)为核心的低层次工具,旨在将 Claude 大语言模型无缝融入日常编程任务中。 这一指南基于 Anthropic 内部的实践经验,强调灵活、安全且高效的编码模式,为希望将 AI 融入现有开发环境的工程师提供了重要参考。 Claude Code:极简主义与代理开发的融合Claude Code 是一个原生集成于命令行环境的开发助手,设计上避免了强制性的工作流框架,而是通过提供上下文丰富的交互工具,让开发者能够根据需求自由定制工作方式。
4/22/2025 10:01:03 AM
AI在线
AI模型蒸馏:大语言模型的“瘦身革命”
译者 | 朱先忠审校 | 重楼简介模型蒸馏是一种机器学习新技术,其基本思想是让较小的模型(学生)模仿较大的模型(老师)的行为。 当前,已经存在几种方法可以实现这一技术(将在下文中展开具体介绍),但其目标都是在学生模型中获得比从头开始训练更好的泛化能力。 模型蒸馏示例:学生(较小)模型使用蒸馏损失函数从教师模型中学习,该函数使用“软标签”和预测(使用OpenAI GPT4o生成的图表)一、为什么模型蒸馏很重要?
4/22/2025 8:08:37 AM
朱先忠
谷歌利用 AI 技术去年封停 3920 万广告账号,效果显著
谷歌近期宣布,2022年该公司成功封停了3920万个广告主账号,数量是2023年的三倍。 这一成绩主要归功于谷歌在广告审核中应用的先进人工智能技术。 通过大语言模型的辅助,谷歌能够在广告投放前识别出商业冒充、非法支付信息等违规行为,从而快速暂停大部分广告账户。
4/17/2025 11:01:15 AM
AI在线
MCP 协议深度解读:技术创新正以前所未有的速度突破
作者 | rianOpenAI 官宣全面支持MCP协议,至此MCP已得到业界广泛的认可。 正逐步成为AI应用架构的基础协议。 做为AI应用架构的USB-C,MCP原理是怎样的?
4/15/2025 10:16:12 AM
腾讯技术工程
智谱AI启用全新域名Z.ai 并开源 32B/9B 系列 GLM 模型
智谱技术团队宣布开源32B 和9B 系列的 GLM(General Language Model)模型,并正式上线了全新的交互体验平台 Z.ai。 这一系列模型包括基座模型、推理模型和沉思模型,均遵循宽松的 MIT 许可协议,为开发者提供了极大的使用和开发自由度,可免费用于商业用途和自由分发。 此次开源的32B 基座模型 GLM-4-32B-0414拥有320亿参数,利用15T 高质量数据进行预训练,特别纳入了丰富的推理类合成数据。
4/15/2025 10:01:27 AM
AI在线
北大研发全球首个基因挖掘大模型 SYMPLEX,助力生物制造新时代
近日,北京大学定量生物学中心的钱珑团队成功研发出全球首个专门用于功能基因挖掘的大语言模型 SYMPLEX。 这一创新的模型能够从海量的生物文献中高效筛选出具有特定功能的关键基因,推动生物科技的发展。 SYMPLEX 的问世,标志着基因挖掘技术进入了一个全新的阶段。
4/14/2025 11:01:07 AM
AI在线
字节跳动推出Seed-Thinking-v1.5:推理AI竞赛中的新力量
字节跳动加入了快速发展的AI推理模型竞争,推出了专注于科学、技术、数学和工程(STEM)领域的新型大语言模型Seed-Thinking-v1.5。 这款采用混合专家(MoE)架构的模型在多项基准测试中表现优异,甚至在某些指标上超越了行业巨头的产品。 推理AI的演进历程推理AI竞赛始于2024年9月OpenAI的o1模型发布,而后在2025年1月DeepSeek R1的推出后真正加速。
4/14/2025 10:01:18 AM
AI在线
大语言模型(LLM)是如何思考的?讲讲推动下一代人工智能推理的五种途径
译者 | 张哲刚审校 | 重楼大语言模型(LLMs)最早时期只是具备自动完成的功能,迄今为止,进步巨大,与当初已经不可同日而语。 然而,仅仅是生成流畅的文本并不足以体现真正的智能——真正的智能是需要推理能力的。 这意味着,大语言模型需要能够解决数学问题、能够调试代码、能够得出合乎逻辑的结论,还要能够检查和改正自身的错误。
4/8/2025 8:18:38 AM
张哲刚
DAPO:面向开源大语言模型的解耦裁剪与动态采样策略优化系统
在人工智能技术快速迭代发展的背景下,大语言模型(LLMs)已成为自然语言处理与生成领域的核心技术。 然而,将这些模型与人类偏好精确对齐并增强其复杂推理能力的挑战,促使研究者开发了一系列复杂的强化学习(RL)技术。 DAPO(解耦裁剪和动态采样策略优化,Decoupled Clip and Dynamic Sampling Policy Optimization)作为一个突破性的开源大语言模型强化学习系统应运而生,为该领域带来了技术变革。
4/3/2025 8:00:00 AM
Jenray
Google 发布 Gemini 2.5:迄今为止最智能的“思考”AI模型
2025 年 3 月 25 日,谷歌正式推出了其最新一代大语言模型Gemini 2.5,这一消息迅速在科技界引发热议。 作为谷歌AI技术的一次重大升级,Gemini 2. 5 被誉为公司迄今为止"最智能的模型",以其卓越的推理能力和多模态特性,标志着人工智能发展的又一里程碑。
3/26/2025 8:58:00 AM
AI在线
通付盾AI Agent信任系统建设宣言:从AI到IA,得Agent者得天下
深耕行业十四年,知浪潮将至,当相向而行。 本文旨在结合企业思考,探讨AI新时代下的技术与应用趋势,对内秉初心以率众,对外纳灼见而求臻。 技术分水岭:算力、算法和数据的能效博弈随着大模型的快速更迭,人类已经走上了通往人工超级智能(ASI)的快车道。
3/26/2025 8:51:00 AM
AI在线
报道称阿里云启动近年来最大规模 AI 人才校园招聘
据科创板日报报道,阿里云在全球范围内开展项大规模的 AI 人才校园招聘活动。 这次招聘规模被认为是近年来最大的一次,主要面向全球顶尖高校,如清华大学、北京大学、浙江大学、麻省理工学院和斯坦福大学等,旨在寻找在人工智能领域具备潜力的人才。 此次招聘涵盖了多个技术领域,包括大语言模型、多模态理解与生成、模型应用以及 AI 基础设施等。
3/25/2025 4:00:40 PM
AI在线
RAG(七)Chain-of-Note:笔记链让检索增强型语言模型更强大!
现有的检索增强型语言模型(Retrieval-Augmented Language Models, RALMs)在处理外部知识时存在一定的局限性。 这些模型有时会因为检索到不相关或不可靠的信息而产生误导性的回答,或者在面对检索信息和模型内在知识的干扰时,无法正确选择使用哪一种知识。 此外,在检索信息不足或完全不存在的情况下,标准的RALMs可能会尝试生成一个答案,即使它们并不具备足够的信息来准确作答。
3/25/2025 10:41:06 AM
Goldma
蚂蚁集团推出两款 MoE 大模型,用国产芯片训练成本显著降低
据证券时报报道,近日,蚂蚁集团 Ling 团队在预印版 Arxiv 平台发表技术成果论文《每一个 FLOP 都至关重要:无需高级 GPU 即可扩展 3000 亿参数混合专家 LING 大模型》,宣布推出两款不同规模的 MoE (混合专家)大语言模型 —— 百灵轻量版(Ling-Lite)与百灵增强版(Ling-Plus),并提出一系列创新方法,实现在低性能硬件上高效训练大模型,显著降低成本。
3/24/2025 3:04:26 PM
远洋
"瀚海智语"大模型正式发布,助力中国海洋领域智能化
国家自然资源部近日宣布,国家海洋环境预报中心联合海洋出版社有限公司和三六零数字安全科技集团有限公司成功开发并发布了海洋垂直领域大语言模型——"瀚海智语"(英文名称OceanDS)。 该模型以360智脑13B和Deepseek-R1-70B大模型为基座,专注于海洋领域应用,已顺利通过专家评审并正式发布。 "瀚海智语"的问世标志着中国在海洋领域人工智能技术应用方面迈出了重要一步,将为海洋行业的智慧化转型提供强有力的技术支撑。
3/24/2025 10:28:00 AM
AI在线
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
大模型
机器人
数据
AI新词
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
技术
智能体
Gemini
马斯克
Anthropic
英伟达
图像
AI创作
训练
LLM
论文
代码
算法
苹果
AI for Science
Agent
Claude
芯片
腾讯
Stable Diffusion
蛋白质
开发者
具身智能
xAI
生成式
神经网络
机器学习
3D
AI视频
人形机器人
RAG
大语言模型
研究
百度
Sora
生成
GPU
工具
华为
计算
字节跳动
AGI
大型语言模型
AI设计
搜索
生成式AI
视频生成
DeepMind
特斯拉
场景
深度学习
AI模型
架构
亚马逊
Transformer
MCP
编程
视觉
预测