AI
字节Seed团队PHD-Transformer突破预训练长度扩展!破解KV缓存膨胀难题
最近,DeepSeek-R1 和 OpenAI o1/03 等推理大模型在后训练阶段探索了长度扩展(length scaling),通过强化学习(比如 PPO、GPRO)训练模型生成很长的推理链(CoT),并在奥数等高难度推理任务上取得了显著的效果提升。 受此启发,研究人员开始探索预训练阶段的长度扩展,已有方法包括在序列中插入文本、插入潜在向量(如 Coconut)、复用中间层隐藏状态(如 CoTFormer)以及将中间隐藏状态映射为概念(如 COCOMix)。 不过,这些方法普遍存在问题,比如需要更大的 KV 缓存导致推理慢 / 占内存多。
4/29/2025 9:10:00 AM
机器之心
AI三驾马车:数据、算力和算法,谁更重要?
人工智能(AI)好比一台超级跑车,正在高速公路上飞驰。 这台超级跑车由三个核心部件驱动:算法是引擎,决定了车辆性能的上限;算力是燃油,提供源源不断的能量;数据是道路,铺就了AI前进的方向。 这三者构成了AI发展的铁三角,缺一不可!算法:AI的思维引擎算法是AI的大脑,决定了系统如何学习和决策。
4/29/2025 9:09:32 AM
大数据AI智能圈
使用OAuth2保护Spring AI MCP服务!
Spring AI框架提供了对Model Context Protocol(简称MCP)的全面支持,使AI模型能够以标准化方式与外部工具和资源进行安全交互。 借助Spring AI,开发者仅需少量代码即可构建功能完备的MCP服务器,为AI模型提供丰富的功能扩展。 MCP 中的授权和安全MCP服务器默认支持通过STDIO传输在本地环境中运行。
4/29/2025 9:07:21 AM
飘渺Jam
猛击OpenAI o1、DeepSeek-R1!刚刚,阿里Qwen3登顶全球开源模型王座,深夜爆火
今天凌晨,从昨晚开始预热、备受全球 AI 圈关注的 Qwen3 系列模型终于正式亮相了! Qwen3 模型依旧采用宽松的 Apache2.0 协议开源,全球开发者、研究机构和企业均可免费在 HuggingFace、魔搭社区等平台下载模型并商用,也可以通过阿里云百炼调用 Qwen3 的 API 服务。 HuggingFace 地址: 地址: 地址:::,Qwen3 系列模型包含两款 MoE 模型以及六款密集模型,其中每一款又包含更多细分版本(比如基础版和量化版):MoE 模型:Qwen3-235B-A22B 和 Qwen3-30B-A3B;其中 235B 和 30B 分别是总参数量,22B 和 3B 分别是激活参数量。
4/29/2025 9:06:00 AM
机器之心
苹果挥刀自救,肢解AI团队!神秘硬件或成救命稻草
曾被寄予厚望的苹果AI,似乎已被这个飞速迭代的时代淘汰了。 Siri,作为曾经的语音助手先驱,光环逐渐暗淡。 苹果AI的努力在谷歌OpenAI等巨头夹击之下,又显得力不从心。
4/29/2025 8:55:00 AM
新智元
RAG性能暴增20%!清华等推出“以笔记为中心”的深度检索增强生成框架,复杂问答效果飙升
在当前大语言模型(LLMs)广泛应用于问答、对话等任务的背景下,如何更有效地结合外部知识、提升模型对复杂问题的理解与解答能力,成为 RAG(Retrieval-Augmented Generation)方向的核心挑战。 来自清华大学、中国科学院大学、华南理工大学、东北大学、九星(AI9Stars)的联合研究团队提出了一项全新的适应式RAG方法——DeepNote。 它首次引入“笔记(Note)”作为知识载体,实现更深入、更稳定的知识探索与整合,在所有任务上均优于主流RAG方法,相较于基础RAG性能提升高达 20.1%。
4/29/2025 8:54:53 AM
100年企业知识超10万文件,「内网版ChatGPT」血洗最卷行业!全员70%和AI共事
要说什么行业是地球上「最卷」的,咨询行业说第一,恐怕没有哪个行业敢称第二。 在这个全球最精英、最高压的竞技场里,卷时间、卷精力、卷智力,现在要卷AI了! ChatGPT已经无法满足世界上最「卷」的这批人了。
4/29/2025 8:40:00 AM
新智元
Adaptive-RAG:让检索增强生成更智能
在人工智能领域,检索增强生成(Retrieval-Augmented Generation,RAG)一直是研究热点。 它通过结合检索和生成技术,为问答系统带来了更强大的性能。 然而,现有的RAG方法并非完美无缺。
4/29/2025 8:20:51 AM
Goldma
非付费广告:OpenAI ChatGPT Search 搜索上线网购功能,基于评价 AI 洞察产品优缺点
OpenAI 公司今天(4 月 29 日)在 X 平台发布推文,宣布增强 ChatGPT Search 搜索体验,新增购物功能,首批覆盖时尚、美妆、家居用品和电子产品等类别。
4/29/2025 6:58:06 AM
故渊
MCP融合Spring AI,Java程序员大模型技术再上一层楼
在当下的技术发展浪潮中,大语言模型(LLMs)正深度渗透至企业应用开发领域,持续改写着该领域的格局。 开发者积极将其融入现代解决方案。 然而,快速发展背后,大语言模型通信和上下文处理缺乏标准化协议的问题日益凸显。
4/29/2025 12:01:55 AM
学研妹
DataBahn.ai推出“数据礁”智能化安全情报的新时代
在网络安全领域,如何快速而准确地处理海量数据是企业面临的一大挑战。 最近,数据科技公司 DataBahn.ai 推出了一款名为 “数据礁”(Reef)的创新产品,旨在将高流量、高速度的安全监测信息转化为及时、可操作的情报,帮助企业做出更明智的决策。 如今,企业收集的日志、警报和监测数据多达数 PB,但实际上仅分析不到5%。
4/28/2025 6:00:40 PM
AI在线
CrowdStrike 推出 Charlotte AI,开启安全运营新纪元
在近期的 RSA2025大会上,网络安全领导者 CrowdStrike(NASDAQ: CRWD)正式发布了其全新的 AI 平台 Charlotte AI,旨在彻底改革安全运营中心(SOC)的运作模式。 Charlotte AI 不仅将智能自动化与人类网络安全专家的经验相结合,还通过其独特的 “自主推理和响应” 能力,提升了对网络威胁的检测、调查和响应效率。 Charlotte AI 平台包括几个核心模块,首次实现了在没有人工提示的情况下,自动分析和处理第一方和第三方数据。
4/28/2025 6:00:40 PM
AI在线
马蜂窝自主研发的 AI 旅行助手 “AI 小蚂” 上线
近日,马蜂窝正式宣布其自主研发的 AI 旅行助手 “AI 小蚂” 上线。 这款全新的旅行助手经过全面的技术升级,现已接入 DeepSeek 大模型,并结合马蜂窝多年来积累的旅行数据,旨在为用户提供更加精准和可靠的旅行推荐。 “AI 小蚂” 具备多项实用功能,包括实时问答、行程线路规划、在线旅行向导和个性化推荐等,用户可以在马蜂窝 APP 的首页搜索栏及目的地 POI 页面轻松使用这些功能。
4/28/2025 6:00:40 PM
AI在线
谷歌每月向三星支付巨额款项,确保 Gemini AI 助理成为默认选择
在谷歌的反垄断审判中,有关谷歌与三星之间财务交易的细节浮出水面。 根据《彭博社》的报道,谷歌为了将 Gemini AI 应用程序预装在三星设备上,每月向三星支付 “巨额资金”。 这一消息是在法官阿米特・梅塔裁定谷歌的搜索引擎构成非法垄断的背景下披露的。
4/28/2025 4:00:40 PM
AI在线
人工智能助力自闭症群体:社交障碍的“解码器”
随着人工智能技术的迅猛发展,AI应用正成为自闭症群体克服社交障碍的重要工具。 根据美国疾控中心(CDC)的数据显示,当前美国有超过500万成年人被诊断为自闭症。 这一群体通常在解读暗示性言语、非言语交流以及理解复杂社交情境方面面临挑战,而AI的介入为他们提供了前所未有的支持。
4/28/2025 4:00:21 PM
AI在线
AI助力网络安全,从被动反应到主动防御的新时代
在当今数字化时代,网络安全正经历一场前所未有的变革。 传统的网络安全防护方法通常是反应式的,依赖于手动监测和静态警报,而如今,人工智能(AI)的应用正在推动网络安全进入一个主动防御的新阶段。 AI 系统的核心是智能代理,这些代理能够实时处理海量数据,学习用户行为模式,并识别可能的安全威胁。
4/28/2025 3:00:51 PM
AI在线
Devin AI推出DeepWiki:AI驱动的GitHub代码库理解新工具
Devin AI 近期推出了 DeepWiki,这是一款免费的工具,能够自动生成任何 GitHub 代码库的结构化维基风格文档。 DeepWiki 采用了该公司自研的 DeepResearch 智能代理,旨在简化开发者对不熟悉代码库的理解过程,用户只需提供代码库的 URL,即可获得详尽且互动的概述。 该工具解决了软件开发中的一个常见痛点:如何在大型、往往文档不完善的代码库中进行有效导航。
4/28/2025 3:00:50 PM
AI在线
阿里 AI 工程师余亮荣获 “全国劳动模范” 称号
在 “庆祝中华全国总工会成立100周年暨全国劳动模范和先进工作者表彰大会” 上,阿里巴巴的员工余亮荣获 “全国劳动模范” 荣誉称号,这也是阿里 AI 工程师首次获得这一殊荣。 余亮是一位专注于大数据和智慧城市领域的杰出工程师,他的贡献在行业内得到了广泛认可。 余亮毕业于武汉大学,曾在浙江大学及海外顶尖高校和研究机构进行博士后研究,并担任研究员和科学家等职务。
4/28/2025 3:00:50 PM
AI在线
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
数据
模型
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Stable Diffusion
马斯克
Gemini
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
3D
Sora
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
模态
字节跳动
Claude
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
Copilot
LLaMA
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
科技
亚马逊
智能体
DeepMind
特斯拉