AI在线 AI在线

理论

谷歌开源基于物理模拟的气象模型,能预测暴雨、台风、大干旱

传统的通用循环模型(GCMs)在天气预报和气候模拟方面发挥了重要作用,但在处理特殊状态的小尺度时存在局限性,例如,处理云、辐射和降水等未完全解析的物理过程时会使用半经验性参数化,会导致模型在匹配历史数据时的调参过程仍然依靠手动设置,且GCMs自身存在许多持续的错误和偏见。 。 所以为了克服这些困难,谷歌提出了基于物理模拟的神经通用环流气象模型NeuralGCM,并已经开源提供给各大气象机构测试和使用。
5/14/2025 9:20:59 AM

ICML Spotlight | MCU:全球首个生成式开放世界基准,革新通用AI评测范式

该工作由通用人工智能研究院 × 北京大学联手打造。 第一作者郑欣悦为通用人工智能研究院研究员,共同一作为北京大学人工智能研究院博士生林昊苇,通讯作者为北京大学助理教授梁一韬和通用人工智能研究院研究员郑子隆。 开发能在开放世界中完成多样任务的通用智能体,是AI领域的核心挑战。
5/14/2025 9:17:00 AM

Poe:DeepSeek使用率下降50%,快手崛起、OpenAI暴涨

今天凌晨,全球著名大模型整合应用平台Poe发布了,2025年春季AI模型使用趋势报告。 结果显示,DeepSeek R1的使用率从2月中旬的峰值7%下降到了4月底的3%,整体使用率下降超过50%;OpenAI由于在GPT-4o推出新的文生图功能后,例如,吉卜力风格、仿真自拍等类型图片,实现病毒式增长使用率暴涨。 下面「AIGC开放社区」将从文本、视频、推理、图像和音频5大领域为大家解读这份报告。
5/14/2025 9:16:39 AM

首次!流匹配模型引入GRPO,GenEval几近满分,组合生图能力远超GPT-4o

本文由香港中文大学与快手可灵等团队联合完成。 第一作者为香港中文大学 MMLab 博士生刘杰,他的研究方向为强化学习和生成模型,曾获 ACL Outstanding Paper Award。 流匹配模型因其坚实的理论基础和在生成高质量图像方面的优异性能,已成为图像生成(Stable Diffusion, Flux)和视频生成(可灵,WanX,Hunyuan)领域最先进模型的训练方法。
5/14/2025 9:15:00 AM

推理大模型1年内就会撞墙,性能无法再扩展几个数量级 | FrontierMath团队最新研究

一年之内,大模型推理训练可能就会撞墙。 以上结论来自Epoch AI。 这是一个专注于人工智能研究和基准测试的非营利组织,之前名动一时的FrontierMath基准测试(评估AI模型数学推理能力)就出自它家。
5/14/2025 9:07:00 AM

OpenAI首席科学家Nature爆料:AI自主发现新科学!世界模型和RL是关键

ChatGPT推出后,迅速震惊了全球。 自那以后,OpenAI一直站在AI技术发展的最前沿。 去年9月,他们推出o系列模型,再次引领AI推理的浪潮。
5/14/2025 9:03:00 AM

首个多模态统一CoT奖励模型来了,模型、数据集、训练脚本全开源

在多模态大模型快速发展的当下,如何精准评估其生成内容的质量,正成为多模态大模型与人类偏好对齐的核心挑战。 然而,当前主流多模态奖励模型往往只能直接给出评分决策,或仅具备浅层推理能力,缺乏对复杂奖励任务的深入理解与解释能力,在高复杂度场景中常出现 “失真失准”。 那么,奖励模型是否也能具备像人类一样的深度思考能力?
5/14/2025 8:51:00 AM

深度学习原来这么好懂?这篇大白话科普,让你轻松 get 新知识!

嘿,朋友们! 你是不是也经常在新闻、科技报道里看到“深度学习”这个词? 听起来是不是特别高大上,感觉像是只有顶尖科学家才能搞懂的神秘领域?
5/14/2025 8:25:00 AM
用户007

使用FastAPI和Redis Caching加快机器学习模型推理

译者 | 布加迪审校 | 重楼Redis 是一款开源内存数据结构存储系统,是机器学习应用领域中缓存的优选。 它的速度、耐用性以及支持各种数据结构使其成为满足实时推理任务的高吞吐量需求的理想选择。 我们在本教程中将探讨Redis缓存在机器学习工作流程中的重要性。
5/14/2025 8:16:46 AM
布加迪

Cursor AI 系统提示词泄露:Vibe 编程的七大提示词技巧

在当前 AI 快速演进的背景下,语言模型展现出的“智能性”愈发惊艳。 即使用户输入的提示词模糊不清,Claude 3.5 或 Cursor 等系统依旧能准确“读懂心思”,给出相对贴切的回应。 这种智能表现,部分原因来自系统提示词(System Prompt)机制的设计。
5/14/2025 8:11:07 AM
前端小智

三分之一的员工对AI的使用保密

员工对利用技术提高生产力的担忧日益加剧,同时对工作感到不满且缺乏工作动力。 事实上,根据Ivanti公司的调查,在工作中使用GenAI工具的员工中,有30%担心自己的工作可能被裁掉,27%的员工则出现了由AI引发的冒名顶替综合征,他们表示不希望别人质疑自己的能力。 “Ivanti的研究表明,员工仍然希望在工作生活中拥有更大的自主权,并希望得到能帮助他们做到最好的AI解决方案,”Ivanti的首席法律顾问兼人力资源与安全高级副总裁布鲁克·约翰逊(Brooke Johnson)表示,“为了应对这一问题,企业应考虑建立一个可持续的AI治理模型,将透明度放在首位,并通过创新来解决由AI引发的冒名顶替综合征这一复杂挑战。
5/14/2025 8:00:00 AM

智能体狂飙:深度智能化大变革来袭

在人工智能技术日新月异的当下,智能体(AI Agent)正突破实验室的局限,迈向规模化商用,成为全球科技巨头竞相角逐的战略高地。 从联想“超级智能体”的发布,到IBM企业级智能体平台的推出;从微软Copilot深度融入办公场景,到城市超级智能体在武夷山的落地,智能体技术凭借多模态交互、自主决策、跨生态协同等核心能力,正重塑人机协作模式,推动生产力范式向“认知操作系统”跃迁。 这一趋势不仅标志着AI技术从工具型助手向全场景智能伙伴的进化,更预示着个人、企业乃至城市将迎来一场深度智能化变革。
5/14/2025 7:10:00 AM
赵立京

企业应避免的关于智能体的五个认知陷阱

在商业和消费科技领域,最新的热点话题全都围绕着智能体。 这些智能体可以被视为GenAI领域的下一个飞跃,该领域曾为我们带来了ChatGPT等大型语言模型聊天机器人。 与仅仅回答问题或生成信息不同,它们能够代表我们采取行动,与其他工具和服务进行交互,以完成复杂的任务。
5/14/2025 7:00:00 AM
Bernard Marr

MCP如何实现Agentic AI工作流

Agentic AI工作流涌现! 本文揭秘如何用 Anthropic 的 MCP 赋能 LLM,实现自主决策。 通过 Todo List MCP Server 和 Calendar MCP Server 演示,展示 MCP 客户端如何协调工具和动态提示,构建模块化、可组合的智能自动化流程。
5/14/2025 3:20:00 AM
岱军

绝!三招教你私有化部署 DeepSeek

在数字化转型的进程中,企业不仅需要高效、智能的工具来提升运营效率,还需确保数据安全与满足隐私保护要求。 DeepSeek 私有化部署正是为解决这一需求而生的,它通过将 DeepSeek 智能助手从公共云端迁移至企业内部服务器,为企业提供了一种安全、可控且高度定制化的解决方案。 这种部署方 式不仅能够满足企业对敏感数据的保护需求,还能根据具体业务场景进行灵活 调整,从而为企业数字化转型提供强有力的支持。
5/14/2025 2:00:00 AM

一口气讲清楚:FC、MCP、A2A

前面几篇文章中,我介绍了AI大模型领域常见的几种专业术语,分别是:AGI、RAG、AIGC、LLM、MCP、EMB、向量库、训练集、多模态。 了解基础概念和专业术语之后,有助于我们在工作和生活中深入学习和应用AI。 这个时候,可能有同学会产生疑问,这么多大模型、ChatBot、智能体等AI工具,我该如何将它们融入到自己的生活和工作场景中呢?
5/14/2025 1:55:00 AM
老张

探索RAG数据分块策略:工具对比与实践指南(含code)

在检索增强生成(Retrieval-Augmented Generation, RAG)应用领域,数据分块作为关键预处理步骤,对模型性能和效果起着决定性作用。 本文深入探讨RAG应用中的数据分块策略,详细介绍和对比LangChain、LlamaIndex和Preprocess三种主流工具在数据分块方面的功能与特点,并结合实际案例分析其应用效果,为读者提供全面的技术指引。 RAG中数据分块的重要性RAG通过检索相关信息来增强语言模型的生成能力,数据分块则是优化这一过程的关键。
5/14/2025 1:40:00 AM
大模型之路

当AI智能体成了"打工人":我们还有饭碗吗?

"AI智能体要来抢我们饭碗了? " 这是最近在我们公司茶水间听到最多的一句话。  直到上周,我看到运营小张用一个智能体,3分钟就完成了以前需要整个团队忙活一整天的市场分析报告。
5/14/2025 1:00:00 AM
大数据AI智能圈