AI在线 AI在线

模型

超越GPT-4o!华人团队新框架让Qwen跨领域推理提升10%,刷新12项基准测试

一项新的强化学习方法,直接让Qwen性能大增,GPT-4o被赶超! 来自加拿大滑铁卢大学与TikTok新加坡,M-A-P的华人团队提出了一种全新训练框架:General-Reasoner。 结果直接让Qwen系列大模型的跨领域推理准确率提升近10%,在多个基准测试中甚至超越GPT-4o。
6/4/2025 9:05:18 AM

论文秒变海报!开源框架PosterAgent一键生成顶会级学术Poster

你好研究僧,听说刚刚中了顶会,却还在愁怎么做Poster(学术海报)? 别急,容在下为你推荐一款新时代科研党神器——PosterAgent,帮你一键从paper.pdf跳转poster.pptx。 相比GPT-4o,PosterAgent生成指标更优,同时token使用量减少87%,还只需要0.0045美元,就可将22页的论文转化为可编辑的 “.pptx” 终稿海报。
6/4/2025 9:03:00 AM

视觉感知驱动的多模态推理,阿里通义提出VRAG,定义下一代检索增强生成

在数字化时代,视觉信息在知识传递和决策支持中的重要性日益凸显。 然而,传统的检索增强型生成(RAG)方法在处理视觉丰富信息时面临着诸多挑战。 一方面,传统的基于文本的方法无法处理视觉相关数据;另一方面,现有的视觉 RAG 方法受限于定义的固定流程,难以有效激活模型的推理能力。
6/4/2025 8:42:00 AM

思维链也会「跳帧」?浙大团队提出CoT-Bridge,显著提升数学推理性能

本文的共同第一作者是徐皓雷和颜聿辰。 徐皓雷是浙江大学的一年级硕士生,主要研究兴趣集中在大模型推理和可解释性研究;颜聿辰是浙江大学博士三年级研究生,主要研究兴趣集中在大模型推理和智能体。 本文通讯作者是浙江大学鲁伟明教授和沈永亮研究员。
6/4/2025 8:35:00 AM

ACL2025 | 传统符号语言传递知识太低效?探索LLM高效参数迁移可行性

论文第一作者谭宇乔来自中国科学院自动化研究所的自然语言处理和知识工程研究组,导师为何世柱老师。 目前研究方向主要在利用大语言模型参数知识增强大模型能力。 1 跨规模参数知识迁移 PKT 的全面分析人类的思维是非透明的,没有继承的记忆,因此需要通过语言交流的环境来学习。
6/4/2025 8:35:00 AM

2025年四大AI模型对比:Claude 4、ChatGPT o3、Grok 3与Gemini 2.5 Pro

随着大模型领域竞争的日益激烈,包括Claude 4、ChatGPT o3、Grok 3和Gemini 2.5 Pro,每款工具都有其独特的优势和适用场景,但如何选择最适合自己的AI工具? 本文将从功能、性能、价格等多个维度进行全面对比,帮助您找到最佳解决方案。 4ChatGPT o3/4.1Grok 3Gemini 2.5 Pro最佳用途编码与分析通用任务实时资讯长文本研究与分析免费版本有限制有 (GPT-3.5)无 (需X Premium)有 (有限功能)API支持是是Beta测试中是上下文窗口200K tokens128K tokens100K tokens2M tokens图像生成否是 (DALL-E)是是月费$20$20$16 (X Premium)20四大AI模型详解Claude 4:开发者的首选工具Claude 4以其在代码生成和分析方面的卓越表现成为开发者的热门选择。
6/4/2025 4:25:00 AM
云原生SRE

Karpathy教你值回ChatGPT 200刀「票价」,初创工程师揭秘ChatGPT最核心能力

ChatGPT你肯定已经用过,也用的很「爽」,但你的使用方法大概率是不对的! 别急,这是OpenAI初创大神Andrej Karpathy说的,「热衷于」科普AI的他再度出手。 这次Andrej Karpathy用一张图教会你如何选择ChatGPT模型!
6/4/2025 4:21:00 AM
新智元

Meta科学家LeCun:当前 AI 模型缺乏四项关键人类智能特质

在巴黎举行的AI行动峰会上,Meta首席AI科学家Yann LeCun提出一个问题:“什么才是智能的基本构成? ”在与IBM AI负责人Anthony Annunziata的对话中,他提出四项标准:理解物理世界、拥有持续的记忆、具备推理能力,以及可以进行分层规划。 这四项能力在LeCun看来,是任何一种具备智能的生命体所共有的基础能力。
6/4/2025 3:22:00 AM

推理“刹不住车”?新框架让DeepSeek-R1们告别过度思考,已开源

DeepSeek-R1、OpenAI o1等推理模型大放异彩。 但随着能力增强,一个副作用越来越明显——它们开始想太多了。 从奥数题到程序逻辑,能解的题越来越多、推理链条越来越长。
6/3/2025 5:38:24 PM

训练MoE足足提速70%!华为只用了三招

Scaling Law之下,MoE(混合专家)如今已经成为各大模型厂商扩展模型能力的制胜法宝。 不过,在高效实现模型参数规模化的同时,MoE的训练难题也日益凸显:训练效率不足,甚至一半以上训练时间都浪费在“等待”上。 现在,为了突破MoE的训练瓶颈,华为出手了:构建了一套名为Adaptive Pipe & EDPB的优化方案,开启“上帝视角”,让MoE面临“交通拥堵”的训练集群,实现无等待流畅运行。
6/3/2025 5:37:49 PM

经典ReLU回归!重大缺陷「死亡ReLU问题」已被解决

在深度学习领域中,对激活函数的探讨已成为一个独立的研究方向。 例如 GELU、SELU 和 SiLU 等函数凭借其平滑梯度与卓越的收敛特性,已成为热门选择。 尽管这一趋势盛行,经典 ReLU 函数仍因其简洁性、固有稀疏性及其他优势拓扑特性而广受青睐。
6/3/2025 5:37:10 PM

大神卡帕西这么用ChatGPT:日常4o快又稳,烧脑切o4做后盾,o3只当备胎用

OpenAI模型命名混乱没规律,以至于打开ChatGPT后,好多人都不知道到底该用哪个模型来完成任务。 不过别慌,现在咱们有救了! 刚刚,大神卡帕西在𝕏上发布了一篇使用ChatGPT时的模型选择指南。
6/3/2025 2:13:56 PM

5700问答对全面评估拷问AI空间感!最新空间智能评测基准来了丨浙大&成电&港中文

这个对人类来说非常简单的问题,连GPT-4o这样级别的视觉语言大模型(VLMs)也可能答错。 究其根本,还是当前的视觉语言大模型在大规模图文数据中学习到的空间信息往往是片段化的,仅限于静态视角的理解,缺乏多维度、多视角的空间推理能力。 因此,当面对需要多视角空间推理的任务时,这些模型们就频频卡壳。
6/3/2025 9:16:00 AM

LSTM之父22年前构想将成真?一周内AI「自我进化」论文集中发布,新趋势涌现?

让 AI 实现自我进化是人类一直以来的梦想。 早在 2003 年,AI 先驱、LSTM 之父 Jürgen Schmidhuber 就提出过一种名为「哥德尔机(Gödel Machine)」的构想——它使用一种递归的自我改进协议,如果能够证明新代码的策略较佳,就会重写自己的代码。 但这终究只是一个假想。
6/3/2025 9:14:00 AM

CVPR 2025 | 解决XR算力瓶颈,FovealSeg框架实现毫秒级IOI分割

本文共同第一作者为纽约大学研究生 Hongyi Zeng 和Wenxuan Liu。 合作作者为 Tianhua Xia、Jinhui Chen、Ziyun Li。 通讯作者为纽约大学电子工程系和计算机系教授 Sai Qian Zhang,研究方向为高效人工智能,硬件加速和增强现实。
6/3/2025 9:12:00 AM

人类程序员依然远强于LLM:为什么说 AI 目前还差点火候

这是一篇来自 Antirez(Redis 之父Salvatore Sanfilippo)的博文,分享给大家人类程序员依然技高一筹:为什么说 AI 目前还差点火候这篇短文,是想聊聊为什么我觉得咱们人类程序员,比起现在大火的 LLM(大语言模型)还是要强太多。 先声明,我可不是什么 AI 反对者,了解我或者关注我动态的朋友应该都清楚。 LLM 我经常用,就像今天,我会用它来碰撞灵感、做代码评审、看看有没有比我最初构想更好的方案、探索那些快要超出我知识边界的领域,诸如此类吧。
6/3/2025 9:11:38 AM

逆向工程:ChatGPT 的记忆是如何工作的

这篇文章是名为eric 工程师对ChatGPT记忆系统的深度逆向工程和技术实现推测。 它详细拆解了“可保存记忆”和包含“当前会话历史”、“对话历史”、“用户洞察”三个子系统的“聊天历史”,分析了它们的工作原理、可能的实现方案(如向量数据库、聚类算法),并探讨了这些记忆系统如何显著提升ChatGPT的用户体验,认为“用户洞察”是体验提升的关键文章深度剖析了“用户洞察”(User Insights)高级记忆系统,分析了ChatGPT如何从你的多轮对话中自动学习、总结你的专业背景(如对Rust编程的深入理解)、知识领域乃至沟通偏好,并附上置信度和时间范围,悄然注入后续对话的上下文中。 这正是ChatGPT能提供“千人千面”且高度相关回复的核心秘密地址:,这里做一个重点梳理ChatGPT的记忆系统:不止一种,而是一套组合拳Eric发现,ChatGPT的记忆并非单一系统,而是主要由两大部分构成:“可保存记忆(Saved Memory)”和“聊天历史(Chat History)”。
6/3/2025 9:08:49 AM

免费使用Sora!微软发布Bing Video Creator

今天凌晨1点,微软在官网发布了Bing搜索引擎全新功能——Bing Video Creator。 Bing Video Creator由OpenAI的文生视频模型Sora提供技术支持,通过自然语言就能生成写实、风景、卡通、影视等各种视频。 同时会免费为用户提供该服务,生成速度分为快速和标准两种模式,初始有10次快速生成机会,用完后可消耗 100 微软奖励积分继续使用,或继续选择标准速度。
6/3/2025 9:05:29 AM