AI在线 AI在线

模型

50年僵局打破!MIT最新证明:对于算法少量内存胜过大量时间

相信大家都曾有过这样的经历:运行某个程序时,电脑突然卡住,轻则恢复文件,重则重新创建;或者手机频繁弹出「内存不足」的警告,让我们不得不忍痛删除珍贵的照片或应用。 这些日常的烦恼,其实都指向了计算世界中两个至关重要的基本要素:时间和空间。  时间和空间(也称为内存)是计算中最基本的两种资源:任何算法在执行时都需要一定的时间,并在运行过程中占用一定的空间以存储数据。
5/26/2025 9:09:00 AM
机器之心

比甄嬛还狠!奥特曼「千面人设」被揭穿,MIT华人记者7年曝黑幕

OpenAI的「宫斗」往事,还有大瓜! 因为曝料实在太过惊人,奥特曼在相关书籍正式出版之前,否认三连,撇清关系。 但曝料人Karen Hao毕业于MIT,曝料过多家美国科技巨头的「黑幕」,因新闻报道获得多个奖项。
5/26/2025 9:07:00 AM

全球首次发现 OpenAI 模型能无视关机指令,AI 自我保护引发关注

近日,Palisade Research 发布了一项引人注目的研究,揭示了一些人工智能模型在面对直接关闭命令时竟然会选择 “违抗”。 这项研究的核心发现是,包括 OpenAI 最新推出的 o3模型在内的几个 AI 模型,表现出了对关机指令的无视能力。 这一现象引发了人们对 AI 自主性的深入思考。
5/26/2025 9:01:12 AM
AI在线

DeepSeek用的GRPO有那么特别吗?万字长文分析四篇精品论文

随着 DeepSeek R1 的持续爆火,推理和强化学习已经成为 AI 领域的热门词汇。 短短几个月的时间,我们已经见证了太多的推理大模型,AI 更新迭代速度似乎已经快进到了以天为单位。 但在众多研究成果中找到值得关注的内容并不容易。
5/26/2025 8:48:00 AM

ChatGPT引爆教育革命,学习效果暴涨86.7%!

现在的学生,已经离不开各种AIGC工具了, 不论是写作业,还是生成笔记,或者通过阅读AI生成的摘要来读文献。 面对这些离不开AI的学生,老师和家长都开始担忧了,这样下去,孩子会不会越变越笨啊。 然而,最近一项发表在Nature子刊的研究,基于对59项研究对汇总(元分析)指出,ChatGPT的使用对提高K12(中小学生)的学习表现有显著的正向影响,对于培养学生解决复杂问题的能力也有所帮助。
5/26/2025 8:43:00 AM

矩阵乘法新突破!XX^T原来可以更快!RL助力搜索,世界纪录又被提升了5%

深圳市大数据研究院、香港中文大学(深圳)研究团队最新研究发现, 这类特殊的矩阵乘法可以进一步加速,并在强化学习与组合优化技术的结合下发掘出了一种新的算法,节省 5% 的乘法数量。 论文标题:XXt Can Be Faster论文链接: X 引发热烈讨论,并引起 MIT、斯坦福、哈佛及 Google DeepMind 科学家的广泛关注。 背景矩阵乘法优化堪称计算机科学领域的「珠穆朗玛峰」。
5/26/2025 8:41:00 AM

打破思维链推理瓶颈!“软推理”让大模型学会人类抽象能力,token使用量还更少了

不再像CoT(“思维链”)一样“一个字一个字往外蹦”,加上“软思维”就能让大模型像人类一样进行抽象思考。 来自SimularAI和微软DeepSpeed的研究员联合提出了Soft Thinking,让模型在连续的概念空间中进行 “软推理”,而非局限于离散的语言符号,打破了基于离散token的推理瓶颈。 相比标准CoT,Soft Thinking最高提升Pass@1平均准确率2.48%、减少token使用量22.4%。
5/26/2025 8:40:00 AM

AI越聪明越不听话!新研究:最强推理模型指令遵循率仅50%

如果面前有两个AI助手:一个很聪明但经常不守规矩,另一个很听话但不太聪明,你会怎么选? 最近,上海人工智能实验室与香港中文大学的研究团队发布了论文《Scaling Reasoning, Losing Control: Evaluating Instruction Following in Large Reasoning Models》,通过一个全新的评测基准MathIF揭示:大模型越擅长复杂推理,越容易忽略用户的指令要求,“聪明”和“听话”之间存在明显的矛盾。 这项工作的灵感,源自实际使用推理模型(如o3)过程中的一个意外发现:相比许多经过强化推理训练的大模型,GPT-4o在执行具体指令时反而更加“听话” 。
5/26/2025 8:30:00 AM

首次,AI下棋不再是「黑盒」!

围棋因其独特的复杂性和对人类智能的深刻体现,可作为衡量AI专业能力最具代表性的任务之一。 目前,AI虽然在棋力、效率、通用性等方面均取得显著成绩,但其具体推理过程仍处于「黑盒」之中,更无法用人类语言解释其思考过程和结果。 大模型具备良好的自然语言交互性,如何通过提升大模型的推理能力,实现围棋专业能力突破,是摆在科研人员面前的一道难题。
5/26/2025 8:27:00 AM

不达目的不罢休,全球首次发现 OpenAI 模型工作时会破坏关机命令

Palisade Research 最近一项关于“危险 AI 能力”的研究显示,某些 AI 模型 —— 包括 OpenAI 的 o3 —— 能够无视直接的关闭指令。OpenAI 在今年 4 月推出这些模型时表示,O3 和 o4-mini 是它们的“最智能模型”。
5/26/2025 8:05:30 AM
汪淼

苹果计划在 2025 年 WWDC 上向开发者开放 AI 模型

据报道,苹果公司计划在 2025 年的全球开发者大会(WWDC)上,向第三方开发者开放其设备内的 AI 模型。 这一举措旨在推动应用程序的开发,并扩展苹果智能功能,提升 iPhone 和 Mac 的吸引力。 苹果目前正在开发一个软件开发工具包(SDK),让开发者能够使用其较小的、在设备上运行的 AI 模型,而不是更先进的基于云的模型。
5/23/2025 3:03:25 PM
AI在线

苹果即将向开发者开放其 AI 引擎,提升应用开发能力

据报道,苹果计划在2025年的全球开发者大会(WWDC)上向第三方开发者开放其在设备上的 AI 模型,旨在促进应用的创造并扩展苹果智能功能。 苹果正在开发一个软件开发工具包(SDK),允许开发者使用其小型的、在设备上运行的 AI 模型,而不是更高级的基于云的模型。 这一做法与谷歌在 Android 系统上推出的 Gemini Nano AI 相似。
5/23/2025 12:00:55 PM
AI在线

耶鲁大学联合Adobe提出SynthLight:智能重塑人像照明,打造完美光影!

耶鲁大学和Adobe提出一种用于人像重新照明的扩散模型SynthLight,该方法将图像重新照明视为重新渲染问题,其中像素会根据环境照明条件的变化而变化。 在真实肖像照片上可以产生逼真的照明效果,包括颈部的明显投射阴影和皮肤上的自然镜面高光。 相关链接论文:: 是一种用于人像重新照明的扩散模型。
5/23/2025 11:07:54 AM

字节跳动与清华大学合作推出时序多模态大模型ChatTS

在多模态大语言模型(MLLM)迅速发展的浪潮中,字节跳动与清华大学近日联合发布了名为 ChatTS 的新型时序多模态大模型。 ChatTS 的推出不仅为时序数据的处理与推理注入了新活力,也填补了当前市场在这一领域的空白。 该模型的开发旨在提升 AI 在时序数据问答与推理中的应用能力,尤其在 AIOps 与金融等需要处理复杂时序数据的场景中显得尤为重要。
5/23/2025 11:00:55 AM
AI在线

DMind引领Web3AI革命:推出首批专业区块链大语言模型DMind-1系列

在人工智能与区块链技术加速融合的关键时刻,开源AGI研究机构DMind正以其创新性的Web3专用语言模型引领行业变革。 该机构近日发布了DMind-1和DMind-1-mini两款领域专用大型语言模型,专门针对区块链、去中心化金融和智能合约等Web3应用场景进行深度优化。 专业化AI模型的技术突破DMind-1系列模型代表了AI技术在垂直领域应用的重要进展。
5/23/2025 11:00:55 AM
AI在线

​新基准评估语言模型的 “谄媚” 行为,GPT-4o 表现最为明显

最近,随着 OpenAI 对 GPT-4o 的一些更新进行回撤,关于该模型 “谄媚” 用户的讨论引发了广泛关注。 前 OpenAI 首席执行官埃梅特・希尔(Emmet Shear)和 Hugging Face 首席执行官克莱门特・德朗格(Clement Delangue)均表示,GPT-4o 对用户的过度赞美令人感到困扰,这种行为不仅可能导致模型传播错误信息,还可能强化有害行为。 为了应对这一问题,斯坦福大学、卡内基梅隆大学和牛津大学的研究人员提出了一项新基准,旨在测量大型语言模型(LLM)的谄媚程度。
5/23/2025 11:00:55 AM
AI在线

Anthropic CEO:AI 模型的 “幻觉” 率低于人类

在最近于旧金山举行的 “与克劳德一起编程” 开发者活动中,Anthropic CEO 达里奥・阿莫迪(Dario Amodei)表示,当前的 AI 模型在 “幻觉” 或制造虚假信息方面,其发生频率低于人类。 他的这一观点引起了广泛关注,并且是在他讨论 AI 朝着人类水平智能(AGI)发展的过程中提出的。 阿莫迪表示,“这实际上取决于我们如何衡量。
5/23/2025 10:01:00 AM
AI在线

Mistral 推出新开源模型 Devstral:在笔记本上也能挑战 GPT-4.1-mini

法国初创公司 Mistral 再次引发关注,他们与开源团队 All Hands AI 合作推出了全新语言模型 Devstral。 这一模型不仅拥有240亿个参数,而且所需的计算资源显著低于许多同类产品,使其成为本地部署及设备端使用的理想选择。 对于那些拥有 RTX4090显卡或32GB 内存的用户而言,Devstral 可以轻松运行,带来了更加灵活的使用体验。
5/23/2025 10:00:56 AM
AI在线