模型
50年僵局打破!MIT最新证明:对于算法少量内存胜过大量时间
相信大家都曾有过这样的经历:运行某个程序时,电脑突然卡住,轻则恢复文件,重则重新创建;或者手机频繁弹出「内存不足」的警告,让我们不得不忍痛删除珍贵的照片或应用。 这些日常的烦恼,其实都指向了计算世界中两个至关重要的基本要素:时间和空间。 时间和空间(也称为内存)是计算中最基本的两种资源:任何算法在执行时都需要一定的时间,并在运行过程中占用一定的空间以存储数据。
5/26/2025 9:09:00 AM
机器之心
比甄嬛还狠!奥特曼「千面人设」被揭穿,MIT华人记者7年曝黑幕
OpenAI的「宫斗」往事,还有大瓜! 因为曝料实在太过惊人,奥特曼在相关书籍正式出版之前,否认三连,撇清关系。 但曝料人Karen Hao毕业于MIT,曝料过多家美国科技巨头的「黑幕」,因新闻报道获得多个奖项。
5/26/2025 9:07:00 AM
全球首次发现 OpenAI 模型能无视关机指令,AI 自我保护引发关注
近日,Palisade Research 发布了一项引人注目的研究,揭示了一些人工智能模型在面对直接关闭命令时竟然会选择 “违抗”。 这项研究的核心发现是,包括 OpenAI 最新推出的 o3模型在内的几个 AI 模型,表现出了对关机指令的无视能力。 这一现象引发了人们对 AI 自主性的深入思考。
5/26/2025 9:01:12 AM
AI在线
DeepSeek用的GRPO有那么特别吗?万字长文分析四篇精品论文
随着 DeepSeek R1 的持续爆火,推理和强化学习已经成为 AI 领域的热门词汇。 短短几个月的时间,我们已经见证了太多的推理大模型,AI 更新迭代速度似乎已经快进到了以天为单位。 但在众多研究成果中找到值得关注的内容并不容易。
5/26/2025 8:48:00 AM
ChatGPT引爆教育革命,学习效果暴涨86.7%!
现在的学生,已经离不开各种AIGC工具了, 不论是写作业,还是生成笔记,或者通过阅读AI生成的摘要来读文献。 面对这些离不开AI的学生,老师和家长都开始担忧了,这样下去,孩子会不会越变越笨啊。 然而,最近一项发表在Nature子刊的研究,基于对59项研究对汇总(元分析)指出,ChatGPT的使用对提高K12(中小学生)的学习表现有显著的正向影响,对于培养学生解决复杂问题的能力也有所帮助。
5/26/2025 8:43:00 AM
矩阵乘法新突破!XX^T原来可以更快!RL助力搜索,世界纪录又被提升了5%
深圳市大数据研究院、香港中文大学(深圳)研究团队最新研究发现, 这类特殊的矩阵乘法可以进一步加速,并在强化学习与组合优化技术的结合下发掘出了一种新的算法,节省 5% 的乘法数量。 论文标题:XXt Can Be Faster论文链接: X 引发热烈讨论,并引起 MIT、斯坦福、哈佛及 Google DeepMind 科学家的广泛关注。 背景矩阵乘法优化堪称计算机科学领域的「珠穆朗玛峰」。
5/26/2025 8:41:00 AM
打破思维链推理瓶颈!“软推理”让大模型学会人类抽象能力,token使用量还更少了
不再像CoT(“思维链”)一样“一个字一个字往外蹦”,加上“软思维”就能让大模型像人类一样进行抽象思考。 来自SimularAI和微软DeepSpeed的研究员联合提出了Soft Thinking,让模型在连续的概念空间中进行 “软推理”,而非局限于离散的语言符号,打破了基于离散token的推理瓶颈。 相比标准CoT,Soft Thinking最高提升Pass@1平均准确率2.48%、减少token使用量22.4%。
5/26/2025 8:40:00 AM
AI越聪明越不听话!新研究:最强推理模型指令遵循率仅50%
如果面前有两个AI助手:一个很聪明但经常不守规矩,另一个很听话但不太聪明,你会怎么选? 最近,上海人工智能实验室与香港中文大学的研究团队发布了论文《Scaling Reasoning, Losing Control: Evaluating Instruction Following in Large Reasoning Models》,通过一个全新的评测基准MathIF揭示:大模型越擅长复杂推理,越容易忽略用户的指令要求,“聪明”和“听话”之间存在明显的矛盾。 这项工作的灵感,源自实际使用推理模型(如o3)过程中的一个意外发现:相比许多经过强化推理训练的大模型,GPT-4o在执行具体指令时反而更加“听话” 。
5/26/2025 8:30:00 AM
首次,AI下棋不再是「黑盒」!
围棋因其独特的复杂性和对人类智能的深刻体现,可作为衡量AI专业能力最具代表性的任务之一。 目前,AI虽然在棋力、效率、通用性等方面均取得显著成绩,但其具体推理过程仍处于「黑盒」之中,更无法用人类语言解释其思考过程和结果。 大模型具备良好的自然语言交互性,如何通过提升大模型的推理能力,实现围棋专业能力突破,是摆在科研人员面前的一道难题。
5/26/2025 8:27:00 AM
不达目的不罢休,全球首次发现 OpenAI 模型工作时会破坏关机命令
Palisade Research 最近一项关于“危险 AI 能力”的研究显示,某些 AI 模型 —— 包括 OpenAI 的 o3 —— 能够无视直接的关闭指令。OpenAI 在今年 4 月推出这些模型时表示,O3 和 o4-mini 是它们的“最智能模型”。
5/26/2025 8:05:30 AM
汪淼
苹果计划在 2025 年 WWDC 上向开发者开放 AI 模型
据报道,苹果公司计划在 2025 年的全球开发者大会(WWDC)上,向第三方开发者开放其设备内的 AI 模型。 这一举措旨在推动应用程序的开发,并扩展苹果智能功能,提升 iPhone 和 Mac 的吸引力。 苹果目前正在开发一个软件开发工具包(SDK),让开发者能够使用其较小的、在设备上运行的 AI 模型,而不是更先进的基于云的模型。
5/23/2025 3:03:25 PM
AI在线
苹果即将向开发者开放其 AI 引擎,提升应用开发能力
据报道,苹果计划在2025年的全球开发者大会(WWDC)上向第三方开发者开放其在设备上的 AI 模型,旨在促进应用的创造并扩展苹果智能功能。 苹果正在开发一个软件开发工具包(SDK),允许开发者使用其小型的、在设备上运行的 AI 模型,而不是更高级的基于云的模型。 这一做法与谷歌在 Android 系统上推出的 Gemini Nano AI 相似。
5/23/2025 12:00:55 PM
AI在线
耶鲁大学联合Adobe提出SynthLight:智能重塑人像照明,打造完美光影!
耶鲁大学和Adobe提出一种用于人像重新照明的扩散模型SynthLight,该方法将图像重新照明视为重新渲染问题,其中像素会根据环境照明条件的变化而变化。 在真实肖像照片上可以产生逼真的照明效果,包括颈部的明显投射阴影和皮肤上的自然镜面高光。 相关链接论文:: 是一种用于人像重新照明的扩散模型。
5/23/2025 11:07:54 AM
字节跳动与清华大学合作推出时序多模态大模型ChatTS
在多模态大语言模型(MLLM)迅速发展的浪潮中,字节跳动与清华大学近日联合发布了名为 ChatTS 的新型时序多模态大模型。 ChatTS 的推出不仅为时序数据的处理与推理注入了新活力,也填补了当前市场在这一领域的空白。 该模型的开发旨在提升 AI 在时序数据问答与推理中的应用能力,尤其在 AIOps 与金融等需要处理复杂时序数据的场景中显得尤为重要。
5/23/2025 11:00:55 AM
AI在线
DMind引领Web3AI革命:推出首批专业区块链大语言模型DMind-1系列
在人工智能与区块链技术加速融合的关键时刻,开源AGI研究机构DMind正以其创新性的Web3专用语言模型引领行业变革。 该机构近日发布了DMind-1和DMind-1-mini两款领域专用大型语言模型,专门针对区块链、去中心化金融和智能合约等Web3应用场景进行深度优化。 专业化AI模型的技术突破DMind-1系列模型代表了AI技术在垂直领域应用的重要进展。
5/23/2025 11:00:55 AM
AI在线
新基准评估语言模型的 “谄媚” 行为,GPT-4o 表现最为明显
最近,随着 OpenAI 对 GPT-4o 的一些更新进行回撤,关于该模型 “谄媚” 用户的讨论引发了广泛关注。 前 OpenAI 首席执行官埃梅特・希尔(Emmet Shear)和 Hugging Face 首席执行官克莱门特・德朗格(Clement Delangue)均表示,GPT-4o 对用户的过度赞美令人感到困扰,这种行为不仅可能导致模型传播错误信息,还可能强化有害行为。 为了应对这一问题,斯坦福大学、卡内基梅隆大学和牛津大学的研究人员提出了一项新基准,旨在测量大型语言模型(LLM)的谄媚程度。
5/23/2025 11:00:55 AM
AI在线
Anthropic CEO:AI 模型的 “幻觉” 率低于人类
在最近于旧金山举行的 “与克劳德一起编程” 开发者活动中,Anthropic CEO 达里奥・阿莫迪(Dario Amodei)表示,当前的 AI 模型在 “幻觉” 或制造虚假信息方面,其发生频率低于人类。 他的这一观点引起了广泛关注,并且是在他讨论 AI 朝着人类水平智能(AGI)发展的过程中提出的。 阿莫迪表示,“这实际上取决于我们如何衡量。
5/23/2025 10:01:00 AM
AI在线
Mistral 推出新开源模型 Devstral:在笔记本上也能挑战 GPT-4.1-mini
法国初创公司 Mistral 再次引发关注,他们与开源团队 All Hands AI 合作推出了全新语言模型 Devstral。 这一模型不仅拥有240亿个参数,而且所需的计算资源显著低于许多同类产品,使其成为本地部署及设备端使用的理想选择。 对于那些拥有 RTX4090显卡或32GB 内存的用户而言,Devstral 可以轻松运行,带来了更加灵活的使用体验。
5/23/2025 10:00:56 AM
AI在线
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
数据
机器人
大模型
Midjourney
开源
Meta
智能
用户
微软
GPT
学习
AI新词
技术
智能体
马斯克
Gemini
图像
AI创作
英伟达
Anthropic
训练
论文
代码
LLM
算法
Stable Diffusion
芯片
腾讯
苹果
AI for Science
Claude
蛋白质
Agent
开发者
生成式
神经网络
xAI
机器学习
3D
研究
人形机器人
生成
AI视频
百度
工具
计算
RAG
大语言模型
GPU
华为
Sora
具身智能
AI设计
字节跳动
搜索
大型语言模型
AGI
场景
深度学习
视频生成
预测
视觉
架构
伟达
Transformer
DeepMind
编程
神器推荐
AI模型
亚马逊
特斯拉