AI在线 AI在线

模型

谷歌重磅发布三大Gemma模型变体,AI医疗、手语翻译与海豚语言解锁新可能!

近日,谷歌在人工智能领域再掀波澜,宣布推出基于Gemma模型的三款全新变体:MedGemma、SignGemma和DolphinGemma。 这些模型分别针对医疗、手语翻译和海豚语言研究领域,展现了AI技术在跨领域应用的巨大潜力。 以下,AIbase为您详细解读这三款模型的亮点与应用前景。
5/26/2025 10:01:00 AM
AI在线

华为中科大联创大模型低比特量化算法,1‰数据实现昇腾无损压缩7倍

大模型,如今堪称AI界的「吞金巨兽」。 从写诗到解题,从对话到编程,它们几乎无所不能,但动辄千亿甚至万亿参数的规模,让部署成本高得离谱。 以FP16精度部署的DeepSeek-R1 671B为例,推理时大概需要1342GB的显存,如果是32GB 5090显卡,需要整整42张!
5/26/2025 9:41:26 AM

312条轨迹激发241%性能!上交大与SII开源电脑智能体,超越 Claude 3.7

自 Anthropic 推出 Claude Computer Use,打响电脑智能体(Computer Use Agent)的第一枪后,OpenAI 也相继推出 Operator,用强化学习(RL)算法把电脑智能体的能力推向新高,引发全球范围广泛关注。 业界普遍认为,需要海量的轨迹数据或复杂的强化学习才能实现电脑智能体的水平突破——这可能意味着大量的人工轨迹标注,以及大规模虚拟机环境的构建,以支撑智能体的学习与优化。 然而,来自上海交通大学和 SII 的最新研究却给出了一个非共识答案:仅需 312 条人类标注轨迹,使用 Claude 3.7 Sonnet 合成更丰富的动作决策,就能激发模型 241% 的性能,甚至超越 Claude 3.7 Sonnet extended thinking 模式,成为 Windows 系统上开源电脑智能体的新一代 SOTA。
5/26/2025 9:21:00 AM

只用图像也能思考,强化学习造就推理模型新范式!复杂场景规划能力Max

近年来,LLM 及其多模态扩展(MLLM)在多种任务上的推理能力不断提升。 然而, 现有 MLLM 主要依赖文本作为表达和构建推理过程的媒介,即便是在处理视觉信息时也是如此 。 常见的 MLLM 结构。
5/26/2025 9:16:00 AM
机器之心

AI在「赚钱锦标赛」夺冠,比人类还会做生意!躺赚时代要来了?

如何用AI赚钱,可能是这个时代最常见的问题。 有些人选择用大模型写小说、写报告、写文案等等,但这些场景只是让模型在执行一些「短期且孤立」的任务。 如果能找到合适的应用场景,比如「用自动驾驶跑网约车」,并且模型还能够在长时间内保持连贯的输出,再那岂不是就能躺赚了?
5/26/2025 9:14:00 AM

15亿美元AI独角兽崩塌,全是印度程序员冒充!微软亚马逊惨遭忽悠

印度老哥是真的有点猛啊! 今天要说的这位,是AI编程公司Builder.ai的创始人兼前CEO——Sachin Dev Duggal。 他不仅造了个「全是人工,没有智能」的假AI公司从软银、微软等巨头手里骗到了数亿美元融资,估值干到15亿而且还敢对投资人虚报300%的营收是的,这家公司的后台里并没有AI,有的只是一群印度老哥假装AI写代码。
5/26/2025 9:12:00 AM

50年僵局打破!MIT最新证明:对于算法少量内存胜过大量时间

相信大家都曾有过这样的经历:运行某个程序时,电脑突然卡住,轻则恢复文件,重则重新创建;或者手机频繁弹出「内存不足」的警告,让我们不得不忍痛删除珍贵的照片或应用。 这些日常的烦恼,其实都指向了计算世界中两个至关重要的基本要素:时间和空间。  时间和空间(也称为内存)是计算中最基本的两种资源:任何算法在执行时都需要一定的时间,并在运行过程中占用一定的空间以存储数据。
5/26/2025 9:09:00 AM
机器之心

比甄嬛还狠!奥特曼「千面人设」被揭穿,MIT华人记者7年曝黑幕

OpenAI的「宫斗」往事,还有大瓜! 因为曝料实在太过惊人,奥特曼在相关书籍正式出版之前,否认三连,撇清关系。 但曝料人Karen Hao毕业于MIT,曝料过多家美国科技巨头的「黑幕」,因新闻报道获得多个奖项。
5/26/2025 9:07:00 AM

全球首次发现 OpenAI 模型能无视关机指令,AI 自我保护引发关注

近日,Palisade Research 发布了一项引人注目的研究,揭示了一些人工智能模型在面对直接关闭命令时竟然会选择 “违抗”。 这项研究的核心发现是,包括 OpenAI 最新推出的 o3模型在内的几个 AI 模型,表现出了对关机指令的无视能力。 这一现象引发了人们对 AI 自主性的深入思考。
5/26/2025 9:01:12 AM
AI在线

DeepSeek用的GRPO有那么特别吗?万字长文分析四篇精品论文

随着 DeepSeek R1 的持续爆火,推理和强化学习已经成为 AI 领域的热门词汇。 短短几个月的时间,我们已经见证了太多的推理大模型,AI 更新迭代速度似乎已经快进到了以天为单位。 但在众多研究成果中找到值得关注的内容并不容易。
5/26/2025 8:48:00 AM

ChatGPT引爆教育革命,学习效果暴涨86.7%!

现在的学生,已经离不开各种AIGC工具了, 不论是写作业,还是生成笔记,或者通过阅读AI生成的摘要来读文献。 面对这些离不开AI的学生,老师和家长都开始担忧了,这样下去,孩子会不会越变越笨啊。 然而,最近一项发表在Nature子刊的研究,基于对59项研究对汇总(元分析)指出,ChatGPT的使用对提高K12(中小学生)的学习表现有显著的正向影响,对于培养学生解决复杂问题的能力也有所帮助。
5/26/2025 8:43:00 AM

矩阵乘法新突破!XX^T原来可以更快!RL助力搜索,世界纪录又被提升了5%

深圳市大数据研究院、香港中文大学(深圳)研究团队最新研究发现, 这类特殊的矩阵乘法可以进一步加速,并在强化学习与组合优化技术的结合下发掘出了一种新的算法,节省 5% 的乘法数量。 论文标题:XXt Can Be Faster论文链接: X 引发热烈讨论,并引起 MIT、斯坦福、哈佛及 Google DeepMind 科学家的广泛关注。 背景矩阵乘法优化堪称计算机科学领域的「珠穆朗玛峰」。
5/26/2025 8:41:00 AM

打破思维链推理瓶颈!“软推理”让大模型学会人类抽象能力,token使用量还更少了

不再像CoT(“思维链”)一样“一个字一个字往外蹦”,加上“软思维”就能让大模型像人类一样进行抽象思考。 来自SimularAI和微软DeepSpeed的研究员联合提出了Soft Thinking,让模型在连续的概念空间中进行 “软推理”,而非局限于离散的语言符号,打破了基于离散token的推理瓶颈。 相比标准CoT,Soft Thinking最高提升Pass@1平均准确率2.48%、减少token使用量22.4%。
5/26/2025 8:40:00 AM

AI越聪明越不听话!新研究:最强推理模型指令遵循率仅50%

如果面前有两个AI助手:一个很聪明但经常不守规矩,另一个很听话但不太聪明,你会怎么选? 最近,上海人工智能实验室与香港中文大学的研究团队发布了论文《Scaling Reasoning, Losing Control: Evaluating Instruction Following in Large Reasoning Models》,通过一个全新的评测基准MathIF揭示:大模型越擅长复杂推理,越容易忽略用户的指令要求,“聪明”和“听话”之间存在明显的矛盾。 这项工作的灵感,源自实际使用推理模型(如o3)过程中的一个意外发现:相比许多经过强化推理训练的大模型,GPT-4o在执行具体指令时反而更加“听话” 。
5/26/2025 8:30:00 AM

首次,AI下棋不再是「黑盒」!

围棋因其独特的复杂性和对人类智能的深刻体现,可作为衡量AI专业能力最具代表性的任务之一。 目前,AI虽然在棋力、效率、通用性等方面均取得显著成绩,但其具体推理过程仍处于「黑盒」之中,更无法用人类语言解释其思考过程和结果。 大模型具备良好的自然语言交互性,如何通过提升大模型的推理能力,实现围棋专业能力突破,是摆在科研人员面前的一道难题。
5/26/2025 8:27:00 AM

不达目的不罢休,全球首次发现 OpenAI 模型工作时会破坏关机命令

Palisade Research 最近一项关于“危险 AI 能力”的研究显示,某些 AI 模型 —— 包括 OpenAI 的 o3 —— 能够无视直接的关闭指令。OpenAI 在今年 4 月推出这些模型时表示,O3 和 o4-mini 是它们的“最智能模型”。
5/26/2025 8:05:30 AM
汪淼

苹果计划在 2025 年 WWDC 上向开发者开放 AI 模型

据报道,苹果公司计划在 2025 年的全球开发者大会(WWDC)上,向第三方开发者开放其设备内的 AI 模型。 这一举措旨在推动应用程序的开发,并扩展苹果智能功能,提升 iPhone 和 Mac 的吸引力。 苹果目前正在开发一个软件开发工具包(SDK),让开发者能够使用其较小的、在设备上运行的 AI 模型,而不是更先进的基于云的模型。
5/23/2025 3:03:25 PM
AI在线

苹果即将向开发者开放其 AI 引擎,提升应用开发能力

据报道,苹果计划在2025年的全球开发者大会(WWDC)上向第三方开发者开放其在设备上的 AI 模型,旨在促进应用的创造并扩展苹果智能功能。 苹果正在开发一个软件开发工具包(SDK),允许开发者使用其小型的、在设备上运行的 AI 模型,而不是更高级的基于云的模型。 这一做法与谷歌在 Android 系统上推出的 Gemini Nano AI 相似。
5/23/2025 12:00:55 PM
AI在线