AI在线 AI在线

资讯列表

基于工作记忆的认知测试显示LLM的检索局限:100%混淆无效信息与正确答案

本文发现一个影响所有大型语言模型(LLMs)的信息检索问题。 该任务对人类没有难度,但是所有 LLM 均出现显著错误。 并对全局记忆(memory)和长推理任务(long reasoning)造成显著损害。
7/10/2025 4:11:00 PM
机器之心

订阅费300刀,值吗?马斯克发布Grok 4登顶SOTA!一项突破上大分:训练阶段就教AI用工具!网友:地表最强AI回来了!

编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)马斯克,又双叒叕意料之中地迟到了。 Grok 4 原定的直播足足晚了一个小时,马老板终于姗姗来迟,开始了这场发布会。 图片更加推迟上线的,则是大家原以为会同步上线的编程模型 Grok 4 Code —— 直接鸽到下个月发布,让人有些小失望。
7/10/2025 3:53:45 PM
伊风

小米汽车一过境,保时捷和特斯拉都卖不动了

杰西卡 发自 副驾寺. 智能车参考 | 公众号 AI4Auto果然,小米汽车过境,保时捷和特斯拉都大受影响了。 这边小米SU7上半年累计销售15.74万辆,YU7开售18小时锁单24万,这几天刚刚开始交付,超级工厂加班加点连轴转,一片如火如荼。
7/10/2025 3:50:51 PM
杰西卡

开发神器 Cursor 最全配置指南:从入门到高效工作流!

想让 Cursor 真正好用? 试试这套实战配置方案! 在 2025 年,AI 编程工具正彻底改变开发者的生产力,而 Cursor 绝对是其中的佼佼者。
7/10/2025 3:38:00 PM
AI拍档

科普:AI 是如何理解问题的?它能像人类一样思考吗?

现有的AI推理的局限性在人类的日常生活中,我们并不需要把思维的每一步说出口或画出来才能思考。  比如:你在脑子里可以默默思考一篇文章的结构,或者在脑海中想象一下你家房间的布局。  思考这些都不需要真正动笔或动手去画。
7/10/2025 3:29:10 PM
AI拍档

YouTube 将更新政策,打击 AI 批量生成低质内容牟利行为

AI在线 7 月 10 日消息,YouTube 正准备更新其平台政策,进一步限制创作者通过“非真实”内容获取收益的能力。 这类内容包括批量生产的视频和其他重复性内容,随着人工智能技术的发展,此类内容的制作门槛大幅降低,数量也迅速增长。 根据 YouTube 官方帮助页面的说明,新的政策将于 7 月 15 日正式生效,届时 YouTube 合作伙伴计划(YouTube Partner Program, YPP)的变现规则将加入更明确的内容规范,帮助创作者更清楚地了解哪些内容可以变现,哪些则不符合标准。
7/10/2025 3:19:39 PM
远洋

英媒:黄仁勋下周访问中国,中国特供 AI 芯片最快 9 月推出

北京时间 7 月 10 日,据《金融时报》报道,英伟达 CEO 黄仁勋 (Jensen Huang) 计划访问中国,重申公司对中国市场的承诺。 该公司计划最快在今年 9 月推出专为中国市场设计的新型 AI 芯片。 据知情人士透露,英伟达新款中国特供芯片是其现有 Blackwell RTX Pro 6000 处理器的降级版,经过了修改以符合美国总统特朗普收紧的出口管制规定。
7/10/2025 3:16:37 PM
箫雨

亚马逊云科技推出基于NVIDIA Blackwell的最新、超强GPU实例

为了加速推理模型、Agentic AI 系统等新兴生成式 AI 技术的发展,亚马逊云科技本周宣布由 NVIDIA Grace Blackwell Superchips 加速的 Amazon EC2 P6e-GB200 UltraServer 现已正式可用。 P6e-GB200 UltraServer 专为训练和部署最大规模、最复杂的 AI 模型而设计。 今年早些时候,亚马逊云科技已推出了基于 NVIDIA Blackwell GPU 的 Amazon EC2 P6-B200 实例,支持多样化的 AI 和高性能计算工作负载。
7/10/2025 3:11:00 PM
新闻助手

Chrome危!AI浏览器新品大爆发,OpenAI都来抢饭碗

AI时代,浏览器正在成为兵家必争之地。 这不,英伟达投资的Perplexity就推出了自己的AI浏览器——Comet,号称专为当今互联网打造。 这家AI搜索起家的独角兽,又要挑战谷歌另一个垄断领域了。
7/10/2025 3:08:00 PM
一水

人类增强子突变敏感性图谱首次绘制:AI 与体内实验揭示发育调控密码

编辑丨&ENCODE 计划(Encyclopedia of DNA Elements)中提到,人类基因组中仅 2% 序列编码蛋白质,其余 90% 非编码区的调控功能长期成谜。 了解人类生物学需要的不仅仅是绘制基因图谱,还必须了解基因表达是如何被调节的,以指导身体系统的健康发育、生长和维系。 对于作为远端调控元件的增强子,其突变与先天性心脏病、肢体畸形等发育疾病密切相关。
7/10/2025 3:02:00 PM
ScienceAI

AI 机器人自主完成复杂胆囊切除手术,准确率 100%

AI在线 7 月 10 日消息,美国约翰斯・霍普金斯大学研究人员称,他们训练出一个能利用人工智能(AI)自主完成胆囊切除手术的机器人。 这标志着人类向自动化医疗迈出一大步。 这一系统不仅能完成特定手术任务,更能“理解”手术流程,具备自主决策和应变能力。
7/10/2025 3:00:26 PM
远洋

推理与操控能力双提升!具身机器人双系统VLA模型新突破

让机器人学会聪明且快速精准执行,一直是机器人操控领域的难题。 为了解决这个问题,香港中文大学、北京大学、智平方和北京智源研究院联合创新性地提出了Fast-in-Slow(FiS-VLA),即一个统一的双系统VLA模型。 它通过将慢系统2最后几层的Transformer模块重新构建为一个高效的执行模块,用作快系统1,从而在一个模型中实现了快慢系统融合。
7/10/2025 2:55:12 PM

扩散语言模型写代码!速度比自回归快10倍

谁说扩散模型只能生成图像和视频? 现在它们能高质量地写代码了,速度还比传统大模型更快! Inception Labs推出基于扩散技术的全新商业级大语言模型——Mercury。
7/10/2025 2:54:13 PM

MCP协议曝出大漏洞:会泄露整个数据库

所有使用MCP协议的企业注意:你的数据库可能正在“裸奔”! 最新研究显示,该协议存在重大漏洞,攻击者可利用LLM的指令/数据混淆漏洞直接访问数据库。 如果用户提供的“数据”被精心伪装成指令,模型很可能会将其作为真实指令执行。
7/10/2025 2:53:40 PM

Meta发布40页报告,具身智能的下一步是「心智世界模型」:能听,能看,能理解,会共情

最近Meta动作频频。 一边是老板小扎亲自下场,豪掷一亿美金挖人。 另一边,自家具身智能研究同样也憋了个大的,40页长文报告。
7/10/2025 2:53:12 PM

下一代AI需要「思想微积分」!华人团队重磅揭秘,AI方法论三连发

AI的时代洪流滚滚向前,我们每个人都身处其中,感受着它的光荣与梦想,也承担着它的迷茫与代价。 一方面,是资本市场的狂欢盛宴。 OpenAI的估值冲向千亿美金,英伟达的市值超越众多老牌巨头,任何与「AI」沾边的概念都能轻易点燃投资者的热情。
7/10/2025 2:52:45 PM
新智元

奖励模型终于迎来预训练新时代!上海AI Lab、复旦POLAR,开启Scaling新范式

在大语言模型后训练阶段,强化学习已成为提升模型能力、对齐人类偏好,并有望迈向 AGI 的核心方法。 然而,奖励模型的设计与训练始终是制约后训练效果的关键瓶颈。 目前,主流的奖励建模方法包括 “基于偏好的奖励建模”(Preference-based Reward Modeling)和 “基于规则的验证”(Rule-based Verifier)两种方法。
7/10/2025 2:51:29 PM

VLA统一架构新突破:自回归世界模型引领具身智能

本文来自:王宇琪,中国科学院自动化所博士,研究方向为世界模型,自动驾驶感知与决策等,在 CVPR、NeurIPS、ICCV、ECCV、ICLR 等顶级会议上发表过多篇论文。 王鑫龙团队,北京智源研究院,研究方向为原生多模态大模型,Emu 系列工作核心负责人。 张兆翔团队,中国科学院自动化研究所,研究方向涵盖世界模型、视觉生成与重建、自动驾驶、具身智能等。
7/10/2025 2:50:46 PM