AI在线 AI在线

AI

爱奇艺 CEO 龚宇: AI 技术将颠覆长短视频行业

在9月26日的爱奇艺秋季推荐会 “悦享会” 上,爱奇艺创始人兼首席执行官龚宇进行了题为《万物皆流,无物常驻》的演讲。 他表示,近年来爱奇艺在战略上明确,未来线下业务将成为公司的核心业务之一。 这一线下业务主要包含体验业务,分为 IP 衍生品和主题乐园两大部分。
9/26/2025 3:01:19 PM
AI在线

缺数据也能拿SOTA?清华&上海AI Lab破解机器人RL两大瓶颈

视觉-语言-动作模型是实现机器人在复杂环境中灵活操作的关键因素。 然而,现有训练范式存在一些核心瓶颈,比如数据采集成本高、泛化能力不足等。 为此,研究团队提出了SimpleVLA-RL。
9/26/2025 10:59:55 AM

多模态推理最高加速3.2倍!华为诺亚新算法入选NeurIPS 2025

不牺牲任何生成质量,将多模态大模型推理最高加速3.2倍! 华为诺亚方舟实验室最新研究已入选NeurIPS 2025。 截至目前,投机推理(Speculative Decoding)技术已成为大语言模型(LLM)推理加速的“标准动作”,但在多模态大模型(VLM)上的应用却举步维艰,现有方法加速比不到1.5倍,性能提升有限。
9/26/2025 10:58:03 AM

“零人”搞医学研究:清华AI智能体从灵感到论文全程自主

医学研究迎来“零人工”时代了? 清华大学自动化系索津莉课题组,发布首个专为医疗信息学设计的全自主AI研究框架——OpenLens AI。 首次实现从文献挖掘→实验设计→数据分析→代码生成→可投稿论文的全链条自动化闭环。
9/26/2025 10:47:35 AM

云栖通道上演AI“实战秀”:守护珊瑚、助盲出行、千元机器人勾勒落地新图景

9月25日正午,杭州云栖大会现场2号馆小舞台,云栖通道如期开通。 这是一个为广大AI产业从业者、创业者以及大模型开发者提供的专属交流平台。 在今年的主题分享中,四位嘉宾带着各自的AI创新成果登台:从南海珊瑚礁的守护,到视障人群的出行辅助;从低成本具身智能开发,到农牧场的智能管理,用真实案例勾勒出人工智能落地现实的鲜活图景。
9/26/2025 10:40:33 AM

ChatGPT 开始“管你的闲事”了

过去我们用 ChatGPT,大多是“有问题→它回答”。 这种即时反馈很神奇,但也有个缺点:它只会在你开口时帮忙,下一步怎么走还是得靠自己。 现在,OpenAI 正在测试一个新功能——ChatGPT Pulse。
9/26/2025 10:13:12 AM

Nature重磅:AI和人脑的根本区别找到了,我们对“聪明”的理解可能全错了

一篇发表在2025年《自然·机器智能》(Nature Machine Intelligence)上的研究,像一颗深水炸弹,炸开了人工智能和人类认知之间最深的那道墙。 这篇由二十多位国际顶尖专家联手的研究,它告诉我们,AI和人类在“泛化能力”上,压根就不是一回事。 什么叫泛化能力?
9/26/2025 9:37:06 AM

“iFold”,苹果AI新成果

起猛了,苹果怎么搞起跨界AI模型了? ? 发布了一个基于流匹配的蛋白质折叠模型SimpleFold,被网友戏称为“iFold”。
9/26/2025 9:34:35 AM

攻克结构化长文档检索难题!新框架让模型告别“结构性失明”

AI读不懂HTML、Markdown长文档的标题和结构,找信息总踩坑? 解决方案来了——SEAL全新对比学习框架通过带结构感知 元素对齐,让模型更懂长文。 该方法创新性地将文档的宏观层级结构和微观元素语义同时融入到统一的Embedding空间中,显著增强了预训练语言模型对结构化数据的理解和表示能力。
9/26/2025 9:32:47 AM

机器狗腿被锯了也能继续走!最新机器人大脑来自320亿估值独角兽

不怕故障的机器人大脑来了! 肢体断裂? 马达卡住?
9/26/2025 9:30:45 AM

为什么“具身智能”是 AI 的下一个前沿

过去十年,人工智能的突破几乎都发生在“去身化”的语境中。 无论是自然语言处理的GPT 系列,还是计算机视觉的 ViT、SAM,它们大多存在于数据与算力的虚拟空间里,擅长处理符号、文本和图像,却与真实世界的物理交互保持着距离。 这样的 AI 可以写诗、画画、回答问题,却无法真正走进现实,理解环境、操纵物体、与人类并肩完成任务。
9/26/2025 9:27:47 AM
Flearkens

中国团队重新定义“星际之门”!全球首个太空计算星座已实现常态化商用

飞在太空中的卫星,已经成为算力中枢给地面交通设施充当大脑了? 在一场视觉算法挑战中,一组参赛团队将道路识别模型部署至在轨卫星,完成了从图像采集、模型推理到结构化结果回传的全过程。 图像未落地,模型也并未运行在地面,所有计算任务均在轨道上完成,最终仅回传识别结果。
9/26/2025 9:26:23 AM

GPT-5通过“哥德尔测试”!独创性解决博士生都得花几天时间的开放数学问题

GPT-5,你这家伙! 究竟还有什么事是我不知道的? 在一篇最新论文中,研究人员让它挑战了5个尚未解决的优化猜想。
9/26/2025 9:24:46 AM

刚刚,谷歌发布机器人最新「大脑」模型!思考能力SOTA,还能「跨物种」学习

谷歌又给机器人「换大脑」了! 刚刚,DeepMind发布了针对机器人和具身智能的Gemini Robotics 1.5系列家族模型,专为机器人和具身智能打造的新一代「大脑」。 Gemini Robotics 1.5系列包括Gemini Robotics 1.5和Gemini Robotics-ER 1.5。
9/26/2025 9:15:40 AM

NeurIPS Spotlight|运动遮挡都不怕,0先验、一段视频精准预测相机参数

论文一作李放,美国伊利诺伊大学香槟分校 (UIUC) 博二学生,研究方向为 4D 视觉定位、重建/新视角合成以及理解。 第二作者为美国伊利诺伊大学香槟分校博四学生张昊。 通讯作者是 Narendra Ahuja, 美国伊利诺伊大学香槟分校 Donald Biggar Willet Professor(Ming-hsuan Yang, Jia-bin Huang 博士导师)。
9/26/2025 9:12:49 AM

阿里云无影Agentic Computer云栖大会首秀 :一台跨模态、跨终端的超级PC

9月25日,杭州云栖大会期间,阿里云宣布旗下Agent Infra重要组件——无影AgentBay迎来重大升级,推出自进化引擎、内存状态管理、安全围栏的全新能力。 并首次展示全新的个人计算产品——无影Agentic Computer,拥有全新的人机交互方式,革命性的“记忆”能力和近乎无穷的云上算力。 AI Agent是当下全球科技和商业的焦点,过去半年涌现的Agent相关产品,超过了2024年的总和,10个创业者有8个在做各种各样的Agent。
9/26/2025 9:04:26 AM

如何极大增加 AI 输出的准确性

大家好,我卡颂。 经常与 AI 进行专业讨论(比如需求分析、方案讨论…)的朋友会发现,即使再先进的 AI,都有两个问题:输出内容有幻觉经常说恭维话常见的解决办法通常是「工程化方案」,比如「对生成内容进行事实核查」。 最近在推上看到@Tz_2022巧妙将Mom Test方法论迁移到“与AI对话”上,获得不错效果。
9/25/2025 5:34:24 PM
卡颂

陶哲轩长文剖析现代社会:大型组织挤压小型社群,个体陷入疏离困境,AI正在加速这一进程

陶哲轩刚刚发布长文,从一个协作式数学项目引发的社群现象出发,提出了一个观察现代人类社会的宏观框架。 该框架认为,现代技术和激励体系在赋能个体与大型组织的同时,正在严重削弱小型组织的生态位,导致个体普遍面临疏离感、孤独感和无力感。 人类社会的四个尺度文章首先提出一个粗略的划分,将人类社会视为四个不同尺度上实体间的互动:1.个体人类2.小型人类组织:如家庭、朋友、本地社团、小型企业、临时项目组、小型在线社群等。
9/25/2025 4:36:09 PM