资讯列表
小说一键转有声剧!豆包语音团队提出「AI多人有声剧」方案,沉浸感拉满了
「东州市第一监狱,犯人屠国安被狱警带到了招待室。 门一开,他看到有人背对着他,对方短发,身形纤瘦,姿态挺拔,在他的记忆里,并没有这样的熟人。 」这段文字源自一本知名的刑侦小说《遮云》,而下面这段音频是对应章节的「有声」版本,先听听:在音频最开始的一分钟里,我们就听到了人物对白和旁白解说,脚步、开门、坐下、手铐晃动和递名片的声音,背景音乐等多种元素。
上交、清华、微软、上海AI Lab等联合发布数据分析智能体综述,LLM化身数据分析师,让数据自己「说话」
传统数据分析方法依赖人工拼接的流程,如编写SQL、调用Python脚本及手动解读数据,不仅耦合度高且扩展性差,难以应对动态、多模态的复杂数据。 而大语言模型与智能体的出现,将数据分析从「规则执行」推向「语义理解」,使机器能够真正解读数据内在逻辑与关系,从而灵活完成查询、建模与报告生成等多样化任务。 近日,由上海交通大学、清华大学、微软雷德蒙德研究院、上海 AI Lab 等机构研究者联合撰写的最新综述论文系统回顾了大语言模型在数据分析领域的整体演进:从传统规则化流程到智能协作,从单模态到多模态融合,并提出构建「通用数据分析智能体(General Data Analyst Agent)」的新范式。
马斯克「世界模拟器」首曝,1天蒸馏人类500年驾驶经验!擎天柱同脑进化
一个神经网络模型,统治了一切。 今天,特斯拉官宣神经网络「世界模型器」,AI可以直接模拟、合成自动驾驶的「孪生世界」。 如下九宫格演示中,特斯拉「世界模拟器」生成了汽车行驶过程中的不同视角。
美国大学排名出炉:哥大断崖式下滑,MIT稳居CS榜第一!
每年秋天,美国高等教育界都会迎来一场「期末大考」——U.S. News最佳大学排名。 它不仅牵动数百万学生和家长的择校决策,更在全球范围内左右着学校的声誉与资源。
谷歌地球整合 Gemini,大模型加持可识别风暴与干旱风险
谷歌正加速为其地球可视化平台注入 AI 能力。 最新消息显示,Google Earth 现已整合 Gemini 大模型,用户可通过自然语言对话直接与地球 AI 互动,实现如“识别风暴威胁”“分析干旱风险社区”等复杂地理推理任务。 据悉,这一升级基于谷歌今年7月推出的地理空间推理(Geospatial Reasoning)模型,并将多种地球 AI 能力联动整合——包括天气预报、卫星图像分析和人口分布数据等。
保时捷营业利润暴跌99%,卖最好的燃油Macan却要停产
杰西卡 发自 副驾寺. 智能车参考 | 公众号 AI4Auto时移世易,曾经最能赚的豪车品牌保时捷,披露了上市之后最“艰难”的一份财报:. 公司前三季度营业利润缩水99%,核心的汽车板块业务已经亏损2.28亿欧元(约18.9亿元)。
新型「验证码」诞生?这张图让 ChatGPT、Claude、Gemini 都翻了车
人眼秒懂,AI抓瞎! 网友用光学错觉玩坏大模型,全网百万人围观。 又多了一个能捉弄大模型的小测试。
首个地球科学智能体Earth-Agent来了,解锁地球观测数据分析新范式
本文的第一作者冯沛林和吕主涛是上海人工智能实验室的实习生,他们的研究聚焦于大语言模型,尤其关注多模态大语言模型的推理和智能体。 通讯作者李唯嘉为中山大学遥感学院副教授。 论文的其他合作者来自上海人工智能实验室和中山大学。
用「进化+压力测试」自动生成的竞赛级编程题,各家大模型谁更hold住?
在当前评测生成式模型代码能力的浪潮中,传统依赖人工编写的算法基准测试集,正日益暴露出可扩展性不足与数据污染严重两大瓶颈。 为突破这一困局,北京大学与通用人工智能研究院联合提出全新 UniCode 框架。 该研究由北京大学梁一韬助理教授指导,博士生郑欣悦为第一作者,林昊苇为共同一作,创新性地构建了一套能够自动生成高质量算法题目与抗污染测试用例的进化式评测系统。
零一万物高管新阵容亮相,李开复加码布局ToB 2.0
衡宇 发自 凹非寺. 量子位 | 公众号 QbitAI零一万物的ToB战略,正在加速进入落地阶段。 继年初宣布“All in ToB”并推出企业级大模型平台“万智”后,零一万物正式公布新一轮高管任命——.
SK 海力士推出专为人工智能定制的下一代 NAND 存储产品
SK 海力士在近期的全球活动中,展示了其面向人工智能(AI)产业的下一代 NAND 存储产品战略。 SK 海力士宣布,将推出一系列针对 AI 优化的 NAND 存储产品,以满足日益增长的市场需求。 图源备注:图片由AI生成,图片授权服务商Midjourney随着人工智能推断市场的迅速发展,对能够高效处理大量数据的 NAND 存储产品的需求也随之攀升。
拍我AI视频替换功能(Swap)上线,开启“角色演绎”创作新玩法
随着AI技术的不断发展,视频创作的门槛正逐步降低,创作的自由度也在不断提升。 拍我AI在这一趋势下推出了全新的视频替换功能(Swap),为创作者提供了前所未有的演绎自由度。 通过自研的Diffusion Transformer大模型和多模态特征融合(Fusion)技术,视频替换功能让每个创作者都能够轻松演绎属于自己的独特故事。
从辅助驾驶到无人驾驶出租车,Mobileye展现技术与商业化双重实力
在全球五大车展之一的2025德国国际汽车及智慧出行博览会(IAA MOBILITY 2025,以下简称:慕尼黑车展)上,来自中国和海外的众多车企及方案商纷纷展示各自的前沿技术。 其中,驾驶自动化依然是最受关注的焦点。 在其中一家企业的展台上,我们得以一览从基础辅助驾驶到L2级组合辅助驾驶,乃至不久将至的L4级全自动驾驶的驾驶自动化发展全景图。
直击IROS现场:宇树禾赛自变量杭州论剑,美团C位攒局
henry 发自 IROS. 量子位 | 公众号 QbitAI要说IROS Day 1谁最炸——美团当仁不让。 一手2025美团机器人研究院学术年会,展厅直接被围到到水泄不通。
拜拜了GUI!中科院团队“LLM友好”计算机使用接口来了
大模型Agent帮你自动操作电脑,理想很丰满,现实却骨感。 现有的LLM智能体,几乎都绕不开两大核心“痛点”:成功率低:稍微复杂一点的任务,Agent就“翻车”,常常卡在某个步骤不知所措。 效率差:完成一个简单任务,Agent需要和系统进行几十轮“极限拉扯”,耗时漫长,看得人着急。
这种眼镜我建议外卖快递小哥人手一个
这种眼镜真应该给快递小哥人手配一副~. 给包裹出货只需要看一眼即可,再也不需要拿个扫码工具跑来跑去了:当抱着一大堆快递送货上门(此时双手不便无法导航)时,它也能实时帮忙指路:好家伙,这不妥妥的科技改变生活、解放快递小哥双手的绝佳典范吗? 而且因为有出货 实时导航功能,把它给外卖小哥用也不是不行,毕竟他们更是需要频繁看手机但又非常需要注意安全的人群。
一行“隐形”的代码,就能让 Comet 泄露你的全部邮件!AI产品公司创始大佬:AI看不懂的网站早晚会消失!
编辑 | 听雨出品 | 51CTO技术栈(微信号:blog51cto)上周,OpenAI 发布了 ChatGPT Atlas 浏览器——一个由 AI 驱动、能主动理解意图并代你完成任务的新型浏览器。 它不仅能“看懂”网页,还能“替你上网”:搜索、总结、订票、发送邮件。 这标志着互联网的一次结构性转折:从以人为中心的“点击互联网”,迈向以机器意图为驱动的互联网。
智元办机器人挑战赛:清华&上海AILab夺冠,华南理工“单人成团”拿亚军
henry 发自 IROS. 量子位 | 公众号 QbitAI这届机器人挑战赛,真的太卷了。 由智元机器人联合OpenDriveLab举办的机器人挑战赛——.