理论

第三届「简约与学习会议（CPAL）」将在德国图宾根举办，征稿中进行

CPAL会议简介CPAL是一年一度的研究型学术会议，专注于解决机器学习、信号处理、优化等领域中普遍存在的简约（Parsimonious）、低维结构（Low Dimensional Structures）问题。回顾本次会议的出发点，其设计为一个普遍的科学论坛，使机器学习、应用数学、信号处理、优化、智能系统以及所有相关的科学和工程领域的研究人员能够聚集在一起，分享意见，并最终达成努力一个共同的现代理论和计算框架，从简单学习的角度理解智能和科学。（）于2024年1月在香港大学举办，吸引了数百名世界各地的成功参与会者，包括为期四天的绑架的活动。

9/23/2025 5:15:00 PM

新闻资讯

阿里最新全模态模型，成了！真·实测：多图合成pose随意摆，视频实时对话，1分钟7种语言丝滑切换，意外发现：训练数据截止到去年

编辑 | 云昭出品 | 51CTO技术栈（微信号：blog51cto）就在今天，通义千问团队带着新品来炸街了。网友看完之后，都替美国的AI焦虑起来了：如果美国实验室不开始在开放权重上竞争，中国模型可就要垄断人工智能市场。图片那么，作为千问系列里首个端到端原生全模态（文本、图像、音频、视频）的通用大模型，Qwen3-Omni 究竟如何呢？

9/23/2025 4:38:05 PM

云昭

Depth Anything再出新作！浙大&港大出品：零样本，优化任意深度图

深度感知，即让机器拥有「三维视觉」，是当今计算机科学和机器人领域的基石。它赋予了自动驾驶系统判断安全距离的能力，让AR/VR头显能准确感知物理空间，也为工业自动化提供了精准操作的保障。尽管单目深度估计（MDE）模型取得了重大进展，能够进行完整和详细的深度预测，但预测的深度是相对的，缺乏精确的度量信息。

9/23/2025 12:52:38 PM

WebWeaver：一个模仿人类思维的AI研究员是如何炼成的？

大家好，我是肆〇柒。在本文我们要一起了解的是来自阿里巴巴通义实验室（Tongyi Lab, Alibaba Group）的前沿研究成果——WebWeaver框架。这篇论文直面AI Open-ended深度研究（OEDR）的核心挑战，不是简单堆砌算力，而是从人类认知过程汲取灵感，构建了一个能让AI像博士生一样思考、探索、写作的智能系统。

9/23/2025 10:27:58 AM

肆零柒

Meta为Facebook Dating引入AI助手，约会应用行业AI竞赛升温

在数字化浪潮的席卷下，恋爱与约会的方式正经历着翻天覆地的变革。近期，Meta 公司宣布一项重大举措，将为旗下的 Facebook Dating 引入人工智能助手，这一创新之举旨在助力用户寻觅到更契合自身需求的理想伴侣，为在线交友体验注入全新活力。 facebook-dating-scaled-1170x550.jpegMeta 推出的这款 AI助手，犹如一位贴心的恋爱顾问，通过深度剖析用户的偏好信息与行为习惯，从而给出极具针对性的匹配建议。

9/23/2025 10:23:59 AM

小菲

AI为啥总“一本正经胡说八道”？OpenAI发长篇论文解释了

相信很多同学都遇到过——问大模型一个冷门知识，它会一本正经地给出完全错误的答案。比如：复制OpenAI(2025a)三次回答分别是 03-07、15-06、01-01，没一次对。这就是典型的 Hallucination（幻觉）——语言模型生成看起来合理，实则错误离谱。

9/23/2025 9:44:02 AM

架构精进之路

超越规模神话：WebSailor-V2 的数据-环境协同之道

大家好，我是肆〇柒。本文要和大家分享的是来自阿里通义实验室（Tongyi Lab, Alibaba Group）的一项重磅研究成果——WebSailor-V2。这项工作不仅刷新了开源Web智能体的性能上限，更关键的是，它揭示了一个被长期忽视的真相：决定Agent能力边界的，或许不是模型参数，而是数据质量与训练生态系统的构建方式。

9/23/2025 9:42:58 AM

肆零柒

阿里通义深夜炸场：全球首个端到端全模态 AI 模型 Qwen3-Omni 发布开源，文本、图像、音视频全统一

9 月 23 日消息，又是熟悉的深夜，阿里云今日发布并开源了全新的 Qwen3-Omni、Qwen3-TTS，以及对标谷歌 Nano Banana 图像编辑工具的 Qwen-Image-Edit-2509。 Qwen3-Omni 是业界首个原生端到端全模态 AI 模型，能够处理文本、图像、音频和视频多种类型的输入，并可通过文本与自然语音实时流式输出结果，解决了长期以来多模态模型需要在不同能力之间进行权衡取舍的难题。 Qwen3-Omni 是原生端到端的多语言全模态基础模型，其核心特性主要包括：跨模态最先进表现：通过早期以文本为核心的预训练和混合多模态训练，模型具备原生多模态能力。

9/23/2025 9:33:10 AM

问舟

英伟达投资千亿美元与OpenAI结盟：AI基础设施竞赛迈入“超级算力”时代

9 月 23 日，全球科技行业迎来一则重磅消息 —— 芯片巨头英伟达与人工智能领军企业 OpenAI 联合宣布达成里程碑式合作。根据协议，英伟达计划向 OpenAI 投入高达 1000 亿美元，共同建设超大规模人工智能数据中心，为 OpenAI 下一代模型的训练与运行提供核心算力支撑。这一合作不仅刷新了 AI 领域的投资纪录，更标志着全球 AI 基础设施竞赛正式从 “单点突破” 转向 “系统比拼”，开启了以超级算力为核心的全新竞争阶段。

9/23/2025 9:29:59 AM

极客AI

Qwen重磅发布：首个端到端全模态AI模型Qwen3-Omni登场

阿里杀疯了，Qwen团队刚刚接连发布了两款重要模型：Qwen3-Omni，业界首个原生端到端全模态AI模型；以及Qwen-Image-Edit-2509，对标谷歌nano banana 图像编辑工具，根据预告，明天还有“大的”要发布。 Qwen3-Omni：真正的一体化AIQwen3-Omni的问世，旨在解决长期以来多模态模型需要在不同能力之间进行权衡取舍的难题。它是一款真正意义上的全能选手，在同一个模型中无缝统一了文本、图像、音频和视频的处理能力。

9/23/2025 9:20:05 AM