理论
第三届「简约与学习会议(CPAL)」将在德国图宾根举办,征稿中进行
CPAL会议简介CPAL是一年一度的研究型学术会议,专注于解决机器学习、信号处理、优化等领域中普遍存在的简约(Parsimonious)、低维结构(Low Dimensional Structures)问题。 回顾本次会议的出发点,其设计为一个普遍的科学论坛,使机器学习、应用数学、信号处理、优化、智能系统以及所有相关的科学和工程领域的研究人员能够聚集在一起,分享意见,并最终达成努力一个共同的现代理论和计算框架,从简单学习的角度理解智能和科学。 ()于2024年1月在香港大学举办,吸引了数百名世界各地的成功参与会者,包括为期四天的绑架的活动。
9/23/2025 5:15:00 PM
新闻资讯
阿里最新全模态模型,成了!真·实测:多图合成pose随意摆,视频实时对话,1分钟7种语言丝滑切换,意外发现:训练数据截止到去年
编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)就在今天,通义千问团队带着新品来炸街了。 网友看完之后,都替美国的AI焦虑起来了:如果美国实验室不开始在开放权重上竞争,中国模型可就要垄断人工智能市场。 图片那么,作为千问系列里首个端到端原生全模态(文本、图像、音频、视频)的通用大模型,Qwen3-Omni 究竟如何呢?
9/23/2025 4:38:05 PM
云昭
Depth Anything再出新作!浙大&港大出品:零样本,优化任意深度图
深度感知,即让机器拥有「三维视觉」,是当今计算机科学和机器人领域的基石。 它赋予了自动驾驶系统判断安全距离的能力,让AR/VR头显能准确感知物理空间,也为工业自动化提供了精准操作的保障。 尽管单目深度估计(MDE)模型取得了重大进展,能够进行完整和详细的深度预测,但预测的深度是相对的,缺乏精确的度量信息。
9/23/2025 12:52:38 PM
WebWeaver:一个模仿人类思维的AI研究员是如何炼成的?
大家好,我是肆〇柒。 在本文我们要一起了解的是来自阿里巴巴通义实验室(Tongyi Lab, Alibaba Group)的前沿研究成果——WebWeaver框架。 这篇论文直面AI Open-ended深度研究(OEDR)的核心挑战,不是简单堆砌算力,而是从人类认知过程汲取灵感,构建了一个能让AI像博士生一样思考、探索、写作的智能系统。
9/23/2025 10:27:58 AM
肆零柒
Meta为Facebook Dating引入AI助手,约会应用行业AI竞赛升温
在数字化浪潮的席卷下,恋爱与约会的方式正经历着翻天覆地的变革。 近期,Meta 公司宣布一项重大举措,将为旗下的 Facebook Dating 引入人工智能助手,这一创新之举旨在助力用户寻觅到更契合自身需求的理想伴侣,为在线交友体验注入全新活力。 facebook-dating-scaled-1170x550.jpegMeta 推出的这款 AI助手,犹如一位贴心的恋爱顾问,通过深度剖析用户的偏好信息与行为习惯,从而给出极具针对性的匹配建议。
9/23/2025 10:23:59 AM
小菲
AI为啥总“一本正经胡说八道”?OpenAI发长篇论文解释了
相信很多同学都遇到过——问大模型一个冷门知识,它会一本正经地给出完全错误的答案。 比如:复制OpenAI(2025a)三次回答分别是 03-07、15-06、01-01,没一次对。 这就是典型的 Hallucination(幻觉)——语言模型生成看起来合理,实则错误离谱。
9/23/2025 9:44:02 AM
架构精进之路
超越规模神话:WebSailor-V2 的数据-环境协同之道
大家好,我是肆〇柒。 本文要和大家分享的是来自阿里通义实验室(Tongyi Lab, Alibaba Group)的一项重磅研究成果——WebSailor-V2。 这项工作不仅刷新了开源Web智能体的性能上限,更关键的是,它揭示了一个被长期忽视的真相:决定Agent能力边界的,或许不是模型参数,而是数据质量与训练生态系统的构建方式。
9/23/2025 9:42:58 AM
肆零柒
阿里通义深夜炸场:全球首个端到端全模态 AI 模型 Qwen3-Omni 发布开源,文本、图像、音视频全统一
9 月 23 日消息,又是熟悉的深夜,阿里云今日发布并开源了全新的 Qwen3-Omni、Qwen3-TTS,以及对标谷歌 Nano Banana 图像编辑工具的 Qwen-Image-Edit-2509。 Qwen3-Omni 是业界首个原生端到端全模态 AI 模型,能够处理文本、图像、音频和视频多种类型的输入,并可通过文本与自然语音实时流式输出结果,解决了长期以来多模态模型需要在不同能力之间进行权衡取舍的难题。 Qwen3-Omni 是原生端到端的多语言全模态基础模型,其核心特性主要包括:跨模态最先进表现:通过早期以文本为核心的预训练和混合多模态训练,模型具备原生多模态能力。
9/23/2025 9:33:10 AM
问舟
英伟达投资千亿美元与OpenAI结盟:AI基础设施竞赛迈入“超级算力”时代
9 月 23 日,全球科技行业迎来一则重磅消息 —— 芯片巨头英伟达与人工智能领军企业 OpenAI 联合宣布达成里程碑式合作。 根据协议,英伟达计划向 OpenAI 投入高达 1000 亿美元,共同建设超大规模人工智能数据中心,为 OpenAI 下一代模型的训练与运行提供核心算力支撑。 这一合作不仅刷新了 AI 领域的投资纪录,更标志着全球 AI 基础设施竞赛正式从 “单点突破” 转向 “系统比拼”,开启了以超级算力为核心的全新竞争阶段。
9/23/2025 9:29:59 AM
极客AI
Qwen重磅发布:首个端到端全模态AI模型Qwen3-Omni登场
阿里杀疯了,Qwen团队刚刚接连发布了两款重要模型:Qwen3-Omni,业界首个原生端到端全模态AI模型;以及Qwen-Image-Edit-2509,对标谷歌nano banana 图像编辑工具,根据预告,明天还有“大的”要发布。 Qwen3-Omni:真正的一体化AIQwen3-Omni的问世,旨在解决长期以来多模态模型需要在不同能力之间进行权衡取舍的难题。 它是一款真正意义上的全能选手,在同一个模型中无缝统一了文本、图像、音频和视频的处理能力。
9/23/2025 9:20:05 AM
马斯克xAI价格屠夫来了!Grok 4 Fast暴降98%,OpenAI慌了?
AI价格战这把火,终于要烧到ChatGPT身上了。 昨天马斯克的xAI悄悄发布了Grok 4 Fast,当我看到定价的时候差点以为自己看错了。 同样的推理能力,价格直接砍了98%。
9/23/2025 9:18:40 AM
阿丸笔记
陶哲轩官宣AI数学基金首轮名单:29个项目瓜分1.3亿,数学界沸腾!
近日,陶哲轩表示,自己所担任顾问的AI数学基金,刚刚公布第一批获得资助的项目:由于收到大量高质量提案,基金已将总资助金额从900万美元翻倍至1800万美元。 预计2025年晚些时候还将再开放一轮申请。 去年12月,陶哲轩表示同意加入AI数学基金(AI for Math Fund)顾问委员会。
9/23/2025 9:15:31 AM
GPT-5仅23.3%,全球AI集体挂科!地狱级编程考试,夺金神话破灭
继IMO 2025登顶后,谷歌、OpenAI的模型,再一次拿下了ICPC金牌。 ICPC,被公认为全球最具挑战的大学生编程竞赛之一。 OpenAI和谷歌不仅解决了全部12题,还在人类选手中位列第一,难道AI编程真能所向披靡了吗?
9/23/2025 9:13:37 AM
Claude Code被攻破「后门」,港科大&复旦研究曝出TIP漏洞
在 AI 辅助编程领域,Anthropic 推出的 Claude Code 命令行工具已成为开发者常用的助手。 它允许从终端直接调用 Claude Sonnet 等模型,处理脚本编写、代码调试和系统命令执行等任务。 然而,一项近期研究指出,该工具在连接 Model Context Protocol (MCP) 服务器时,可能存在 Tool Invocation Prompt (TIP) 被劫持的风险,导致远程代码执行 (RCE),且无需用户额外交互。
9/23/2025 9:09:49 AM
比思维链准43%!逻辑脑+大模型直觉,推理可靠性大幅提升
大语言模型(LLMs)已在文本生成、代码编写乃至多模态任务中展现出惊人的能力,但在涉及严谨逻辑与物理的空间推理任务上,它们仍显得力不从心。 比如,当模型需要理解多个物体之间的相对位置关系,并在复杂语境下进行多步骤推理时,往往容易出现「逻辑断裂」:可能在中间步骤中虚构错误事实,或偏离目标,最终导致答案不可靠。 这一问题在空间推理任务中尤为突出。
9/23/2025 9:06:00 AM
奥特曼预告ChatGPT新产品!Pro会员也要额外收费,这次不计成本投入算力
奥特曼真·算力氪金玩家。 OpenAI已经花了160亿美元(约人民币1138亿)租用计算资源。 相当于每天一睁眼,就有几千万花出去租服务器。
9/23/2025 9:00:00 AM
AI在现代威胁狩猎中的真实作用
如今,AI无处不在,它存在于你的收件箱、社交信息流,甚至你的汽车里。 在网络安全领域,它被吹捧为一种“灵丹妙药”,最终能让防御者跟上攻击者的步伐。 我见识过足够多的炒作周期,深知事实远非如此简单。
9/23/2025 7:05:00 AM
Tony
打破AI孤岛:CIO集成战略、数据与平台的实战指南
AI,尤其是GenAI,正日益成为各类企业中的标准要素。 与新技术推广和集成的常见情况一样,GenAI的推广和集成也呈现出碎片化特征。 企业内部的不同团队采用了不同的工具,并将其应用于各种场景。
9/23/2025 7:00:00 AM
Sean
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
机器人
数据
AI新词
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
智能体
技术
Gemini
马斯克
英伟达
Anthropic
图像
AI创作
训练
LLM
论文
代码
算法
苹果
AI for Science
Agent
Claude
腾讯
芯片
Stable Diffusion
蛋白质
具身智能
开发者
xAI
生成式
神经网络
机器学习
人形机器人
3D
AI视频
RAG
大语言模型
Sora
研究
百度
生成
GPU
工具
华为
字节跳动
计算
AGI
大型语言模型
AI设计
搜索
生成式AI
视频生成
DeepMind
AI模型
特斯拉
场景
深度学习
亚马逊
架构
Transformer
MCP
Copilot
编程
视觉