AI在线 AI在线

理论

WebResearcher:从线性累积到迭代进化,重塑AI研究范式的三大支柱

大家好,我是肆〇柒。 本文一篇来自阿里巴巴通义实验室(Tongyi Lab, Alibaba Group)的研究,是通义 Deepresearch 发布的系列研究之一。 这篇论文不仅推出了一个名为WebResearcher的新型AI智能体,更重要的是,它提出了一种名为"IterResearch"的全新范式,期望从根本上解决长程推理任务中的核心瓶颈。
9/24/2025 10:24:57 AM
肆零柒

MCP 安全“体检” | 基于 AI 驱动的 MCP 安全扫描系统

1、概述Model Context Protocol(MCP)作为 AI 应用生态系统中的关键协议,为大语言模型与外部工具、数据源的集成提供了标准化接口。 随着 MCP 在企业级应用中的快速普及,其安全风险也日益凸显。 构建一套智能化的 MCP 安全扫描系统,不仅是技术发展的必然需求,更是保障 AI 生态安全的重要基础设施。
9/24/2025 10:21:11 AM
火山引擎云安全

OpenAI一口气建5个算力中心!英伟达喂饱孙正义和甲骨文

英伟达刚刚计划给OpenAI一千万美元新投资,OpenAI就宣布了钱的用法:将和甲骨文及软银合作建数据中心,而且一口气就是五个。 这批新建的数据中心,将作为奥特曼“星际之门”计划的一部分,并将该项目的规划容量增加到近7GW,大致相当于七座大型核反应堆。 OpenAI表示,新的数据中心将使“星际之门”计划提前完成。
9/24/2025 9:45:51 AM

奥特曼刚刚发文,10GW核爆级算力!每周一座核电站,五座新城官宣

昨天,英伟达豪掷千亿,要帮OpenAI打造一个10GW超算中心。 今天,5000亿美元「星际之门」五个全新站点正式官宣,有望年底前,OpenAI提前实现10GW算力目标。 图片这五个选址,分别位于:德克萨斯州、俄亥俄州、新墨西哥州,还有一个位于中西部地区。
9/24/2025 9:18:55 AM
新智元

DeepSeek终极版震撼发布!

从15.9分跳到21.7分——当我看到DeepSeek V3.1-Terminus在"人类终极测试"中的得分时,第一反应是检查了下数据有没有看错。 36%的提升幅度,这在AI模型优化中简直是质的飞跃。 图片昨天DeepSeek正式发布了V3.1-Terminus"终极版",这个名字挺有意思。
9/24/2025 9:13:29 AM
阿丸笔记

ReSum:让AI智能体学会“记笔记”,突破长程推理瓶颈

大家好,我是肆〇柒。 本文分享的这篇工作来自通义实验室(Tongyi Lab, Alibaba Group)的最新研究成果——ReSum。 他们提出了一种全新的推理范式,让大模型智能体在面对复杂问题时,能够像人类一样“停下来复盘、做笔记”,从而突破传统上下文长度限制,实现真正意义上的长程探索。
9/24/2025 9:10:24 AM
肆零柒

国产MiroMind智能体框架,登顶全球预测未来大模型榜单

一个叫MiroMind的AI公司,在全球首个动态实时预测基准FutureX上拿了第一。 老板,是陈天桥。 就是那个创办了盛大网络,后来跑去做脑科学研究的陈天桥。
9/24/2025 9:02:42 AM

Nature发布Delphi-2M模型,提前20年预测你得什么病

一个叫Delphi-2M的AI模型横空出世,在科学界炸开了锅。 这玩意儿能预测一个人未来可能得的1000多种病,有时候甚至能提前几十年打招呼。 相关的研究成果,2025年9月17日发表在了顶尖期刊《自然》上。
9/24/2025 9:00:25 AM
suai

Qwen开源版Banana来了!原生支持ControlNet

Qwen版Banana来了! 刚刚,Qwen推出了新图像编辑模型——Qwen-Image-Edit-2509。 不仅支持多图融合,提供“人物 人物”,“人物 商品”,“人物 场景” 等多种玩法,还增强了人物、商品、文字等单图一致性。
9/24/2025 8:57:13 AM

GUI智能体训练迎来新范式!半在线强化学习让7B模型媲美GPT-4o

如何让AI更聪明地操作手机、电脑界面? 浙江大学与通义实验室Mobile-Agent团队在UI-R1的基础上,推出全新研究成果——UI-S1,提出了一种名为半在线强化学习(Semi-online Reinforcement Learning)的创新训练范式。 该工作融合了离线训练的稳定性与在线学习的长程优化能力,在不依赖真实环境交互的前提下,显著提升了模型在动态多轮任务中的表现。
9/24/2025 8:53:10 AM

8B硬刚72B!MiniCPM-V 4.5技术报告正式出炉

行业首个具备“高刷”视频理解能力的多模态模型MiniCPM-V 4.5的技术报告正式发布! 报告提出统一的3D-Resampler架构实现高密度视频压缩、面向文档的统一OCR和知识学习范式、可控混合快速/深度思考的多模态强化学习三大技术。 基于这些关键技术,MiniCPM-V 4.5在视频理解、图像理解、OCR、文档解析等多项任务上达到同级SOTA水平,不仅以8B的参数规模超越GPT-4o-latest和Qwen2.5-VL-72B,更在推理速度上具有显著优势。
9/24/2025 8:50:30 AM

山姆•奥特曼刚发长文:《丰盛的智能》,智能将人人可及

刚刚,Sam Altman 发布了一篇名为Abundant Intelligence的新博文,勾勒出 OpenAI 野心勃勃的 AI 基础设施愿景。 山姆•奥特曼在文中表示,AI 服务的增长速度令人惊叹,而未来将更加惊人。 他认为:随着 AI 变得更智能,获取 AI 将成为经济的基本驱动力,甚至可能最终被视为一项基本人权。
9/24/2025 8:46:13 AM
J0hn

庖丁解牛——透彻理解多层感知机(MLP)的内部机制

译者 | 朱先忠审校 | 重楼简介多层感知机(MLP)——有时也称为人工神经网络(ANN)或前馈神经网络(FNN)——是深度学习中最基础、最强大的架构之一。 其灵活的设计和卓越的性能使其成为解决各领域各种问题的首选算法。 此外,MLP是所有现代深度学习架构的核心构建块——无论是CNN、RNN、LSTM还是Transformer。
9/24/2025 8:03:22 AM
朱先忠

三大简易AI技术:快速释放数据治理价值的关键

如今,领导者们逐渐认识到,要成为数据驱动型企业,并营造一种数据为成功驱动力的文化,仅靠数据管理是远远不够的。 在实现数据最大价值的同时有效管理其风险,关键在于严谨的数据治理。 然而,尽管数据治理具有显著优势,但在推广和取得成效方面却常遇阻碍。
9/24/2025 7:12:00 AM
Jonathan

2026年的八大AI趋势:当前必须应对的变革浪潮

正如我去年所预测的,2025年,AI已深度融入日常生活。 无论是工作、娱乐、学习,还是我们做的几乎所有事情,其影响都不容忽视。 那么,未来我们将何去何从?我认为,2026年,我们将开始看到其长期影响逐渐显现。
9/24/2025 7:05:00 AM
Bernard

AI冲击与外包加速:全球CIO预判IT招聘两年内缩减18%

科技招聘公司Harvey Nash的最新报告显示,CIO预计IT行业受薪职位将大幅减少。 业内观察人士表示,在IT工作获取方式上,无论是内部员工还是承包商或第三方公司,都可能正在经历一场历史性的调整,此外,企业对所需经验和培训的期望因AI而改变,以及企业领导层普遍认为AI最终将减少人力需求,这些因素也在产生影响。 报告称:“数字化领导者认为,未来两年内,现有技术岗位的招聘需求将减少18%。
9/24/2025 7:00:00 AM
Evan

DeepSeek 更新了!

昨日,Deepseek推出了V3.1-Terminus,据介绍,这是其混合AI模型Deepseek-V3.1的改进版本。 新模型首先解决了语言区分问题,能够更准确地区分中文与英文,从而避免出现随机特殊字符等低级错误。 同时,Deepseek对内置的代码和搜索代理进行了调整,这让模型在调用外部工具时的稳定性更高,结果也更可靠。
9/23/2025 6:18:41 PM

突发:甲骨文CEO下台!刚和OpenAI签下3000亿美元大单,或因路线斗争

昨天,甲骨文官宣其在任11年的CEO Safra Catz卸任,转任董事会执行副主席。 Safra Catz参加白宫晚宴接替她的,是甲骨文云基础设施总裁Clay Magouyrk和甲骨文行业总裁Mike Sicilia,再次恢复双CEO制。 从左至右分别为Clay Magouyrk和Mike Sicilia甲骨文前脚刚与OpenAI签订3000亿美元的天价订单,后脚替换了在位11年的CEO,既是对公司资源的重新分配,也为投资者增添了在AI大基建时代长期投资甲骨文的底气。
9/23/2025 6:02:07 PM
新智元