AI在线 AI在线

理论

Meta AI大洗牌!超级智能一拆四,小扎押注硅谷华人,LeCun或已出局

扎克伯格,这次是铁了心了,他要All in AI,不留一点后路。 8月20号,Meta又扔下一颗炸弹! 超级智能团队,再一次大重组,短短6个月这已经是第四次重组AI团队了。
8/20/2025 12:41:10 PM

dLLM的「Free Lunch」!浙大&蚂蚁利用中间结果显著提升扩散语言模型

本文第一作者王文,浙江大学博士生,研究方向是多模态理解与生成等。 本文通讯作者沈春华,浙江大学求是讲席教授,主要研究课题包括具身智能、大模型推理增强、强化学习、通用感知模型等。 近年来,扩散大语言模型(Diffusion Large Language Models, dLLMs)正迅速崭露头角,成为文本生成领域的一股新势力。
8/20/2025 12:38:26 PM

深度揭秘OpenAI如何让GPT-5「技术性」超越Claude:悄悄跳过最难的23道题

几天前,OpenAI发布会上,奥特曼宣布GPT-5登顶了,号称代码能力全球第一。 但发布会上搞了一个大乌龙,52.8>69.1=30.8? 于是,OpenAI那些年薪上亿的天才们做的一张表格火遍了全世界(左边)。
8/20/2025 12:24:23 PM

OpenAI高管自爆:Scaling不死,GPT-5「双轴训练」撕开智能天花板

GPT-5的能力到底有什么提升与意义? 人工智能未来走向何处? 这款惊艳亮相的OpenAI新模型,如何揭示智能的多种形态?
8/20/2025 12:22:31 PM

DeepSeek V3.1 Base突袭上线!击败Claude 4编程爆表,全网在蹲R2和V4

就在昨晚,DeepSeek官方悄然上线了全新的V3.1版本,上下文长度拓展到128k。 图片本次开源的V3.1模型拥有685B参数,支持多种精度格式,从BF16到FP8。 综合公开信息和国内大咖karminski3的实测,V3.1此次更新亮点有:编程能力:表现突出,根据社区使用Aider测试数据,V3.1在开源模型中霸榜。
8/20/2025 9:57:40 AM

突发!DeepSeek刚刚开源V3.1-Base

今天凌晨,全球著名大模型开源平台DeepSeek开源了Deepseek V3.1-Base版本。 非常低调没有任何介绍,只是把模型放上去了。 但在Hugging Face的趋势榜单中已经上升到第4名,还是相当受欢迎的。
8/20/2025 9:35:20 AM

ICCV 2025 | 跨越视觉与语言边界,打开人机交互感知的新篇章:北大团队提出INP-CC模型重塑开放词汇HOI检测

本文的第一作者为北京大学王选计算机研究所博士生雷廷,通讯作者为博士生导师刘洋。 团队近年来在 TPAMI、CVPR、ICCV、ICML 等顶会上有多项代表性成果发表,多次荣获多模态感知和生成竞赛冠军,和国内外知名高校、科研机构广泛开展合作。 目前的 HOI 检测方法普遍依赖视觉语言模型(VLM),但受限于图像编码器的表现,难以有效捕捉细粒度的区域级交互信息。
8/20/2025 9:13:00 AM

Meta超级智能实验室重组为四个部门,某些高管将离开

据《彭博社》报道,Meta 将重组其超级智能实验室(Meta Superintelligence Labs,MSL)。 具体来说,MSL 以及 Meta 之前的 FAIR 等 AI 部门将被重组为四个专注于 AI 的新部门:TBD Lab,负责人是 Alexandr WangFAIR (Fundamental AI Research),基础 AI 研究Products and Applied Research, 产品和应用研究,由 GitHub 前 CEO Nat Friedman 领导MSL Infra,负责 Meta 的 AI 基础设施Meta 首席 AI 官 Alexandr Wang 在一份内部备忘录中表示,超级智能实验室将被划分为更小的部门,分别专注于 AI 研究、基础设施、硬件、产品集成以及公司的长期超级智能目标。 他写到:「超级智能即将到来,为了认真对待它,我们需要围绕实现它的关键领域进行组织构建。
8/20/2025 9:10:00 AM

DeepSeek开源新基础模型,但不是V4,而是V3.1-Base

昨晚,深度求索在用户群里宣布「DeepSeek 线上模型版本已升级至 V3.1,上下文长度拓展至 128k」并更新了 UI (去掉了 DeepThink 旁的 R1 标示)之后,在 Hugging Face 发布了一款新模型 DeepSeek-V3.1-Base。 模型地址:,该模型是 DeepSeek-V3 系列最新的基础模型。 至于为什么命名为 V3.1,而不是像之前以前命名为 V3 带四位日期数字的形式(如 V3-0324),尽管社区有诸多猜测,但深度求索官方尚未给出明确说明 —— 和该公司之前的操作一样,这一次同样是模型先行,说明和宣传还在后面。
8/20/2025 9:08:00 AM

美国专家来中国转了一圈:AI比赛已经结束了

现状来看,美国后继乏力,比赛可能已经结束了。 这就是一个美国专家,近期来中国转了一圈,然后回国后被万千美国网友议论的最新结论。 而且这个结论,不少美国人由衷认同,因为论据核心主要涉及——电力。
8/20/2025 9:04:00 AM

最懂Claude内部运作团队采访流出:大模型输出的思考全是拍马屁!曝自家减少幻觉路径;绝非只预测下一个词。网友:这都敢免费公开

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)上周末,Anthropic 团队放出了一个非常优质的播客。 话题的敏感尺度很大,头排的听众们都替Claude担心了起来,惊呼:这种“核心机密”竟然敢免费公开吗? 甚至有网友表示,第一次从头到尾把60分钟的播客听完了。
8/20/2025 8:34:48 AM
云昭

AI教父辛顿:人类需要AI成为“母亲”,李飞飞:反对!

“AI 会统治人类吗? ”这个问题,早已不是科幻小说的专属。 不如我们回顾下《爱,死亡与机器人》中那个荒诞又深刻的故事——《当酸奶统治世界》。
8/20/2025 7:53:01 AM
DataFun

ACM MM 2025 | 小红书AIGC团队提出风格迁移加速新算法STD

基于一致性模型(Consistency Models, CMs)的轨迹蒸馏(Trajectory Distillation)为加速扩散模型提供了一个有效框架,通过减少推理步骤来提升效率。 然而,现有的一致性模型在风格化任务中会削弱风格相似性,并损害美学质量 —— 尤其是在处理从部分加噪输入开始去噪的图像到图像(image-to-image)或视频到视频(video-to-video)变换任务时问题尤为明显。 这一核心问题源于当前方法要求学生模型的概率流常微分方程(PF-ODE)轨迹在初始步骤与其不完美的教师模型对齐。
8/20/2025 7:49:28 AM

揭秘扩散模型:深入了解DALL-E和Midjourney背后的技术

译者 | 布加迪审校 | 重楼本文介绍了最流行的图像生成模型架构之一的技术层面。 近年来,生成式AI模型已成为一颗冉冉升起的新星,尤其是随着ChatGPT等大语言模型(LLM)产品闪亮登场。 这类模型使用人类能够理解的自然语言,可以处理输入,并提供合适的输出。
8/20/2025 7:47:19 AM
布加迪

填补AI模型治理鸿沟:CISO必知的五大关键发现

尽管大多数企业都意识到对AI模型进行强有力治理的必要性,但许多企业仍在努力弥补可能减缓AI应用速度并增加风险的种种差距。 Anaconda一项针对300多名AI从业者和决策者的新调查结果凸显了开源工具存在的安全隐患、模型监控不一致以及AI工具链碎片化带来的运营挑战。 尽管经过验证,安全担忧依然居高不下开源软件是AI开发的核心,但同时也带来了需要谨慎管理的供应链风险,大多数受访者都制定了相关流程,以验证Python软件包的安全性和合规性,这些流程包括从自动化漏洞扫描到维护内部软件包注册表以及进行人工审查等多种方式。
8/20/2025 7:18:00 AM
Anamarija

AI就绪型数据:当下发展最快的技术,到底是什么?

在当今数字时代,人工智能(AI)正以前所未有的速度蓬勃发展,其影响力已深度渗透到商业与社会的各个领域。 在这一过程中,算法迭代与模型创新始终是行业关注的焦点。 然而,当深入探究AI技术落地的核心逻辑时会发现,数据才是支撑这一切的真正引擎。
8/20/2025 12:10:00 AM
Yu

腾讯开源 X-Omni:RL缝合混合架构,对标 GPT-4o,中文文本渲染登顶

近日,腾讯研究团队打造了一款新型图像生成模型X-Omni。 技术上,采用了强化学习重构混合模型架构;性能上,直接对标OpenAI的GPT-4o。 地址:,还在多个图像生成任务中击败了商用大模型。
8/20/2025 12:00:00 AM

医疗AI安全革命:全球首个医疗动态红队测试框架DAS,破解临床落地信任危机

作者 | 论文团队编辑 | ScienceAI近年来,以大型语言模型(LLMs)为代表的人工智能技术正以前所未有的速度发展,并在医疗健康领域展现出巨大的潜力。 从辅助疾病诊断到优化临床决策,LLMs 似乎正为我们描绘一幅智慧医疗的宏伟蓝图。 Med-Gemini 以及最新的 OpenAI 模型在各类医学资格考试中取得的优异成绩,更是点燃了人们对于其近期临床应用的热情。
8/19/2025 4:28:00 PM
ScienceAI