AI在线 AI在线

资讯列表

AMD再攀高峰!与甲骨文合作部署5万块AI芯片,全面发力AI市场

在全球 AI 芯片市场竞争愈演愈烈的背景下,AMD(超威半导体)宣布与云服务巨头甲骨文(Oracle)达成重要合作。 近日,双方联合发布声明,透露甲骨文计划从2026年第三季度起,在其数据中心部署多达5万块 AMD 最新的 Instinct MI450芯片。 此次合作标志着 AMD 在 AI 领域的进一步扩张,并有望提升其与竞争对手英伟达的竞争力。
10/16/2025 10:11:58 AM
AI在线

全球首个真实物理环境多任务基准 RoboChallenge 发布

近日,一项名为 RoboChallenge 的基准测试平台正式发布,旨在为机器人领域提供首个大规模、多任务且在真实物理环境中由真实机器人执行操作任务的评估标准。 RoboChallenge 由 Dexmal 原力灵机联合 Hugging Face 共同发起。 该测试平台的核心价值在于克服了现有机器人基准测试在真实环境下的性能验证、标准化测试条件和公开可访问测试平台等方面的挑战。
10/16/2025 10:11:55 AM
AI在线

苹果 M5芯片重磅发布:AI 性能实现“四倍飞跃”,加速终端侧智能体验

苹果公司推出了全新的 M5芯片,旨在大幅提升 MacBook Pro、iPad Pro 和 Apple Vision Pro 等设备的 AI 功能。 这款芯片采用第三代 3纳米制造工艺,性能指标全面升级,尤其在人工智能任务中实现了跨越式发展。 M5芯片在 AI 任务中的 GPU 性能提升了四倍以上,为复杂的终端侧人工智能应用奠定了基础。
10/16/2025 10:11:55 AM
AI在线

紧急应对Sora 2,谷歌推出Veo 3.1版本:一手实测

刚刚,谷歌Veo 3进行了更新,最新版本Veo 3.1,可以在这里体验,fast模式每次生成耗费20积分,相比sora 2 看起来贵很多,sora 2到目前为止都是无限制生成,完全免费我第一时间就做了一个Veo 3.1和sora 2的初步对比测试,测试下来,Veo 3.1审美以及提示词遵循能力还是不如sora 2,不过好处是,Veo 3.1支持上传人像进行创作,sora 2 目前图生视频不支持人像废话不多说,看玩法:上手测试1.图生视频:nanobanana  Veo 3.1先用nanobanana生成一个超高清小姐姐提示词:复制进入:,提示词:展示穿搭。
10/16/2025 9:37:11 AM

迈向可信AI Agent:Jeddak AgentArmor意图对齐与约束遵循方案

构建可信AI Agent:智能体行为偏离的深层危机在人工智能技术快速演进的背景下,AI Agent 已经成为复杂任务的执行主体与人机协作的关键接口。 当关键任务被委托给 Agent,我们需要的不是一次性的“准点执行”,而是贯穿输入、推理与行动全流程的“意图理解与约束遵循”能力。 近期的安全事件表明,意图误解与约束失守可以在零交互或间接注入条件下触发严重风险:有报告显示电商平台智能购物助手在用户提出 “帮我买200元以下的衣服” 请求时,因对颜色、尺码、促销等动态因素的意图理解偏差,错误估算商品价格,导致实际支付价格超过用户预算,可能造成用户经济损失,反映出意图误判与约束失守的潜在风险。
10/16/2025 9:23:48 AM
字节安全研究团队

AI挖出癌症潜在新疗法!谷歌耶鲁联手突破免疫系统冷肿瘤难题

靠AI挖出了癌症潜在新疗法,AI医疗领域再添猛将。 谷歌、耶鲁联手,给攻克冷肿瘤找到了新方法。 他们推出Cell2Sentence-Scale 27B大模型,目标是寻找能在特定免疫情境环境中增强免疫信号的药物,突破了癌症免疫疗法中冷肿瘤难以被免疫系统察觉的难题。
10/16/2025 9:11:23 AM

AI玩拼图游戏暴涨视觉理解力,告别文本中心训练,无需标注的多模态大模型后训练范式

在多模态大模型的后训练浪潮中,强化学习驱动的范式已成为提升模型推理与通用能力的关键方向。 然而,大多数现有方法仍以文本为中心,视觉部分常被动地作为辅助信号输入。 相比之下,我们认为在后训练阶段重新审视视觉自监督学习的潜力,设计以视觉为中心的后训练对于增强多模态大模型对于视觉信息本身的细粒度深入理解也同样至关重要。
10/16/2025 9:00:00 AM

大模型降本增效,稀疏注意力机制的魔力在哪?

就在上个月,DeepSeek正式发布了实验性模型DeepSeek-V3.2-Exp,该模型在长文本处理与推理效率上实现了突破。 这一提升主要源于其架构中引入了名为DeepSeek Sparse Attention(DSA)的稀疏注意力机制。 这篇文章我们就来聊聊,什么是稀疏注意力机制?稀疏注意力机制是通过限制注意力范围,减少需要计算的注意力权重数量,从而降低计算复杂度。
10/16/2025 9:00:00 AM
Yu

「重要性采样」并不「重要」?快手清华ASPO攻克重要性采样权重错配

从ChatGPT到DeepSeek,强化学习(Reinforcement Learning, RL)已成为大语言模型(LLM)后训练的关键一环。 然而,随着模型参数规模的不断扩大,一个长期被忽视的问题正悄然成为性能瓶颈:重要性采样真的「重要」吗? 近期,由快手与清华合作的研究团队发现,现有的结果监督强化学习范式存在一种深层次的权重错配现象,它不仅让模型「过度自信」,甚至可能导致熵坍缩与训练早熟收敛。
10/16/2025 8:55:00 AM

王兴兴硕士论文惊现GitHub,宇树雏形那时候就有了

人火了是连毕业论文都要被翻出来的(doge)。 这不,宇树科技CEO王兴兴的硕士毕业论文就被网友们掘地三尺找到了。 (不在知网,而是在GitHub上找到的。
10/16/2025 8:46:00 AM

20.3次工具调用的秘密:InfoAgent如何让信息检索真正"懂你"

大家好,我是肆〇柒。 今天一起看看由东南大学、布朗大学与微软研究院联合推出的最新研究成果——InfoAgent。 这项工作直指当前深度研究智能体领域的核心痛点,通过创新的数据合成管道和自托管搜索工具,成功让14B参数的模型在复杂研究任务上超越72B参数的竞品。
10/16/2025 8:35:41 AM
四零柒

波士顿动力狗gogo回来了!“五条腿”协同发力

机器狗搬轮胎,“五只腿”齐发力! 在波士顿动力人工智能研究所的最新方法——结合采样与学习的动态全身操作中,波士顿动力的机器狗Spot最快仅用3.7秒就能搬起轮胎。 搬运的轮胎重达15公斤,相当于Spot自身重量的一半(32.7千克),并远超其最大臂力。
10/16/2025 8:26:15 AM

AI辅助编程的生产力悖论与破解之道

译者 | 核子可乐审校 | 重楼AI正成为加速代码生成的有力推手,帮助开发者以前所未有的效率产出更多成果,为超高生产力、缩短开发周期、快速发布功能开启新的可能。 但不少工程团队也注意到由此带来的趋势:尽管单个开发者的代码生成速度更快,但项目的整体交付时间并未缩短。 这并非错觉,METR最新研究发现,AI编程助手反而令资深开发者的生产力降低了19%。
10/16/2025 8:00:00 AM
核子可乐

合成数据:它是什么以及如何使用它

在现代数据科学和机器学习的领域中,数据是开发预测模型和进行精确分析的基础资源。 然而,真实的数据集并非总是可访问、完整或可用的。 数据稀缺、固有偏见或隐私限制等问题常常导致获取高质量数据变得困难。
10/16/2025 5:00:00 AM
晓晓

AI智能体正在悄悄改变你的工作方式,90%的人还没意识到

从ChatGPT的爆火到各类AI工具和Agent的涌现,我们正站在一个临界点:AI不再只是聊天工具,而是进化成能够独立思考和行动的数字员工。  在这个临界点之上,90%的人还没意识到:AI智能体正在悄悄改变你的工作方式! 很多人把大模型比作AI的大脑,这个比喻很形象,但不够完整。
10/16/2025 4:00:00 AM
大数据AI智能圈

实测,Claude Code 配合国内大模型,一样很牛x(完整配置教程)

差别确实是有的,因为 AI Agent 的能力取决于大模型 和 Agent 终端工程化两方面的能力,这两个工具之所以厉害,除了模型外,优秀的 Agent 终端工程能力也占了一半功劳。 所以,换了其他终端后,如果终端能力不行,依然没办法发挥优势。 还有个问题,那就是 Droid 依然是国外的产品。
10/16/2025 3:22:00 AM
风筝

智能体时代CEO的六大战略:从人机协作到优势重构的领导力议程

根据你交谈的对象或阅读的内容,智能体(基于GenAI基础模型构建的系统,能够在实际世界中行动并执行多步骤流程)要么将带来生产力的乌托邦;要么将取代大量劳动力,要么将导致机器人统治世界,要么将赋予每个人超能力;要么以上情况全部出现。 为了应对这一不确定的未来,企业高管需要抛开情绪化的讨论。 承诺随处可见,但批判性思维却十分匮乏。
10/16/2025 3:00:00 AM
Barr Seitz