资讯列表
不再靠「猜坐标」!颜水成团队等联合发布PaDT多模态大模型:实现真正的多模态表征输出
近年来,多模态大语言模型(Multimodal Large Language Models, MLLMs)在图文理解、视觉问答等任务上取得了令人瞩目的进展。 然而,当面对需要精细空间感知的任务 —— 比如目标检测、实例分割或指代表达理解时,现有模型却常常「力不从心」。 其根本原因在于:当前主流 MLLMs 仍依赖将视觉目标「翻译」成文本坐标(如 [x1, y1, x2, y2] )的方式进行输出。
10/16/2025 10:17:00 AM
机器之心
国内首个标准化领域大模型"同道"上线:破解标准检索与应用难题
中国电子技术标准化研究院开发的标准化领域专用大模型"同道"互联网版于10月14日正式上线。 这是国内首个面向标准化工作的垂直领域大模型产品,旨在解决长期困扰行业的标准检索困难、文档撰写效率低和应用场景薄弱等问题。 标准化工作一直面临实际操作层面的挑战。
10/16/2025 10:12:48 AM
AI在线
Scality 推出20多种关键工具的 AI 认证,助力企业加速 AI 应用开发
在人工智能(AI)迅猛发展的今天,数据的安全性和应用的高效性变得尤为重要。 近日,全球领先的网络弹性存储软件公司 Scality 宣布,其全面的 AI 生态认证计划进一步升级,目前已覆盖20多种行业内最关键的 AI 和机器学习(ML)工具及框架。 图源备注:图片由AI生成,图片授权服务商Midjourney这一认证项目建立在 Scality 的网络弹性存储架构上,旨在确保工具之间的互操作性,并在整个 AI 生命周期中保护数据的完整性和安全性。
10/16/2025 10:12:42 AM
AI在线
Anthropic 未来三年或将迎来收入狂飙,2026年年化收入可能高达260亿美元!
根据近期消息,人工智能公司 Anthropic 预计到 2026 年,其年化收入可能达到惊人的 260 亿美元。 这一数字反映了该公司在 AI 领域的快速增长与广泛应用潜力。 更令人振奋的是,Anthropic 有望在 2025 年底前实现 90 亿美元的年化收入,这意味着它在接下来的几年里将呈现出迅猛的增长势头。
10/16/2025 10:12:42 AM
AI在线
DeepMind 携手耶鲁大学发布 C2S-Scale27B 模型:AI 发现癌症治疗新途径
谷歌 DeepMind 近日与耶鲁大学合作,推出了一款名为 C2S-Scale27B 的全新人工智能模型。 该模型基于开放的 Gemma 模型系列构建,专注于复杂的单细胞分析,并成功发现了一条此前未知的癌症治疗途径。 C2S-Scale27B 的主要发现是识别出药物 Silmitasertib (CX-4945) 是一种“条件增强剂”。
10/16/2025 10:12:05 AM
AI在线
AI 驱动的“数字孪生”解放工作效率:初创公司 Viven 获3500万美元种子轮融资,解决员工“不在场”痛点
内部沟通和信息协调是项目推进的常态,然而,当掌握关键信息的员工因休假或时区差异而无法及时回复时,项目进度往往被迫停滞,造成高昂的时间成本。 人工智能招聘初创公司 Eightfold 的联合创始人 Ashutosh Garg 和 Varun Kacholia 认为,利用先进的 大型语言模型 (LLM) 和 数据隐私技术 可以解决这一难题。 两人于今年早些时候创立了 Viven。
10/16/2025 10:12:01 AM
AI在线
Meta 投资 15 亿美元在德州建设 AI 数据中心,水资源回收率将达 200%
Meta 公司近日宣布将在美国德克萨斯州埃尔帕索新建一座投资高达15亿美元的人工智能优化数据中心。 这将是 Meta 在全球的第29座数据中心,同时也是该州的第三座,旨在满足不断增长的人工智能应用需求。 新数据中心的设计容量可扩展至1吉瓦(GW),其电力供应足以支撑像旧金山这样规模城市的一天用电需求。
10/16/2025 10:11:59 AM
AI在线
中国标准化迎来“AI 专家”!国内首个标准大模型“同道”互联网版上线,告别“人找标准”!
据中新网报道,中国国内首个标准大模型——“同道”迎来重要升级,互联网版正式上线。 此举标志着中国的标准化工作正式迈入由人工智能驱动的新阶段,预示着一场以提高效率、精度和协同性为目标的深刻变革正在标准领域展开。 长期以来,标准化工作者面临着“检索难、撰写慢、应用弱”的现实困境,在海量标准文本中难以精准、高效地定位信息。
10/16/2025 10:11:58 AM
AI在线
AMD再攀高峰!与甲骨文合作部署5万块AI芯片,全面发力AI市场
在全球 AI 芯片市场竞争愈演愈烈的背景下,AMD(超威半导体)宣布与云服务巨头甲骨文(Oracle)达成重要合作。 近日,双方联合发布声明,透露甲骨文计划从2026年第三季度起,在其数据中心部署多达5万块 AMD 最新的 Instinct MI450芯片。 此次合作标志着 AMD 在 AI 领域的进一步扩张,并有望提升其与竞争对手英伟达的竞争力。
10/16/2025 10:11:58 AM
AI在线
苹果 M5芯片重磅发布:AI 性能实现“四倍飞跃”,加速终端侧智能体验
苹果公司推出了全新的 M5芯片,旨在大幅提升 MacBook Pro、iPad Pro 和 Apple Vision Pro 等设备的 AI 功能。 这款芯片采用第三代 3纳米制造工艺,性能指标全面升级,尤其在人工智能任务中实现了跨越式发展。 M5芯片在 AI 任务中的 GPU 性能提升了四倍以上,为复杂的终端侧人工智能应用奠定了基础。
10/16/2025 10:11:55 AM
AI在线
全球首个真实物理环境多任务基准 RoboChallenge 发布
近日,一项名为 RoboChallenge 的基准测试平台正式发布,旨在为机器人领域提供首个大规模、多任务且在真实物理环境中由真实机器人执行操作任务的评估标准。 RoboChallenge 由 Dexmal 原力灵机联合 Hugging Face 共同发起。 该测试平台的核心价值在于克服了现有机器人基准测试在真实环境下的性能验证、标准化测试条件和公开可访问测试平台等方面的挑战。
10/16/2025 10:11:55 AM
AI在线
紧急应对Sora 2,谷歌推出Veo 3.1版本:一手实测
刚刚,谷歌Veo 3进行了更新,最新版本Veo 3.1,可以在这里体验,fast模式每次生成耗费20积分,相比sora 2 看起来贵很多,sora 2到目前为止都是无限制生成,完全免费我第一时间就做了一个Veo 3.1和sora 2的初步对比测试,测试下来,Veo 3.1审美以及提示词遵循能力还是不如sora 2,不过好处是,Veo 3.1支持上传人像进行创作,sora 2 目前图生视频不支持人像废话不多说,看玩法:上手测试1.图生视频:nanobanana Veo 3.1先用nanobanana生成一个超高清小姐姐提示词:复制进入:,提示词:展示穿搭。
10/16/2025 9:37:11 AM
迈向可信AI Agent:Jeddak AgentArmor意图对齐与约束遵循方案
构建可信AI Agent:智能体行为偏离的深层危机在人工智能技术快速演进的背景下,AI Agent 已经成为复杂任务的执行主体与人机协作的关键接口。 当关键任务被委托给 Agent,我们需要的不是一次性的“准点执行”,而是贯穿输入、推理与行动全流程的“意图理解与约束遵循”能力。 近期的安全事件表明,意图误解与约束失守可以在零交互或间接注入条件下触发严重风险:有报告显示电商平台智能购物助手在用户提出 “帮我买200元以下的衣服” 请求时,因对颜色、尺码、促销等动态因素的意图理解偏差,错误估算商品价格,导致实际支付价格超过用户预算,可能造成用户经济损失,反映出意图误判与约束失守的潜在风险。
10/16/2025 9:23:48 AM
字节安全研究团队
AI挖出癌症潜在新疗法!谷歌耶鲁联手突破免疫系统冷肿瘤难题
靠AI挖出了癌症潜在新疗法,AI医疗领域再添猛将。 谷歌、耶鲁联手,给攻克冷肿瘤找到了新方法。 他们推出Cell2Sentence-Scale 27B大模型,目标是寻找能在特定免疫情境环境中增强免疫信号的药物,突破了癌症免疫疗法中冷肿瘤难以被免疫系统察觉的难题。
10/16/2025 9:11:23 AM
大模型降本增效,稀疏注意力机制的魔力在哪?
就在上个月,DeepSeek正式发布了实验性模型DeepSeek-V3.2-Exp,该模型在长文本处理与推理效率上实现了突破。 这一提升主要源于其架构中引入了名为DeepSeek Sparse Attention(DSA)的稀疏注意力机制。 这篇文章我们就来聊聊,什么是稀疏注意力机制?稀疏注意力机制是通过限制注意力范围,减少需要计算的注意力权重数量,从而降低计算复杂度。
10/16/2025 9:00:00 AM
Yu
AI玩拼图游戏暴涨视觉理解力,告别文本中心训练,无需标注的多模态大模型后训练范式
在多模态大模型的后训练浪潮中,强化学习驱动的范式已成为提升模型推理与通用能力的关键方向。 然而,大多数现有方法仍以文本为中心,视觉部分常被动地作为辅助信号输入。 相比之下,我们认为在后训练阶段重新审视视觉自监督学习的潜力,设计以视觉为中心的后训练对于增强多模态大模型对于视觉信息本身的细粒度深入理解也同样至关重要。
10/16/2025 9:00:00 AM
「重要性采样」并不「重要」?快手清华ASPO攻克重要性采样权重错配
从ChatGPT到DeepSeek,强化学习(Reinforcement Learning, RL)已成为大语言模型(LLM)后训练的关键一环。 然而,随着模型参数规模的不断扩大,一个长期被忽视的问题正悄然成为性能瓶颈:重要性采样真的「重要」吗? 近期,由快手与清华合作的研究团队发现,现有的结果监督强化学习范式存在一种深层次的权重错配现象,它不仅让模型「过度自信」,甚至可能导致熵坍缩与训练早熟收敛。
10/16/2025 8:55:00 AM
王兴兴硕士论文惊现GitHub,宇树雏形那时候就有了
人火了是连毕业论文都要被翻出来的(doge)。 这不,宇树科技CEO王兴兴的硕士毕业论文就被网友们掘地三尺找到了。 (不在知网,而是在GitHub上找到的。
10/16/2025 8:46:00 AM