资讯列表
CVPR2025 | 五大榜单夺冠!MonSter:单目+双目融合引领深度估计新纪元
一眼概览:MonSter是一种创新性的双分支立体匹配方法,首次将单目深度估计与双目立体匹配协同优化,在多个主流数据集上取得全面领先的性能。 核心问题:传统立体匹配在遮挡、纹理缺失、重复结构和远距离区域表现不佳,难以恢复精确深度。 该研究核心在于:如何利用单目深度的结构先验弥补双目匹配在病态区域中的信息缺失,同时消除单目深度的尺度漂移误差。
5/13/2025 4:57:18 PM
萍哥学AI
火山引擎发布豆包 1.5・视觉深度思考模型,新增 GUI Agent 能力
火山引擎发布豆包1.5视觉深度思考模型,支持动态帧率采样和视频深度思考能力,在60个评测基准中38个达到SOTA。新增GUI Agent能力,可自动化检测App功能。#人工智能##火山引擎#
5/13/2025 3:48:13 PM
远洋
火山引擎发布豆包视频生成模型 Seedance 1.0 lite:影视级质量、速度大幅提升
火山引擎在FORCE LINK AI创新巡展上海站发布Seedance 1.0 lite视频生成模型,支持文生视频和图生视频,具备影视级画质和快速生成能力,适用于电商广告、娱乐特效等多个领域。#AI视频生成##火山引擎#
5/13/2025 3:35:00 PM
远洋
支付巨头被打脸!曾放话AI能顶700名人类客服,年省4千万刀;一年后又把员工招回来了!CEO公开认错:我们部署AI的方式太极端了
编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)第一批因为AI裁员的公司,又把员工请回来了! 曾信誓旦旦宣布“一个 AI 顶 700 个客服”的 Klarna,如今不得不亲自“打脸”。 图片这家全球领先的“先买后付”平台(类似于国内的“蚂蚁花呗”),在 2024 年接入 OpenAI 技术后,便风风火火地All in AI:暂停招聘、削减成本,甚至计划用 AI 逐步取代多达数千名的外包客服。
5/13/2025 3:17:07 PM
伊风
一句指令,无限宇宙!Matrix-Game硬核上线,秒杀SOTA
黑客帝国中的「矩阵」,已照进现实。 指尖轻点,一个细节满满、物理规则完美运转的虚拟世界就此诞生。 这个曾经只在科幻大片出现的场景,如今「空间智能」就帮人类实现了。
5/13/2025 3:16:48 PM
新智元
突破大模型推理瓶颈!首篇「Test-Time Scaling」全景综述,深入剖析AI深思之道
本文由来自香港城市大学、麦吉尔大学(McGill)、蒙特利尔人工智能实验室(MILA)、人大高瓴人工智能学院、Salesforce AI Research、斯坦福大学、UCSB、香港中文大学等机构的多位研究者共同完成。 第一作者为来自香港城市大学的博士生张启源和来自蒙特利尔人工智能实验室(MILA)的博士生吕福源。 当训练成本飙升、数据枯竭,如何继续激发大模型潜能?
5/13/2025 3:13:28 PM
机器之心
AI 横扫医学问答,赢麻了?牛津大学团队实锤 AI 临床短板
原本以为,大模型考过了医学考试,离成为“AI医生”也就差临门一脚。 没想到,牛津大学最新这项研究,却狠狠给了一记当头棒喝。 图片论文地址:“AI诊断准确率高达99%!
5/13/2025 3:10:50 PM
文摘菌
OpenAI 发布 HealthBench:评估大型语言模型在医疗领域表现的新标准
近日,OpenAI 发布了一款名为 HealthBench 的开源评估框架,旨在测量大型语言模型(LLMs)在真实医疗场景中的表现和安全性。 此框架的开发得到了来自60个国家和26个医学专业的262名医生的支持,旨在弥补现有评估标准的不足,特别是在真实应用、专家验证和诊断覆盖方面。 现有的医疗 AI 评估标准通常依赖于狭窄、结构化的形式,如多项选择考试。
5/13/2025 3:00:52 PM
AI在线
AI秘密曝光:Claude系统提示词泄露引发行业热议
近日,AI 领域再度掀起波澜,焦点集中在由 Anthropic 公司开发的强大语言模型 Claude 上。 令人惊讶的是,一份长达25000个 Token 的提示词(System Prompt)意外泄露,内容详尽,超出行业的常规认知。 这一事件迅速引发技术圈的热烈讨论,既揭示了顶尖 AI 系统的复杂性,也将透明度、安全性及知识产权等关键议题推向前台。
5/13/2025 3:00:52 PM
AI在线
百型智能推出AI外贸员Zoe:国内首个外贸行业专用智能助手
据36氪消息,百型智能近日宣布推出国内首个外贸行业垂类Agent——AI外贸员Zoe。 这款专为外贸行业设计的智能助手能够显著提升外贸企业的客户开发效率。 据了解,Zoe具备强大的任务分解能力,可根据企业设定的目标自动拆解工作流程,并独立完成外贸开发拓客的全链路操作。
5/13/2025 3:00:52 PM
AI在线
教育部划清AI使用边界:小学到高中分阶段引导,禁止复制AI答案
教育部于5月12日正式发布《中小学人工智能通识教育指南(2025年版)》和《中小学生成式人工智能使用指南(2025年版)》(简称《使用指南》),旨在科学规范推进人工智能全学段教育。 《使用指南》明确规定,禁止学生直接复制人工智能生成内容作为作业或考试答案,并限制在创造性任务中滥用人工智能。 此举意在从源头上杜绝"代劳式"使用行为,防止学生过度依赖AI而弱化独立思考能力。
5/13/2025 3:00:30 PM
AI在线
苹果发布 FastVLM 视觉语言模型,为新型智能眼镜等穿戴设备铺路
技术文档显示,FastVLM 在保持精度的前提下,实现了高分辨率图像处理的近实时响应,同时所需的计算量比同类模型要少得多。
5/13/2025 2:48:39 PM
问舟
SDS 技术首次用于音频:英伟达携手 MIT 推 Audio-SDS,参数化控制 AI 音效生成
SDS 技术广泛应用于文本生成 3D 图像和图像编辑中,英伟达融合该技术推出 Audio-SDS,结合预训练模型的生成先验知识,能够直接根据高级文本提示调整 FM 合成参数、冲击音模拟器或分离掩码,将信号处理的清晰可解释性与现代扩散模型的灵活性融为一体。
5/13/2025 2:15:09 PM
故渊
文生图进入R1时代:港中文MMLab发布T2I-R1,让AI绘画“先推理再下笔”
“先推理、再作答”,语言大模型的Thinking模式,现在已经被拓展到了图片领域。 近日,港中文MMLab团队发布了第一个基于强化学习的推理增强文生图模型:T2I-R1。 大家都知道,OpenAI o1和DeepSeek-R1这类的大语言模型(LLMs),已经在解数学题和写代码这些需要“动脑筋”的事情上面展现出了较高的水平。
5/13/2025 1:54:41 PM
量子位
全球闲置算力训个模型,性能媲美R1,老黄天塌了!Karpathy曾投资它
一夜之间,老黄天塌了(doge)。 全球首个分布式RL训练模型INTELLECT-2发布,它仅通过整合全球闲置或分散的计算资源,就完成了模型的强化学习训练,训练成本大大降低。 其模型性能与DeepSeek-R1媲美!
5/13/2025 1:51:20 PM
AI无限生成《我的世界》,玩家动动键盘鼠标自主控制!国产交互式世界模型来了
用AI无限扩展《我的世界》,动动鼠标、键盘即可搞定! 一直前进、砍掉树木,后面别有洞天的世界,都是由用户与环境交互、AI实时生成的。 也就是说,在砍掉树木之前,树后面的内容还是不存在的。
5/13/2025 1:50:00 PM
OpenAI 高管:AI 未来可自主生成知识,商业与科研迎来革命
Pachocki强调,AI通过无监督预训练和强化学习(RLHF)构建“世界模型”,并将其转化为实用助手。他还预测,到本世纪末,AI将在自主研究领域取得重大进展,甚至可能在今年内实现近乎自主的软件开发。
5/13/2025 1:46:00 PM
故渊
苹果携手复旦大学推 StreamBridge 端侧视频大语言模型框架,AI 可实时响应视频流
苹果公司联合复旦大学,推出 StreamBridge 端侧视频大语言模型(Video-LLMs)框架,助力 AI 理解直播流视频。
5/13/2025 1:33:18 PM
故渊