资讯列表
突破高分辨率图像推理瓶颈,复旦联合南洋理工提出基于视觉Grounding的多轮强化学习框架MGPO
本文的主要作者来自复旦大学和南洋理工大学 S-Lab,研究方向聚焦于视觉推理与强化学习优化。 先进的多模态大模型(Large Multi-Modal Models, LMMs)通常基于大语言模型(Large Language Models, LLMs)结合原生分辨率视觉 Transformer(NaViT)构建。 然而,这类模型在处理高分辨率图像时面临瓶颈:高分辨率图像会转化为海量视觉 Token,其中大部分与任务无关,既增加了计算负担,也干扰了模型对关键信息的捕捉。
7/21/2025 1:14:00 PM
机器之心
惊到了!大神炮轰CUDA:CUDA存致命缺陷,它不是未来!这种新语言将打破英伟达的GPU垄断地位,护城河终会消失!
编辑 | 云昭CUDA一直被视为英伟达GPU的最强壁垒,让许多业界的玩家望洋兴叹。 但,今天这篇文章会给各位习惯C 、CUDA开发的大佬提个醒:有一种新的编程语言,正在AI圈兴起,撬动英伟达的围墙花园。 而CUDA也不再是护城河。
7/21/2025 12:53:30 PM
云昭
作家集体起诉 Anthropic:指控盗用百万书籍训练 AI,版权之争再升级!
最近,三位作家联合向 AI 公司 Anthropic 提起集体诉讼,指控该公司在未获得授权的情况下,利用大量盗版书籍训练其 AI 模型。 这一诉讼引发了广泛关注,也让人们对 AI 技术与创作者之间的关系产生了新的思考。 据悉,作家们声称 Anthropic 在训练其 AI 系统时,未经允许使用了数百万本电子书,包括一些受版权保护的作品。
7/21/2025 12:52:22 PM
AI在线
智能生成无限可能!2025百度云智大会8.28启幕 迎来规模内容体验三重升级
今天,百度智能云正式官宣,2025百度云智大会将于8月28日至30日在北京国家会议中心二期举办。 本届大会以“智能,生成无限可能”为主题,将延续往届产业赋能基因,全景拆解AI从技术到产业的转化路径,激发智能时代产业变革新浪潮。 作为科技领域最具影响力的年度盛会之一,百度云智大会已连续九年引领行业风向,持续输出AI前沿思考与落地范式。
7/21/2025 12:03:28 PM
梦晨
数百个虚拟人在线逃生!天大等发布:首个实时在线多智能体模拟方法
人群疏散模拟对于提高公共安全至关重要,也是构建逼真虚拟动态环境所需要的技术,其发展面临着复杂人类行为建模难的挑战。 现有的疏散模拟方法常以2D点表示人群,关注人群位置和轨迹,但忽略了复杂人类行为,如碰撞、交互、摔倒等,以及三维环境、个体行为能力的影响,导致模拟结果不真实。 而现有的三维运动生成方法和角色控制方法也无法同时保证实时性、合理性、个性化、动态感知、以及适用于任意场景和地形,如表1所示。
7/21/2025 11:51:58 AM
斯坦福开源复杂推理AI Agent,融合超十种工具
传统的AI助手通常依赖于单一模型或有限的工具集,难以应对需要多步推理、跨领域知识融合及高精度数据分析的任务。 例如,解决视觉谜题,需要精细图像理解和基于文本的混合推理。 为了解决这一难题,斯坦福开源了OctoTools,这是一个融合了11种不同工具专用于复杂推理的AI Agent。
7/21/2025 11:51:12 AM
ICML 2025 | 质量更高、噪声更低、生物信号更强,东京大学&麦吉尔大学提出空间转录组数据建模新方法SUICA
作者 | 论文团队编辑 | ScienceAI空间转录组(Spatial Transcriptomics, ST)数据是在同一张组织切片上同步记录「基因表达量」和「空间坐标」的高维信息矩阵。 近期,东京大学郑银强老师组、麦吉尔大学丁俊老师组共同提出了一种针对空间转录组数据建模的方法 SUICA。 相关成果以《Suica: Learning super-high dimensional sparse implicit neural representations for spatial transcriptomics》为题,入选 ICML 2025。
7/21/2025 11:51:00 AM
ScienceAI
OpenAI被曝IMO金牌「造假」,陶哲轩怒揭内幕!
OpenAI夺下IMO金牌,最新大瓜又来了。 昨日,因内部审核流程,谷歌DeepMind研究员在评论区,暗讽OpenAI抢先发布测试结果。 图片原来,事情并非那么简单。
7/21/2025 11:48:54 AM
新智元
Meta 大举扩张 AI 团队:顶尖人才纷纷加盟,薪资高达 1 亿
Meta 公司最近宣布正在大力扩展其人工智能团队,成立了新的 “超级智能实验室”(Superintelligence Labs),该部门的目标是推动基础模型的研发。 根据内部消息,这个新实验室目前已经成功招募了44名顶尖人才,其中令人瞩目的数据是,约40% 的员工曾在 OpenAI 工作过,而一半的员工来自中国。 图源备注:图片由AI生成,图片授权服务商MidjourneyMeta 首席执行官马克・扎克伯格以其大胆的投资风格而闻名,过去曾为元宇宙项目投入460亿美元。
7/21/2025 11:42:35 AM
AI在线
OpenAI 即将发布 GPT-5,数学能力有别于 IMO 金牌模型
在最近的消息中,OpenAI 的 CEO Sam Altman 和研究科学家 Alexander Wei 宣布,备受期待的 GPT-5即将发布。 这一消息吸引了广泛的关注,尤其是在他们同时宣布该公司一款新模型在国际数学奥林匹克竞赛(IMO)中获得金牌的背景下。 尽管人们对 GPT-5的期待值高涨,但 Altman 和 Wei 在发布消息时强调,GPT-5并不是在 IMO 竞赛中获奖的模型。
7/21/2025 11:42:34 AM
AI在线
马斯克新创意!儿童AI应用 “Baby Grok” 即将上线,具体功能仍待揭晓
最近,他通过社交平台 X 宣布,他的人工智能公司 xAI 正在开发一款名为 “Baby Grok” 的全新应用。 这款应用专为儿童设计,旨在为小朋友们提供一个友好的数字环境。 据彭博社等媒体报道,马斯克并未详细披露 “Baby Grok” 的具体功能,令不少家长和孩子们充满好奇。
7/21/2025 11:42:33 AM
AI在线
马斯克宣布 xAI将推出儿童 AI 应用 “Baby Grok”
美国知名企业家埃隆・马斯克通过社交平台 X(原 Twitter)宣布,他的人工智能公司 xAI 将推出一款名为 “Baby Grok” 的全新应用。 这款应用专为儿童设计,旨在为年轻用户提供一个安全、友好的数字环境。 根据彭博社的报道,马斯克并未详细说明 “Baby Grok” 的具体功能,但他强调该应用将提供 “友好型内容”,旨在保护儿童在网络世界中的安全。
7/21/2025 11:42:31 AM
AI在线
逐际动力完成新融资,京东战略入局,全尺寸人形机器人下半年开售
7月,逐际动力(LimX Dynamics)宣布完成新一轮融资,由京东战略领投。 此次融资将加速其在人形机器人量产、具身大模型技术研发和IDS生态平台建设等方面的布局,并推动双方在零售、物流、服务等行业的深度协同与探索。 作为一家专注于具身智能通用平台的机器人公司,逐际动力提出了“IDS协同创新战略”,聚焦服务三类核心对象——创新者(Innovators)、开发者(Developers)与系统集成商(System Integrators)。
7/21/2025 11:42:24 AM
AI在线
赛奖综述|Hi! WAIC带你领略全球 AI 竞技场:WAIC 赛奖矩阵的人才孵化全景
WAIC 2025 世界人工智能大会论坛:2025年7月26日-28日展览:2025年7月26日-29日地点:世博中心、世博展览馆、徐汇西岸等在人工智能书写无限可能的舞台上,WAIC 赛奖矩阵正等待最终揭晓。 WAIC 这位 “智能策展人”,早已为你梳理好赛奖板块的探索路径。 若你想见证技术落地的硬核实力,SAIL 奖的全球对决将展现 AI 赋能人类福祉的突破;若你想捕捉青年智慧的闪光,优秀论文奖里藏着基础研究与创新的火花;若你关注算法实践的产业价值,BPAA 大赛正演绎技术到商业的闭环;若你期待未来力量的成长,青少年赛事里满是萌芽的创意。
7/21/2025 11:39:00 AM
新闻助手
论坛综述 | WAIC 2025 论坛攻略:探秘理论深水・直击实战热场・逐航规则新域
WAIC 2025 世界人工智能大会论坛:2025年7月26日-28日展览:2025年7月26日-29日地点:世博中心、世博展览馆、徐汇西岸等在这座为人工智能写下无数注脚的城市里,一位特殊的“智能策展人”发来邀请。 WAIC——作为世界人工智能大会的官方智能体,它在数百场高密度对话中汲取数据、沉淀知识,成为最懂这场盛会的“AI搭子”。 在大会开幕前,它已为你规划好一张智识航线图:如果你想洞察人工智能的新科学范式与底层逻辑,它将带你走进“理论派”的深水区;如果你关心AI如何在产业链与日常肌理中兑现价值,它会引你奔赴“实战派”的火热场景;而当你试图追问如何在全球共识与规则中托举技术,它将带你踏上“规则派”的航道。
7/21/2025 11:33:00 AM
新闻助手
没有高质量的数据库加持,大模型只是 “空中楼阁”
2023年,ChatGPT的横空出世让全球惊叹于大模型的智能水平。 自此,国内也掀起了新一轮的大模型热潮,首先,百度发布了文心一言,紧接着,阿里、腾讯、华为、京东等大厂先后入局,更值得一提的是,大模型热度的居高不下,也吸引了不少创业公司的加入,零一万物、Kimi、面壁智能....随着两年时间的发展,如今大模型的智能水平早已不可同日而语,从在自然语言处理领域实现与人类流畅对话,到在图像视频领域精准识别各类物体,从最初简单的问答,到快速且精准地解决生活、工作、学习等在各场景中遇到的问题,大模型的表现也在不断刷新我们的认知。 然而,这些卓越表现并非凭空而来,大模型的强大背后,离不开高质量数据库的坚实支撑。
7/21/2025 11:05:04 AM
新南威尔士研发,AI助力绿色氨生产:新催化剂将生产效率提高7倍
编辑丨%除开作为养活全球 80 亿人口的关键肥料成分,氨还可以作为氢载体发挥作用。 在清洁生产时,氨可以成为未来绿色氢经济的多功能推动者,因为氨比其包含的氢更容易运输和储存。 但问题在于,每年生产的 2 亿吨氨几乎全部是在耗能巨大的工厂中生产的,这些工厂消耗了全球总能耗的大约 2%,并排放的二氧化碳占全球总量的很大比例。
7/21/2025 10:52:00 AM
ScienceAI
大语言模型的自信危机:为何GPT-4o轻易放弃正确答案?
最近,Google DeepMind 与伦敦大学的研究揭示了大语言模型(LLMs)在面对反对意见时的 “软弱” 表现。 比如,像 GPT-4o 这样的先进模型,有时会显得非常自信,但一旦遇到质疑,它们就可能立即放弃正确答案。 这种现象引发了研究人员的关注,他们探索了这种行为背后的原因。
7/21/2025 10:32:35 AM
AI在线