AI在线 AI在线

资讯列表

为今年最火的机器人来场全球挑战赛:150万高额奖金,还有顶级硬件支持

ATEC2025 科技精英赛是由 ATEC 前沿科技探索社区主办,清华大学、浙江大学、西安交通大学、上海交通大学发起。 本届赛事由香港中文大学、北京大学、北京师范大学顶尖学府联合蚂蚁集团共同承办的全球性智能科技竞技盛会。 本届赛事聚焦人工智能与机器人技术融合创新,设置软件算法与硬件设计双赛道,通过线上线下联动模式,推动具身智能技术在养老援助、灾害救援等现实场景的突破性应用。
4/3/2025 2:04:00 PM
机器之心

OpenAI的AI复现论文新基准,Claude拿了第一名

近年来,AI 正从科研辅助工具蜕变为创新引擎:从 DeepMind 破解蛋白质折叠难题的 AlphaFold,到 GPT 系列模型展现文献综述与数学推理能力,人工智能正逐步突破人类认知边界。 今年 3 月 12 日,Sakana AI 宣布他们推出的 AI Scientist-v2 通过了 ICLR 会议一个研讨会的同行评审过程。 这是 AI 科学家写出的首篇通过同行评审的科研论文!
4/3/2025 1:59:00 PM
机器之心

ICLR 2025 Spotlight | 参数高效微调新范式!上海交大联合上海AI Lab推出参数冗余微调算法

本文作者来自复旦大学、上海交通大学和上海人工智能实验室。 一作江书洋为复旦大学和实验室联培的博二学生,目前是实验室见习研究员,师从上海交通大学人工智能学院王钰教授。 本文通讯作者为王钰教授与张娅教授。
4/3/2025 1:54:00 PM
机器之心

谷歌 DeepMind 闭关修炼《我的世界》:自学成才挖钻石,成果登 Nature

谷歌 DeepMind 研发的 DreamerV3 实现重大突破:无需任何人类数据,通过强化学习与「世界模型」,自主完成《我的世界》中极具挑战的钻石收集任务。该成果被视为通往 AGI 的一大步,并已登上 Nature。
4/3/2025 1:42:19 PM
汪淼

人类赢了!OpenAI深夜开源全新Agent评测基准!AI大战顶尖人类,上演机器学习届“神仙打架”;R1排第三,Claude夺冠

编辑 | 李美涵出品 | 51CTO技术栈(微信号:blog51cto)深夜,OpenAI再次发力Agent领域,开源了一个全新的AI Agent评测基准—— PaperBench。 这是一个用于评估 AI 智能体复现最前沿 AI 研究能力的基准测试。 智能体需从零开始复现 20 篇 ICML 2024 Spotlight 和 Oral 论文,包括理解论文贡献、构建代码库并成功执行实验。
4/3/2025 1:35:49 PM
李美涵

Dify+大模型:重构企业基因的“数智引擎”——解锁AI工业化落地新范式

当AI开发进入“流水线时代”2025年,全球企业AI应用开发呈现“冰火两重天”:一边是OpenAI、DeepSeek等大模型参数突破百万亿级,另一边却是78%的企业困在“PPT智能”阶段——AI应用开发周期长、场景碎片化、数据孤岛难破。 Dify与大模型的结合,正在打破这一僵局。 它不仅是工具,更是企业AI能力工业化的流水线,让大模型从“技术狂欢”走向“价值落地”。
4/3/2025 1:07:50 PM
推推君

终于坐不住了!Midjourney V7全新版本亮出王牌!

最近AI圈可太热闹了。 随着什么都会的GPT-4o横空出世,大家都忙着让它画画去了。 我前几天刷朋友圈,十条有八条都在晒GPT-4o画的吉卜力风,剩下两条还在求画教程….
4/3/2025 12:38:44 PM
彭彭

让AI替码农卷复杂任务,贾佳亚团队提出MoTCoder,准确率刷新SOTA

论文一作李靖瑶,香港中文大学博士生(DV Lab),师从贾佳亚教授。 主要研究方向是大语言模型,包括模型预训练、后训练、推理优化。 作者陈鹏光、夏彬等均为 DV Lab 成员。
4/3/2025 11:16:10 AM
机器之心

视觉SSL终于追上了CLIP!Yann LeCun、谢赛宁等新作,逆转VQA任务固有认知

在视觉问题解答(VQA)等多模态环境中,当前视觉自监督学习(SSL)的表现还比不上语言图像预训练(CLIP)。 这种差距通常归因于语言监督引入的语义,尽管视觉 SSL 模型和 CLIP 模型通常在不同的数据上进行训练。 在最近的一项研究中,Yann LeCun、谢赛宁等研究者探讨了一个基本问题: 语言监督对于多模态建模的视觉表征预训练是否必要?
4/3/2025 11:11:50 AM
机器之心

为什么AI需要向量数据库?

大模型火遍全球,DeepSeek、OpenAI、谷歌、百度、抖音等科技巨头争相发布自家产品。 多数人会想当然认为,大模型越大越强大,参数量越多就越聪明。  现实呢?
4/3/2025 11:04:40 AM

10倍吞吐提升无损性能:多模态适用的KV cache量化策略来了,即插即用无需改原模型

在InternVL-2.5上实现10倍吞吐量提升,模型性能几乎无损失。 最新1-bit多模态大模型KV cache量化方案CalibQuant来了。 通过结合后缩放和校准方法,可显著降低显存与计算成本,无需改动原模型即可直接使用。
4/3/2025 10:29:06 AM
量子位

OpenAI官方基准测试:承认Claude遥遥领先(狗头)

OpenAI承认Claude是最好的了(狗头)。 刚刚开源的新基准测试PaperBench,6款前沿大模型驱动智能体PK复现AI顶会论文,新版Claude-3.5-Sonnet显著超越o1/r1排名第一。 与去年10月OpenAI考验Agent机器学习代码工程能力MLE-Bnch相比,PaperBench更考验综合能力,不再是只执行单一任务。
4/3/2025 10:21:32 AM
量子位

视觉Token无缝对齐LLMs词表!V²Flow:基于LLMs实现高保真自回归图像生成

视觉Token可以与LLMs词表无缝对齐了! V²Flow,基于LLMs可以实现高保真自回归图像生成。 随着ChatGPT掀起自回归建模革命后,近年来研究者们开始探索自回归建模在视觉生成任务的应用,将视觉和文本数据统一在“next-token prediction”框架下。
4/3/2025 10:17:23 AM

动态场景,开放文本查询!清华哈佛联合建模4D语言场 | CVPR 2025

构建支持开放词汇查询的语言场在机器人导航、3D场景编辑和交互式虚拟环境等众多应用领域展现出巨大的潜力。 尽管现有方法在静态语义场重建方面已取得显著成果,但如何建模4D语言场(4D language fields)以实现动态场景中时间敏感且开放式的语言查询,仍面临诸多挑战,动态世界的语义建模对于推动许多实际应用的落地至关重要。 近日,来自清华大学、哈佛大学等机构的研究团队提出了一种创新方法4D LangSplat,基于动态三维高斯泼溅技术,成功重建了动态语义场,能够高效且精准地完成动态场景下的开放文本查询任务。
4/3/2025 10:12:30 AM
新智元

DeepMind核心论文禁发6个月,Transformer级研究锁死!CEO:不满意就走人

DeepMind研究成果,已被按下暂停键。 FT爆料称,由Demis Hassabis领导的谷歌AI部门,正对研究论文发布实施更严格的审查机制。 总结来说,有这么几种论文不发:会被竞争对手利用的创新成果让Gemini模型相形见绌的研究而那些涉及到GenAI的「战略性研究」,更是有着长达6个月「禁发期」。
4/3/2025 10:03:29 AM
新智元

75年后,图灵测试终被GPT-4.5破解!73%人类被骗过,彻底输给AI

什么? AI竟然通过了标准的三方图灵测试,而且还是拿出了实打实证据的那种! 来自加州大学圣迭戈分校的研究人员系统评估了4个AI系统,证明大语言模型(LLM)通过了图灵测试。
4/3/2025 10:00:52 AM
新智元

企业级AI“脱虚向实”,落地还有几道槛?

从ChatGPT横空出世,到越来越智能化的人形机器人,再到让世人惊艳的Sora文生视频……种种迹象表明,人工智能逐渐迎来产业化的临界点。 当全球科技巨头们将AI的边界推向星辰大海时,绝大多数企业仍在经历着AI落地的“高原反应”。 某制造业CIO的办公桌上,堆积着三份不同供应商的AI解决方案,却始终无法解答他“如何让AI看懂三十年陈旧的ERP数据”的灵魂拷问。
4/3/2025 10:00:00 AM
科技云报到

稚晖君刚挖来的90后机器人大牛:逆袭履历堪比爽文男主

刚刚,稚晖君旗下创企智元机器人官宣了两个新动向——一则是关于人事变动。 具身智能领域的国际领军学者罗剑岚博士,已于近日加盟并出任首席科学家。 罗剑岚在该领域已深耕10年,曾担任Google X、Google DeepMind研究科学家,是UC伯克利17万引大佬Sergey Levine团队的核心成员。
4/3/2025 9:37:23 AM
量子位