AI在线 AI在线

数据

用梯度下降求解整数规划,中科大等提出无监督训练整数规划求解器新范式 | ICLR 2025 Spotlight

无监督学习训练整数规划求解器的新范式来了。 中国科学技术大学王杰教授团队(MIRA Lab)提出了一种全新的整数规划求解方法——DiffILO(Differentiable Integer Linear Programming Optimization),相关论文已被人工智能顶级国际会议ICLR 2025接收为Spotlight。 结果显示:与现有主流的监督学习方法对比,DiffILO不仅显著加快训练速度,还能生成更高质量的可行解。
4/10/2025 9:15:03 AM
量子位

首个统一多模态模型评测标准,DeepSeek Janus理解能力领跑开源,但和闭源还有差距

统一多模态大模型(U-MLLMs)逐渐成为研究热点,近期GPT-4o,Gemini-2.0-flash都展现出了非凡的理解和生成能力,而且还能实现跨模态输入输出,比如图像 文本输入,生成图像或文本。 相比传统的多模态模型(比如 GPT-4V 或 DALL·E 3),这类模型在任务适应性和灵活性上更具优势。 然而,当前研究领域还存在几个突出的问题:1.
4/10/2025 9:15:00 AM
量子位

论文党狂喜!alphaXiv推出Deep Research一秒搜遍arXiv,研究效率直接爆表

刚刚,alphaXiv 推出了新功能「Deep Research for arXiv」,该功能可协助研究人员更高效地在 arXiv 平台上进行学术论文的检索与阅读,显著提升文献检索及研究效率。 体验链接:,当用户输入「Can you help me do a lit review for self-supervised learning. with relevant applications?」时,系统迅速生成了一篇内容完整、结构清晰的文献综述,并提供了 arXiv 链接。
4/9/2025 12:48:13 PM
机器之心

三个LLM顶一个OpenAI?2亿条性能记录加持,路由n个「小」模型逆袭

当前大模型研究面临三大困境:算力垄断(顶尖成果集中于大厂)、成本壁垒(单次训练成本高,可能需要数千GPU小时)以及技术路径单一化(过度依赖单一模型的规模扩展)。 为突破这些限制,路由LLM(Routing LLM)范式应运而生——通过智能调度实现多个开源小模型的协同增效,以「组合创新」替代「规模竞赛」。 代码:: : level的MoE(Mixture-of-Experts),传统MoE通过在模型内部扩展专家网络(如稀疏激活的FFN层)提升性能,而路由LLM将完整LLM视为独立「专家」,通过预训练Router动态分配任务输入。
4/9/2025 9:00:00 AM
新智元

2025 CSRankings排名出炉!上交大、清华北大、浙大霸榜全球AI TOP 10

就在刚刚,2025 CSRankings全球计算机科学排名发布! 地址:,CMU再次霸榜,UIUC曾连续多年稳坐全球第二,如今跌至第6。 中国高校/机构继续包揽多个席位,其中清华排名第2,上交大/浙大并列第3,北大第5。
4/8/2025 9:42:00 AM
新智元

首个个性化对齐大模型问世!可精准识别用户内在动机和偏好,还有百万用户画像开源数据集 | 蚂蚁&人大

如何让大模型更懂「人」? 虽然现有大模型经过了人类价值观对齐训练,但其对齐效果往往会让少数群体的声音被系统性淹没。 那随之而来的问题是,当大模型服务全球用户,标准化对齐范式是否正在制造新的数字鸿沟?
4/8/2025 9:12:00 AM
量子位

中科大ICLR2025:特定领域仅用5%训练数据,知识准确率提升14%

让大语言模型更懂特定领域知识,有新招了! 来自中国科学技术大学MIRA实验室的王杰教授团队提出了提出了一个创新的框架——知识图谱驱动的监督微调(KG-SFT),该框架通过引入知识图谱(KG)来提升大语言模型(LLMs)在特定领域的知识理解和处理能力。 实验结果表明,其在多个领域和多种语言的数据集上取得了显著的效果,成功入选ICLR 2025。
4/8/2025 9:00:00 AM
量子位

CVPR满分论文 | 英伟达开源双目深度估计大模型FoundationStereo

本文介绍了 FoundationStereo,一种用于立体深度估计的基础模型,旨在实现强大的零样本泛化能力。 通过构建大规模(100 万立体图像对)合成训练数据集,结合自动自筛选流程去除模糊样本,并设计了网络架构组件(如侧调谐特征主干和远程上下文推理)来增强可扩展性和准确性。 这些创新显著提升了模型在不同领域的鲁棒性和精度,为零样本立体深度估计设立了新标准。
4/7/2025 9:45:00 AM
机器之心

DeepSeek前脚发新论文,奥特曼立马跟上:GPT-5就在几个月后啊

有点意思。 这不DeepSeek前脚刚刚上新了一篇关于推理时Scaling Law的论文嘛,引得大家纷纷联想是不是R2马上要来了。 然鹅……奥特曼这边却发了一条“变卦”的消息:计划改变:我们可能在几周之后先发布o3和o4-mini。
4/7/2025 8:15:00 AM
量子位

Claude 3.5首战复现21%顶会论文,人类博士无法取代!OpenAI:AI全是草台班子

AI智能体,能否复现顶会中重磅的AI研究? 今天,OpenAI团队发布了全新框架PaperBench,便可评估AI智能体复现顶尖研究的基础能力。 论文地址:,AI智能体需从0开始复现20篇ICML 2024 Spotlight和Oral论文,包括理解论文核心文献、开发可运行代码库,以及执行实验并验证结果。
4/4/2025 12:00:00 AM
新智元

预测精度达93%,个人电脑可部署,科学家开发Transformer新方法预测结合蛋白

编辑丨&结合蛋白通过与特定分子(如 DNA、RNA 或肽)选择性相互作用来调节各种细胞过程,它们能以高特异性识别和结合靶分子,这使得它们在信号传导、转运和酶活性功能上有着至关重要的地位。 当前,用于鉴定蛋白质结合肽的传统方法效率低下且性价比极低,而基于序列的方法因过于狭隘地关注近端序列特征而忽略了结构数据,导致没有一种良好的方式进行结合蛋白预测。 阿富汗呼罗珊大学(Khurasan University)领导了一项研究,推出一款名为 Deep-ProBind 的强大预测模型,旨在通过整合序列和结构信息对蛋白质结合位点进行分类。
4/2/2025 2:06:00 PM
ScienceAI

让机器人在人群中穿梭自如,港科广&港科大突破社交导航盲区 | ICRA 2025

机器人落地复杂场景,社交导航能力一定是避不开的关键一点。 先简单介绍下,社交导航 (SocialNav,Social navigation) 是指在人机共存的环境中,机器人在遵循社会规范的前提下执行导航任务。 就拿下图来说,机器人需导航至目标点,而目标恰好位于两名行人未来轨迹的交汇区域。
4/2/2025 9:50:00 AM
量子位

孙正义豪掷1万亿,机器人帝国崛起!总额远超星际之门,劳动力末日翻盘

报道称,在「星际之门」放血5000亿后,软银又拿着1万亿砸向机器人! 孙正义将在美国各地创建配备AI工厂的工业园区,用人形机器人助力制造业解决劳动力短缺难题。 机器人军团领衔,AI工厂重定义制造业在软银的宏伟蓝图中,AI工厂成为核心。
4/2/2025 9:15:00 AM
新智元

OpenAI重新开源!第一弹就推理模型,还不限制商用,“冲着DeepSeek来的” 关注前沿科技 量子位 2025年04月01日 08:38

一夜之间,OpenAI更新三大动向,开源、融资、用户暴增。 第一,将开源一个具备推理能力的大语言模型,包含参数权重那种。 上一次这样开源还是6年前推出GPT-2。
4/2/2025 8:40:00 AM
量子位

OCR技术选型:数据提取哪家强?

数据是企业运营的核心资产之一。 然而,超过 85% 的商业信息以非结构化数据的形式存在,如电子邮件、报告、发票和合同等,这给计算机处理带来了极大挑战。 为解决这一问题,光学字符识别(OCR)技术(Mistral OCR:文档处理领域的革新者)应运而生。
4/2/2025 4:00:00 AM
大模型之路

奥赛级AI基准来了:难倒所有模型,GPT-4o仅考34分,上海交大出品

为了进一步挑战AI系统,大家已经开始研究一些最困难的竞赛中的问题,特别是国际奥林匹克竞赛和算法挑战。 但目前尚无奥林匹克级别的、多学科的基准,能够全面评估综合解决问题的能力,以全面检验人工智能的综合认知能力。 上海交通大学生成式人工智能实验室 (GAIR Lab) 的研究团队推出多学科认知推理基准OlympicArena,即使是GPT-4o 也只达到了 34.01% 的整体准确率,而其他开源模型的整体准确率也难以达到20%。
4/1/2025 9:25:00 AM
量子位

从0编写基因组!史上最大生物学模型Evo-2全面开源:硅基生命能创造细胞?

生命的一切表现,基本都可以从DNA编码中找到答案。 基因组(Genome)包含了生物体所有基因以及非编码的DNA序列,承载了生物体发育、生长、繁殖和适应环境所需的全部遗传信息,近年来基因组相关的测序、合成和编辑工具已经彻底改变了生物学研究。 然而,基因组的复杂性是巨大的,即使是最简单的微生物,也包含数百万个DNA碱基对,要智能地构建新的生物系统,研究人员还需要深入理解基因组编码的复杂信息。
3/31/2025 9:30:00 AM
新智元

AI Agent来,传统BI危

在互联网时代,数据已成为企业发展的必经之路。 从电商平台的用户行为记录,到工业传感器的实时监测,数据渗透在商业活动的每个环节,成为驱动决策的基础资源。 然而数据的价值并不在于简单的堆砌,未经梳理与解读的原始数据如同散落的拼图碎片,既无法呈现完整图景,也难以支撑业务判断。
3/31/2025 8:35:00 AM
量子位