数据

中科大ICLR2025：特定领域仅用5%训练数据，知识准确率提升14%

让大语言模型更懂特定领域知识，有新招了！来自中国科学技术大学MIRA实验室的王杰教授团队提出了提出了一个创新的框架——知识图谱驱动的监督微调（KG-SFT），该框架通过引入知识图谱（KG）来提升大语言模型（LLMs）在特定领域的知识理解和处理能力。实验结果表明，其在多个领域和多种语言的数据集上取得了显著的效果，成功入选ICLR 2025。

4/8/2025 9:00:00 AM

量子位

CVPR满分论文 | 英伟达开源双目深度估计大模型FoundationStereo

本文介绍了 FoundationStereo，一种用于立体深度估计的基础模型，旨在实现强大的零样本泛化能力。通过构建大规模（100 万立体图像对）合成训练数据集，结合自动自筛选流程去除模糊样本，并设计了网络架构组件（如侧调谐特征主干和远程上下文推理）来增强可扩展性和准确性。这些创新显著提升了模型在不同领域的鲁棒性和精度，为零样本立体深度估计设立了新标准。

4/7/2025 9:45:00 AM

机器之心

DeepSeek前脚发新论文，奥特曼立马跟上：GPT-5就在几个月后啊

有点意思。这不DeepSeek前脚刚刚上新了一篇关于推理时Scaling Law的论文嘛，引得大家纷纷联想是不是R2马上要来了。然鹅……奥特曼这边却发了一条“变卦”的消息：计划改变：我们可能在几周之后先发布o3和o4-mini。

4/7/2025 8:15:00 AM

量子位

Claude 3.5首战复现21%顶会论文，人类博士无法取代！OpenAI：AI全是草台班子

AI智能体，能否复现顶会中重磅的AI研究？今天，OpenAI团队发布了全新框架PaperBench，便可评估AI智能体复现顶尖研究的基础能力。论文地址：，AI智能体需从0开始复现20篇ICML 2024 Spotlight和Oral论文，包括理解论文核心文献、开发可运行代码库，以及执行实验并验证结果。

4/4/2025 12:00:00 AM

新智元

预测精度达93%，个人电脑可部署，科学家开发Transformer新方法预测结合蛋白

编辑丨&结合蛋白通过与特定分子（如 DNA、RNA 或肽）选择性相互作用来调节各种细胞过程，它们能以高特异性识别和结合靶分子，这使得它们在信号传导、转运和酶活性功能上有着至关重要的地位。当前，用于鉴定蛋白质结合肽的传统方法效率低下且性价比极低，而基于序列的方法因过于狭隘地关注近端序列特征而忽略了结构数据，导致没有一种良好的方式进行结合蛋白预测。阿富汗呼罗珊大学（Khurasan University）领导了一项研究，推出一款名为 Deep-ProBind 的强大预测模型，旨在通过整合序列和结构信息对蛋白质结合位点进行分类。

4/2/2025 2:06:00 PM

ScienceAI

让机器人在人群中穿梭自如，港科广&港科大突破社交导航盲区 | ICRA 2025

机器人落地复杂场景，社交导航能力一定是避不开的关键一点。先简单介绍下，社交导航 (SocialNav，Social navigation) 是指在人机共存的环境中，机器人在遵循社会规范的前提下执行导航任务。就拿下图来说，机器人需导航至目标点，而目标恰好位于两名行人未来轨迹的交汇区域。

4/2/2025 9:50:00 AM

量子位

孙正义豪掷1万亿，机器人帝国崛起！总额远超星际之门，劳动力末日翻盘

报道称，在「星际之门」放血5000亿后，软银又拿着1万亿砸向机器人！孙正义将在美国各地创建配备AI工厂的工业园区，用人形机器人助力制造业解决劳动力短缺难题。机器人军团领衔，AI工厂重定义制造业在软银的宏伟蓝图中，AI工厂成为核心。

4/2/2025 9:15:00 AM

新智元

OpenAI重新开源！第一弹就推理模型，还不限制商用，“冲着DeepSeek来的” 关注前沿科技量子位 2025年04月01日 08:38

一夜之间，OpenAI更新三大动向，开源、融资、用户暴增。第一，将开源一个具备推理能力的大语言模型，包含参数权重那种。上一次这样开源还是6年前推出GPT-2。

4/2/2025 8:40:00 AM

量子位

OCR技术选型：数据提取哪家强？

数据是企业运营的核心资产之一。然而，超过 85% 的商业信息以非结构化数据的形式存在，如电子邮件、报告、发票和合同等，这给计算机处理带来了极大挑战。为解决这一问题，光学字符识别（OCR）技术（Mistral OCR：文档处理领域的革新者）应运而生。

4/2/2025 4:00:00 AM

大模型之路

奥赛级AI基准来了：难倒所有模型，GPT-4o仅考34分，上海交大出品

为了进一步挑战AI系统，大家已经开始研究一些最困难的竞赛中的问题，特别是国际奥林匹克竞赛和算法挑战。但目前尚无奥林匹克级别的、多学科的基准，能够全面评估综合解决问题的能力，以全面检验人工智能的综合认知能力。上海交通大学生成式人工智能实验室 (GAIR Lab) 的研究团队推出多学科认知推理基准OlympicArena，即使是GPT-4o 也只达到了 34.01% 的整体准确率，而其他开源模型的整体准确率也难以达到20%。

4/1/2025 9:25:00 AM

量子位

从0编写基因组！史上最大生物学模型Evo-2全面开源：硅基生命能创造细胞？

生命的一切表现，基本都可以从DNA编码中找到答案。基因组（Genome）包含了生物体所有基因以及非编码的DNA序列，承载了生物体发育、生长、繁殖和适应环境所需的全部遗传信息，近年来基因组相关的测序、合成和编辑工具已经彻底改变了生物学研究。然而，基因组的复杂性是巨大的，即使是最简单的微生物，也包含数百万个DNA碱基对，要智能地构建新的生物系统，研究人员还需要深入理解基因组编码的复杂信息。

3/31/2025 9:30:00 AM

新智元

AI Agent来，传统BI危

在互联网时代，数据已成为企业发展的必经之路。从电商平台的用户行为记录，到工业传感器的实时监测，数据渗透在商业活动的每个环节，成为驱动决策的基础资源。然而数据的价值并不在于简单的堆砌，未经梳理与解读的原始数据如同散落的拼图碎片，既无法呈现完整图景，也难以支撑业务判断。

3/31/2025 8:35:00 AM

量子位

3D版DeepSeek卷起开源月：两大基础模型率先SOTA！又是VAST

3D生成版DeepSeek再上新高度！国产、易用、性能强且开源——新模型一露面就刷新SOTA，并且第一时间加入开源全家桶。顺时针转个圈圈给大家看，效果是这样：加上“皮肤”是这样：再来一个，效果是这样：肉眼可见，这次妥妥升级变成了更细节的细节控～以上效果，都来自3D大模型明星初创公司VAST，其刚刚上新的两个基础模型，TripoSG和TripoSF，为团队的最新研发成果。

3/31/2025 8:25:00 AM

量子位

7B模型搞定AI视频通话，阿里最新开源炸场，看听说写全模态打通，开发者企业免费商用

深夜重磅！阿里发布并开源首个端到端全模态大模型——通义千问Qwen2.5-Omni-7B，来了。仅靠一个一体式模型，就能搞定文本、音频、图像、视频全模态，并实时生成文本和自然语音。

3/27/2025 1:23:39 PM

量子位

统一细粒度感知！北大&阿里提出UFO：无需SAM，16个token让MLLM实现精准分割

本文作者来自北京大学和阿里通义万相实验室。其中论文第一作者是汤昊，北京大学 2022 级博士生，目前主要关注统一的多模态任务建模算法。指导教授是王立威老师，北京大学智能学院教授，曾获 NeurIPS 2024 最佳论文奖、ICLR 2023 杰出论文奖及 ICLR 2024 杰出论文提名奖。

3/25/2025 10:13:26 AM

机器之心

DeepSeek-V3深夜惊爆上新！代码数学飙升剑指GPT-5，一台Mac可跑

昨晚，DeepSeek-V3悄然升级！新模型版本为DeepSeek-V3-0324，参数量为6850亿，相较上个版本参数增幅不大（6710亿）。从发布时间和技术特点来看，DeepSeek-V3-0324，很可能是DeepSeek-R2的基础架构。

3/25/2025 9:03:00 AM

新智元

每天2小时成绩逆袭全美前2%！AI助教让学生不再内卷

每天只用2小时就能搞定繁重的学习任务，剩下时间开发自己的兴趣项目，考试成绩还提高了。这样的学校你愿意尝试吗？据福克斯新闻报道，德克萨斯州一家名为Alpha School的私立学校在引入AI「助教」后，学生的考试成绩蹭蹭上涨，提高到了全美国的前2%。

3/24/2025 9:12:00 AM

新智元

Idea撞车何恺明「分形生成模型」！速度领先10倍，性能更强

前不久，大神何恺明刚刚放出新作「分形生成模型」，递归调用原子生成模块，构建了新型的生成模型，形成了自相似的分形架构，将GenAI模型的模块化层次提升到全新的高度。论文地址：地址：，澳大利亚国立大学的研究人员提出了一个全新的图像生成模型ARINAR，在思想上与分形生成模型不谋而合，但是在性能和速度上都显著提升，base模型的FID从11.8提升到2.75，生成时间从2分钟降低到12秒！ ARINAR不仅超越了之前的扩散模型，与目前表现最好的自回归模型MAR相比，ARINAR生成质量相当，速度是MAR的5倍。

3/24/2025 9:08:00 AM

新智元

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool GGUF 是什么？一文看懂大模型里最火的模型格式 AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 Sora、可灵、即梦哪家强？AI视频软件深度测评！免注册免费用！17种AI绘图模型一站式体验平台LMArena 可灵、即梦、海螺、Vidu哪家强？4大AI视频神器深度测评深度拆解！这可能是全网最详细的AI视频创作教程 LangChain V1.0 深度解析：手把手带你跑通全新智能体架构

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI绘画大模型机器人数据 AI新词 Midjourney 开源 Meta 微软智能用户 GPT 学习技术智能体 Gemini 马斯克 Anthropic 英伟达图像 AI创作训练 LLM 论文代码算法苹果 AI for Science Agent Claude 腾讯芯片 Stable Diffusion 蛋白质具身智能开发者 xAI 生成式神经网络机器学习人形机器人 3D AI视频 RAG 大语言模型研究百度 Sora 生成 GPU 工具华为字节跳动计算 AGI 大型语言模型 AI设计搜索生成式AI 视频生成 DeepMind 特斯拉场景 AI模型深度学习亚马逊架构 Transformer MCP 编程视觉预测

数据