资讯列表

分类

标签

供应链中的代理人工智能应用是物流的未来

联合利华的人工智能系统通过分析天气数据来调整冰淇淋销售预测、优化库存并减少浪费。人工智能冰箱的数据已使某些地区的零售订单和销售额增长高达 30%。这些人工智能工具在瑞典等市场将预测准确率提高了 10%，从而能够更灵活地应对不断变化的天气模式。

10/20/2025 9:48:35 AM 晓晓

LLM的“记忆”与“推理”该分家了吗？一种全新的训练范式，彻底厘清思考流程

在医疗诊断中，模型误将“罕见病症状”与“常见病混淆”；在金融分析里，因记错政策条款给出错误投资建议——大语言模型（LLMs）的这些“失误”，本质上源于一个核心症结：记忆知识与逻辑推理的过程被死死绑定在黑箱中。当模型的思考既需要调用事实性知识，又要进行多步逻辑推导时，两种能力的相互干扰往往导致答案失真或决策失据。罗格斯大学、俄亥俄州立大学等团队发表于2025 ACL的研究《Disentangling Memory and Reasoning Ability in Large Language Models》，为破解这一难题提供了全新思路。

10/20/2025 9:33:49 AM Goldma

全球第一！百度0.9B参数大模型碾压传统OCR！

最近有个感觉特别强烈：AI正在从"识别文字"悄然进化成"理解文档"。当我看到百度飞桨团队刚刚发布的PaddleOCR-VL在全球权威评测中以92.6分位列第一时，第一反应是——这个0.9B的"小家伙"，怎么就把那些动辄几十亿参数的巨无霸给比下去了？说实话，刚开始我也有点半信半疑。

10/20/2025 9:30:34 AM 阿丸笔记

开源对机器人的价值，远超大模型时代的想象丨唐文斌深度对谈抱抱脸创始人

“很多模型在模拟器里完美运行，但一到现实就彻底失灵。 ”在最新一次线上对谈中，Dexmal联合创始人唐文斌与Hugging Face联合创始人Thomas Wolf指出了当前机器人研究的最大痛点。唐文斌是旷视科技联合创始人兼CTO，原力灵机（Dexmal）CEO、清华大学“姚班”出身、首届“Yao Award”金牌得主。

10/20/2025 9:30:15 AM

OpenAI以为GPT-5搞出了数学大新闻，结果…哈萨比斯都觉得尴尬

太尴尬了。就在周末，GPT-5又双叒带来了数学方面的新突破，一道难题被宣称解决…然鹅……很快就被发现是OpenAI的“营销过度”，小题大作，根本算不上什么突破。友商大咖们也都不装了。

10/20/2025 9:22:56 AM

一文看懂使用HuggingFace的完整拼图

无论你开发怎样的AI应用，如何依托成熟的开源技术栈进行应用构建都是一个关键的路径。本文通过解析从环境配置到服务部署的完整链路，基于HuggingFace的生态系统，结合对话系统、内容生成等典型场景案例，为开发者提供可复用实施参考。 1.

10/20/2025 9:20:06 AM 曹洪伟

「死亡互联网理论」刷屏硅谷！Reddit创始人预警，奥特曼公开发声

当互联网被AI内容淹没，真正由人类创作的内容正在日益缩减。「如今的互联网，大部分已经死了」，近日Reddit联合创始人Alexis Ohanian一语惊人。 Reddit联合创始人Alexis Ohanian他口中的「互联网死亡」并不是指互联网被关闭了，而是被铺天盖地的AI生成内容所淹没，失去了真实的生命力。

10/20/2025 9:15:00 AM

扎克伯格急了！Meta内部文件曝光：宁用竞品，也要废掉祖传系统

九位数年薪抢人、数百亿美元押注、部署从「小时级」压到「分钟级」。在Meta，时间就是唯一敌人。据报道，Meta的「超级智能实验室」（Meta Superintelligence Lab， MSL）正在发起一场深度内部革命，旨在引导团队转向更快的工程工具，全面加速AI的开发进程。

10/20/2025 9:14:00 AM

GPT-5破解世纪难题，竟是上网抄来的！哈萨比斯：太尴尬了

OpenAI团队狂吹了一波GPT-5，结果竟是闹剧一场......事情是这样的。几天前，OpenAI科学家Sebastien Bubeck激动转发，两位研究员联手GPT-5 Pro，仅用了一个周末，破解了10个「百年悬案」——埃尔德什难题（Erdos problems）紧接着，OpenAI科学副总裁Kevin Weil等人纷纷加入，大肆宣传。然而，真相很快浮出水面：这十道难题，早就被学界解决，并非由GPT-5独立解决，它只是通过检索网络文献给出了答案。

10/20/2025 9:13:00 AM

浙大推出首个「多图应用题」基准GSM8K-V，全面评估 VLM数学推理能力

「小明买了3个苹果，每个5元，他付了20元，应该找回多少钱？」这是典型的小学数学应用题。但在日常生活中，我们更常遇到的是它的视觉版本：看到货架上的苹果标价牌，数出购物篮里的苹果数量，估算总价，再从收银员手中接过找零，快速判断对不对。

10/20/2025 9:12:00 AM

英伟达4段简短提示词，IOI夺金！开源模型也能征服最难编程竞赛

IOI（国际信息学奥林匹克）是全球中学生算法编程竞赛的最高殿堂，每年只有不到10%选手能拿到金牌。比赛要求选手在两天内各5小时独立解决3道高难度算法题，全程断网、不能借助外部资料，每题最多允许50次提交尝试。要拿金牌，既要有过硬的算法思维，又得策略得当、在有限提交内调优代码。

10/20/2025 9:10:00 AM

超越纯视觉模型！不改VLM标准架构，实现像素级深度预测

在当前多模态AI发展浪潮中，视觉语言模型（Vision Language Models, VLMs）因其能通过「看图文字交互」处理多样任务而备受关注。然而，尽管在语义理解、视觉问答、图像指令等任务上表现优异，它们在从 2D 图像理解 3D 空间结构方面仍显薄弱。相比之下，纯视觉模型（pure vision models）在绝对深度估计（metric depth estimation）等三维理解任务上，凭借专门设计的网络结构与损失函数，早已达到了超越人类的精度。

10/20/2025 9:09:00 AM

5万美元筛选「超级婴儿」, 智商提升15点？马斯克被曝是客户！

马斯克，这个誓言要将人类文明送上火星的男人，正在地球上进行一场更私密、也更具争议的实验——「优化」自己的孩子。据《华盛顿邮报》披露，他至少有一名子女使用了胚胎多基因筛查服务。这项技术，正被硅谷的VC和创业者们包装成通往「超级婴儿」的金色门票，吸引着富豪们斥巨资入场。

10/20/2025 9:08:00 AM

无需再训练即可增强性能！港大团队提出GPC框架，实现机器人「策略组合」

本文一作曹嘉航，香港大学在读博士生，前北京人形机器人创新中心实习生；共同一作黄翊泽，上海交通大学在读本科生；通讯导师 Andrew F. Luo，香港大学助理教授。在机器人学习领域，提升基于生成式模型的控制策略（Policy）的性能通常意味着投入巨额成本进行额外的数据采集和模型训练，这极大地限制了机器人能力的快速迭代与升级。

10/20/2025 9:07:00 AM

长上下文窗口、Agent崛起，RAG已死？

在技术飞速更新迭代的今天，每隔一段时间就会出现「XX 已死」的论调。「搜索已死」、「Prompt 已死」的余音未散，如今矛头又直指 RAG。向量数据库 Chroma 创始人兼 CEO Jeff Huber 在播客与访谈中抛出「RAG 已死，上下文工程当立」的表述，主张以上下文工程框架取代对「RAG」这一术语的狭义依赖。

10/20/2025 9:06:00 AM

Meta用40万个GPU小时做了一个实验，只为弄清强化学习Scaling Law

在 LLM 领域，扩大强化学习算力规模正在成为一个关键的研究范式。但要想弄清楚 RL 的 Scaling Law 具体是什么样子，还有几个关键问题悬而未决：如何 scale？ scale 什么是有价值的？

10/20/2025 9:05:00 AM

教多模态大模型学会“反思”和“复盘”，上交&上海AI Lab重磅发布MM-HELIX&AHPO，破解多模态复杂推理难题

多模态大模型表现越来越惊艳，但人们也时常困于它的“耿直”。无论是生成代码、分析图表还是回答问题，诸多多模态大模型（MLLM）都倾向于给出一个“一步到位”的答案。它们就像一个从不检查作业的“学霸”，虽然知识渊博，但一旦在复杂的、需要反复试错的问题上走错一步，就很难回头。

10/20/2025 9:02:00 AM

让模型“看视频写网页”，GPT-5仅得36.35分！上海AI Lab联合发布首个video2code基准

多模态大模型在根据静态截图生成网页代码（Image-to-Code）方面已展现出不俗能力，这让许多人对AI自动化前端开发充满期待。然而，一个网页的真正价值远不止于其静态布局。用户的点击、筛选、表单提交，乃至游戏中的每一步操作，都构成了其核心的交互功能。

10/20/2025 9:01:00 AM

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ OmniParser V2 在 Windows 系统上的详细安装与运行指南

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉

资讯列表

供应链中的代理人工智能应用是物流的未来

LLM的“记忆”与“推理”该分家了吗？一种全新的训练范式，彻底厘清思考流程

全球第一！百度0.9B参数大模型碾压传统OCR！

开源对机器人的价值，远超大模型时代的想象丨唐文斌深度对谈抱抱脸创始人

OpenAI以为GPT-5搞出了数学大新闻，结果…哈萨比斯都觉得尴尬

一文看懂使用HuggingFace的完整拼图

「死亡互联网理论」刷屏硅谷！Reddit创始人预警，奥特曼公开发声

扎克伯格急了！Meta内部文件曝光：宁用竞品，也要废掉祖传系统

GPT-5破解世纪难题，竟是上网抄来的！哈萨比斯：太尴尬了

浙大推出首个「多图应用题」基准GSM8K-V，全面评估 VLM数学推理能力

英伟达4段简短提示词，IOI夺金！开源模型也能征服最难编程竞赛

超越纯视觉模型！不改VLM标准架构，实现像素级深度预测

5万美元筛选「超级婴儿」, 智商提升15点？马斯克被曝是客户！

无需再训练即可增强性能！港大团队提出GPC框架，实现机器人「策略组合」

长上下文窗口、Agent崛起，RAG已死？

Meta用40万个GPU小时做了一个实验，只为弄清强化学习Scaling Law

教多模态大模型学会“反思”和“复盘”，上交&amp;上海AI Lab重磅发布MM-HELIX&amp;AHPO，破解多模态复杂推理难题

让模型“看视频写网页”，GPT-5仅得36.35分！上海AI Lab联合发布首个video2code基准

教多模态大模型学会“反思”和“复盘”，上交&上海AI Lab重磅发布MM-HELIX&AHPO，破解多模态复杂推理难题