资讯列表
比Qwen3-Max更Max?夸克抢先用上最新闭源模型
最强搜索「牵手」最强模型,能碰撞出什么火花? Qwen 最新闭源模型,让夸克先用上了。 10 月 23 日,一向不爱出风头的夸克上线了对话助手,可以让用户在一个 App 内即可完成信息查找、问题解答与任务处理,实现了 AI 搜索与对话的深度融合。
携手中国邮政,九识包揽全球最大RoboVan集采全部席位
一则中标公告,近期掀起自动驾驶行业热议。 近日,中国邮政速递物流股份有限公司公布2025年无人车租赁集中采购项目结果,值得关注的是,全球RoboVan第一品牌九识智能(Zelos)包揽该项目全部标段,并在第1、2、6、7四个标段中以绝对优势确定为主供应商,成为中国邮政无人运力核心合作伙伴。 中国邮政位列2024年世界500强排行榜第83位、世界邮政第1位,是中国快递物流产业布局中唯一的央企和”关键少数“,进一步细看其的招标公告,会发现此次招标采购的无人车不仅采购范围广,覆盖全国。
从课程高分到人生进阶,为何Andrej Karpathy两年前的一份「本科生实用」学习指南再次引起热议?
近日,AI 学者 Andrej Karpathy(安德烈・卡帕斯)激烈抨击智能体、强化学习的言论在网上甚嚣尘上,也使得他的过往言论引起大家的好奇。 这不,他几年前写的一份「学习指南」就被网友找出,并引起热烈讨论,不过不是关于智能体,也不是对强化学习的吐槽,而是给那些想要在本科课程中取得好成绩的年轻学生的建议。 在这份学习指南中,Andrej 表示,自己多年来一直经受各种考试的「检验」,且成绩还不错,所以他想将那些对自己很有帮助的经验法则传授给大家。
NeurIPS 2025 Spotlight | 让检索、推理真正「合体」的小而强模型,AceSearcher来了
如何让一个并不巨大的开源大模型,在面对需要多步检索与复杂逻辑整合的问题时,依然像 “冷静的研究员” 那样先拆解、再查证、后归纳,最后给出可核实的结论? 近期,来自埃默里大学,佐治亚理工大学,罗格斯大学,纽约州立大学奥尔巴尼分校,得克萨斯大学西南医学中心的研究团队发布 AceSearcher 模型,一个让同一语言模型在推理时兼任 “问题分解者(Decomposer)” 与 “答案求解者(Solver)” 的合作式自博弈框架:它以两阶段训练(SFT→RFT)为骨架,把 “会拆题、会找料、会整合” 的完整能力链拧成了一根绳。 更重要的是,这不是单纯的 “又一个新模型”,而是一个更优的框架:它把公开的推理数据集引入到检索增强的训练流程中,让模型真正学会如何把推理与检索结合起来,显著提升了复杂检索任务的效果。
均值至上假繁荣!北大新作专挑难题,逼出AI模型真本事
当强化学习(RL)成为大模型后训练的核心工具,「带可验证奖励的强化学习(RLVR)」凭借客观的二元反馈(如解题对错),迅速成为提升推理能力的主流范式。 从数学解题到代码生成,RLVR本应推动模型突破「已知答案采样」的局限,真正掌握深度推理逻辑——但现实是,以GRPO为代表的主流方法正陷入「均值优化陷阱」。 这些基于均值的优化策略,过度聚焦高概率输出序列,却忽略了「低概率但高信息密度」的推理路径:模型训练早期就会出现熵坍缩,过早丧失探索能力;面对全错的难题时,优势函数直接归零,模型在薄弱环节完全无法学习。
红色警报:OpenAI的Atlas浏览器,是捅向谷歌万亿心脏的匕首吗?
浏览器「第三次世界大战」打响! OpenAI向谷歌扔下一个AI核弹,谁能掌握未来互联网之门的钥匙? 一觉醒来,变天了!
李开复:美国在AI硬件赛道已败给中国!中国AI算力将是美国十倍!警告AI速度失控:先上车再修路,将酿成重大事故!
编辑 | 云昭在旧金山TED AI大会上,创新工场董事长、AI科学家李开复通过视频连线发表演讲,罕见地直言:“在AI硬件和机器人制造方面,美国正在被中国超越。 ”李表示,这一点也不夸张。 在AI硬件与机器人赛道,中国的领先正在成为事实。
AI数据中心公司Crusoe完成13. 8 亿美元股权融资,估值突破 100 亿美元
人工智能(AI)数据中心公司Crusoe周四宣布,已通过一轮股权融资成功筹集13. 8 亿美元,公司估值一举突破 100 亿美元大关。 此轮融资的成功,凸显了投资者对AI基础设施市场爆炸性增长的巨大信心。
一图胜千言被实现了!DeepSeek-OCR用图片压缩文本,10倍压缩率
DeepSeek开源了DeepSeek-OCR,用1张图片的信息,还原10页书的文字,10倍的压缩率,可以做到几乎不丢失信息。 视觉编码器走了不少弯路大型语言模型记性不好,或者说,能记住的东西太有限。 你给它一篇长长的文章,它的计算量呈二次方往上飙。
斯坦福与Adobe新研究,模仿蒸馏技术轻松让200亿参数图像生成高质量大模型
高质量图像生成又加速了! 斯坦福大学和 Adobe 研究院联手,用 pi-Flow(基于策略的流模型)技术,让 200 亿参数的文本到图像大模型,在 4 步之内就生成了媲美教师模型的高质量、高多样性图片。 让图像生成模型少走几步所有玩过 AI 绘画的人都有一个共同的体验,未蒸馏的原版大模型,点击生成,看着进度条一点点爬升,从一个模糊的噪声,慢慢变得清晰。
AI在线强化学习“边做边学”,斯坦福团队让7B小模型性能飙升,甚至超越GPT-4o
允中 发自 凹非寺. 量子位 | 公众号 QbitAI斯坦福等新框架,用在线强化学习让智能体系统“以小搏大”,领先GPT-4o——. AgentFlow,是一种能够在线优化智能体系统的新范式,可以持续提升智能体系统对于复杂问题的推理能力。
干家务一小时挣1000元,具身智能时代人类新岗位
西风 发自 凹非寺. 量子位 | 公众号 QbitAI注意看,眼前这个男人暂且叫他小帅。 你可能想不到,他只是在厨房里优雅地煎牛排做做家务,每小时最高能赚进1000多块(150美元)。
AI时代,开发者不能再当 i 人了,「云计算代言人」敬告
开发者不能再内向了:要会和客户同事说,会和 AI 说。 「我想说的很明确:现在我们有了更多学习新技术的机会,但最有意思的是,很多技巧并非技术。 我坚信,未来最成功的开发者,必须拥有强大的沟通能力。
八年后,Meta教会了Transformer「显式思考」
最近的 Meta 可谓大动作不断,一边疯狂裁人,一边又高强度产出论文。 10 月 20 日,他们又上线了一篇新论文《The Free Transformer》,作者只有一位,日内瓦大学教授、Meta 研究科学家 François Fleuret。 有意思的是,François 所在的 FAIR 是 Meta 近日裁员最严重的部门之一。
腾讯发布SpecExit算法,无损压缩端到端加速2.5倍!解决大模型长思考效率难题
以 DeepSeek-R1 等为代表的推理模型(Large Reasoning Models, LRMs),通过生成更长的思维链,在各类复杂任务中取得了更优的表现。 但长思维链是推理模型的 “双刃剑”,虽能提升性能,但 “过度思考” 带来的语义冗余会大幅推高推理成本。 为破解大模型长思维链的效率难题,并且为了更好的端到端加速落地,我们将思考早停与投机采样无缝融合,提出了 SpecExit 方法,利用轻量级草稿模型预测 “退出信号”,在避免额外探测开销的同时将思维链长度缩短 66%,vLLM 上推理端到端加速 2.5 倍。
夸克AI眼镜开售,88VIP叠加9折消费券,超低价格仅需3329元
10月24日零点,阿里巴巴首款自研的夸克AI眼镜在其天猫官方店铺——夸克智能设备旗舰店上正式首发。 天猫平台的实时成交竞速榜单显示,新品上线销售后仅7个小时,便成为双11期间智能眼镜行业top2品牌。 不少消费者已经在社交媒体及粉丝群里陆续晒出购买订单。
MinerU2.5源码拆解:双后端架构设计与企业级部署实践
8月中旬的时候,我去MinerU的办公室交流过一次。 当时对方有位工作人员表示,接下来会很快基于视觉模型的路线实现全面 SOTA。 说实话,那个时候我还挺怀疑的。
基于JoyAgent的二开工程实践(信贷尽调报告生成)
很久没更新,书稿终于写完了,后续恢复每周一到两更。 这篇来继续聊聊 Agent, 这个现在有些烂大街的概念。 我在历史文章中提到 Agent 的案例演示时,大多是围绕 Dify,介绍了些诸如设备预测性运维、多源异构数据分析等使用场景。