资讯列表
HuggingFace发布超200页「实战指南」,从决策到落地「手把手」教你训练大模型
近期,HuggingFace 发布的超过 200 页的超长技术博客,系统性地分享训练先进 LLM 的端到端经验。 博客的重点是 LLM 开发过程中「混乱的现实」。 它坦诚地记录了哪些方法有效、哪些会失败,以及如何应对实际工程中遇到的陷阱。
11/9/2025 8:41:00 PM
机器之心
大规模高精度量子化学模拟新范式:字节最新成果入选Nature子刊
我们对世界的理解,越来越依赖计算。 从药物、蛋白质设计到新材料发现,科学家们希望在计算机里「虚拟实验」出物质的性质。 要做到这一点,就必须准确地模拟原子中,核、电子之间的相互作用。
11/9/2025 8:35:00 PM
机器之心
IEEE | LLM Agent的能力边界在哪?首篇「图智能体 (GLA)」综述为复杂系统构建统一蓝图
作者为 Griffith Unversity 的刘奕鑫,李世源,潘世瑞,National University of Singapore 的张桂彬,和 Nanyang Technological University 的王琨。 LLM Agent 正以前所未有的速度发展,从网页浏览、软件开发到具身控制,其强大的自主能力令人瞩目。 然而,繁荣的背后也带来了研究的「碎片化」和能力的「天花板」:多数 Agent 在可靠规划、长期记忆、海量工具管理和多智能体协调等方面仍显稚嫩,整个领域仿佛一片广袤却缺乏地图的丛林。
11/9/2025 8:30:00 PM
机器之心
2025乌镇峰会:蚂蚁已部署万卡规模国产算力群,全面应用于安全及风控
11月8日,在2025年世界互联网大会·乌镇峰会前沿人工智能模型论坛上,蚂蚁集团平台技术事业群总裁骆骥发表了主题演讲,分享了蚂蚁持续通过技术创新实现大模型突破的实践和思考。 骆骥指出,近年来通用人工智能(AGI)在“规模定律”(Scaling Law)推动下快速发展,部分能力已达到并超越人类基准。 主流旗舰级语言大模型的训练数据量已超过20TB,参数规模已迈入“万亿”时代,同时算力资源的紧张与成本的上升,成为制约AGI在“规模定律”下继续突破的关键因素。
11/9/2025 10:03:00 AM
新闻助手
好玩又简单!手把手教你用AI制作VR全景视频
背景. 最近大家疯传制作VR全景视频,用在了博物馆介绍、非遗介绍、房屋室内介绍、园林介绍等场景中,还蛮有意思的。 于是我就想着,能不能自己也做个场景用下呢,于是我做了关于「程序员使用无代码开发项目的前后对比场景」,一起来看看吧。
11/9/2025 12:43:54 AM
小果
虚数 i ,要被量子力学抛弃了?
如果量子世界根本不需要虚数 i,会怎样? 近日,发表于 Quanta Magazine 的一篇报道指出,一些物理学家发现,量子力学或许完全可以用纯实数的方式重写,而不影响任何实验预测。 这意味着,那些贯穿近百年的复数结构,也许只是我们对自然的一种数学幻觉。
11/8/2025 4:56:00 PM
机器之心
突破LLM遗忘瓶颈,谷歌「嵌套学习」让AI像人脑一样持续进化
LLM在持续学习方面有了新突破。 近日,谷歌推出了一种全新的用于持续学习的机器学习范式 —— 嵌套学习,模型不再采用静态的训练周期,而是以不同的更新速度在嵌套层中进行学习,即将模型视为一系列嵌套问题的堆叠,使其能够不断学习新技能,同时又不会遗忘旧技能。 而这或将标志着人工智能朝着「真正像大脑一样进化的方向」迈出了一大步。
11/8/2025 4:52:00 PM
机器之心
Utopai联手LG、中东主权基金加码韩娱,新模型颠覆AI视频格局!
当 Sora 2、Google Veo 3 还在卷短视频逼真度,AI 影视的下一站该是长片叙事了? 在 AI 视频生成技术日新月异的今天,主流模型如 Sora 2、Google Veo 3 等已能生成视觉惊艳的短视频片段,但想要创作长视频甚至是影视作品时,AI 模型似乎开始变得力不从心。 然而,在好莱坞,一家 AI 影视公司却已经拔地而起,开始将 AI 影视生成技术从模型验证推向大规模产业化。
11/8/2025 2:02:00 PM
机器之心
6.4万star的开源智能体框架全面重构!OpenHands重大升级,叫板OpenAI和谷歌
刚刚,OpenHands 开发团队发布了一篇新论文,正式宣布广受欢迎的软件开发智能体框架 OpenHands (GitHub star 已超 6.4 万)中的智能体组件完成了架构重构,即 OpenHands Software Agent SDK。 这一轮重新设计改进巨大,也让 OpenHands 从 V0 进化到了 V1。 包括:灵活性方面,他们设计了一个简洁的接口,在默认情况下仅需几行代码即可实现智能体,但又易于扩展为具有自定义工具、内存管理等功能的、功能齐全的复杂智能体。
11/8/2025 1:57:00 PM
机器之心
SimKO:缓解RLVR训练中的概率过度集中,优化pass@K性能
作者彭若天是西湖大学和浙江大学联培博士生,任毅是不列颠哥伦比亚大学博士,郁昼亮是香港中文大学博士生,刘威杨是香港中文大学计算机系助理教授,温研东是西湖大学人工智能系助理教授随着 Deepseek-R1,Kimi1.5 等模型展示了强化学习在提升大型语言模型复杂推理能力上的巨大潜力,使用可验证强化学习(RLVR)在数学、逻辑与编程等领域进行训练提升模型性能受到了广泛关注。 然而,尽管现有 RLVR 方法在提升模型的 pass@1 性能(单次尝试正确的概率)方面取得了显著成果,但其在 pass@K(K 次尝试中至少一次正确的概率,K1)上的性能相比基础模型却下降了。 这一现象表明,虽然模型在「利用」(Exploitation)单一正确路径的能力有所增强,但牺牲了对多样化正确解的「探索」(Exploration)能力。
11/8/2025 1:54:00 PM
机器之心
LLM强化学习新框架!UCSD多智能体训练框架让LLM工具调用能力暴增5.8倍
PettingLLMs团队 投稿. 量子位 | 公众号 QbitAI大语言模型智能体的强化学习框架, 首次实现了通用的多智能体的“群体强化”。 在大语言模型(LLM)智能体的各种任务中,已有大量研究表明在各领域下的多智能体工作流在未经训练的情况下就能相对单智能体有显著提升。
11/8/2025 1:08:34 PM
西风
我从3.5亿用户的女性应用Flo ,学到9条聊天机器人的设计经验
编者按:顶级的产品通常在特定的功能上有一些非常深入的设计,这些设计常常立足于特定的领域、特定的用户,在深入的测试磨合之后,形成的行之有效的方案。 Flo 这款面向女性用户的 APP 在聊天机器人的设计上,有很多特别的设计,这对于当下的很多基于 AI 的聊天机器人产品而言,非常有参考价值。 Mary Borysova 在这篇文章当中,总结了 Flo 在聊天机器人当中的 9 个重要的优势和特点。
11/8/2025 8:19:39 AM
Mary Borysova
百度无人车孵化的卡车,冲刺港股智能重卡第一股
杰西卡 发自 副驾寺. 智能车参考 | 公众号 AI4Auto中国第一家卡车新势力,正在冲刺港股IPO。 DeepWay深向科技,最近刚向港交所递交了招股书。
11/7/2025 6:59:05 PM
杰西卡
Nature | 颠覆性突破:大卫·贝克团队等用AI从头开始设计抗体,或将商用
图源:华盛顿大学蛋白质设计研究所编辑丨coisini在疾病的预防和治疗中,抗体药物发挥着至关重要的作用。 作为一种蛋白质治疗剂,全球现有超过 160 种抗体药物获批,其市场价值预计在未来 5 年内将达到 4450 亿美元。 以往,抗体发现主要依赖于免疫接种、随机库筛选或直接从患者体内分离抗体。
11/7/2025 5:59:00 PM
ScienceAI
OpenAI CEO:大学学位的回报率将快速下降,但 AI 应用前景广阔
在最近的一次访谈中,OpenAI 首席执行官(CEO)山姆・奥特曼分享了他对普通大学学位回报率变化的看法。 他指出,普通大学学位的回报率将会比过去十年更快下降,尽管这种下降不会像理论上预测的那样迅速降到零。 他强调,未来的教育回报将受到人工智能(AI)技术普及的影响。
11/7/2025 5:31:54 PM
AI在线
AI+如何赋能百行千业:2025百度世界大会前瞻
据百度官方消息,一年一度的百度世界大会,将于11月13日在北京开幕。 大会将全方位展现百度众多AI应用领先的创新能力及产业应用,探索技术赋能生产生活的新场景。 同时,百度创始人李彦宏将携多位重磅嘉宾,分享关于AI行业的新洞察与新思考。
11/7/2025 4:39:02 PM
量子位的朋友们
拷问 MLLM 空间想象力:SpatialViz-Bench 新基准发布,程序化生成防“数据污染”,Gemini-2.5 Pro 也仅答对 44.66%
论文信息:-论文标题:SpatialViz-Bench: An MLLM Benchmark for Spatial Visualization-论文链接::本文是由中科院自动化所张海峰教授团队和伦敦大学学院汪军教授团队合作完成。 第一作者为王斯婷,现就读于中科院自动化所,研究方向是多模态大语言模型、面向物理交互的世界模型,第二作者为裴旻楠,现就读于中科院自动化所,研究方向是三维视觉算法的高性能计算,第三作者为孙罗洋,现就读于中科院自动化所,研究方向是高效大语言模型。 本文的通讯作者为爱丁堡大学博士后邓程,中科院自动化所张海峰教授,伦敦大学学院汪军教授。
11/7/2025 4:26:00 PM
新闻助手