资讯列表
3D高斯泼溅,可输入视图量高达500!推理速度提升3倍,内存少80%
在增强现实(AR)和虚拟现实(VR)等前沿应用领域,新视角合成(Novel View Synthesis, NVS)正扮演着越来越关键的角色。 近年来,3D高斯泼溅(3D Gaussian Splatting, 3DGS)技术横空出世,凭借其革命性的实时渲染能力和卓越的视觉质量,迅速成为NVS领域的一大突破。 然而,传统3DGS对耗时的「逐场景优化」的依赖,严重限制了其在实际应用中的部署。
6/18/2025 8:54:48 AM
首个全面梳理语音大模型发展脉络的权威综述,入选ACL 2025主会
本文第一作者:崔文谦,香港中文大学博士生,致力于语音大模型,多模态大模型,AI音乐生成等方向的研究。 由香港中文大学团队撰写的语音语言模型综述论文《Recent Advances in Speech Language Models: A Survey》已成功被 ACL 2025 主会议接收! 这是该领域首个全面系统的综述,为语音 AI 的未来发展指明了方向。
6/18/2025 8:53:00 AM
逐个token太慢!大模型原生并行出token,CMU、英伟达新作Multiverse
众所周知,大语言模型的参数量越来越大,算力需求也越来越可怕,然而因为「祖宗之法」,推理只能一个一个 token 按顺序来。 对此,卡耐基梅隆大学(CMU)Infini-Al-Lab 的研究人员拿出了「多元宇宙」Multiverse,这是一个全新的生成式建模框架,支持原生的并行生成。 参与这项研究的机器学习大佬,CMU 助理教授陈天奇表示,这是一个有前途的大方向。
6/18/2025 8:51:28 AM
大模型“拼好题”,45K数据撬动18%提升,数学问题拒绝死记硬背 | MathFusion
当前数学领域的数据生成方法常常局限于对单个问题进行改写或变换,好比是让学生反复做同一道题的变种,却忽略了数学题目之间内在的关联性。 为了打破这种局限,让大模型学会“串联”与“并联”知识,上海AI Lab、人大高瓴等团队联合提出了MathFusion,通过指令融合增强大语言模型解决数学问题的能力。 仅使用45K的合成指令,MathFusion在多个基准测试中平均准确率提升了18.0个百分点,展现了卓越的数据效率和性能。
6/18/2025 8:51:00 AM
形式化证明迈向多模态,MLLM正确率仅4%!港科大等推出全新基准
近年来,自动定理证明(ATP)取得了显著进展,但大部分工作都集中在处理纯文本形式的定理。 然而,在现实世界中,尤其是在几何学领域,许多定理的呈现和理解都离不开图像、图表等视觉元素。 人类数学家善于从这些图表中获取直觉,并将其作为引导严谨证明过程的关键。
6/18/2025 8:49:00 AM
不用千亿参数也能合成高质量数据!这个开源框架让小模型“组团逆袭”,7B性能直追72B
无需蒸馏任何大规模语言模型,小模型也能自给自足、联合提升? 上海人工智能实验室联合中国人民大学提出的GRA框架(Generator–Reviewer–Adjudicator) 正是这样一种新范式:该方法以“多人协作”、“角色分工”的理念为核心,系统性探索了多开源小模型如何通过协同机制生成高质量训练数据。 实验结果显示,在涵盖数学、代码、逻辑推理、通识问答等10个主流数据集上,GRA生成的数据质量与单个大型语言模型(如Qwen-2.5-72B-Instruct)输出相当或更高,并在多数任务中取得了显著领先。
6/18/2025 8:47:00 AM
腾讯元宝上线 AI 编程模式:支持边修改代码边实时预览
腾讯元宝昨日宣布上线 AI 编程模式,用户在电脑版选择 DeepSeek V3 模型并关闭深度思考后,输入“@AI 编程”即可通过双栏界面在左侧对话生成代码,右侧实时展示并支持预览运行。
6/18/2025 8:43:00 AM
清源
AI记忆革命:能否突破数据牢笼,媲美人脑的适应性?
译者 | 朱先忠审校 | 重楼本文要讨论什么内容? Meta公司努力开发出的CoCoMix(Continuous Concept Mixing:连续概念混合,出自Jihoon等人2025年发表的论文,见【引文1】)框架实现了概念学习,即学习单词背后的概念而不是仅仅预测下一个标记,从而使其具有极强的可操控性和可解释性。 但是,依然存在一个核心问题:即使是概念上非常出色的模型,在训练之后的实际部署中,也可能难以应对细微差别或事实性的回忆挑战。
6/18/2025 8:26:01 AM
朱先忠
亚马逊 CEO 贾西:生成式 AI 将重塑企业人力资源规划
亚马逊CEO安迪・贾西表示,生成式AI将改变公司人力资源规划,未来某些岗位需求将减少。世界经济论坛调查显示,40%雇主计划裁减可被AI自动化的岗位。#AI取代人工##未来职场#
6/18/2025 8:18:11 AM
远洋
使用谷歌的最新应用程序,免费本地运行LLM
译者 | 布加迪审校 | 重楼谷歌的Edge Gallery刚刚让AI界迎来了巨大飞跃。 就在上周,谷歌悄然发布了AI Edge Gallery,这是一款普及AI的应用程序。 谷歌Edge AI可以直接在我们的智能手机上执行强大的语言模型,摆脱依赖云的局面,而且不收订阅费。
6/18/2025 8:12:14 AM
布加迪
全球领先水平!MiniMax开源首个推理模型M1
不知道还有多少人记得,AI 行业的六小虎。 行业内都在说,他们已经沉寂好久了。 上一次相关的项目发布,还是前一段时间我写的 MiniMax 声音模型的更新,Speech-02。
6/18/2025 7:42:52 AM
数字生命卡兹克
奥尔特曼:Meta 曾开出 1 亿美元高价试图挖走 OpenAI 人才,但未能成功
“Meta确实给我们团队很多人开出了惊人的报价,比如签约奖金就有1亿美元,年薪还远不止这些……我很欣慰,到目前为止,我们最优秀的成员都没有接受这样的邀请。”
6/18/2025 7:25:13 AM
清源
亚马逊首席执行官:Agent化的未来对于亚马逊格外重要!谁能精通,谁就能在这家公司产生巨大的影响力;现在的工作方式必然改变
编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)当地时间本周二,亚马逊首席执行官 Andy Jassy 在给员工的一份备忘录中表示:Agent 化的未来,对亚马逊而言格外重要;接下来几个月,我们会进一步加码,让开发 Agent 变得更容易。 而同时,生成式 AI 和 Agent 的落地公司的工作方式必然发生改变。 “某些岗位会减少,新的岗位也会出现。
6/18/2025 7:13:37 AM
云昭
CIO如何为AI优化数据管理
一项成功的AI计划在很大程度上取决于底层数据的质量,IT领导者们正在提升他们的数据湖、数据仓库和数据湖仓策略,以提供坚实的基础。 优质数据对于任何IT计划的成功都至关重要,对于AI项目来说更是如此。 糟糕的数据总是会产生糟糕的结果,对于AI来说,风险尤其高,因为不良数据可能导致严重的财务损失、监管罚款和声誉损害。
6/18/2025 7:08:00 AM
Stan Gibson
谷歌推理最快、成本效益最高 AI 模型:Gemini 2.5 Flash-Lite 亮相,全面升级编码、翻译、推理
Flash-Lite在编码、数学、科学推理及多模态任务中表现全面超越前代2.0 Flash-Lite,推理速度提升且延迟更低,适合实时翻译、分类等高吞吐量场景。
6/18/2025 6:42:28 AM
故渊
AI智能体的三种"人格":为什么99%的人都用错了?
昨天和一位创业朋友聊天,他抱怨说:"花了几万块做的Agent客服,效果还不如人工。 用户稍微问点复杂的,就答非所问。 " 我问他:"你选对Agent类型了吗?
6/18/2025 3:30:00 AM
大数据AI智能圈
AM-Thinking-v1:解锁 32B 模型推理潜力的密码
大家好,我是肆〇柒。 本篇想和大家分享一个后训练的模型案例 ——AM-Thinking-v1 模型。 这个模型是由贝壳(Ke.com)公司旗下的 a-m-team 团队开发的,他们一直致力于探索 AGI 技术。
6/18/2025 2:30:00 AM
肆零柒
MiniMax Agent的能力,彻底震撼了我
我最近试用了一款叫MiniMax Agent的产品,说实话,体验完之后整个人都不好了。 图片你想想,以前我们做个网站,得先构思、找素材、写代码、调UI,光是找合适的图片就要花半天时间。 现在这玩意儿,你只要说一句话,它就能帮你搞定一切。
6/18/2025 2:01:00 AM
阿丸笔记