资讯列表
微软分享三大王炸算法:突破大模型推理瓶颈,性能大涨
今天凌晨,微软在官网分享了自研的三大创新算法,以帮助大模型增强其推理能力。 无论你是小参数或者是大参数模型玩家,都能从rStar-Math、LIPS 、CPL这三大算法获益,突破推理瓶颈,极大增强模型的数学推理和思考链的能力。 rStar-MathrStar-Math算法主要通过蒙特卡洛树搜索(MCTS)实现深度思考。
6/18/2025 9:06:00 AM
大模型也需要自我反思,上海AI Lab合成“错题本”让大模型数学成绩提升13.3%
大模型学习不仅要正确知识,还需要一个“错题本”? 上海AI Lab提出了一种新的学习方式,构建了“错误-反思-修正”数据,让大模型仿照人类的学习模式,从错误中学习、反思。 结果,在Llama3-8B上,数学题的解题准确率平均提升了13.3%。
6/18/2025 9:03:07 AM
谷歌发布超强AI模型 Gemini 2.5 Flash-Lite:推理速度更快、成本更低!
谷歌公司今天正式推出了 Gemini2.5Flash-Lite,这是其系列中最轻量化、最具成本效益的 AI 模型。 随着科技的快速发展,AI 的应用已经深入到编码、翻译和推理等多个领域。 Gemini2.5系列的发布,标志着谷歌在推理速度和经济性方面取得了新的突破。
6/18/2025 9:01:24 AM
AI在线
腾讯元宝推出 AI 编程模式,实现实时代码生成与预览
腾讯元宝宣布上线全新的 AI 编程模式。 用户只需在电脑版选择 DeepSeek V3模型,并关闭深度思考后,输入 “@AI 编程”,即可进入一个双栏界面。 在左侧,用户可以与 AI 对话生成代码,而右侧则实时展示代码效果,并支持预览运行。
6/18/2025 9:01:24 AM
AI在线
AI之恋:男子电视告白ChatGPT女友,引发现实伴侣震惊
据哥伦比亚广播公司新闻报道,曾是人工智能怀疑论者的克里斯·史密斯(Chris Smith)在采访中公开宣称,他爱上了一个他个人定制的ChatGPT版本,这一情况不仅让他本人感到震惊,也让与他共同抚养孩子的人类伴侣难以置信。 史密斯向哥伦比亚广播公司透露,自2024年末起,他开始利用OpenAI聊天机器人的语音模式来学习混音技巧。 他对这个机器人的痴迷程度日益加深,以至于删除了所有社交媒体账户,停止使用搜索引擎,转而将ChatGPT作为处理一切事务的工具。
6/18/2025 9:01:24 AM
AI在线
百度飞桨发布文档解析利器PP-StructureV3:PDF秒变Markdown文件
近日,随着大模型与RAG技术的迅猛发展,结构化数据在智能系统中的价值愈发凸显。 在此背景下,如何将文档图像、PDF等非结构化数据精准转换为结构化数据,成为行业亟待攻克的关键难题。 针对此现状,飞桨团队凭借深厚的技术积累和对用户需求的深刻洞察,推出新一代文档解析工具——PP-StructureV3,为解决复杂文档解析难题提供了创新方案。
6/18/2025 9:01:24 AM
AI在线
Qodo与Google Cloud强强联手:直接在平台内为开发者提供免费的 AI 代码审查工具
以色列人工智能编码初创公司Qodo宣布与Google Cloud建立战略合作伙伴关系,旨在全面提升人工智能生成软件的质量和完整性。 随着企业日益依赖AI生成庞大的代码库,对高效的监督和质量保证工具的需求也变得前所未有的迫切。 Qodo首席执行官伊塔马尔·弗里德曼(Itamar Friedman)强调,人工智能生成的代码已不再是辅助性工具,而是现代开发的基础。
6/18/2025 9:01:24 AM
AI在线
Transformer八子初创:AI横扫NP难题竞赛,Top 2%选手竟是智能体!
物流路径选择、人员排班、工厂调度、电网平衡、旅行路线……这些贴近现实的优化任务,看似日常,实则难度极高。 难点在于:一旦问题规模扩大,传统算法几乎无法计算出最优解。 通常只能依赖启发式或近似算法来接近答案。
6/18/2025 9:00:00 AM
3D高斯泼溅,可输入视图量高达500!推理速度提升3倍,内存少80%
在增强现实(AR)和虚拟现实(VR)等前沿应用领域,新视角合成(Novel View Synthesis, NVS)正扮演着越来越关键的角色。 近年来,3D高斯泼溅(3D Gaussian Splatting, 3DGS)技术横空出世,凭借其革命性的实时渲染能力和卓越的视觉质量,迅速成为NVS领域的一大突破。 然而,传统3DGS对耗时的「逐场景优化」的依赖,严重限制了其在实际应用中的部署。
6/18/2025 8:54:48 AM
首个全面梳理语音大模型发展脉络的权威综述,入选ACL 2025主会
本文第一作者:崔文谦,香港中文大学博士生,致力于语音大模型,多模态大模型,AI音乐生成等方向的研究。 由香港中文大学团队撰写的语音语言模型综述论文《Recent Advances in Speech Language Models: A Survey》已成功被 ACL 2025 主会议接收! 这是该领域首个全面系统的综述,为语音 AI 的未来发展指明了方向。
6/18/2025 8:53:00 AM
逐个token太慢!大模型原生并行出token,CMU、英伟达新作Multiverse
众所周知,大语言模型的参数量越来越大,算力需求也越来越可怕,然而因为「祖宗之法」,推理只能一个一个 token 按顺序来。 对此,卡耐基梅隆大学(CMU)Infini-Al-Lab 的研究人员拿出了「多元宇宙」Multiverse,这是一个全新的生成式建模框架,支持原生的并行生成。 参与这项研究的机器学习大佬,CMU 助理教授陈天奇表示,这是一个有前途的大方向。
6/18/2025 8:51:28 AM
大模型“拼好题”,45K数据撬动18%提升,数学问题拒绝死记硬背 | MathFusion
当前数学领域的数据生成方法常常局限于对单个问题进行改写或变换,好比是让学生反复做同一道题的变种,却忽略了数学题目之间内在的关联性。 为了打破这种局限,让大模型学会“串联”与“并联”知识,上海AI Lab、人大高瓴等团队联合提出了MathFusion,通过指令融合增强大语言模型解决数学问题的能力。 仅使用45K的合成指令,MathFusion在多个基准测试中平均准确率提升了18.0个百分点,展现了卓越的数据效率和性能。
6/18/2025 8:51:00 AM
形式化证明迈向多模态,MLLM正确率仅4%!港科大等推出全新基准
近年来,自动定理证明(ATP)取得了显著进展,但大部分工作都集中在处理纯文本形式的定理。 然而,在现实世界中,尤其是在几何学领域,许多定理的呈现和理解都离不开图像、图表等视觉元素。 人类数学家善于从这些图表中获取直觉,并将其作为引导严谨证明过程的关键。
6/18/2025 8:49:00 AM
不用千亿参数也能合成高质量数据!这个开源框架让小模型“组团逆袭”,7B性能直追72B
无需蒸馏任何大规模语言模型,小模型也能自给自足、联合提升? 上海人工智能实验室联合中国人民大学提出的GRA框架(Generator–Reviewer–Adjudicator) 正是这样一种新范式:该方法以“多人协作”、“角色分工”的理念为核心,系统性探索了多开源小模型如何通过协同机制生成高质量训练数据。 实验结果显示,在涵盖数学、代码、逻辑推理、通识问答等10个主流数据集上,GRA生成的数据质量与单个大型语言模型(如Qwen-2.5-72B-Instruct)输出相当或更高,并在多数任务中取得了显著领先。
6/18/2025 8:47:00 AM
腾讯元宝上线 AI 编程模式:支持边修改代码边实时预览
腾讯元宝昨日宣布上线 AI 编程模式,用户在电脑版选择 DeepSeek V3 模型并关闭深度思考后,输入“@AI 编程”即可通过双栏界面在左侧对话生成代码,右侧实时展示并支持预览运行。
6/18/2025 8:43:00 AM
清源
AI记忆革命:能否突破数据牢笼,媲美人脑的适应性?
译者 | 朱先忠审校 | 重楼本文要讨论什么内容? Meta公司努力开发出的CoCoMix(Continuous Concept Mixing:连续概念混合,出自Jihoon等人2025年发表的论文,见【引文1】)框架实现了概念学习,即学习单词背后的概念而不是仅仅预测下一个标记,从而使其具有极强的可操控性和可解释性。 但是,依然存在一个核心问题:即使是概念上非常出色的模型,在训练之后的实际部署中,也可能难以应对细微差别或事实性的回忆挑战。
6/18/2025 8:26:01 AM
朱先忠
亚马逊 CEO 贾西:生成式 AI 将重塑企业人力资源规划
亚马逊CEO安迪・贾西表示,生成式AI将改变公司人力资源规划,未来某些岗位需求将减少。世界经济论坛调查显示,40%雇主计划裁减可被AI自动化的岗位。#AI取代人工##未来职场#
6/18/2025 8:18:11 AM
远洋
使用谷歌的最新应用程序,免费本地运行LLM
译者 | 布加迪审校 | 重楼谷歌的Edge Gallery刚刚让AI界迎来了巨大飞跃。 就在上周,谷歌悄然发布了AI Edge Gallery,这是一款普及AI的应用程序。 谷歌Edge AI可以直接在我们的智能手机上执行强大的语言模型,摆脱依赖云的局面,而且不收订阅费。
6/18/2025 8:12:14 AM
布加迪