资讯列表
小型革命:SLM、智能体人工智能与超级智能之路
过去十年的大部分时间里,人工智能领域被一个强大却终归存在局限的范式所主导——“越大越好”。 2010年代的里程碑式研究证实,扩大模型规模能带来可预测的性能提升,这一结论让“越大越好”的理念根深蒂固,进而引发了一场构建超大规模模型的竞赛,模型参数从数十亿一路突破至万亿级别。 在当时的认知里,通往高级智能的道路是一场垂直攀登,每一次突破都需要更多数据、更强算力以及更庞大的单体模型作为支撑。
9/28/2025 3:20:00 AM
大模型之路
Stability AI前CEO惊人预测:人类智力价值归零,只剩1000天!
Stability AI前CEO、缔造者Emad Mostaque,观点惊人:未来1000天内,人工智能不仅将取代工作岗位,更将彻底重塑人类的经济结构。 AI的「无情优化」可能让人类劳动力变得一文不值,甚至变成负值。 在最近的《影响理论》(Impact Theory)播客节目上,Emad Mostaque讨论了他的新书《最后的经济》。
9/28/2025 3:00:00 AM
新智元
首款推理具身模型,谷歌DeepMind造!自主理解/规划/执行复杂任务,打破一机一训,还能互相0样本迁移技能
全球首个具备模拟推理能力的具身模型来了! 谷歌DeepMind正式发布新一代通用机器人基座模型——Gemini Robotics 1.5系列。 它不止于对语言、图像进行理解,还结合了视觉、语言与动作(VLA),并通过具身推理(Embodied Reasoning)来实现“先思考,再行动”。
9/28/2025 2:00:00 AM
量子位
GGUF 是什么?一文看懂大模型里最火的模型格式
图片最近你要是混迹在 AI 圈,或者经常玩 Hugging Face、CSDN、GitHub 上的开源模型,肯定会碰到一个后缀:👉 .gguf比如:qwen2-7b-instruct.Q4_K_M.gguf很多人第一次见到就一头雾水:这是模型吗? 压缩包吗? 还是量化格式?
9/28/2025 1:55:00 AM
道玄
如何在 LLM 推理中战胜不确定性
最近thinkingmachines的一篇博文在内外网引起了无数的关注和转载,这篇文章的核心内容先是解释了一下为什么LLM推理会有不确定性,随后文章还给出了具体的解决方案。 在详细介绍文章的内容之前,我们先来说一下thinkingmachines这家公司。 它是由前OpenAI首席技术官Mira Murati与多位前OpenAI高管联合创立。
9/28/2025 1:25:00 AM
技不辱你
AI在前后端联调提效的实践
一、背景介绍现阶段前后端自测 联调耗时较长,经过摸底,耗时主要在以下几个方面:接口录入、接口转为前端代码、mock数据生成。 但是在我们预期中,联调耗时占比应该很少,理想情况下就像两个匹配的齿轮,各自完成开发后,组装在一起便可顺利运行。 为了达到这种状态,需要重新梳理我们现有的工具和流程,融入AI的能力,让联调自测环节更加高效。
9/28/2025 1:22:00 AM
叶宗洋
别再折腾小众APP了!剪映才是真正的AI创作天花板
说个特别有意思的事,前两天看到一个朋友在群里问,哪个 AI 或者产品能给对话音频强力降噪,试了好多都不行。 我当时就完全没动脑子的给了一个非常朴素的我最常用的答案:. 剪映。
9/28/2025 12:57:30 AM
数字生命卡兹克
AI工作垃圾大爆发:员工花2小时擦屁股,企业一年亏900万美金
生成式 AI 本该成为效率革命的引擎,如今却被越来越多的员工拿来制造“看起来像完成了工作”的伪成果。 研究发现,所谓的“AI 工作垃圾”(Workslop),已经渗透进各大公司,并正以意想不到的方式削弱协作、拉低生产力。 从幻灯片、总结、代码到整篇报告,人们用 AI 生成光鲜的内容,但内容本身缺乏深度,缺少上下文,也没有真正的思考。
9/28/2025 12:00:05 AM
OpenAI史上最大算力军备竞赛!224亿美元背后的AI基础设施争夺战
说实话,当我看到OpenAI与CoreWeave的合作金额从119亿美元一路飙升到224亿美元时,第一反应是——这真的不是在开玩笑吗? 要知道,这个数字已经超过了很多国家的GDP。 但仔细一想,这背后反映的其实是一个更震撼的现实:AI行业的算力需求已经到了什么程度。
9/28/2025 12:00:00 AM
阿丸笔记
AI能「拍」好电影?五部短片亮相釜山电影节,答案出乎意料
全 AI 生成高质量剧情长片已经在技术上成为可能。 去年九月,中国香港动画公司 ManyMany Creations Limited 的几位年轻主创立下了一个几乎「逆天」的目标——拍一部真正的剧情短片,至少十五分钟长,而且每个镜头都必须由 AI 生成。 野心之大,连他们自己都觉得悬。
9/27/2025 8:54:00 PM
机器之心
OpenAI研究大模型对GDP贡献,三大行业已能代替人类,并自曝不敌Claude
AI 的颠覆近在眼前,奥特曼不是乱说的。 时至今日,我们已见过太多大模型的评估方法。 比如涵盖了数十个学科的考试式问题的学术基准 MMLU,还有 SWE-Bench (软件工程错误修复任务)、 MLE-Bench (机器学习工程任务,例如模型训练和分析)和 Paper-Bench (对研究论文的科学推理和评论)这类更具应用性的评估,以及基于市场的评估 SWE-Lancer。
9/27/2025 8:46:00 PM
机器之心
规范对齐时代:GPT-5 断层领先,让安全与行为边界更明晰
张昊然,上海交通大学人工智能学院的博士一年级学生,主要研究兴趣为大模型推理和可信人工智能。 去年 12 月,OpenAI 提出的 Deliberative Alignment 引发了广泛关注。 面对用户安全风险,大模型不再止于简单拒绝,而是将规范意识融入思考过程,主动识别边界,清楚哪些可以回应,哪些必须避免。
9/27/2025 8:44:00 PM
机器之心
让RAG真正读懂“言外之意”!新框架引入词汇多样性,刷新多项基准SOTA
RAG准确率提升10.6%,多项基准拿下新SOTA! ACL 2025最新研究提出Lexical Diversity-aware RAG (DRAG) 框架,首次系统性地将词汇多样性引入RAG的检索与生成过程,提供了一个轻量、通用且易扩展的解决方案。 在多项基准任务中,该方法带来了显著性能提升,尤其在HotpotQA上刷新了当前最优结果。
9/27/2025 1:17:41 PM
一水
业界首个高质量原生3D组件生成模型来了!来自腾讯混元团队
业界首个高质量原生3D组件生成模型来了! 来自腾讯混元3D团队。 现有的3D生成算法通常会生成一体化的3D模型,而下游应用通常需要语义可分解的3D形状,即3D物体的每一个组件需要单独地生成出来。
9/27/2025 1:10:36 PM
一水
大模型“精细化”对齐,真实性提升25.8%刷新SOTA!token级精准编辑,无需训练即插即用
提升大模型对齐能力新方法,在TruthfulQA任务上真实性指标提升25.8%,刷新当前最优性能! 方法名为Token-Aware Editing (TAE),是一种token感知的推理时表征编辑方法。 该方法首次系统性地从token层面解决了传统表征编辑技术的问题,无需训练、即插即用,可广泛应用于对话系统、内容审核、偏见mitigation等场景。
9/27/2025 12:58:47 PM
衡宇
首个开源实现100%可复现的稳定RL训练框架来了!2次结果完全重合
开源框架实现100%可复现的稳定RL训练! 下图是基于Qwen3-8B进行的重复实验。 两次运行,一条曲线,实现了结果的完美重合,为需要高精度复现的实验场景提供了可靠保障。
9/27/2025 11:30:07 AM
衡宇
用同一组提示词,横向测评30+热门AI绘画平台(下)
前言. 常见的 AI 生图模型大概有以下这些:黑森林的 flux kontext、flux krea、flux dev、flux pro、flux krea、flux1.1,谷歌的 imagen-4、nano-banana,OpenAI 的 Gpt-4o,以及国内的 Dreamina3.1、Qwen3、Wan2.2、星流,还有就是老牌的 Midjourney、Ideogram、即梦、豆包、可灵、海螺等其他平台。 当有设计需求,无论是要出主图还是找创意灵感时,我习惯根据具体使用场景,把提示词放到对应的平台上尝试。
9/27/2025 7:38:24 AM
AI设计师Lena
京东AI「结果」:深度应用已成当下,万亿生态瞄准未来
谁最懂场景,谁赢得未来。 9 月 25 日,北京,深秋的气息逐渐浓烈,即便太阳高悬,空气中还是流露出些许凉意,而在中关村国际创新中心,一墙之隔的里面,却是喧哗而热闹。 人形机器人前一刻还在台上与碳基生物酷酷斗舞,下一秒便转头向观众说「hi」;数字人歌手与人类歌手隔着屏幕互动,吟唱着同一首歌;可爱的玩偶不再沉默,变身「话痨」与大家聊起了天;让打工人挠破了脑袋想创意的营销海报,现在直接「秒级」生成;不管是人还是动物,甚至一个动漫角色,只需要上传一张图就直接拥有一个数字分身……这是「2025 京东全球科技探索者大会 (JDD 大会)」的现场,也是京东大模型品牌升级后的首次 JDD,而这些都是京东 AI 应用最为沉浸、直观的展示。
9/26/2025 7:35:00 PM
机器之心