资讯列表
创智&交大发现AI能动性新规律, 78样本胜GPT5实现软件+科研自动化
本文来自于上海创智学院和上海交大刘鹏飞老师团队,团队专注于构建最前沿 AI 系统。 核心作者来自于香港理工大学,上海交通大学,以及中国科学技术大学。 从 ChatGPT 到 Claude,从 Codex 到 Claude Code,全球科技公司正在 "能动性" 领域展开激烈竞争。
9/28/2025 9:07:00 AM
从探索到验证:Parallel-R1 如何塑造大模型的"思考"哲学
大家好,我是肆〇柒。 今天看看由腾讯AI Lab Seattle联合马里兰大学、北卡罗来纳大学、香港城市大学和圣路易斯华盛顿大学共同研究的工作——Parallel-R1,它首次通过强化学习让大语言模型真正掌握了"并行思考"这一人类高级认知能力,而非仅依赖推理时策略的临时拼凑。 这项研究不仅刷新了AIME25数学竞赛基准测试的准确率记录,更揭示了机器"思考"方式的演化规律。
9/28/2025 9:00:00 AM
肆零柒
强化学习之父Richard Sutton最新采访:LLM是“死路一条”
强化学习之父Richard Sutton老爷子加入了Yann LeCun行列,认为当前的LLM路线行不通,不可能通向AGI。 图灵奖获得者Richard Sutton,强化学习之父最新采访,认为当前热门的大语言模型是一条死胡同。 他的核心观点是,LLMs 的架构从根本上缺乏从实际互动(on-the-job)中持续学习的能力。
9/28/2025 8:58:55 AM
2025人工智能计算大会在京召开,筑牢“人工智能 +”高质量发展底座
9月26日,以“筑基 开放 燎原”为主题的AICC2025人工智能计算大会在北京举行。 本届大会由北京市发展改革委、北京市科委中关村管委会、北京市经信局、中关村科学城管委会共同指导,中国人工智能学会支持。 大会紧扣人工智能基础设施建设和国产AI算力体系优化,着力推动算法创新与应用落地,深入贯彻国家关于加快发展新质生产力的战略部署,积极响应国务院“人工智能 ”行动规划,以算力核心要素为创新牵引,汇聚产学研用各界力量,共同推动人工智能产业高质量发展。
9/28/2025 8:56:47 AM
Agentic AI 的 17 种模式及其在下一代大规模 AI 系统中的价值
当你构建一个大规模AI系统时,你其实是在把不同的代理设计模式组合起来。 每个模式都有自己的阶段、构建方法、输出和评估。 如果我们退一步,把这些模式归类,它们可以分成17种高层架构,这些架构捕捉了代理系统可能采用的主要形式……Multi-Agent System,在这个系统中,几个工具和代理一起合作来解决问题。
9/28/2025 8:39:56 AM
AI研究生
Meta CWM:代码世界模型的技术突破
Meta FAIR团队刚刚发布了Code World Model (CWM),这是一个32B参数的开源大语言模型,标志着代码生成领域的一次根本性转变。 想象一下传统的代码模型就像一个只会背诵菜谱的厨师,虽然能够准确复述每道菜的制作步骤,但并不真正理解食材如何变化、调料如何融合。 而CWM的革命性突破在于它不仅知道代码怎么写,更重要的是理解代码运行时会发生什么。
9/28/2025 7:28:06 AM
庞德公
GenAI正导致敏感数据大规模泄露
敏感数据无处不在,且增长迅速。 Concentric AI发布的一份新报告强调了非结构化数据、重复文件以及高风险的共享行为如何给安全团队带来严重问题。 研究结果显示,微软Copilot等GenAI工具增加了复杂性,而过度共享和数据管理不善等老问题仍持续造成数据泄露风险。
9/28/2025 7:10:00 AM
Anamarija
揭秘RAG检索增强生成:从原理到Spring AI实战,开启AI新世界!
在当今人工智能的奇妙世界里,RAG检索增强生成技术就像是一颗冉冉升起的新星,正以其独特的魅力吸引着无数开发者和研究者的目光。 今天,咱们就一起来深入探究一下这个神奇的RAG技术,从它的基本原理到完整实现,再到结合Spring AI的超详细应用,保证让你对它有一个全方位的了解。 图片一、RAG技术:开启模型理解与生成的新大门(一)什么是RAG技术RAG,全称检索增强生成(Retrieval-Augmented Generation),这名字听起来就很厉害,感觉像是给模型加上了一个超级外挂。
9/28/2025 4:22:00 AM
demo123567
RAG在B站大会员中心数据智能平台的应用实践
在数字化浪潮中,数据已成为企业的核心资产。 在B站大会员中心部门,数据智能平台扮演着举足轻重的角色。 它不仅要处理和分析大规模的会员数据,为会员服务的优化和拓展提供坚实的数据支撑,还要满足业务对于数据洞察的多样化需求。
9/28/2025 4:00:00 AM
大数据
Code World Model (CWM):用世界模型改善代码生成的开源大语言模型
Meta发布了 Code World Model (CWM,论文:CWM: An Open-Weights LLM for Research on Code Generation with World Models),一个拥有32B参数的开源大语言模型(LLM),旨在推动基于世界模型的代码生成研究。 与传统仅从静态代码训练的模型不同,CWM在大规模 Python解释器执行轨迹 和 agent性Docker环境交互轨迹 上进行中期训练,并在可验证编码、数学和多轮软件工程环境中进行多任务强化学习(RL)。 CWM为研究者提供了探索世界建模在代码生成中通过推理和规划提升能力的强大平台。
9/28/2025 4:00:00 AM
无影寺
为什么说“嵌入”是 AI 的灵魂?一文带你玩转 SpringAI 向量模型
最近有小伙伴问我,AI 里的“嵌入模型 API”到底是干嘛的? 其实,它就像把文字、图片、数据转成“数字DNA”,方便 AI 理解和处理。 在 SpringAI 里,这一套 API 已经封装得很优雅,今天小米就带大家从故事开头一路聊到落地实现,保证看完你能用得飞起。
9/28/2025 3:55:00 AM
软件求生
小型革命:SLM、智能体人工智能与超级智能之路
过去十年的大部分时间里,人工智能领域被一个强大却终归存在局限的范式所主导——“越大越好”。 2010年代的里程碑式研究证实,扩大模型规模能带来可预测的性能提升,这一结论让“越大越好”的理念根深蒂固,进而引发了一场构建超大规模模型的竞赛,模型参数从数十亿一路突破至万亿级别。 在当时的认知里,通往高级智能的道路是一场垂直攀登,每一次突破都需要更多数据、更强算力以及更庞大的单体模型作为支撑。
9/28/2025 3:20:00 AM
大模型之路
Stability AI前CEO惊人预测:人类智力价值归零,只剩1000天!
Stability AI前CEO、缔造者Emad Mostaque,观点惊人:未来1000天内,人工智能不仅将取代工作岗位,更将彻底重塑人类的经济结构。 AI的「无情优化」可能让人类劳动力变得一文不值,甚至变成负值。 在最近的《影响理论》(Impact Theory)播客节目上,Emad Mostaque讨论了他的新书《最后的经济》。
9/28/2025 3:00:00 AM
新智元
首款推理具身模型,谷歌DeepMind造!自主理解/规划/执行复杂任务,打破一机一训,还能互相0样本迁移技能
全球首个具备模拟推理能力的具身模型来了! 谷歌DeepMind正式发布新一代通用机器人基座模型——Gemini Robotics 1.5系列。 它不止于对语言、图像进行理解,还结合了视觉、语言与动作(VLA),并通过具身推理(Embodied Reasoning)来实现“先思考,再行动”。
9/28/2025 2:00:00 AM
量子位
GGUF 是什么?一文看懂大模型里最火的模型格式
图片最近你要是混迹在 AI 圈,或者经常玩 Hugging Face、CSDN、GitHub 上的开源模型,肯定会碰到一个后缀:👉 .gguf比如:qwen2-7b-instruct.Q4_K_M.gguf很多人第一次见到就一头雾水:这是模型吗? 压缩包吗? 还是量化格式?
9/28/2025 1:55:00 AM
道玄
如何在 LLM 推理中战胜不确定性
最近thinkingmachines的一篇博文在内外网引起了无数的关注和转载,这篇文章的核心内容先是解释了一下为什么LLM推理会有不确定性,随后文章还给出了具体的解决方案。 在详细介绍文章的内容之前,我们先来说一下thinkingmachines这家公司。 它是由前OpenAI首席技术官Mira Murati与多位前OpenAI高管联合创立。
9/28/2025 1:25:00 AM
技不辱你
AI在前后端联调提效的实践
一、背景介绍现阶段前后端自测 联调耗时较长,经过摸底,耗时主要在以下几个方面:接口录入、接口转为前端代码、mock数据生成。 但是在我们预期中,联调耗时占比应该很少,理想情况下就像两个匹配的齿轮,各自完成开发后,组装在一起便可顺利运行。 为了达到这种状态,需要重新梳理我们现有的工具和流程,融入AI的能力,让联调自测环节更加高效。
9/28/2025 1:22:00 AM
叶宗洋
别再折腾小众APP了!剪映才是真正的AI创作天花板
说个特别有意思的事,前两天看到一个朋友在群里问,哪个 AI 或者产品能给对话音频强力降噪,试了好多都不行。 我当时就完全没动脑子的给了一个非常朴素的我最常用的答案:. 剪映。
9/28/2025 12:57:30 AM
数字生命卡兹克