资讯列表
让大模型合成检查器:UIUC团队挖出Linux内核90余个长期潜伏漏洞
这篇论文的作者来自伊利诺伊大学香槟分校(UIUC)张令明老师团队,包括:杨晨源,四年级博士生,研究方向是基于 AI 大模型的软件系统可靠性保障;赵子杰,四年级博士生,研究方向是模糊测试等软件工程技术与 AI 大模型的结合;谢子晨,科研实习生,目前为弗吉尼亚大学一年级博士生;李皓宇,科研实习生,目前为 UIUC 一年级博士生。 张令明老师现任 UIUC 计算机系副教授,主要从事软件工程、机器学习、代码大模型的相关研究。 想象一下,大语言模型不仅能生成代码,还能通过静态分析看代码找漏洞:在千万行的 Linux 内核代码中挖出 92 个长期潜伏的真实缺陷 —— 这也可能是 LLM 首次在 Linux 内核中发现如此多的实际漏洞。
9/28/2025 9:13:00 AM
刚刚,北大&360里程碑式突破!32B安全分碾压千亿巨兽
2025年9月23日,由「北大-360大模型联合实验室」研发的TinyR1-32B模型正式发布。 近年来开源大模型层出不穷,但对「安全性」的关注却严重不足。 北大-360联合实验室聚焦于大模型安全方向,以极高的安全性能和轻量化的创新设计,推出更安全的模型TinyR1-32B。
9/28/2025 9:12:00 AM
苹果掀桌!扔掉AlphaFold核心模块,开启蛋白折叠「生成式AI」时代
蛋白质折叠,一直是计算生物学中的一个核心难题,并对药物研发等领域产生着深远影响。 若把蛋白质折叠类比为视觉领域的生成模型,氨基酸序列相当于「提示词」,模型输出则是原子的三维坐标。 受此思维启发,研究人员构建了一个基于标准Transformer模块与自适应层的通用且强大的架构——SimpleFold。
9/28/2025 9:12:00 AM
估值840亿AI实验室再放大招,他们要给大模型戴上「紧箍咒」
刚刚,OpenAI前CTO Mira Murati创办的Thinking Machines Lab再次发布成果! 这是他们继《克服LLM推理中的不确定性》(Defeating Nondeterminism in LLM Inference)之后,第二篇研究文章——《模块流形》(Modular Manifolds)。 博客地址:「走钢丝」,必须小心翼翼地维持其内部「健康」,防止权重、激活值或梯度这些关键张量变得过大或过小,以免引发数值溢出等一系列问题。
9/28/2025 9:11:00 AM
免训练加速61倍!陈怡然团队新作DPad:仅关注「彩票token」
在大型语言模型的优化中,业界通常认为计算量与模型性能正相关。 然而,杜克大学陈怡然教授团队的一项最新研究DPad,却揭示了一个反直觉的现象:对于扩散大语言模型(dLLMs),通过一种「先验丢弃」策略,主动减少其计算量,不仅能带来高达61倍的推理加速,还能意外地增强模型语境学习的能力。 这一发现源于对dLLM内部一种「中奖彩票」(Lottery Ticket)现象的洞察。
9/28/2025 9:10:00 AM
2025全球前2%顶尖科学家榜单发布!清华国内第一、Bengio全球前十
当地时间9月19日,斯坦福大学和国际权威学术出版社爱思唯尔(Elsevier)共同发布了「斯坦福2025全球前2%顶尖科学家榜单」。 全榜单链接:,国内共有1435人入选终身「斯坦福2025全球前2%顶尖科学家榜单」;有2270人入选年度「斯坦福2025全球前2%顶尖科学家榜单」。 这份榜单是学术界关注度最高的爱思唯尔发布的年度清单之一。
9/28/2025 9:08:00 AM
创智&交大发现AI能动性新规律, 78样本胜GPT5实现软件+科研自动化
本文来自于上海创智学院和上海交大刘鹏飞老师团队,团队专注于构建最前沿 AI 系统。 核心作者来自于香港理工大学,上海交通大学,以及中国科学技术大学。 从 ChatGPT 到 Claude,从 Codex 到 Claude Code,全球科技公司正在 "能动性" 领域展开激烈竞争。
9/28/2025 9:07:00 AM
从探索到验证:Parallel-R1 如何塑造大模型的"思考"哲学
大家好,我是肆〇柒。 今天看看由腾讯AI Lab Seattle联合马里兰大学、北卡罗来纳大学、香港城市大学和圣路易斯华盛顿大学共同研究的工作——Parallel-R1,它首次通过强化学习让大语言模型真正掌握了"并行思考"这一人类高级认知能力,而非仅依赖推理时策略的临时拼凑。 这项研究不仅刷新了AIME25数学竞赛基准测试的准确率记录,更揭示了机器"思考"方式的演化规律。
9/28/2025 9:00:00 AM
肆零柒
强化学习之父Richard Sutton最新采访:LLM是“死路一条”
强化学习之父Richard Sutton老爷子加入了Yann LeCun行列,认为当前的LLM路线行不通,不可能通向AGI。 图灵奖获得者Richard Sutton,强化学习之父最新采访,认为当前热门的大语言模型是一条死胡同。 他的核心观点是,LLMs 的架构从根本上缺乏从实际互动(on-the-job)中持续学习的能力。
9/28/2025 8:58:55 AM
2025人工智能计算大会在京召开,筑牢“人工智能 +”高质量发展底座
9月26日,以“筑基 开放 燎原”为主题的AICC2025人工智能计算大会在北京举行。 本届大会由北京市发展改革委、北京市科委中关村管委会、北京市经信局、中关村科学城管委会共同指导,中国人工智能学会支持。 大会紧扣人工智能基础设施建设和国产AI算力体系优化,着力推动算法创新与应用落地,深入贯彻国家关于加快发展新质生产力的战略部署,积极响应国务院“人工智能 ”行动规划,以算力核心要素为创新牵引,汇聚产学研用各界力量,共同推动人工智能产业高质量发展。
9/28/2025 8:56:47 AM
Agentic AI 的 17 种模式及其在下一代大规模 AI 系统中的价值
当你构建一个大规模AI系统时,你其实是在把不同的代理设计模式组合起来。 每个模式都有自己的阶段、构建方法、输出和评估。 如果我们退一步,把这些模式归类,它们可以分成17种高层架构,这些架构捕捉了代理系统可能采用的主要形式……Multi-Agent System,在这个系统中,几个工具和代理一起合作来解决问题。
9/28/2025 8:39:56 AM
AI研究生
Meta CWM:代码世界模型的技术突破
Meta FAIR团队刚刚发布了Code World Model (CWM),这是一个32B参数的开源大语言模型,标志着代码生成领域的一次根本性转变。 想象一下传统的代码模型就像一个只会背诵菜谱的厨师,虽然能够准确复述每道菜的制作步骤,但并不真正理解食材如何变化、调料如何融合。 而CWM的革命性突破在于它不仅知道代码怎么写,更重要的是理解代码运行时会发生什么。
9/28/2025 7:28:06 AM
庞德公
GenAI正导致敏感数据大规模泄露
敏感数据无处不在,且增长迅速。 Concentric AI发布的一份新报告强调了非结构化数据、重复文件以及高风险的共享行为如何给安全团队带来严重问题。 研究结果显示,微软Copilot等GenAI工具增加了复杂性,而过度共享和数据管理不善等老问题仍持续造成数据泄露风险。
9/28/2025 7:10:00 AM
Anamarija
揭秘RAG检索增强生成:从原理到Spring AI实战,开启AI新世界!
在当今人工智能的奇妙世界里,RAG检索增强生成技术就像是一颗冉冉升起的新星,正以其独特的魅力吸引着无数开发者和研究者的目光。 今天,咱们就一起来深入探究一下这个神奇的RAG技术,从它的基本原理到完整实现,再到结合Spring AI的超详细应用,保证让你对它有一个全方位的了解。 图片一、RAG技术:开启模型理解与生成的新大门(一)什么是RAG技术RAG,全称检索增强生成(Retrieval-Augmented Generation),这名字听起来就很厉害,感觉像是给模型加上了一个超级外挂。
9/28/2025 4:22:00 AM
demo123567
RAG在B站大会员中心数据智能平台的应用实践
在数字化浪潮中,数据已成为企业的核心资产。 在B站大会员中心部门,数据智能平台扮演着举足轻重的角色。 它不仅要处理和分析大规模的会员数据,为会员服务的优化和拓展提供坚实的数据支撑,还要满足业务对于数据洞察的多样化需求。
9/28/2025 4:00:00 AM
大数据
Code World Model (CWM):用世界模型改善代码生成的开源大语言模型
Meta发布了 Code World Model (CWM,论文:CWM: An Open-Weights LLM for Research on Code Generation with World Models),一个拥有32B参数的开源大语言模型(LLM),旨在推动基于世界模型的代码生成研究。 与传统仅从静态代码训练的模型不同,CWM在大规模 Python解释器执行轨迹 和 agent性Docker环境交互轨迹 上进行中期训练,并在可验证编码、数学和多轮软件工程环境中进行多任务强化学习(RL)。 CWM为研究者提供了探索世界建模在代码生成中通过推理和规划提升能力的强大平台。
9/28/2025 4:00:00 AM
无影寺
为什么说“嵌入”是 AI 的灵魂?一文带你玩转 SpringAI 向量模型
最近有小伙伴问我,AI 里的“嵌入模型 API”到底是干嘛的? 其实,它就像把文字、图片、数据转成“数字DNA”,方便 AI 理解和处理。 在 SpringAI 里,这一套 API 已经封装得很优雅,今天小米就带大家从故事开头一路聊到落地实现,保证看完你能用得飞起。
9/28/2025 3:55:00 AM
软件求生