资讯列表
对话27岁博导张林峰:模型压缩获CVPR满分有点意外,上海交大像我这样年轻老师很多
上海交大、27岁、最年轻博导,留给张林峰的标签不多了(Doge)。 最新引发关注的,是他实实在在的一个论文成果——他们提出了一种新的数据集蒸馏方法,结果获得了CVPR 2025满分。 通过引入一个辅助的神经网络,只需一块6年前的2080Ti,就能做大模型数据蒸馏。
5%参数比肩DeepSeek满血R1!北大“小”模型靠分合蒸馏,打破推理成本下限
只用5%的参数,数学和代码能力竟然超越满血DeepSeek? 北京大学杨仝教授团队近期发布了其在高效大型语言模型研究方向的一项新成果——FairyR1-32B模型。 该模型基于DeepSeek-R1-Distill-Qwen-32B基座,通过结合微调与模型合并技术构建。
两岁的Llama,最初的14位作者已跑了11个!Mistral成最大赢家
Meta 开源 Llama 模型家族帮助该公司制定了 AI 战略,某种程度上也改变了全世界的大模型格局。 然而,令人意想不到的是,短短几年,Llama 的初创者们大多已经转投他处。 在 2023 年发表的那篇具有里程碑意义的论文《 LLaMA: Open and Efficient Foundation Language Models 》中,Llama 被推向世界,当时论文共有 14 位作者。
舍弃自回归!国内团队打造纯扩散多模态大模型LLaDA-V,理解任务新SOTA
本文介绍的工作由中国人民大学高瓴人工智能学院李崇轩、文继荣教授团队与蚂蚁集团共同完成。 游泽彬和聂燊是中国人民大学高瓴人工智能学院的博士生,导师为李崇轩副教授。 该研究基于团队前期发布的、首个性能比肩 LLaMA 3 的 8B 扩散大语言模型 LLaDA。
Claude 4被诱导窃取个人隐私!GitHub官方MCP服务器安全漏洞曝光
被选为GitHub Copilot官方模型后,Claude 4直接被诱导出bug了! 一家瑞士网络安全公司发现,GitHub官方MCP服务器正在面临新型攻击——通过在公共仓库的正常内容中隐藏恶意指令,可以诱导AI Agent自动将私有仓库的敏感数据泄露至公共仓库。 就是说,当用户使用集成了GitHub MCP的Claude 4 ,用户的私人敏感数据可能遭到泄露。
低Token高精度!字节复旦推出自适应推理框架CAR
过度依赖CoT思维链推理会降低模型性能,有新解了! 来自字节、复旦大学的研究人员提出自适应推理框架CAR,能根据模型困惑度动态选择短回答或详细的长文本推理,最终实现了准确性与效率的最佳平衡。 推理能力的进步极大提升了大语言模型(LLMs)和多模态大语言模型(MLLMs)在各类任务中的表现。
扩散语言模型九倍推理加速!上海交大:KV Cache并非自回归模型的专属技巧
首个用于加速扩散式大语言模型(diffusion-based Large Language Models, 简称 dLLMs)推理过程的免训练方法。 上海交通大学EPIC Lab团队提出了一种无需训练、即插即用的高效推理缓存机制:dLLM-Cache。 其核心思想在于,在一个多步去噪过程中,复用相邻时间步上变化较小的特征,仅更新那些变化较大的特征,从而实现了计算量的大幅降低,并保持了原有的生成质量。
让视觉语言模型像o3一样动手搜索、写代码!Visual ARFT实现多模态智能体能力
在大型推理模型(例如 OpenAI-o3)中,一个关键的发展趋势是让模型具备原生的智能体能力。 具体来说,就是让模型能够调用外部工具(如网页浏览器)进行搜索,或编写/执行代码以操控图像,从而实现「图像中的思考」。 尽管开源研究社区在纯文本的智能体能力方面(比如函数调用和工具集成)已取得显著进展,但涉及图像理解与操作的多模态智能体能力及其对应的评估体系仍处于起步阶段。
北大团队发布首篇大语言模型心理测量学系统综述:评估、验证、增强
随着大语言模型(LLM)能力的快速迭代,传统评估方法已难以满足需求。 如何科学评估 LLM 的「心智」特征,例如价值观、性格和社交智能? 如何建立更全面、更可靠的 AI 评估体系?
Meta「轻量级」KernelLLM颠覆GPU内核生成,8B参数碾压GPT-4o
在AI领域,参数规模曾被视为「性能天花板」。 Meta最新发布的KernelLLM,却用8B参数的「小身板」,在GPU内核生成任务中把200B的GPT-4o按在地上摩擦。 这是一个基于Llama 3.1 Instruct进行微调的8B参数模型,旨在将PyTorch模块自动转换为高效的Triton GPU内核。
Llama 论文作者“出逃”,14人团队仅剩3人,法国独角兽 Mistral 成最大赢家
他们大多去向了 Mistral,这家总部位于巴黎的 AI 初创公司,正在用“开源速度”反攻 Meta 自己开启的战场。 Llama 曾是 Meta 最具野心的 AI 作品:在 ChatGPT 和 PaLM 占据主流话语权的 2023 年,Meta 用一篇重量级论文和一组开放权重的大语言模型,意外地把开源阵营推上主舞台。 而那时,Meta 的 AI 科研团队 FAIR(Fundamental AI Research)也正处于高光时刻。
Dify携手亚马逊云科技 加速全球企业生成式AI应用规模化落地
简单易用的AI应用开发平台Dify通过深度集成亚马逊云科技的生成式AI技术与云服务,在保障性能、合规与全球交付的基础上,显著降低企业在生成式AI应用开发中的技术门槛和部署成本。 此外,依托亚马逊云科技遍布全球的基础设施与亚马逊云科技Marketplace,Dify将产品迅速推广至全球,为汽车、制造、零售快消、医疗健康和游戏等多个行业逾百家企业提供服务,助力企业释放生成式AI创新潜力的同时,实现商业价值增长。 Dify是一款发布于 2023 年的大语言模型应用开发平台,涵盖从Agent构建到AI Workflow编排、RAG检索、模型管理等核心技术栈,助力开发者快速实现AI应用落地。
OpenAI 首款 AI 硬件被曝 2026 年登场,ChatGPT 全面融入用户生活
科技媒体 bleepingcomputer 今天(5 月 27 日)发布博文,报道称 OpenAI 公司计划 2026 年发布一款由 ChatGPT 驱动的新产品,希望让 ChatGPT 成为用户生活中无处不在的助手。
国内首个!夸克健康大模型成功通过副主任医师考试
夸克健康大模型在全国副主任医师职称考试中表现出色,成功通过12门学科的评测,成为国内首个跨越这一门槛的大模型。 此次考试涵盖了全科医学、普通内科学、普通外科学、妇产科学、小儿内科学、肿瘤内科学、口腔医学、耳鼻咽喉科学、眼科学、皮肤与性病学、精神病学和麻醉学等12个常用学科。 夸克健康大模型在所有测试科目中均超过了合格线,并在全科医学、肿瘤内科学、皮肤与性病学、精神病学等四个学科达到了主任医师的及格线。
百度心响 iOS 版正式上线,智能体应用实现全面覆盖
最近,百度心响 iOS 版正式上线,这款多智能体协作应用的发布,标志着智能体应用的普及进入了一个全新阶段。 用户只需在苹果的 APP Store 中搜索 “心响” 即可免费下载,安卓用户也能自由使用,让所有人都可以轻松体验到这款应用的便捷。 心响 APP 的使用门槛非常低,无需邀请码且每日使用次数不限,这一点在智能体应用中相对少见。
Chrome v137 开发者工具重磅升级 Gemini 智能标注让性能分析秒变神器!
Google 近日发布了 Chrome v137开发者工具(Chrome DevTools)的重大更新,集成了 Gemini AI 智能助手,为开发者带来前所未有的性能分析和调试体验。 从智能标注性能追踪到 CSS 修改保存,Chrome v137的新功能极大提升了开发效率。 AIbase 综合整理最新信息,为您详细解析此次更新的亮点与应用前景。
夸克发布行业首个“高考深度搜索”,一句话生成志愿填报方案
“河南郑州二模549分,历史类,一本线517分,推荐一下应该怎么报考”。 高考临近,这类问题成为考生和家长搜索查询的典型方式。 试着把这个问题丢给传统搜索引擎,结果前排是广告,后面是匹配不准确的网页链接。
AI数字人助力PPT展示,SlidesOrator在BEYOND Expo崭露头角
在近日举行的 BEYOND Expo 展会上,SlidesOrator 项目引起了与会者的广泛关注。 这一新颖的工具不需要高端的机械设备或虚拟现实眼镜,展台简约却不失亮点,直接聚焦于每一位职场人士都能感同身受的一个核心问题:如何更好地展示 PPT。 SlidesOrator 的理念与其功能紧密相连,它的目标不仅是帮助用户快速制作 PPT,更在于通过 AI 技术将演讲变得 “自动而可信”。