AI
「重要性采样」并不「重要」?快手清华ASPO攻克重要性采样权重错配
从ChatGPT到DeepSeek,强化学习(Reinforcement Learning, RL)已成为大语言模型(LLM)后训练的关键一环。 然而,随着模型参数规模的不断扩大,一个长期被忽视的问题正悄然成为性能瓶颈:重要性采样真的「重要」吗? 近期,由快手与清华合作的研究团队发现,现有的结果监督强化学习范式存在一种深层次的权重错配现象,它不仅让模型「过度自信」,甚至可能导致熵坍缩与训练早熟收敛。
王兴兴硕士论文惊现GitHub,宇树雏形那时候就有了
人火了是连毕业论文都要被翻出来的(doge)。 这不,宇树科技CEO王兴兴的硕士毕业论文就被网友们掘地三尺找到了。 (不在知网,而是在GitHub上找到的。
波士顿动力狗gogo回来了!“五条腿”协同发力
机器狗搬轮胎,“五只腿”齐发力! 在波士顿动力人工智能研究所的最新方法——结合采样与学习的动态全身操作中,波士顿动力的机器狗Spot最快仅用3.7秒就能搬起轮胎。 搬运的轮胎重达15公斤,相当于Spot自身重量的一半(32.7千克),并远超其最大臂力。
智能体时代CEO的六大战略:从人机协作到优势重构的领导力议程
根据你交谈的对象或阅读的内容,智能体(基于GenAI基础模型构建的系统,能够在实际世界中行动并执行多步骤流程)要么将带来生产力的乌托邦;要么将取代大量劳动力,要么将导致机器人统治世界,要么将赋予每个人超能力;要么以上情况全部出现。 为了应对这一不确定的未来,企业高管需要抛开情绪化的讨论。 承诺随处可见,但批判性思维却十分匮乏。
连锁零售巨头克罗格构建能大规模稳健运行的负责任AI的实战经验
84.51˚(美国零售业领军者克罗格的数据科学部门)数据科学与AI高级副总裁Kristin . Foster正处于这一转型的核心位置。 Foster领导工作的核心在于,关注将原始数据转化为实际价值的基础设施建设。
英国政府提出 AI 节省 450 亿英镑计划,但专家质疑其可行性
近日,英国政府计划通过人工智能(AI)在公共部门节省450亿英镑的提案引发了广泛关注。 然而,在国会科学、创新与技术委员会上,专家指出这一数字缺乏明确依据,并且基于粗略假设。 英国政府的资金主要用于员工薪资和基础设施建设,如何在这些领域实现如此巨额的节省,成为了质疑的焦点。
清华&巨人网络首创MoE多方言TTS框架,数据代码方法全开源
无论是中文的粤语、闽南话、吴语,还是欧洲的荷兰比尔茨语方言、法国奥克语,亦或是非洲和南美的地方语言,方言都承载着独特的音系与文化记忆,是人类语言多样性的重要组成部分。 然而,许多方言正在快速消失,语音技术如果不能覆盖这些语言,势必加剧数字鸿沟与文化失声。 在当今大模型引领的语音合成时代,通用 TTS 系统已展现出令人惊叹的能力,但方言 TTS 依然是相关从业者难以触及的「灰色地带」。
实测新版LiblibAI:终于把模型、生图、工作流塞进一个碗了
梦瑶 发自 凹非寺. 量子位 公众号 QbitAI上网冲浪突然看到这个评论我懵了,升级过后的LiblibAI ,真的有这么好用? 甚至直接把另一个产品的会员停了,转身冲了年费那种…….
震撼!7M参数AI碾压千亿巨模,"小而美"颠覆大模型时代
想象一下这个场景:你的公司准备部署AI系统,预算有限,只能在昂贵的千亿参数大模型和性能一般的小模型之间二选一。 就在你纠结的时候,突然出现了第三个选择——一个仅有700万参数的"小不点",性能却能碾压GPT-4。 这听起来像科幻小说,但它真的发生了。
算力帝国再扩张!OpenAI豪掷3500-5000亿美元购博通10吉瓦算力
据《金融时报》报道,AI巨头OpenAI再掀算力军备竞赛高潮,已与美国半导体巨头博通达成协议,将采购10吉瓦定制化计算机芯片。 这笔交易不仅是其近期千亿级算力布局的最新落子,更标志着这家创业公司,预计将在现有约1万亿美元芯片和数据中心协议基础上,追加3500亿至5000亿美元支出,全力冲刺ChatGPT等服务所需的算力储备。 根据协议,OpenAI将主导芯片与系统设计,博通负责联合开发及部署,双方合作开发周期已长达18个月。
一个模型装下整个物种树!伯克利GPN-Star斩获基因预测双料冠军
让大模型读懂物种关系,这可能吗? 近日,加州大学伯克利分校等机构的研究人员,推出了一个全新、通用且功能强大的GLM框架GPN-Star。 论文地址:、且在一些预测任务中不如传统进化模型等短板。
NeurIPS 25 | 中大&UC Merced等开源RAPID Hand,重新定义多指灵巧手数据采集
在最近的一篇 NeurIPS 25 中稿论文中,来自中山大学、加州大学 Merced 分校、中科院自动化研究所、诚橙动力的研究者联合提出了一个全新开源的高自由度灵巧手平台 — RAPID Hand (Robust, Affordable, Perception-Integrated, Dexterous Hand)。 论文标题:RAPID Hand: A Robust, Affordable, Perception-Integrated, Dexterous Manipulation Platform for Generalist Robot Autonomy论文地址:: 地址:。 无论是日常的家庭整理、物品归置,还是辅助类服务任务,若缺乏灵巧的操作能力,机器人便难以真正完成复杂交互。
AI圈再颠覆!中国AI翻译耳机通话翻译,实测震撼
刚刚,在上海世界会客厅现场,一部AI翻译耳机成为了全场焦点。 从上海到迪拜,跨越6000多公里,时空第一次在耳畔折叠。 发布会现场,主讲人戴上那副翻译耳机,向迪拜友人发出的问候,瞬间被清晰转译。
你无法察觉的攻击面:如何保护自主式AI与智能体系统安全
风险新领域几十年来,网络安全一直致力于保护静态资产,如服务器、终端和代码。 即使是复杂的现代软件,通常也具有确定性,遵循明确、预先定义的规则。 自主式智能体的引入,从根本上改变了这种安全格局。
在AI时代构建具备未来适应性的IT团队的实战策略
随着企业为AI将给工作性质带来的变革做好准备,IT组织已经感受到了巨大的影响。 随着AI自动化接管IT服务台、手动测试、语言编程和安全监控等领域的职能,传统的初级工作正在消失,IT职业阶梯的底层台阶不复存在。 Indeed最近的一份报告显示,该行业大部分领域对技术工作者的招聘需求大幅下降,对经验不足的求职者影响尤为严重。
卡神新项目刷屏!AI老鸟深度解析Karpathy的开发Trick,网友:700块复刻ChatGPT!终于能亲自研究ChatGPT
编辑 | 云昭复刻 ChatGPT 有多难? 商业层面看,很难。 但对于众多的开发者、甚至实验室的研究生而言,从今天起,可能就要有标准答案了。
驳“AI 泡沫论”:一场被误读的、正在进行中的产业结构性调整
目前流传着一种看似合理的说法:GPT-5 表现未达预期,因此 AI 泡沫正在破裂。 这个观点看似顺理成章,实则是错误的。 这个说法将四个不同维度的事情强行捆绑,硬是揉成了一个整体:(1)产品体验的设计选择;(2)应用层的投资回报;(3)基础设施投入与供应链;(4)科研进展与规模化应用。
Chrome已死,AI浏览器当立!认知革命比技术成熟来得更快
今天的内容分享一个新的认知, AI-native 浏览器引发的认知革命,本文不强烈推荐某一款应用~因为我发现,即使 AI 浏览器还没那么靠谱,成功率可能只有 60-70%,或者更低,但还是很容易完成从“我要搜索什么网站”到“我想要什么结果的转变”。 图片AI浏览器 到底做对了什么? 一个好的AI浏览器,应该都不是给 Chrome 加个 AI 插件,而是重新定义浏览器的底层逻辑:从导航工具变成执行意图的引擎。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉