AI在线 AI在线

AI

AI训练迎来范式革命:Karpathy重磅观点揭示环境交互时代来临

AI训练迎来范式革命:Karpathy重磅观点揭示环境交互时代来临

一个明显的趋势是,AI训练正在发生一场悄无声息的范式革命。 当所有人还在讨论更大的数据集、更多的GPU时,特斯拉前AI总监Andrej Karpathy却抛出了一个颠覆性观点:在强化学习时代,环境比数据更重要。 过去几年我们见证的都是GPT-4、Claude这些"喂"了海量文本数据的大模型。
8/29/2025 9:16:06 AM 阿丸笔记
数据科学新风口?三大环节搞定ML「资产」管理,VLDB'25最新教程抢先看!

数据科学新风口?三大环节搞定ML「资产」管理,VLDB'25最新教程抢先看!

大模型时代,模型、数据与各种「参数/脚本/许可证」等ML资产爆炸式增长,但真正能被发现、复用、合规使用的比例并不高,这正在成为AI生产力落地的「隐形天花板」。 以知名开源平台HuggingFace为例,平台目前托管超过150万个模型,每月还在新增约10万个模型,总数据存储量高达17PB。 然而超过半数的模型缺乏基本文档说明,不到8%的模型拥有明确的许可证。
8/29/2025 9:16:00 AM
Andrej Karpathy再次看衰强化学习:奖励函数非常可疑,RL环境才是最重要的

Andrej Karpathy再次看衰强化学习:奖励函数非常可疑,RL环境才是最重要的

AK再次看衰RL本身,当然指的是长期来看刚刚Prime Intellect公司开源了一个叫Environments Hub的平台,简单来说Environments Hub是一个开源的的强化学习环境(RL environments)平台,强化学习环境被认为是下一波人工智能进步的关键瓶颈,但大型实验室正在将其锁定环境是Agent学习的地方,它们定义了世界、规则以及状态 → 动作 → 奖励的反馈循环。 从编程/数学任务到游戏和多轮对话评估,一切都可以被视为环境。 没有它们,强化学习就只是数学,没有任何交互可言详细内容看这里:,以下是AK的观点:在预训练(pretraining)时代,最重要的是互联网文本。
8/29/2025 9:01:40 AM
AI挖的坑,还得人来填

AI挖的坑,还得人来填

“今年新上的AI项目没效果! ”“陈老师快来帮帮忙,想想办法”“能不能设计一个评估体系,证明它管用! ”从6月份开始,我就在十几个客户之间奔走处理类似需求,边做边调侃:“还说啥AI取代数据分析,现在都指望数据分析来救场子的” 为什么会出现如此奇观?
8/29/2025 8:42:17 AM 接地气的陈老师
顶级CIO打造高效AI团队的实战经验

顶级CIO打造高效AI团队的实战经验

几年前,高层支持不足是AI项目落地面临的最大障碍之一。 如今,企业对AI解决方案的需求量之大,足以让任何一位CIO为之咋舌。 不过,他们正通过采取战略性的项目方法,同时组建高性能AI团队来迎接这一挑战。
8/29/2025 7:25:00 AM Robert
为 AI Agent 行为立“规矩”——字节跳动提出 Jeddak AgentArmor 智能体安全框架

为 AI Agent 行为立“规矩”——字节跳动提出 Jeddak AgentArmor 智能体安全框架

技术报告地址: AI Agent 时代已来,但“失控”风险近在眼前继 LLM(大语言模型)之后,AI Agent(智能体)正掀起新一轮的技术革命。 它们不再仅仅是语言的“复读机”,而是能够自主理解、规划并执行现实世界任务的“行动派”。 从自动预订旅行、管理复杂的云资源,到处理成千上万封邮件,AI Agent 展现出的巨大潜力,预示着一个由 AI 驱动的自动化新纪元。
8/29/2025 12:10:00 AM
Claude Code被黑客用疯了!用AI编程几周敲诈17家机构,教堂也被勒索,赎金上百万!官方怒斥:Claude成“共犯”了!

Claude Code被黑客用疯了!用AI编程几周敲诈17家机构,教堂也被勒索,赎金上百万!官方怒斥:Claude成“共犯”了!

编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)Vibe coding火了,Vibe hacking还会远吗? 今天,Anthropic 在最新报告中自曝:黑客正把 Claude Code 武器化,搭建出一整套“诈骗流水线”。 据披露,2025 年 7 月他们成功阻止了一起复杂的网络犯罪行动。
8/28/2025 3:43:34 PM 伊风
AAAI-26投稿量爆炸:近3万篇论文,2万来自中国,评审系统都快崩了

AAAI-26投稿量爆炸:近3万篇论文,2万来自中国,评审系统都快崩了

你可能不信,你投的 AAAI-2026 会议,应该是有史以来投稿量最多的一次。 此前,取号人数就突破了 3 万,其中有不少 NeurIPS 转投的。 如今官方数据也公开了:主技术轨道共接收将近 29000 篇投稿,来自中国的投稿接近 20000 篇,占据了惊人的三分之二。
8/28/2025 3:32:51 PM
小扎噩梦来了!MSL两月爆雷8人闪辞,PyTorch元老出走实验室人心崩盘

小扎噩梦来了!MSL两月爆雷8人闪辞,PyTorch元老出走实验室人心崩盘

小扎AI大计还未真正开始,就要凉凉了? 继昨日曝出三人闪辞Meta之后,又一位「超级智能实验室」(MSL)老将官宣离职。 PyTorch核心开发者,现MSL预/后训练工程师——Rohan Varma,在入职Meta六年后,决定离开了。
8/28/2025 3:29:43 PM
一场「狼人杀」,考倒了一堆大模型

一场「狼人杀」,考倒了一堆大模型

人工智能越来越像人,但“像人”到底意味着什么? 除了会解题、写文,它是否也能理解人类那种充满个性的推理方式? 比如在一场狼人杀游戏中,有人逻辑缜密、有人直觉敏锐、有人擅长伪装。
8/28/2025 1:49:00 PM 郑佳美
波士顿动力机器狗侧空翻炸场!穿轮滑鞋照样能翻

波士顿动力机器狗侧空翻炸场!穿轮滑鞋照样能翻

刚刚,风头被中国机器人盖过的波士顿动力,又整了个大活! 前后空翻我还能理解,这侧空翻? (不是哥们,你真会啊!
8/28/2025 1:24:54 PM
专治智能体盲跑!微软发布AI Agent 五大可观测性,打通任督二脉

专治智能体盲跑!微软发布AI Agent 五大可观测性,打通任督二脉

今天凌晨,微软在官网发布了AI Agent 5大可观测性最佳实践,以帮助开发者深度解决智能体盲跑、自动化流程不可控等难题。 智能体可观测性的主要好处包括:在开发早期检测并解决问题;验证智能体是否符合质量、安全和合规标准;优化生产中的性能和用户体验;维护智能体的信任和问责制等。 同时还展示了5个应用案例,让大家更直观地了解这项技术。
8/28/2025 11:55:15 AM
刚刚,全球AI百强榜发布!ChatGPT稳坐第一,DeepSeek第三,前50有22个来自中国

刚刚,全球AI百强榜发布!ChatGPT稳坐第一,DeepSeek第三,前50有22个来自中国

就在刚刚,a16z最新一期的「Top 100消费级GenAI应用榜单」出炉! 本期榜单传递出一个最核心信息:AI产品竞争的生态格局正日趋稳定! 网页排行前50移动应用排行前50不论是你常用的DeepSeek、豆包、夸克,还是一直领先的ChatGPT和Gemini,或者是新进榜单Lovable等,这场AI产品的「百团大战」依然在继续!
8/28/2025 10:07:18 AM 新智元
​OpenAI 与 Anthropic 进行首次合作测试,推动 AI 安全标准

​OpenAI 与 Anthropic 进行首次合作测试,推动 AI 安全标准

在当前竞争激烈的人工智能(AI)领域,OpenAI 和 Anthropic 两家顶尖 AI 实验室决定进行一项前所未有的合作,联合对彼此的 AI 模型进行安全性测试。 这一举措旨在识别各自内部评估中的盲点,并展示在确保 AI 安全与对齐方面,领先企业之间如何能够携手共进。 OpenAI 联合创始人沃伊切赫・扎伦巴(Wojciech Zaremba)在接受采访时指出,随着 AI 技术逐步成熟并被广泛使用,这种跨实验室的合作显得尤为重要。
8/28/2025 9:40:57 AM AI在线
不靠高薪靠信仰!以文化破局,Anthropic凭「使命驱动」杀出AI人才血路

不靠高薪靠信仰!以文化破局,Anthropic凭「使命驱动」杀出AI人才血路

如今的大模型厂商,如足球豪门一样争夺开发者,动辄开出百万甚至千万的年薪。 例如Meta花五千万年薪来招募AI工程师,身价已经超过了足球明星姆巴佩和内马尔。 在Meta与OpenAI等科技巨头之间,顶尖AI人才的争夺战已近白热化。
8/28/2025 9:15:00 AM
破解人机协作密码:工作技能拆成两层,AI执行人类决策成功率狂飙 | ICML 2025

破解人机协作密码:工作技能拆成两层,AI执行人类决策成功率狂飙 | ICML 2025

人类和AI在工作中如何协作? 耶鲁和南大的研究人员合作的这篇论文讲清楚了。 这篇论文提出了一个数学框架,通过把工作技能拆分成两个层次来解释这个问题,具体包括:决策层子技能(decision-level subskill):确立目标、界定问题、权衡取舍的认知工作。
8/28/2025 9:12:00 AM
告别「面瘫」配音,InfiniteTalk开启从口型同步到全身表达新范式

告别「面瘫」配音,InfiniteTalk开启从口型同步到全身表达新范式

传统 video dubbing 技术长期受限于其固有的 “口型僵局”,即仅能编辑嘴部区域,导致配音所传递的情感与人物的面部、肢体表达严重脱节,削弱了观众的沉浸感。 现有新兴的音频驱动视频生成模型,在应对长视频序列时也暴露出身份漂移和片段过渡生硬等问题。 为解决这些痛点,Infinitetalk 引入 “稀疏帧 video dubbing”。
8/28/2025 9:11:56 AM
正确采用AI,防止影子AI迅速蔓延的实战经验

正确采用AI,防止影子AI迅速蔓延的实战经验

企业采用AI已不再是理论,而是正在发生的现实——无论企业是否做好准备。 员工正在使用公开可用的AI工具完成实际工作:总结文档、撰写邮件、生成报告、翻译资料、编写代码、解答问题。 他们并非因为被强制去做,而是因为这些工具能快速、有效地解决实际问题。
8/28/2025 7:26:00 AM Tyler