AI
AI训练迎来范式革命:Karpathy重磅观点揭示环境交互时代来临
一个明显的趋势是,AI训练正在发生一场悄无声息的范式革命。 当所有人还在讨论更大的数据集、更多的GPU时,特斯拉前AI总监Andrej Karpathy却抛出了一个颠覆性观点:在强化学习时代,环境比数据更重要。 过去几年我们见证的都是GPT-4、Claude这些"喂"了海量文本数据的大模型。
数据科学新风口?三大环节搞定ML「资产」管理,VLDB'25最新教程抢先看!
大模型时代,模型、数据与各种「参数/脚本/许可证」等ML资产爆炸式增长,但真正能被发现、复用、合规使用的比例并不高,这正在成为AI生产力落地的「隐形天花板」。 以知名开源平台HuggingFace为例,平台目前托管超过150万个模型,每月还在新增约10万个模型,总数据存储量高达17PB。 然而超过半数的模型缺乏基本文档说明,不到8%的模型拥有明确的许可证。
Andrej Karpathy再次看衰强化学习:奖励函数非常可疑,RL环境才是最重要的
AK再次看衰RL本身,当然指的是长期来看刚刚Prime Intellect公司开源了一个叫Environments Hub的平台,简单来说Environments Hub是一个开源的的强化学习环境(RL environments)平台,强化学习环境被认为是下一波人工智能进步的关键瓶颈,但大型实验室正在将其锁定环境是Agent学习的地方,它们定义了世界、规则以及状态 → 动作 → 奖励的反馈循环。 从编程/数学任务到游戏和多轮对话评估,一切都可以被视为环境。 没有它们,强化学习就只是数学,没有任何交互可言详细内容看这里:,以下是AK的观点:在预训练(pretraining)时代,最重要的是互联网文本。
AI挖的坑,还得人来填
“今年新上的AI项目没效果! ”“陈老师快来帮帮忙,想想办法”“能不能设计一个评估体系,证明它管用! ”从6月份开始,我就在十几个客户之间奔走处理类似需求,边做边调侃:“还说啥AI取代数据分析,现在都指望数据分析来救场子的” 为什么会出现如此奇观?
顶级CIO打造高效AI团队的实战经验
几年前,高层支持不足是AI项目落地面临的最大障碍之一。 如今,企业对AI解决方案的需求量之大,足以让任何一位CIO为之咋舌。 不过,他们正通过采取战略性的项目方法,同时组建高性能AI团队来迎接这一挑战。
为 AI Agent 行为立“规矩”——字节跳动提出 Jeddak AgentArmor 智能体安全框架
技术报告地址: AI Agent 时代已来,但“失控”风险近在眼前继 LLM(大语言模型)之后,AI Agent(智能体)正掀起新一轮的技术革命。 它们不再仅仅是语言的“复读机”,而是能够自主理解、规划并执行现实世界任务的“行动派”。 从自动预订旅行、管理复杂的云资源,到处理成千上万封邮件,AI Agent 展现出的巨大潜力,预示着一个由 AI 驱动的自动化新纪元。
Claude Code被黑客用疯了!用AI编程几周敲诈17家机构,教堂也被勒索,赎金上百万!官方怒斥:Claude成“共犯”了!
编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)Vibe coding火了,Vibe hacking还会远吗? 今天,Anthropic 在最新报告中自曝:黑客正把 Claude Code 武器化,搭建出一整套“诈骗流水线”。 据披露,2025 年 7 月他们成功阻止了一起复杂的网络犯罪行动。
AAAI-26投稿量爆炸:近3万篇论文,2万来自中国,评审系统都快崩了
你可能不信,你投的 AAAI-2026 会议,应该是有史以来投稿量最多的一次。 此前,取号人数就突破了 3 万,其中有不少 NeurIPS 转投的。 如今官方数据也公开了:主技术轨道共接收将近 29000 篇投稿,来自中国的投稿接近 20000 篇,占据了惊人的三分之二。
小扎噩梦来了!MSL两月爆雷8人闪辞,PyTorch元老出走实验室人心崩盘
小扎AI大计还未真正开始,就要凉凉了? 继昨日曝出三人闪辞Meta之后,又一位「超级智能实验室」(MSL)老将官宣离职。 PyTorch核心开发者,现MSL预/后训练工程师——Rohan Varma,在入职Meta六年后,决定离开了。
一场「狼人杀」,考倒了一堆大模型
人工智能越来越像人,但“像人”到底意味着什么? 除了会解题、写文,它是否也能理解人类那种充满个性的推理方式? 比如在一场狼人杀游戏中,有人逻辑缜密、有人直觉敏锐、有人擅长伪装。
波士顿动力机器狗侧空翻炸场!穿轮滑鞋照样能翻
刚刚,风头被中国机器人盖过的波士顿动力,又整了个大活! 前后空翻我还能理解,这侧空翻? (不是哥们,你真会啊!
专治智能体盲跑!微软发布AI Agent 五大可观测性,打通任督二脉
今天凌晨,微软在官网发布了AI Agent 5大可观测性最佳实践,以帮助开发者深度解决智能体盲跑、自动化流程不可控等难题。 智能体可观测性的主要好处包括:在开发早期检测并解决问题;验证智能体是否符合质量、安全和合规标准;优化生产中的性能和用户体验;维护智能体的信任和问责制等。 同时还展示了5个应用案例,让大家更直观地了解这项技术。
刚刚,全球AI百强榜发布!ChatGPT稳坐第一,DeepSeek第三,前50有22个来自中国
就在刚刚,a16z最新一期的「Top 100消费级GenAI应用榜单」出炉! 本期榜单传递出一个最核心信息:AI产品竞争的生态格局正日趋稳定! 网页排行前50移动应用排行前50不论是你常用的DeepSeek、豆包、夸克,还是一直领先的ChatGPT和Gemini,或者是新进榜单Lovable等,这场AI产品的「百团大战」依然在继续!
OpenAI 与 Anthropic 进行首次合作测试,推动 AI 安全标准
在当前竞争激烈的人工智能(AI)领域,OpenAI 和 Anthropic 两家顶尖 AI 实验室决定进行一项前所未有的合作,联合对彼此的 AI 模型进行安全性测试。 这一举措旨在识别各自内部评估中的盲点,并展示在确保 AI 安全与对齐方面,领先企业之间如何能够携手共进。 OpenAI 联合创始人沃伊切赫・扎伦巴(Wojciech Zaremba)在接受采访时指出,随着 AI 技术逐步成熟并被广泛使用,这种跨实验室的合作显得尤为重要。
不靠高薪靠信仰!以文化破局,Anthropic凭「使命驱动」杀出AI人才血路
如今的大模型厂商,如足球豪门一样争夺开发者,动辄开出百万甚至千万的年薪。 例如Meta花五千万年薪来招募AI工程师,身价已经超过了足球明星姆巴佩和内马尔。 在Meta与OpenAI等科技巨头之间,顶尖AI人才的争夺战已近白热化。
破解人机协作密码:工作技能拆成两层,AI执行人类决策成功率狂飙 | ICML 2025
人类和AI在工作中如何协作? 耶鲁和南大的研究人员合作的这篇论文讲清楚了。 这篇论文提出了一个数学框架,通过把工作技能拆分成两个层次来解释这个问题,具体包括:决策层子技能(decision-level subskill):确立目标、界定问题、权衡取舍的认知工作。
告别「面瘫」配音,InfiniteTalk开启从口型同步到全身表达新范式
传统 video dubbing 技术长期受限于其固有的 “口型僵局”,即仅能编辑嘴部区域,导致配音所传递的情感与人物的面部、肢体表达严重脱节,削弱了观众的沉浸感。 现有新兴的音频驱动视频生成模型,在应对长视频序列时也暴露出身份漂移和片段过渡生硬等问题。 为解决这些痛点,Infinitetalk 引入 “稀疏帧 video dubbing”。
正确采用AI,防止影子AI迅速蔓延的实战经验
企业采用AI已不再是理论,而是正在发生的现实——无论企业是否做好准备。 员工正在使用公开可用的AI工具完成实际工作:总结文档、撰写邮件、生成报告、翻译资料、编写代码、解答问题。 他们并非因为被强制去做,而是因为这些工具能快速、有效地解决实际问题。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉