AI在线 AI在线

理论

Andrej Karpathy再次看衰强化学习:奖励函数非常可疑,RL环境才是最重要的

AK再次看衰RL本身,当然指的是长期来看刚刚Prime Intellect公司开源了一个叫Environments Hub的平台,简单来说Environments Hub是一个开源的的强化学习环境(RL environments)平台,强化学习环境被认为是下一波人工智能进步的关键瓶颈,但大型实验室正在将其锁定环境是Agent学习的地方,它们定义了世界、规则以及状态 → 动作 → 奖励的反馈循环。 从编程/数学任务到游戏和多轮对话评估,一切都可以被视为环境。 没有它们,强化学习就只是数学,没有任何交互可言详细内容看这里:,以下是AK的观点:在预训练(pretraining)时代,最重要的是互联网文本。
8/29/2025 9:01:40 AM

AI挖的坑,还得人来填

“今年新上的AI项目没效果! ”“陈老师快来帮帮忙,想想办法”“能不能设计一个评估体系,证明它管用! ”从6月份开始,我就在十几个客户之间奔走处理类似需求,边做边调侃:“还说啥AI取代数据分析,现在都指望数据分析来救场子的” 为什么会出现如此奇观?
8/29/2025 8:42:17 AM
接地气的陈老师

一文带你开启 SmartNotebook 的 GPU 支持(PyTorch 实测)

在数据科学与深度学习的日常工作中,GPU 已经成为不可或缺的计算加速工具。 无论是训练大规模 Transformer 模型,还是运行复杂的图像处理与科学计算任务,GPU 都能显著提升性能。 SmartNotebook 作为一款类似 Hex.tech 的现代化 DataNotebook 平台,不仅支持在容器环境中快速部署,还可以通过简单的配置实现 GPU 加速,让用户在 DataNotebook 内即可运行深度学习任务。
8/29/2025 8:10:18 AM
新叔

顶级CIO打造高效AI团队的实战经验

几年前,高层支持不足是AI项目落地面临的最大障碍之一。 如今,企业对AI解决方案的需求量之大,足以让任何一位CIO为之咋舌。 不过,他们正通过采取战略性的项目方法,同时组建高性能AI团队来迎接这一挑战。
8/29/2025 7:25:00 AM
Robert

企业将在2025年面临的四大营销技术烧钱陷阱

从AI内容生成到大规模个性化,技术在连接营销者与受众方面持续突破新边界。 借助GenAI新工具和平台,以及不断变化的消费者行为,营销规则正在被重新书写。 机遇无处不在,但许多企业仍难以将技术与战略有效结合,从而推动真正的增长。
8/29/2025 7:00:00 AM
Bernard

聊聊大模型推理系统之 Arrow:自适应调度实现请求吞吐提升7.78倍背后的三大创新

在大模型(LLM)推理服务中,如何在输入/输出长度剧烈波动的现实场景下,依然保持高吞吐与低延迟? 传统静态资源分配策略往往导致计算资源严重浪费。 近期,来自中国科学技术大学、北航与京东的研究团队提出了一项名为 Arrow 的自适应调度机制,通过无状态实例与弹性实例池,实现了高达 7.78 倍 的请求服务速率提升。
8/29/2025 1:15:00 AM
机智流科技

为 AI Agent 行为立“规矩”——字节跳动提出 Jeddak AgentArmor 智能体安全框架

技术报告地址: AI Agent 时代已来,但“失控”风险近在眼前继 LLM(大语言模型)之后,AI Agent(智能体)正掀起新一轮的技术革命。 它们不再仅仅是语言的“复读机”,而是能够自主理解、规划并执行现实世界任务的“行动派”。 从自动预订旅行、管理复杂的云资源,到处理成千上万封邮件,AI Agent 展现出的巨大潜力,预示着一个由 AI 驱动的自动化新纪元。
8/29/2025 12:10:00 AM

Claude Code被黑客用疯了!用AI编程几周敲诈17家机构,教堂也被勒索,赎金上百万!官方怒斥:Claude成“共犯”了!

编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)Vibe coding火了,Vibe hacking还会远吗? 今天,Anthropic 在最新报告中自曝:黑客正把 Claude Code 武器化,搭建出一整套“诈骗流水线”。 据披露,2025 年 7 月他们成功阻止了一起复杂的网络犯罪行动。
8/28/2025 3:43:34 PM
伊风

AAAI-26投稿量爆炸:近3万篇论文,2万来自中国,评审系统都快崩了

你可能不信,你投的 AAAI-2026 会议,应该是有史以来投稿量最多的一次。 此前,取号人数就突破了 3 万,其中有不少 NeurIPS 转投的。 如今官方数据也公开了:主技术轨道共接收将近 29000 篇投稿,来自中国的投稿接近 20000 篇,占据了惊人的三分之二。
8/28/2025 3:32:51 PM

小扎噩梦来了!MSL两月爆雷8人闪辞,PyTorch元老出走实验室人心崩盘

小扎AI大计还未真正开始,就要凉凉了? 继昨日曝出三人闪辞Meta之后,又一位「超级智能实验室」(MSL)老将官宣离职。 PyTorch核心开发者,现MSL预/后训练工程师——Rohan Varma,在入职Meta六年后,决定离开了。
8/28/2025 3:29:43 PM

OpenAI/微软争夺AGI控制权!重组谈判激烈,年底谈不成软银700亿或撤

OpenAI就重组问题与微软持续进行了胶着的谈判,重写合作合同,至今悬而未决。 今年年底是一个关键节点,关系到软银对OpenAI的100亿美元投资能否到账。 OpenAI在接受了微软的注资后,双方的利益诉求点始终处在不同的轨道上。
8/28/2025 3:27:22 PM

AI加持气候模拟:华盛顿大学等12小时跑出一千年模拟,快了数千倍

编辑丨&想象一下,一部拍摄了长达 50 年的连续剧——还是纪录片,这其中的视角记录不能说乏善可陈,只能说是枯燥无味。 诚然自然的美景的确引人注目,但倘若就这么持续关注 50 年? 这就是过去科学家在面对地球模型时的窘境。
8/28/2025 2:02:00 PM
ScienceAI

波士顿动力机器狗侧空翻炸场!穿轮滑鞋照样能翻

刚刚,风头被中国机器人盖过的波士顿动力,又整了个大活! 前后空翻我还能理解,这侧空翻? (不是哥们,你真会啊!
8/28/2025 1:24:54 PM

专治智能体盲跑!微软发布AI Agent 五大可观测性,打通任督二脉

今天凌晨,微软在官网发布了AI Agent 5大可观测性最佳实践,以帮助开发者深度解决智能体盲跑、自动化流程不可控等难题。 智能体可观测性的主要好处包括:在开发早期检测并解决问题;验证智能体是否符合质量、安全和合规标准;优化生产中的性能和用户体验;维护智能体的信任和问责制等。 同时还展示了5个应用案例,让大家更直观地了解这项技术。
8/28/2025 11:55:15 AM

刚刚,全球AI百强榜发布!ChatGPT稳坐第一,DeepSeek第三,前50有22个来自中国

就在刚刚,a16z最新一期的「Top 100消费级GenAI应用榜单」出炉! 本期榜单传递出一个最核心信息:AI产品竞争的生态格局正日趋稳定! 网页排行前50移动应用排行前50不论是你常用的DeepSeek、豆包、夸克,还是一直领先的ChatGPT和Gemini,或者是新进榜单Lovable等,这场AI产品的「百团大战」依然在继续!
8/28/2025 10:07:18 AM
新智元

从汉语言文学学生到鸿蒙先锋:林子亿的跨界成长与生态探索

当汉语言文学的诗意撞上鸿蒙开发的代码,会迸发出怎样的创新火花? 林子亿,这位汉语言文学专业的大二学生,用行动给出了答案。 作为十年"花粉"的他自2019年HarmonyOS发布后便埋下技术火种,2022年正式踏上鸿蒙开发之路。
8/28/2025 9:44:07 AM

谷歌"香蕉"模型nano banana震撼发布!图像编辑能力碾压所有对手

想象一下这个场景:你正在设计一个品牌Logo,客户突然要求修改颜色、调整字体,还要保持角色的一致性。 以往你可能需要在Photoshop里折腾半天,但现在,只需要一句话就能搞定——"把这个logo改成蓝色调,让角色表情更友善一些"。 这不是科幻电影,而是谷歌刚刚发布的Gemini 2.5 Image模型,代号"Nano Banana"正在创造的现实。
8/28/2025 9:17:50 AM
阿丸笔记

不靠高薪靠信仰!以文化破局,Anthropic凭「使命驱动」杀出AI人才血路

如今的大模型厂商,如足球豪门一样争夺开发者,动辄开出百万甚至千万的年薪。 例如Meta花五千万年薪来招募AI工程师,身价已经超过了足球明星姆巴佩和内马尔。 在Meta与OpenAI等科技巨头之间,顶尖AI人才的争夺战已近白热化。
8/28/2025 9:15:00 AM