理论

Karpathy盛赞「环境中心」！AGI最后一块拼图开源，大厂豪掷百万锁死

强化学习时代，什么最重要？ Karpathy给出了答案，环境！只有环境，才能让LLM真正进行交互、执行动作、观察结果。

8/29/2025 5:09:30 PM 新智元

「香蕉革命」首揭秘！谷歌疯狂工程师死磕文字渲染，竟意外炼出最强模型

纳尼(°ロ°)，怎么AI圈子突然就开始「纳米香蕉革命」了。谷歌没想到自己发布了一个新的图像模型，直接就引爆了社区！最近这个香蕉实在太火了，仿佛又回到几个月前的OpenAI的「吉卜力热」盛况。

8/29/2025 2:45:21 PM

突发！微软与OpenAI同日开火：语音之战+通用大模型，AI霸权决战打响

8/29/2025 2:41:52 PM

今夜，语音模型第一次超越人类！OpenAI再现Her时刻，95后华人研究员坐镇

今天凌晨1点，OpenAI接连扔出AI语音能力的两个重磅更新。一个是Realtime API，可支持生产级的实时智能体。另一个是最先进的语音到语音模型gpt-realtime。

8/29/2025 2:38:42 PM

我是如何玩转Claude100 万 Token上下文的？（附代码实战）

编辑 | 云昭出品 | 51CTO技术栈（微信号：blog51cto）进入8月后，Anthropic 推出了一个相当让开发者兴奋的更新！那就是：Claude Sonnet 4 现在支持 100 万 token 的上下文窗口 —— 这相当于在一次对话中处理 75 万个单词，或 7.5 万行代码。（1个token相当于0.75个单词，1行代码大概10个单词长度。

8/29/2025 2:17:01 PM 云昭

输入成本接近免费，推理根本不烧钱！ChatGPT毛利超5倍，Claude赚麻溢价20倍！大佬起底：别被忽悠了！API利润超80%

编辑｜云昭OpenAI 的 ChatGPT 也好、Claude 也好，国内的 DeepSeek也好，到底在推理上是烧钱，亏钱，还是挣钱？ ChatGPT Pro 的毛利高达 5-6 倍；Claude 做开发者的生意更赚钱：Claude Code Max 的毛利润率竟高达 12-20 倍溢价。怪不得大家都下场卷编程赛道！

8/29/2025 2:06:40 PM 云昭

IJCAI 2025 | 化学不是单向路：ChemDual大模型用拆分与重组，优化化学反应与分子逆合成预测

作者 | 论文团队编辑 | ScienceAI化学反应预测和逆合成设计是药物研发中的核心步骤。近年来，虽然大型语言模型（LLMs）在各领域表现优异，但直接应用到化学合成任务时仍存在两大挑战：数据量稀缺和反应预测与逆合成任务建模割裂。为了应对数据稀缺问题，湘潭大学林轩副教授课题组联合湖南大学曾湘祥教授、湖南师范大学曾道建教授课题组针对化学反应和逆合成预测，提出了一个新的大模型框架 ——ChemDual。

8/29/2025 12:00:00 PM ScienceAI

工具为谁而造？AI Agentic Programming 的“元挑战”与破局

大家好，我是肆〇柒。今天，我们不聊技术的表象，而是探讨一个正在重塑软件开发未来的核心议题。这篇深度解析，源自英国利兹大学（University of Leeds）的综述《AI Agentic Programming: A Survey of Techniques, Challenges, and Opportunities》。

8/29/2025 9:33:19 AM 肆零柒

AI训练迎来范式革命：Karpathy重磅观点揭示环境交互时代来临

一个明显的趋势是，AI训练正在发生一场悄无声息的范式革命。当所有人还在讨论更大的数据集、更多的GPU时，特斯拉前AI总监Andrej Karpathy却抛出了一个颠覆性观点：在强化学习时代，环境比数据更重要。过去几年我们见证的都是GPT-4、Claude这些"喂"了海量文本数据的大模型。

8/29/2025 9:16:06 AM 阿丸笔记

数据科学新风口？三大环节搞定ML「资产」管理，VLDB'25最新教程抢先看！

大模型时代，模型、数据与各种「参数/脚本/许可证」等ML资产爆炸式增长，但真正能被发现、复用、合规使用的比例并不高，这正在成为AI生产力落地的「隐形天花板」。以知名开源平台HuggingFace为例，平台目前托管超过150万个模型，每月还在新增约10万个模型，总数据存储量高达17PB。然而超过半数的模型缺乏基本文档说明，不到8%的模型拥有明确的许可证。

8/29/2025 9:16:00 AM

Andrej Karpathy再次看衰强化学习：奖励函数非常可疑，RL环境才是最重要的

AK再次看衰RL本身，当然指的是长期来看刚刚Prime Intellect公司开源了一个叫Environments Hub的平台，简单来说Environments Hub是一个开源的的强化学习环境（RL environments）平台，强化学习环境被认为是下一波人工智能进步的关键瓶颈，但大型实验室正在将其锁定环境是Agent学习的地方，它们定义了世界、规则以及状态 → 动作 → 奖励的反馈循环。从编程/数学任务到游戏和多轮对话评估，一切都可以被视为环境。没有它们，强化学习就只是数学，没有任何交互可言详细内容看这里：，以下是AK的观点：在预训练（pretraining）时代，最重要的是互联网文本。

8/29/2025 9:01:40 AM

AI挖的坑，还得人来填

“今年新上的AI项目没效果！ ”“陈老师快来帮帮忙，想想办法”“能不能设计一个评估体系，证明它管用！ ”从6月份开始，我就在十几个客户之间奔走处理类似需求，边做边调侃：“还说啥AI取代数据分析，现在都指望数据分析来救场子的” 为什么会出现如此奇观？

8/29/2025 8:42:17 AM 接地气的陈老师

一文带你开启 SmartNotebook 的 GPU 支持（PyTorch 实测）

在数据科学与深度学习的日常工作中，GPU 已经成为不可或缺的计算加速工具。无论是训练大规模 Transformer 模型，还是运行复杂的图像处理与科学计算任务，GPU 都能显著提升性能。 SmartNotebook 作为一款类似 Hex.tech 的现代化 DataNotebook 平台，不仅支持在容器环境中快速部署，还可以通过简单的配置实现 GPU 加速，让用户在 DataNotebook 内即可运行深度学习任务。

8/29/2025 8:10:18 AM 新叔

顶级CIO打造高效AI团队的实战经验

几年前，高层支持不足是AI项目落地面临的最大障碍之一。如今，企业对AI解决方案的需求量之大，足以让任何一位CIO为之咋舌。不过，他们正通过采取战略性的项目方法，同时组建高性能AI团队来迎接这一挑战。

8/29/2025 7:25:00 AM Robert

企业将在2025年面临的四大营销技术烧钱陷阱

从AI内容生成到大规模个性化，技术在连接营销者与受众方面持续突破新边界。借助GenAI新工具和平台，以及不断变化的消费者行为，营销规则正在被重新书写。机遇无处不在，但许多企业仍难以将技术与战略有效结合，从而推动真正的增长。

8/29/2025 7:00:00 AM Bernard

聊聊大模型推理系统之 Arrow：自适应调度实现请求吞吐提升7.78倍背后的三大创新

在大模型（LLM）推理服务中，如何在输入/输出长度剧烈波动的现实场景下，依然保持高吞吐与低延迟？传统静态资源分配策略往往导致计算资源严重浪费。近期，来自中国科学技术大学、北航与京东的研究团队提出了一项名为 Arrow 的自适应调度机制，通过无状态实例与弹性实例池，实现了高达 7.78 倍的请求服务速率提升。

8/29/2025 1:15:00 AM 机智流科技

为 AI Agent 行为立“规矩”——字节跳动提出 Jeddak AgentArmor 智能体安全框架

技术报告地址： AI Agent 时代已来，但“失控”风险近在眼前继 LLM（大语言模型）之后，AI Agent（智能体）正掀起新一轮的技术革命。它们不再仅仅是语言的“复读机”，而是能够自主理解、规划并执行现实世界任务的“行动派”。从自动预订旅行、管理复杂的云资源，到处理成千上万封邮件，AI Agent 展现出的巨大潜力，预示着一个由 AI 驱动的自动化新纪元。

8/29/2025 12:10:00 AM

Claude Code被黑客用疯了！用AI编程几周敲诈17家机构，教堂也被勒索，赎金上百万！官方怒斥：Claude成“共犯”了！

编辑 | 伊风出品 | 51CTO技术栈（微信号：blog51cto）Vibe coding火了，Vibe hacking还会远吗？今天，Anthropic 在最新报告中自曝：黑客正把 Claude Code 武器化，搭建出一整套“诈骗流水线”。据披露，2025 年 7 月他们成功阻止了一起复杂的网络犯罪行动。

8/28/2025 3:43:34 PM 伊风

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ OmniParser V2 在 Windows 系统上的详细安装与运行指南

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉