理论
Andrej Karpathy再次看衰强化学习:奖励函数非常可疑,RL环境才是最重要的
AK再次看衰RL本身,当然指的是长期来看刚刚Prime Intellect公司开源了一个叫Environments Hub的平台,简单来说Environments Hub是一个开源的的强化学习环境(RL environments)平台,强化学习环境被认为是下一波人工智能进步的关键瓶颈,但大型实验室正在将其锁定环境是Agent学习的地方,它们定义了世界、规则以及状态 → 动作 → 奖励的反馈循环。 从编程/数学任务到游戏和多轮对话评估,一切都可以被视为环境。 没有它们,强化学习就只是数学,没有任何交互可言详细内容看这里:,以下是AK的观点:在预训练(pretraining)时代,最重要的是互联网文本。
8/29/2025 9:01:40 AM
AI挖的坑,还得人来填
“今年新上的AI项目没效果! ”“陈老师快来帮帮忙,想想办法”“能不能设计一个评估体系,证明它管用! ”从6月份开始,我就在十几个客户之间奔走处理类似需求,边做边调侃:“还说啥AI取代数据分析,现在都指望数据分析来救场子的” 为什么会出现如此奇观?
8/29/2025 8:42:17 AM
接地气的陈老师
一文带你开启 SmartNotebook 的 GPU 支持(PyTorch 实测)
在数据科学与深度学习的日常工作中,GPU 已经成为不可或缺的计算加速工具。 无论是训练大规模 Transformer 模型,还是运行复杂的图像处理与科学计算任务,GPU 都能显著提升性能。 SmartNotebook 作为一款类似 Hex.tech 的现代化 DataNotebook 平台,不仅支持在容器环境中快速部署,还可以通过简单的配置实现 GPU 加速,让用户在 DataNotebook 内即可运行深度学习任务。
8/29/2025 8:10:18 AM
新叔
顶级CIO打造高效AI团队的实战经验
几年前,高层支持不足是AI项目落地面临的最大障碍之一。 如今,企业对AI解决方案的需求量之大,足以让任何一位CIO为之咋舌。 不过,他们正通过采取战略性的项目方法,同时组建高性能AI团队来迎接这一挑战。
8/29/2025 7:25:00 AM
Robert
企业将在2025年面临的四大营销技术烧钱陷阱
从AI内容生成到大规模个性化,技术在连接营销者与受众方面持续突破新边界。 借助GenAI新工具和平台,以及不断变化的消费者行为,营销规则正在被重新书写。 机遇无处不在,但许多企业仍难以将技术与战略有效结合,从而推动真正的增长。
8/29/2025 7:00:00 AM
Bernard
聊聊大模型推理系统之 Arrow:自适应调度实现请求吞吐提升7.78倍背后的三大创新
在大模型(LLM)推理服务中,如何在输入/输出长度剧烈波动的现实场景下,依然保持高吞吐与低延迟? 传统静态资源分配策略往往导致计算资源严重浪费。 近期,来自中国科学技术大学、北航与京东的研究团队提出了一项名为 Arrow 的自适应调度机制,通过无状态实例与弹性实例池,实现了高达 7.78 倍 的请求服务速率提升。
8/29/2025 1:15:00 AM
机智流科技
为 AI Agent 行为立“规矩”——字节跳动提出 Jeddak AgentArmor 智能体安全框架
技术报告地址: AI Agent 时代已来,但“失控”风险近在眼前继 LLM(大语言模型)之后,AI Agent(智能体)正掀起新一轮的技术革命。 它们不再仅仅是语言的“复读机”,而是能够自主理解、规划并执行现实世界任务的“行动派”。 从自动预订旅行、管理复杂的云资源,到处理成千上万封邮件,AI Agent 展现出的巨大潜力,预示着一个由 AI 驱动的自动化新纪元。
8/29/2025 12:10:00 AM
Claude Code被黑客用疯了!用AI编程几周敲诈17家机构,教堂也被勒索,赎金上百万!官方怒斥:Claude成“共犯”了!
编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)Vibe coding火了,Vibe hacking还会远吗? 今天,Anthropic 在最新报告中自曝:黑客正把 Claude Code 武器化,搭建出一整套“诈骗流水线”。 据披露,2025 年 7 月他们成功阻止了一起复杂的网络犯罪行动。
8/28/2025 3:43:34 PM
伊风
AAAI-26投稿量爆炸:近3万篇论文,2万来自中国,评审系统都快崩了
你可能不信,你投的 AAAI-2026 会议,应该是有史以来投稿量最多的一次。 此前,取号人数就突破了 3 万,其中有不少 NeurIPS 转投的。 如今官方数据也公开了:主技术轨道共接收将近 29000 篇投稿,来自中国的投稿接近 20000 篇,占据了惊人的三分之二。
8/28/2025 3:32:51 PM
小扎噩梦来了!MSL两月爆雷8人闪辞,PyTorch元老出走实验室人心崩盘
小扎AI大计还未真正开始,就要凉凉了? 继昨日曝出三人闪辞Meta之后,又一位「超级智能实验室」(MSL)老将官宣离职。 PyTorch核心开发者,现MSL预/后训练工程师——Rohan Varma,在入职Meta六年后,决定离开了。
8/28/2025 3:29:43 PM
OpenAI/微软争夺AGI控制权!重组谈判激烈,年底谈不成软银700亿或撤
OpenAI就重组问题与微软持续进行了胶着的谈判,重写合作合同,至今悬而未决。 今年年底是一个关键节点,关系到软银对OpenAI的100亿美元投资能否到账。 OpenAI在接受了微软的注资后,双方的利益诉求点始终处在不同的轨道上。
8/28/2025 3:27:22 PM
AI加持气候模拟:华盛顿大学等12小时跑出一千年模拟,快了数千倍
编辑丨&想象一下,一部拍摄了长达 50 年的连续剧——还是纪录片,这其中的视角记录不能说乏善可陈,只能说是枯燥无味。 诚然自然的美景的确引人注目,但倘若就这么持续关注 50 年? 这就是过去科学家在面对地球模型时的窘境。
8/28/2025 2:02:00 PM
ScienceAI
专治智能体盲跑!微软发布AI Agent 五大可观测性,打通任督二脉
今天凌晨,微软在官网发布了AI Agent 5大可观测性最佳实践,以帮助开发者深度解决智能体盲跑、自动化流程不可控等难题。 智能体可观测性的主要好处包括:在开发早期检测并解决问题;验证智能体是否符合质量、安全和合规标准;优化生产中的性能和用户体验;维护智能体的信任和问责制等。 同时还展示了5个应用案例,让大家更直观地了解这项技术。
8/28/2025 11:55:15 AM
刚刚,全球AI百强榜发布!ChatGPT稳坐第一,DeepSeek第三,前50有22个来自中国
就在刚刚,a16z最新一期的「Top 100消费级GenAI应用榜单」出炉! 本期榜单传递出一个最核心信息:AI产品竞争的生态格局正日趋稳定! 网页排行前50移动应用排行前50不论是你常用的DeepSeek、豆包、夸克,还是一直领先的ChatGPT和Gemini,或者是新进榜单Lovable等,这场AI产品的「百团大战」依然在继续!
8/28/2025 10:07:18 AM
新智元
从汉语言文学学生到鸿蒙先锋:林子亿的跨界成长与生态探索
当汉语言文学的诗意撞上鸿蒙开发的代码,会迸发出怎样的创新火花? 林子亿,这位汉语言文学专业的大二学生,用行动给出了答案。 作为十年"花粉"的他自2019年HarmonyOS发布后便埋下技术火种,2022年正式踏上鸿蒙开发之路。
8/28/2025 9:44:07 AM
谷歌"香蕉"模型nano banana震撼发布!图像编辑能力碾压所有对手
想象一下这个场景:你正在设计一个品牌Logo,客户突然要求修改颜色、调整字体,还要保持角色的一致性。 以往你可能需要在Photoshop里折腾半天,但现在,只需要一句话就能搞定——"把这个logo改成蓝色调,让角色表情更友善一些"。 这不是科幻电影,而是谷歌刚刚发布的Gemini 2.5 Image模型,代号"Nano Banana"正在创造的现实。
8/28/2025 9:17:50 AM
阿丸笔记
不靠高薪靠信仰!以文化破局,Anthropic凭「使命驱动」杀出AI人才血路
如今的大模型厂商,如足球豪门一样争夺开发者,动辄开出百万甚至千万的年薪。 例如Meta花五千万年薪来招募AI工程师,身价已经超过了足球明星姆巴佩和内马尔。 在Meta与OpenAI等科技巨头之间,顶尖AI人才的争夺战已近白热化。
8/28/2025 9:15:00 AM
资讯热榜
量大管饱!我整理了10个好用到爆的即梦4.0进阶玩法
甲骨文公司股价飙升 27%,人工智能未来收入大幅增长
全球高校 “猎杀” AI作业!学生如何应对 “人类化” 挑战?
AI 数据版权新纪元:Real Simple Licensing 协议引发行业关注
ChatGPT能随便连MCP了!对话就能开发票、帮退款…奥特曼的野心毕露:将OpenAI打造成全能型平台!开发者:太危险了不敢用
OpenAI进军韩国市场,携手三星与SK海力士共建AI未来!
为什么 LangChain ReAct 机制值得关注 ?
数十亿人将用上免费AGI!OpenAI奥特曼高调断言:全球经济将迎来极度通缩!效率强如DeepSeek,全球AI也需百吉瓦能源!
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
Meta
用户
微软
GPT
学习
技术
图像
Gemini
智能体
马斯克
AI新词
AI创作
Anthropic
英伟达
论文
训练
代码
算法
LLM
Stable Diffusion
芯片
腾讯
苹果
蛋白质
Claude
开发者
AI for Science
Agent
生成式
神经网络
机器学习
3D
xAI
研究
人形机器人
生成
AI视频
百度
计算
工具
Sora
GPU
大语言模型
华为
RAG
AI设计
字节跳动
具身智能
搜索
大型语言模型
场景
深度学习
AGI
视频生成
预测
视觉
伟达
架构
Transformer
神器推荐
编程
DeepMind
亚马逊
特斯拉
AI模型