理论

震撼实锤！清华姚班校友揭「1.4×加速」陷阱：AI优化器为何名不符实？

一直以来，预训练，都是大模型训练过程中最花钱的部分。比如，在DeepSeek V3中，它的成本占比就超过95%。谁能在这里节省算力，就等于赚了。

9/8/2025 8:59:00 AM

设计师大解放！清华发布「建筑平面图」自动生成模型 | ACL'25

建筑平面图是AEC（建筑、工程、施工）领域的核心「语言」，贯穿设计思想草绘、方案交流与落地执行全流程。而住宅作为人们日常生活的基本空间载体，其平面图更是在建筑设计早期发挥着核心作用。然而，传统平面图设计流程高度依赖建筑师个人经验，存在效率低、反馈慢、缺乏智能辅助等问题。

9/8/2025 8:54:00 AM

谁不用谁亏！Karpathy吹爆GPT-5：10分钟编码完胜Claude一小时，奥特曼秒回感谢

GPT-5 Pro再次得到了AI大佬的认可。今天，Karpathy一早激动发文，「必须再吹一波OpenAI的GPT-5 Pro，真的太强了」！这究竟是肿么回事儿？

9/8/2025 8:53:00 AM

调整训练数据出场顺序，大模型就能变聪明！无需扩大模型/数据规模

模型训练重点在于数据的数量与质量？其实还有一个关键因素——数据的出场顺序。对此，微软亚洲研究院提出了一种全新的文本数据组织范式DELT（Data Efficacy in LM Training），通过引入数据排序策略，充分挖掘训练数据潜力，在不同模型尺寸与规模下都达到了良好性能。

9/8/2025 8:50:00 AM

字节发了个机器人全能大模型，带队人李航

机器人终于不用散装大脑了！字节Seed一个模型就能搞定机器人推理、任务规划和自然语言交互。经常做机器人的朋友都知道，以前想让机器人干活，得先解决一个烦人的问题——模块之间的信息代沟。

9/8/2025 8:45:00 AM

拜拜Claude！阿里最强万亿模型编程秒了Opus4，实测在此

总参数达到1万亿，阿里迄今为止最大的模型来了！没错，就是前几日大家期待已久的Qwen3-Max-Preview （Instruct）。 1万亿啥概念？

9/8/2025 8:40:00 AM

毁誉参半的AI重建濒危语言之路

译者 | 陈峻审校 | 重楼众所周知，过去那些曾经定义和描述了灿烂文化的语言，如今可能只能留存于书面记录、片段影像、以及少数传颂者的记忆中。而人类历史的每一次更迭，都会导致语言信息的此消彼长，文化知识的重塑。目前，人工智能（AI）正在被用于研究手稿、音频档案和铭文，以重建失传的语法、词汇和发音。

9/8/2025 7:17:13 AM

陈峻

投资143亿、裁员200人、合作告急！Scale AI正驶向何方？

今年6月，Meta向数据标注公司Scale AI注资143亿美元，同时将其CEO Alexandr Wang及多位高管引入旗下的Meta超级智能实验室（MSL）。这场高调合作被外界解读为Meta打造通用人工智能的重要一步。但仅仅两个月后，裂痕便已浮现。

9/8/2025 3:00:00 AM

AI 工程师必备：八大 LLM 开发核心技能

很多人以为使用大语言模型（LLM）只是“写提示词（prompting）”。但如果目标是打造生产级（production-grade）的 AI 系统，仅仅依赖提示词远远不够。图片真正的 LLM 开发需要系统性的工程能力：模型如何设计、部署、优化与运维。

9/8/2025 2:32:00 AM

新叔

这两年在AI圈子里，真的是新名词、新概念、新模型层出不穷，貌似隔段时间不出现一个新词感觉整个行业都退步了一样，大家都还在学习怎么使用好Prompt Engineering（提示词工程）的时候，这不Context Engineering（上下文工程）这个新词就出来了。这篇内容来分享一下关于Context Engineering（上下文工程）这个新词的介绍、提示词工程和上下文工程的区别、以及二者在实际工作中的作用是什么，毕竟，现在AI圈子里面的新东西还是要跟上节奏学习的。首先还是要先说一下这个背景，也就是为什么会提出一个Context Engineering（上下文工程）概念，以及它所解决的问题是啥。

9/8/2025 1:55:00 AM

DateForAI

Sklearn 实现高效机器学习的 19 个最优雅的技巧

了解 19 个 Sklearn 功能，它们可以直接而优雅地替代你手动执行的常见操作。通过查阅Sklearn 的API 参考[1]，我发现最常用的模型和函数只是该库功能的冰山一角。尽管有些功能非常局限，只用于极少数的边缘情况，但我发现许多估算器、变换器和实用函数，可以更优雅地修复人们手动执行的常见操作。

9/8/2025 1:00:00 AM

云朵君

告别被动挨打，国内厂商正迎接AI赋能的主动防御新时代

当前，网络安全威胁的复杂性和智能化程度进入前所未有的快速发展，传统的被动防御模式已难以招架。在这种背景下，AI赋能的主动防御正在国内推动网络攻防范式的变革。这种变革不仅仅是简单地升级现有安全工具，而是从根本上改变安全攻防的规则，推动企业从被动响应转向安全左移的主动防御。

9/8/2025 12:00:01 AM

安全牛

阿里最新模型真的猛！真肝实测：硬刚GPT5，技压DS、月暗，情商比GPT5高，读懂下棋大爷淋雨4小时的倔犟，但我发现了一个问题

编辑｜云昭出品 | 51CTO技术栈（微信号：blog51cto）越来越有趣了！连续两天，中国队一天推出了一个万亿参数模型。昨天是Kimi的k2-0905，今天凌晨，则是阿里的Qwen3-Max-preview！

9/6/2025 6:54:33 PM

云昭

马斯克人形机器人再曝光：仿生手部引争议，Optimus 3原型疑云重重

近日，互联网企业赛富时创始人 Marc Benioff 在社交媒体平台 X 上发布了一段走访特斯拉的视频，展示了疑似 Optimus 3 . 人形机器人的原型。这一视频迅速引发了科技界和公众的广泛关注，尤其是关于其仿生手部设计的讨论，使这一新一代机器人陷入了技术真实性与实用性的争议之中。

9/5/2025 4:53:04 PM

极客AI

突发！Claude AI 宣布封禁中国控股公司，在哪都不行

今天，Claude AI 的母公司 Anthropic 突然发布了一项新政策：即日起，Anthropic将不再对中国控股公司及其海外子公司开放服务。图片那么，作为一名开发者，我们最关心的问题就是：这背后为什么会发生？对我们会有什么影响？

9/5/2025 4:51:48 PM

前端充电宝

金融服务巨头Visa的新应用：AI竟能替你花钱！这意味着什么？

这家金融服务巨头周四宣布推出新的开发者工具，使智能体能够直接接入Visa的支付基础设施，从而实现公司所称的“智能体商业”——一种AI机器人可以根据消费者偏好和消费限额，从商品发现到结账全程自主完成的系统。此举让Visa站在了可能彻底改变人们在线购物方式的技术变革前沿。消费者无需再浏览网站或手动下单，而是设定参数，由智能体在多个商家之间自主寻找、评估并购买商品。

9/5/2025 4:49:43 PM

Michael