AI

震撼实锤！清华姚班校友揭「1.4×加速」陷阱：AI优化器为何名不符实？

一直以来，预训练，都是大模型训练过程中最花钱的部分。比如，在DeepSeek V3中，它的成本占比就超过95%。谁能在这里节省算力，就等于赚了。

9/8/2025 8:59:00 AM

设计师大解放！清华发布「建筑平面图」自动生成模型 | ACL'25

建筑平面图是AEC（建筑、工程、施工）领域的核心「语言」，贯穿设计思想草绘、方案交流与落地执行全流程。而住宅作为人们日常生活的基本空间载体，其平面图更是在建筑设计早期发挥着核心作用。然而，传统平面图设计流程高度依赖建筑师个人经验，存在效率低、反馈慢、缺乏智能辅助等问题。

9/8/2025 8:54:00 AM

谁不用谁亏！Karpathy吹爆GPT-5：10分钟编码完胜Claude一小时，奥特曼秒回感谢

GPT-5 Pro再次得到了AI大佬的认可。今天，Karpathy一早激动发文，「必须再吹一波OpenAI的GPT-5 Pro，真的太强了」！这究竟是肿么回事儿？

9/8/2025 8:53:00 AM

调整训练数据出场顺序，大模型就能变聪明！无需扩大模型/数据规模

模型训练重点在于数据的数量与质量？其实还有一个关键因素——数据的出场顺序。对此，微软亚洲研究院提出了一种全新的文本数据组织范式DELT（Data Efficacy in LM Training），通过引入数据排序策略，充分挖掘训练数据潜力，在不同模型尺寸与规模下都达到了良好性能。

9/8/2025 8:50:00 AM

拜拜Claude！阿里最强万亿模型编程秒了Opus4，实测在此

总参数达到1万亿，阿里迄今为止最大的模型来了！没错，就是前几日大家期待已久的Qwen3-Max-Preview （Instruct）。 1万亿啥概念？

9/8/2025 8:40:00 AM

毁誉参半的AI重建濒危语言之路

译者 | 陈峻审校 | 重楼众所周知，过去那些曾经定义和描述了灿烂文化的语言，如今可能只能留存于书面记录、片段影像、以及少数传颂者的记忆中。而人类历史的每一次更迭，都会导致语言信息的此消彼长，文化知识的重塑。目前，人工智能（AI）正在被用于研究手稿、音频档案和铭文，以重建失传的语法、词汇和发音。

9/8/2025 7:17:13 AM 陈峻

AI 工程师必备：八大 LLM 开发核心技能

很多人以为使用大语言模型（LLM）只是“写提示词（prompting）”。但如果目标是打造生产级（production-grade）的 AI 系统，仅仅依赖提示词远远不够。图片真正的 LLM 开发需要系统性的工程能力：模型如何设计、部署、优化与运维。

9/8/2025 2:32:00 AM 新叔

告别被动挨打，国内厂商正迎接AI赋能的主动防御新时代

当前，网络安全威胁的复杂性和智能化程度进入前所未有的快速发展，传统的被动防御模式已难以招架。在这种背景下，AI赋能的主动防御正在国内推动网络攻防范式的变革。这种变革不仅仅是简单地升级现有安全工具，而是从根本上改变安全攻防的规则，推动企业从被动响应转向安全左移的主动防御。

9/8/2025 12:00:01 AM 安全牛

马斯克人形机器人再曝光：仿生手部引争议，Optimus 3原型疑云重重

近日，互联网企业赛富时创始人 Marc Benioff 在社交媒体平台 X 上发布了一段走访特斯拉的视频，展示了疑似 Optimus 3 . 人形机器人的原型。这一视频迅速引发了科技界和公众的广泛关注，尤其是关于其仿生手部设计的讨论，使这一新一代机器人陷入了技术真实性与实用性的争议之中。

9/5/2025 4:53:04 PM 极客AI

金融服务巨头Visa的新应用：AI竟能替你花钱！这意味着什么？

这家金融服务巨头周四宣布推出新的开发者工具，使智能体能够直接接入Visa的支付基础设施，从而实现公司所称的“智能体商业”——一种AI机器人可以根据消费者偏好和消费限额，从商品发现到结账全程自主完成的系统。此举让Visa站在了可能彻底改变人们在线购物方式的技术变革前沿。消费者无需再浏览网站或手动下单，而是设定参数，由智能体在多个商家之间自主寻找、评估并购买商品。

9/5/2025 4:49:43 PM Michael

实测美团 LongCat：快到极致，但是别说追平 DeepSeek

如果你这几天刷社交媒体，应该已经注意到，美团的 LongCat-Flash-Chat 正在频频刷屏，标题大多是将其与DeepSeek作对比，称美团推出的第一款开源大模型已经追平了DeepSeek-V3.1。事实果真如此吗？ AI 科技评论想要一探究竟。

9/5/2025 3:03:00 PM 郑佳美

没PhD，算什么AI研究员！LeCun论文竟要28岁辍学生审批，发文「暗讽」内讧升级

Meta内部的AI大戏，剧情又加码了！最近，首席科学家LeCun亲自下场，发了一篇帖子，字里行间疑似在「内涵」新BOSS——Alexandr Wang。这是一段写给AI领域的记者和评论家们的话——在AI领域工作的人，并非都是「研究员」。

9/5/2025 1:57:28 PM

只收AI人才，OpenAI认证直通大厂！全球AI招聘平台，1000万人持证上岗

在全球职场社交的牌桌上，LinkedIn坐了快二十年，几乎没有真正的挑战者。直到9月4日，OpenAI公布了「AI就业平台 AI技能认证」两项计划。它试图用AI直接撮合招聘与求职，并用可验证的技能认证作为通行证。

9/5/2025 1:51:01 PM 新智元

准确率达90%，用户却疯狂弃用，一遇问题转人工，AI客服竟比电话语音还糟！大牛发文痛斥：能力≠采纳!四层架构让Agent无AI感

编辑 | 云昭出品 | 51CTO技术栈（微信号：blog51cto）上周，我和一位最近刚上线 AI Agent 的 PM 聊天。指标看上去非常亮眼：89% 的准确率、毫秒级的响应、用户调研反馈积极。但实际情况却很打脸，上线没多久，用户纷纷弃用了。

9/5/2025 1:06:00 PM 云昭

正则化：机器学习泛化能力的守护者

一、什么是正则化？正则化是机器学习和统计建模中的关键技术，用于控制模型复杂度，防止过拟合（overfitting）。当模型过度拟合训练数据时，它会过度关注数据中的噪声和细节，导致在新数据上表现显著下降。

9/5/2025 10:22:35 AM 用户007

告别海量标注！浙大团队提出GUI-RCPO，让GUI定位在无标签数据上自我进化

无需海量数据标注，智能体也能精确识别定位目标元素了！来自浙大等机构的研究人员提出GUI-RCPO——一种自我监督的强化学习方法，可以让模型在没有标注的数据上自主提升GUI grounding（图形界面定位）能力。何谓GUI grounding？

9/5/2025 10:11:01 AM

突破具身智能“专家困境”！北大新方法让宇树G1靠单一框架掌握跳舞和侧手翻

人形机器人对跳舞这件事，如今是越来越擅长了。比如跳一支查尔斯顿舞，一分四十秒的丝滑摇摆，稳定得像踩着节拍器：不过，它们能否像人类一样自如切换跳舞、体操、日常操作等不同的动作模式？北京大学与BeingBeyond团队联合研发的BumbleBee系统给出了最新答案：通过创新的“分治-精炼-融合”三级架构，该系统首次实现人形机器人在多样化动作中的稳定控制。

9/5/2025 10:09:47 AM

「纳米香蕉」LMArena两周500万投票，引爆10倍流量！谷歌、OpenAI扎堆打擂台

今年8月，一款名为「纳米香蕉」的神秘AI图像编辑器轻松登顶Image Edit Arena榜首，直接把LMArena8月份的平台流量拉爆：流量暴增10倍，月活300万。该模型自在LMArena启动盲测以来，短短两周便吸引了超过500万次总投票，并单独赢得了250万直接投票，创下历史最高参与度。 nano‑banana的神秘身份，也在LMArena社区引发广泛猜测。

9/5/2025 9:14:00 AM

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 GGUF 是什么？一文看懂大模型里最火的模型格式 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享 Sora、可灵、即梦哪家强？AI视频软件深度测评！免注册免费用！17种AI绘图模型一站式体验平台LMArena 可灵、即梦、海螺、Vidu哪家强？4大AI视频神器深度测评 LangChain V1.0 深度解析：手把手带你跑通全新智能体架构

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI绘画大模型 AI新词机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习智能体技术 Gemini 英伟达马斯克 Anthropic 图像 AI创作训练 LLM 论文代码 AI for Science 苹果算法腾讯 Agent Claude 芯片 Stable Diffusion 具身智能 xAI 蛋白质开发者人形机器人生成式神经网络机器学习 AI视频 3D RAG 大语言模型字节跳动 Sora 百度研究 GPU 生成工具华为 AGI 计算大型语言模型 AI设计生成式AI 搜索视频生成亚马逊 AI模型 DeepMind 特斯拉场景深度学习 Transformer 架构 Copilot MCP 编程视觉