AI在线 AI在线

理论

震撼实锤!清华姚班校友揭「1.4×加速」陷阱:AI优化器为何名不符实?

一直以来,预训练,都是大模型训练过程中最花钱的部分。 比如,在DeepSeek V3中,它的成本占比就超过95%。 谁能在这里节省算力,就等于赚了。
9/8/2025 8:59:00 AM

设计师大解放!清华发布「建筑平面图」自动生成模型 | ACL'25

建筑平面图是AEC(建筑、工程、施工)领域的核心 「语言」,贯穿设计思想草绘、方案交流与落地执行全流程。 而住宅作为人们日常生活的基本空间载体,其平面图更是在建筑设计早期发挥着核心作用。 然而,传统平面图设计流程高度依赖建筑师个人经验,存在效率低、反馈慢、缺乏智能辅助等问题。
9/8/2025 8:54:00 AM

谁不用谁亏!Karpathy吹爆GPT-5:10分钟编码完胜Claude一小时,奥特曼秒回感谢

GPT-5 Pro再次得到了AI大佬的认可。 今天,Karpathy一早激动发文,「必须再吹一波OpenAI的GPT-5 Pro,真的太强了」! 这究竟是肿么回事儿?
9/8/2025 8:53:00 AM

调整训练数据出场顺序,大模型就能变聪明!无需扩大模型/数据规模

模型训练重点在于数据的数量与质量? 其实还有一个关键因素——数据的出场顺序。 对此,微软亚洲研究院提出了一种全新的文本数据组织范式DELT(Data Efficacy in LM Training),通过引入数据排序策略,充分挖掘训练数据潜力,在不同模型尺寸与规模下都达到了良好性能。
9/8/2025 8:50:00 AM

字节发了个机器人全能大模型,带队人李航

机器人终于不用散装大脑了! 字节Seed一个模型就能搞定机器人推理、任务规划和自然语言交互。 经常做机器人的朋友都知道,以前想让机器人干活,得先解决一个烦人的问题——模块之间的信息代沟。
9/8/2025 8:45:00 AM

拜拜Claude!阿里最强万亿模型编程秒了Opus4,实测在此

总参数达到1万亿,阿里迄今为止最大的模型来了! 没错,就是前几日大家期待已久的Qwen3-Max-Preview (Instruct)。 1万亿啥概念?
9/8/2025 8:40:00 AM

毁誉参半的AI重建濒危语言之路

译者 | 陈峻审校 | 重楼众所周知,过去那些曾经定义和描述了灿烂文化的语言,如今可能只能留存于书面记录、片段影像、以及少数传颂者的记忆中。 而人类历史的每一次更迭,都会导致语言信息的此消彼长,文化知识的重塑。 目前,人工智能(AI)正在被用于研究手稿、音频档案和铭文,以重建失传的语法、词汇和发音。
9/8/2025 7:17:13 AM
陈峻

投资143亿、裁员200人、合作告急!Scale AI正驶向何方?

今年6月,Meta向数据标注公司Scale AI注资143亿美元,同时将其CEO Alexandr Wang及多位高管引入旗下的Meta超级智能实验室(MSL)。 这场高调合作被外界解读为Meta打造通用人工智能的重要一步。 但仅仅两个月后,裂痕便已浮现。
9/8/2025 3:00:00 AM

AI 工程师必备:八大 LLM 开发核心技能

很多人以为使用大语言模型(LLM)只是“写提示词(prompting)”。 但如果目标是打造生产级(production-grade)的 AI 系统,仅仅依赖提示词远远不够。 图片    真正的 LLM 开发需要系统性的工程能力:模型如何设计、部署、优化与运维。
9/8/2025 2:32:00 AM
新叔

提示词工程还没玩明白,又多了一个新词叫上下文工程!

这两年在AI圈子里,真的是新名词、新概念、新模型层出不穷,貌似隔段时间不出现一个新词感觉整个行业都退步了一样,大家都还在学习怎么使用好Prompt Engineering(提示词工程)的时候,这不Context Engineering(上下文工程)这个新词就出来了。 这篇内容来分享一下关于Context Engineering(上下文工程)这个新词的介绍、提示词工程和上下文工程的区别、以及二者在实际工作中的作用是什么,毕竟,现在AI圈子里面的新东西还是要跟上节奏学习的。 首先还是要先说一下这个背景,也就是为什么会提出一个Context Engineering(上下文工程)概念,以及它所解决的问题是啥。
9/8/2025 1:55:00 AM
DateForAI

Sklearn 实现高效机器学习的 19 个最优雅的技巧

了解 19 个 Sklearn 功能,它们可以直接而优雅地替代你手动执行的常见操作。 通过查阅Sklearn 的API 参考[1],我发现最常用的模型和函数只是该库功能的冰山一角。 尽管有些功能非常局限,只用于极少数的边缘情况,但我发现许多估算器、变换器和实用函数,可以更优雅地修复人们手动执行的常见操作。
9/8/2025 1:00:00 AM
云朵君

告别被动挨打,国内厂商正迎接AI赋能的主动防御新时代

当前,网络安全威胁的复杂性和智能化程度进入前所未有的快速发展,传统的被动防御模式已难以招架。 在这种背景下,AI赋能的主动防御正在国内推动网络攻防范式的变革。 这种变革不仅仅是简单地升级现有安全工具,而是从根本上改变安全攻防的规则,推动企业从被动响应转向安全左移的主动防御。
9/8/2025 12:00:01 AM
安全牛

阿里最新模型真的猛! 真肝实测:硬刚GPT5,技压DS、月暗,情商比GPT5高,读懂下棋大爷淋雨4小时的倔犟,但我发现了一个问题

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)越来越有趣了! 连续两天,中国队一天推出了一个万亿参数模型。 昨天是Kimi的k2-0905,今天凌晨,则是阿里的Qwen3-Max-preview!
9/6/2025 6:54:33 PM
云昭

马斯克人形机器人再曝光:仿生手部引争议,Optimus 3原型疑云重重

近日,互联网企业赛富时创始人 Marc Benioff 在社交媒体平台 X 上发布了一段走访特斯拉的视频,展示了疑似 Optimus 3 . 人形机器人的原型。 这一视频迅速引发了科技界和公众的广泛关注,尤其是关于其仿生手部设计的讨论,使这一新一代机器人陷入了技术真实性与实用性的争议之中。
9/5/2025 4:53:04 PM
极客AI

突发!Claude AI 宣布封禁中国控股公司,在哪都不行

今天,Claude AI 的母公司 Anthropic 突然发布了一项新政策:即日起,Anthropic将不再对中国控股公司及其海外子公司开放服务。 图片那么,作为一名开发者,我们最关心的问题就是:这背后为什么会发生? 对我们会有什么影响?
9/5/2025 4:51:48 PM
前端充电宝

金融服务巨头Visa的新应用:AI竟能替你花钱!这意味着什么?

这家金融服务巨头周四宣布推出新的开发者工具,使智能体能够直接接入Visa的支付基础设施,从而实现公司所称的“智能体商业”——一种AI机器人可以根据消费者偏好和消费限额,从商品发现到结账全程自主完成的系统。 此举让Visa站在了可能彻底改变人们在线购物方式的技术变革前沿。 消费者无需再浏览网站或手动下单,而是设定参数,由智能体在多个商家之间自主寻找、评估并购买商品。
9/5/2025 4:49:43 PM
Michael

没PhD,算什么AI研究员!LeCun论文竟要28岁辍学生审批,发文「暗讽」内讧升级

Meta内部的AI大戏,剧情又加码了! 最近,首席科学家LeCun亲自下场,发了一篇帖子,字里行间疑似在「内涵」新BOSS——Alexandr Wang。 这是一段写给AI领域的记者和评论家们的话——在AI领域工作的人,并非都是「研究员」。
9/5/2025 1:57:28 PM

只收AI人才,OpenAI认证直通大厂!全球AI招聘平台,1000万人持证上岗

在全球职场社交的牌桌上,LinkedIn坐了快二十年,几乎没有真正的挑战者。 直到9月4日,OpenAI公布了「AI就业平台 AI技能认证」两项计划。 它试图用AI直接撮合招聘与求职,并用可验证的技能认证作为通行证。
9/5/2025 1:51:01 PM
新智元