AI在线 AI在线

AI

震撼实锤!清华姚班校友揭「1.4×加速」陷阱:AI优化器为何名不符实?

震撼实锤!清华姚班校友揭「1.4×加速」陷阱:AI优化器为何名不符实?

一直以来,预训练,都是大模型训练过程中最花钱的部分。 比如,在DeepSeek V3中,它的成本占比就超过95%。 谁能在这里节省算力,就等于赚了。
9/8/2025 8:59:00 AM
设计师大解放!清华发布「建筑平面图」自动生成模型 | ACL'25

设计师大解放!清华发布「建筑平面图」自动生成模型 | ACL'25

建筑平面图是AEC(建筑、工程、施工)领域的核心 「语言」,贯穿设计思想草绘、方案交流与落地执行全流程。 而住宅作为人们日常生活的基本空间载体,其平面图更是在建筑设计早期发挥着核心作用。 然而,传统平面图设计流程高度依赖建筑师个人经验,存在效率低、反馈慢、缺乏智能辅助等问题。
9/8/2025 8:54:00 AM
谁不用谁亏!Karpathy吹爆GPT-5:10分钟编码完胜Claude一小时,奥特曼秒回感谢

谁不用谁亏!Karpathy吹爆GPT-5:10分钟编码完胜Claude一小时,奥特曼秒回感谢

GPT-5 Pro再次得到了AI大佬的认可。 今天,Karpathy一早激动发文,「必须再吹一波OpenAI的GPT-5 Pro,真的太强了」! 这究竟是肿么回事儿?
9/8/2025 8:53:00 AM
调整训练数据出场顺序,大模型就能变聪明!无需扩大模型/数据规模

调整训练数据出场顺序,大模型就能变聪明!无需扩大模型/数据规模

模型训练重点在于数据的数量与质量? 其实还有一个关键因素——数据的出场顺序。 对此,微软亚洲研究院提出了一种全新的文本数据组织范式DELT(Data Efficacy in LM Training),通过引入数据排序策略,充分挖掘训练数据潜力,在不同模型尺寸与规模下都达到了良好性能。
9/8/2025 8:50:00 AM
拜拜Claude!阿里最强万亿模型编程秒了Opus4,实测在此

拜拜Claude!阿里最强万亿模型编程秒了Opus4,实测在此

总参数达到1万亿,阿里迄今为止最大的模型来了! 没错,就是前几日大家期待已久的Qwen3-Max-Preview (Instruct)。 1万亿啥概念?
9/8/2025 8:40:00 AM
毁誉参半的AI重建濒危语言之路

毁誉参半的AI重建濒危语言之路

译者 | 陈峻审校 | 重楼众所周知,过去那些曾经定义和描述了灿烂文化的语言,如今可能只能留存于书面记录、片段影像、以及少数传颂者的记忆中。 而人类历史的每一次更迭,都会导致语言信息的此消彼长,文化知识的重塑。 目前,人工智能(AI)正在被用于研究手稿、音频档案和铭文,以重建失传的语法、词汇和发音。
9/8/2025 7:17:13 AM 陈峻
AI 工程师必备:八大 LLM 开发核心技能

AI 工程师必备:八大 LLM 开发核心技能

很多人以为使用大语言模型(LLM)只是“写提示词(prompting)”。 但如果目标是打造生产级(production-grade)的 AI 系统,仅仅依赖提示词远远不够。 图片    真正的 LLM 开发需要系统性的工程能力:模型如何设计、部署、优化与运维。
9/8/2025 2:32:00 AM 新叔
告别被动挨打,国内厂商正迎接AI赋能的主动防御新时代

告别被动挨打,国内厂商正迎接AI赋能的主动防御新时代

当前,网络安全威胁的复杂性和智能化程度进入前所未有的快速发展,传统的被动防御模式已难以招架。 在这种背景下,AI赋能的主动防御正在国内推动网络攻防范式的变革。 这种变革不仅仅是简单地升级现有安全工具,而是从根本上改变安全攻防的规则,推动企业从被动响应转向安全左移的主动防御。
9/8/2025 12:00:01 AM 安全牛
马斯克人形机器人再曝光:仿生手部引争议,Optimus 3原型疑云重重

马斯克人形机器人再曝光:仿生手部引争议,Optimus 3原型疑云重重

近日,互联网企业赛富时创始人 Marc Benioff 在社交媒体平台 X 上发布了一段走访特斯拉的视频,展示了疑似 Optimus 3 . 人形机器人的原型。 这一视频迅速引发了科技界和公众的广泛关注,尤其是关于其仿生手部设计的讨论,使这一新一代机器人陷入了技术真实性与实用性的争议之中。
9/5/2025 4:53:04 PM 极客AI
金融服务巨头Visa的新应用:AI竟能替你花钱!这意味着什么?

金融服务巨头Visa的新应用:AI竟能替你花钱!这意味着什么?

这家金融服务巨头周四宣布推出新的开发者工具,使智能体能够直接接入Visa的支付基础设施,从而实现公司所称的“智能体商业”——一种AI机器人可以根据消费者偏好和消费限额,从商品发现到结账全程自主完成的系统。 此举让Visa站在了可能彻底改变人们在线购物方式的技术变革前沿。 消费者无需再浏览网站或手动下单,而是设定参数,由智能体在多个商家之间自主寻找、评估并购买商品。
9/5/2025 4:49:43 PM Michael
实测美团 LongCat:快到极致,但是别说追平 DeepSeek

实测美团 LongCat:快到极致,但是别说追平 DeepSeek

如果你这几天刷社交媒体,应该已经注意到,美团的 LongCat-Flash-Chat 正在频频刷屏,标题大多是将其与DeepSeek作对比,称美团推出的第一款开源大模型已经追平了DeepSeek-V3.1。 事实果真如此吗? AI 科技评论想要一探究竟。
9/5/2025 3:03:00 PM 郑佳美
没PhD,算什么AI研究员!LeCun论文竟要28岁辍学生审批,发文「暗讽」内讧升级

没PhD,算什么AI研究员!LeCun论文竟要28岁辍学生审批,发文「暗讽」内讧升级

Meta内部的AI大戏,剧情又加码了! 最近,首席科学家LeCun亲自下场,发了一篇帖子,字里行间疑似在「内涵」新BOSS——Alexandr Wang。 这是一段写给AI领域的记者和评论家们的话——在AI领域工作的人,并非都是「研究员」。
9/5/2025 1:57:28 PM
只收AI人才,OpenAI认证直通大厂!全球AI招聘平台,1000万人持证上岗

只收AI人才,OpenAI认证直通大厂!全球AI招聘平台,1000万人持证上岗

在全球职场社交的牌桌上,LinkedIn坐了快二十年,几乎没有真正的挑战者。 直到9月4日,OpenAI公布了「AI就业平台 AI技能认证」两项计划。 它试图用AI直接撮合招聘与求职,并用可验证的技能认证作为通行证。
9/5/2025 1:51:01 PM 新智元
准确率达90%,用户却疯狂弃用,一遇问题转人工,AI客服竟比电话语音还糟!大牛发文痛斥:能力≠采纳!四层架构让Agent无AI感

准确率达90%,用户却疯狂弃用,一遇问题转人工,AI客服竟比电话语音还糟!大牛发文痛斥:能力≠采纳!四层架构让Agent无AI感

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)上周,我和一位最近刚上线 AI Agent 的 PM 聊天。 指标看上去非常亮眼:89% 的准确率、毫秒级的响应、用户调研反馈积极。 但实际情况却很打脸,上线没多久,用户纷纷弃用了。
9/5/2025 1:06:00 PM 云昭
正则化:机器学习泛化能力的守护者

正则化:机器学习泛化能力的守护者

一、什么是正则化? 正则化是机器学习和统计建模中的关键技术,用于控制模型复杂度,防止过拟合(overfitting)。 当模型过度拟合训练数据时,它会过度关注数据中的噪声和细节,导致在新数据上表现显著下降。
9/5/2025 10:22:35 AM 用户007
告别海量标注!浙大团队提出GUI-RCPO,让GUI定位在无标签数据上自我进化

告别海量标注!浙大团队提出GUI-RCPO,让GUI定位在无标签数据上自我进化

无需海量数据标注,智能体也能精确识别定位目标元素了! 来自浙大等机构的研究人员提出GUI-RCPO——一种自我监督的强化学习方法,可以让模型在没有标注的数据上自主提升GUI grounding(图形界面定位)能力。 何谓GUI grounding?
9/5/2025 10:11:01 AM
突破具身智能“专家困境”!北大新方法让宇树G1靠单一框架掌握跳舞和侧手翻

突破具身智能“专家困境”!北大新方法让宇树G1靠单一框架掌握跳舞和侧手翻

人形机器人对跳舞这件事,如今是越来越擅长了。 比如跳一支查尔斯顿舞,一分四十秒的丝滑摇摆,稳定得像踩着节拍器:不过,它们能否像人类一样自如切换跳舞、体操、日常操作等不同的动作模式? 北京大学与BeingBeyond团队联合研发的BumbleBee系统给出了最新答案:通过创新的“分治-精炼-融合”三级架构,该系统首次实现人形机器人在多样化动作中的稳定控制。
9/5/2025 10:09:47 AM
「纳米香蕉」LMArena两周500万投票,引爆10倍流量!谷歌、OpenAI扎堆打擂台

「纳米香蕉」LMArena两周500万投票,引爆10倍流量!谷歌、OpenAI扎堆打擂台

今年8月,一款名为「纳米香蕉」的神秘AI图像编辑器轻松登顶Image Edit Arena榜首,直接把LMArena8月份的平台流量拉爆:流量暴增10倍,月活300万 。 该模型自在LMArena启动盲测以来,短短两周便吸引了超过500万次总投票,并单独赢得了250万 直接投票,创下历史最高参与度。 nano‑banana的神秘身份,也在LMArena社区引发广泛猜测。
9/5/2025 9:14:00 AM