AI
震撼实锤!清华姚班校友揭「1.4×加速」陷阱:AI优化器为何名不符实?
一直以来,预训练,都是大模型训练过程中最花钱的部分。 比如,在DeepSeek V3中,它的成本占比就超过95%。 谁能在这里节省算力,就等于赚了。
设计师大解放!清华发布「建筑平面图」自动生成模型 | ACL'25
建筑平面图是AEC(建筑、工程、施工)领域的核心 「语言」,贯穿设计思想草绘、方案交流与落地执行全流程。 而住宅作为人们日常生活的基本空间载体,其平面图更是在建筑设计早期发挥着核心作用。 然而,传统平面图设计流程高度依赖建筑师个人经验,存在效率低、反馈慢、缺乏智能辅助等问题。
谁不用谁亏!Karpathy吹爆GPT-5:10分钟编码完胜Claude一小时,奥特曼秒回感谢
GPT-5 Pro再次得到了AI大佬的认可。 今天,Karpathy一早激动发文,「必须再吹一波OpenAI的GPT-5 Pro,真的太强了」! 这究竟是肿么回事儿?
调整训练数据出场顺序,大模型就能变聪明!无需扩大模型/数据规模
模型训练重点在于数据的数量与质量? 其实还有一个关键因素——数据的出场顺序。 对此,微软亚洲研究院提出了一种全新的文本数据组织范式DELT(Data Efficacy in LM Training),通过引入数据排序策略,充分挖掘训练数据潜力,在不同模型尺寸与规模下都达到了良好性能。
拜拜Claude!阿里最强万亿模型编程秒了Opus4,实测在此
总参数达到1万亿,阿里迄今为止最大的模型来了! 没错,就是前几日大家期待已久的Qwen3-Max-Preview (Instruct)。 1万亿啥概念?
毁誉参半的AI重建濒危语言之路
译者 | 陈峻审校 | 重楼众所周知,过去那些曾经定义和描述了灿烂文化的语言,如今可能只能留存于书面记录、片段影像、以及少数传颂者的记忆中。 而人类历史的每一次更迭,都会导致语言信息的此消彼长,文化知识的重塑。 目前,人工智能(AI)正在被用于研究手稿、音频档案和铭文,以重建失传的语法、词汇和发音。
AI 工程师必备:八大 LLM 开发核心技能
很多人以为使用大语言模型(LLM)只是“写提示词(prompting)”。 但如果目标是打造生产级(production-grade)的 AI 系统,仅仅依赖提示词远远不够。 图片 真正的 LLM 开发需要系统性的工程能力:模型如何设计、部署、优化与运维。
告别被动挨打,国内厂商正迎接AI赋能的主动防御新时代
当前,网络安全威胁的复杂性和智能化程度进入前所未有的快速发展,传统的被动防御模式已难以招架。 在这种背景下,AI赋能的主动防御正在国内推动网络攻防范式的变革。 这种变革不仅仅是简单地升级现有安全工具,而是从根本上改变安全攻防的规则,推动企业从被动响应转向安全左移的主动防御。
马斯克人形机器人再曝光:仿生手部引争议,Optimus 3原型疑云重重
近日,互联网企业赛富时创始人 Marc Benioff 在社交媒体平台 X 上发布了一段走访特斯拉的视频,展示了疑似 Optimus 3 . 人形机器人的原型。 这一视频迅速引发了科技界和公众的广泛关注,尤其是关于其仿生手部设计的讨论,使这一新一代机器人陷入了技术真实性与实用性的争议之中。
金融服务巨头Visa的新应用:AI竟能替你花钱!这意味着什么?
这家金融服务巨头周四宣布推出新的开发者工具,使智能体能够直接接入Visa的支付基础设施,从而实现公司所称的“智能体商业”——一种AI机器人可以根据消费者偏好和消费限额,从商品发现到结账全程自主完成的系统。 此举让Visa站在了可能彻底改变人们在线购物方式的技术变革前沿。 消费者无需再浏览网站或手动下单,而是设定参数,由智能体在多个商家之间自主寻找、评估并购买商品。
实测美团 LongCat:快到极致,但是别说追平 DeepSeek
如果你这几天刷社交媒体,应该已经注意到,美团的 LongCat-Flash-Chat 正在频频刷屏,标题大多是将其与DeepSeek作对比,称美团推出的第一款开源大模型已经追平了DeepSeek-V3.1。 事实果真如此吗? AI 科技评论想要一探究竟。
没PhD,算什么AI研究员!LeCun论文竟要28岁辍学生审批,发文「暗讽」内讧升级
Meta内部的AI大戏,剧情又加码了! 最近,首席科学家LeCun亲自下场,发了一篇帖子,字里行间疑似在「内涵」新BOSS——Alexandr Wang。 这是一段写给AI领域的记者和评论家们的话——在AI领域工作的人,并非都是「研究员」。
只收AI人才,OpenAI认证直通大厂!全球AI招聘平台,1000万人持证上岗
在全球职场社交的牌桌上,LinkedIn坐了快二十年,几乎没有真正的挑战者。 直到9月4日,OpenAI公布了「AI就业平台 AI技能认证」两项计划。 它试图用AI直接撮合招聘与求职,并用可验证的技能认证作为通行证。
准确率达90%,用户却疯狂弃用,一遇问题转人工,AI客服竟比电话语音还糟!大牛发文痛斥:能力≠采纳!四层架构让Agent无AI感
编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)上周,我和一位最近刚上线 AI Agent 的 PM 聊天。 指标看上去非常亮眼:89% 的准确率、毫秒级的响应、用户调研反馈积极。 但实际情况却很打脸,上线没多久,用户纷纷弃用了。
正则化:机器学习泛化能力的守护者
一、什么是正则化? 正则化是机器学习和统计建模中的关键技术,用于控制模型复杂度,防止过拟合(overfitting)。 当模型过度拟合训练数据时,它会过度关注数据中的噪声和细节,导致在新数据上表现显著下降。
告别海量标注!浙大团队提出GUI-RCPO,让GUI定位在无标签数据上自我进化
无需海量数据标注,智能体也能精确识别定位目标元素了! 来自浙大等机构的研究人员提出GUI-RCPO——一种自我监督的强化学习方法,可以让模型在没有标注的数据上自主提升GUI grounding(图形界面定位)能力。 何谓GUI grounding?
突破具身智能“专家困境”!北大新方法让宇树G1靠单一框架掌握跳舞和侧手翻
人形机器人对跳舞这件事,如今是越来越擅长了。 比如跳一支查尔斯顿舞,一分四十秒的丝滑摇摆,稳定得像踩着节拍器:不过,它们能否像人类一样自如切换跳舞、体操、日常操作等不同的动作模式? 北京大学与BeingBeyond团队联合研发的BumbleBee系统给出了最新答案:通过创新的“分治-精炼-融合”三级架构,该系统首次实现人形机器人在多样化动作中的稳定控制。
「纳米香蕉」LMArena两周500万投票,引爆10倍流量!谷歌、OpenAI扎堆打擂台
今年8月,一款名为「纳米香蕉」的神秘AI图像编辑器轻松登顶Image Edit Arena榜首,直接把LMArena8月份的平台流量拉爆:流量暴增10倍,月活300万 。 该模型自在LMArena启动盲测以来,短短两周便吸引了超过500万次总投票,并单独赢得了250万 直接投票,创下历史最高参与度。 nano‑banana的神秘身份,也在LMArena社区引发广泛猜测。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
AI新词
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
智能体
技术
Gemini
英伟达
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
代码
AI for Science
苹果
算法
腾讯
Agent
Claude
芯片
Stable Diffusion
具身智能
xAI
蛋白质
开发者
人形机器人
生成式
神经网络
机器学习
AI视频
3D
RAG
大语言模型
字节跳动
Sora
百度
研究
GPU
生成
工具
华为
AGI
计算
大型语言模型
AI设计
生成式AI
搜索
视频生成
亚马逊
AI模型
DeepMind
特斯拉
场景
深度学习
Transformer
架构
Copilot
MCP
编程
视觉