理论
震撼实锤!清华姚班校友揭「1.4×加速」陷阱:AI优化器为何名不符实?
一直以来,预训练,都是大模型训练过程中最花钱的部分。 比如,在DeepSeek V3中,它的成本占比就超过95%。 谁能在这里节省算力,就等于赚了。
9/8/2025 8:59:00 AM
设计师大解放!清华发布「建筑平面图」自动生成模型 | ACL'25
建筑平面图是AEC(建筑、工程、施工)领域的核心 「语言」,贯穿设计思想草绘、方案交流与落地执行全流程。 而住宅作为人们日常生活的基本空间载体,其平面图更是在建筑设计早期发挥着核心作用。 然而,传统平面图设计流程高度依赖建筑师个人经验,存在效率低、反馈慢、缺乏智能辅助等问题。
9/8/2025 8:54:00 AM
谁不用谁亏!Karpathy吹爆GPT-5:10分钟编码完胜Claude一小时,奥特曼秒回感谢
GPT-5 Pro再次得到了AI大佬的认可。 今天,Karpathy一早激动发文,「必须再吹一波OpenAI的GPT-5 Pro,真的太强了」! 这究竟是肿么回事儿?
9/8/2025 8:53:00 AM
调整训练数据出场顺序,大模型就能变聪明!无需扩大模型/数据规模
模型训练重点在于数据的数量与质量? 其实还有一个关键因素——数据的出场顺序。 对此,微软亚洲研究院提出了一种全新的文本数据组织范式DELT(Data Efficacy in LM Training),通过引入数据排序策略,充分挖掘训练数据潜力,在不同模型尺寸与规模下都达到了良好性能。
9/8/2025 8:50:00 AM
字节发了个机器人全能大模型,带队人李航
机器人终于不用散装大脑了! 字节Seed一个模型就能搞定机器人推理、任务规划和自然语言交互。 经常做机器人的朋友都知道,以前想让机器人干活,得先解决一个烦人的问题——模块之间的信息代沟。
9/8/2025 8:45:00 AM
拜拜Claude!阿里最强万亿模型编程秒了Opus4,实测在此
总参数达到1万亿,阿里迄今为止最大的模型来了! 没错,就是前几日大家期待已久的Qwen3-Max-Preview (Instruct)。 1万亿啥概念?
9/8/2025 8:40:00 AM
毁誉参半的AI重建濒危语言之路
译者 | 陈峻审校 | 重楼众所周知,过去那些曾经定义和描述了灿烂文化的语言,如今可能只能留存于书面记录、片段影像、以及少数传颂者的记忆中。 而人类历史的每一次更迭,都会导致语言信息的此消彼长,文化知识的重塑。 目前,人工智能(AI)正在被用于研究手稿、音频档案和铭文,以重建失传的语法、词汇和发音。
9/8/2025 7:17:13 AM
陈峻
投资143亿、裁员200人、合作告急!Scale AI正驶向何方?
今年6月,Meta向数据标注公司Scale AI注资143亿美元,同时将其CEO Alexandr Wang及多位高管引入旗下的Meta超级智能实验室(MSL)。 这场高调合作被外界解读为Meta打造通用人工智能的重要一步。 但仅仅两个月后,裂痕便已浮现。
9/8/2025 3:00:00 AM
AI 工程师必备:八大 LLM 开发核心技能
很多人以为使用大语言模型(LLM)只是“写提示词(prompting)”。 但如果目标是打造生产级(production-grade)的 AI 系统,仅仅依赖提示词远远不够。 图片 真正的 LLM 开发需要系统性的工程能力:模型如何设计、部署、优化与运维。
9/8/2025 2:32:00 AM
新叔
提示词工程还没玩明白,又多了一个新词叫上下文工程!
这两年在AI圈子里,真的是新名词、新概念、新模型层出不穷,貌似隔段时间不出现一个新词感觉整个行业都退步了一样,大家都还在学习怎么使用好Prompt Engineering(提示词工程)的时候,这不Context Engineering(上下文工程)这个新词就出来了。 这篇内容来分享一下关于Context Engineering(上下文工程)这个新词的介绍、提示词工程和上下文工程的区别、以及二者在实际工作中的作用是什么,毕竟,现在AI圈子里面的新东西还是要跟上节奏学习的。 首先还是要先说一下这个背景,也就是为什么会提出一个Context Engineering(上下文工程)概念,以及它所解决的问题是啥。
9/8/2025 1:55:00 AM
DateForAI
Sklearn 实现高效机器学习的 19 个最优雅的技巧
了解 19 个 Sklearn 功能,它们可以直接而优雅地替代你手动执行的常见操作。 通过查阅Sklearn 的API 参考[1],我发现最常用的模型和函数只是该库功能的冰山一角。 尽管有些功能非常局限,只用于极少数的边缘情况,但我发现许多估算器、变换器和实用函数,可以更优雅地修复人们手动执行的常见操作。
9/8/2025 1:00:00 AM
云朵君
告别被动挨打,国内厂商正迎接AI赋能的主动防御新时代
当前,网络安全威胁的复杂性和智能化程度进入前所未有的快速发展,传统的被动防御模式已难以招架。 在这种背景下,AI赋能的主动防御正在国内推动网络攻防范式的变革。 这种变革不仅仅是简单地升级现有安全工具,而是从根本上改变安全攻防的规则,推动企业从被动响应转向安全左移的主动防御。
9/8/2025 12:00:01 AM
安全牛
阿里最新模型真的猛! 真肝实测:硬刚GPT5,技压DS、月暗,情商比GPT5高,读懂下棋大爷淋雨4小时的倔犟,但我发现了一个问题
编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)越来越有趣了! 连续两天,中国队一天推出了一个万亿参数模型。 昨天是Kimi的k2-0905,今天凌晨,则是阿里的Qwen3-Max-preview!
9/6/2025 6:54:33 PM
云昭
马斯克人形机器人再曝光:仿生手部引争议,Optimus 3原型疑云重重
近日,互联网企业赛富时创始人 Marc Benioff 在社交媒体平台 X 上发布了一段走访特斯拉的视频,展示了疑似 Optimus 3 . 人形机器人的原型。 这一视频迅速引发了科技界和公众的广泛关注,尤其是关于其仿生手部设计的讨论,使这一新一代机器人陷入了技术真实性与实用性的争议之中。
9/5/2025 4:53:04 PM
极客AI
突发!Claude AI 宣布封禁中国控股公司,在哪都不行
今天,Claude AI 的母公司 Anthropic 突然发布了一项新政策:即日起,Anthropic将不再对中国控股公司及其海外子公司开放服务。 图片那么,作为一名开发者,我们最关心的问题就是:这背后为什么会发生? 对我们会有什么影响?
9/5/2025 4:51:48 PM
前端充电宝
金融服务巨头Visa的新应用:AI竟能替你花钱!这意味着什么?
这家金融服务巨头周四宣布推出新的开发者工具,使智能体能够直接接入Visa的支付基础设施,从而实现公司所称的“智能体商业”——一种AI机器人可以根据消费者偏好和消费限额,从商品发现到结账全程自主完成的系统。 此举让Visa站在了可能彻底改变人们在线购物方式的技术变革前沿。 消费者无需再浏览网站或手动下单,而是设定参数,由智能体在多个商家之间自主寻找、评估并购买商品。
9/5/2025 4:49:43 PM
Michael
没PhD,算什么AI研究员!LeCun论文竟要28岁辍学生审批,发文「暗讽」内讧升级
Meta内部的AI大戏,剧情又加码了! 最近,首席科学家LeCun亲自下场,发了一篇帖子,字里行间疑似在「内涵」新BOSS——Alexandr Wang。 这是一段写给AI领域的记者和评论家们的话——在AI领域工作的人,并非都是「研究员」。
9/5/2025 1:57:28 PM
只收AI人才,OpenAI认证直通大厂!全球AI招聘平台,1000万人持证上岗
在全球职场社交的牌桌上,LinkedIn坐了快二十年,几乎没有真正的挑战者。 直到9月4日,OpenAI公布了「AI就业平台 AI技能认证」两项计划。 它试图用AI直接撮合招聘与求职,并用可验证的技能认证作为通行证。
9/5/2025 1:51:01 PM
新智元
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
机器人
数据
AI新词
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
技术
智能体
Gemini
马斯克
Anthropic
英伟达
图像
AI创作
训练
LLM
论文
代码
算法
苹果
AI for Science
Agent
Claude
腾讯
芯片
Stable Diffusion
蛋白质
具身智能
开发者
xAI
生成式
神经网络
机器学习
人形机器人
3D
AI视频
RAG
大语言模型
Sora
研究
百度
生成
GPU
工具
华为
字节跳动
计算
AGI
大型语言模型
AI设计
搜索
生成式AI
视频生成
DeepMind
特斯拉
场景
AI模型
深度学习
亚马逊
架构
Transformer
MCP
编程
Copilot
视觉