理论
你的 AI “体检”了吗?开源 AI 红队测试平台,一键自查三大风险
作者 | 腾讯朱雀实验室最近的AI圈,简直比好莱坞大片还精彩。 一边是各家的顶尖模型接连发布,技术狂欢席卷全球;另一边,这些看似无所不能的“最强大脑”却集体被成功“越狱”(Jailbreak)输出有害内容。 [大模型们的越狱“一日游”]而当我们回过头看,每个重磅发布的大模型都在经历类似的迅速失守,从23年的DAN(Do Anything Now)、24年的BoN(Best of N)到今年的回音室(Echo Chamber)与模型降级(PROMISQROUTE)攻击,各种新的通用越狱手法层出不穷,而在arXiv上截止到今年7月累计已有七百余篇越狱攻击相关论文。
震撼实锤!清华姚班校友揭「1.4×加速」陷阱:AI优化器为何名不符实?
一直以来,预训练,都是大模型训练过程中最花钱的部分。 比如,在DeepSeek V3中,它的成本占比就超过95%。 谁能在这里节省算力,就等于赚了。
设计师大解放!清华发布「建筑平面图」自动生成模型 | ACL'25
建筑平面图是AEC(建筑、工程、施工)领域的核心 「语言」,贯穿设计思想草绘、方案交流与落地执行全流程。 而住宅作为人们日常生活的基本空间载体,其平面图更是在建筑设计早期发挥着核心作用。 然而,传统平面图设计流程高度依赖建筑师个人经验,存在效率低、反馈慢、缺乏智能辅助等问题。
谁不用谁亏!Karpathy吹爆GPT-5:10分钟编码完胜Claude一小时,奥特曼秒回感谢
GPT-5 Pro再次得到了AI大佬的认可。 今天,Karpathy一早激动发文,「必须再吹一波OpenAI的GPT-5 Pro,真的太强了」! 这究竟是肿么回事儿?
调整训练数据出场顺序,大模型就能变聪明!无需扩大模型/数据规模
模型训练重点在于数据的数量与质量? 其实还有一个关键因素——数据的出场顺序。 对此,微软亚洲研究院提出了一种全新的文本数据组织范式DELT(Data Efficacy in LM Training),通过引入数据排序策略,充分挖掘训练数据潜力,在不同模型尺寸与规模下都达到了良好性能。
字节发了个机器人全能大模型,带队人李航
机器人终于不用散装大脑了! 字节Seed一个模型就能搞定机器人推理、任务规划和自然语言交互。 经常做机器人的朋友都知道,以前想让机器人干活,得先解决一个烦人的问题——模块之间的信息代沟。
拜拜Claude!阿里最强万亿模型编程秒了Opus4,实测在此
总参数达到1万亿,阿里迄今为止最大的模型来了! 没错,就是前几日大家期待已久的Qwen3-Max-Preview (Instruct)。 1万亿啥概念?
毁誉参半的AI重建濒危语言之路
译者 | 陈峻审校 | 重楼众所周知,过去那些曾经定义和描述了灿烂文化的语言,如今可能只能留存于书面记录、片段影像、以及少数传颂者的记忆中。 而人类历史的每一次更迭,都会导致语言信息的此消彼长,文化知识的重塑。 目前,人工智能(AI)正在被用于研究手稿、音频档案和铭文,以重建失传的语法、词汇和发音。
投资143亿、裁员200人、合作告急!Scale AI正驶向何方?
今年6月,Meta向数据标注公司Scale AI注资143亿美元,同时将其CEO Alexandr Wang及多位高管引入旗下的Meta超级智能实验室(MSL)。 这场高调合作被外界解读为Meta打造通用人工智能的重要一步。 但仅仅两个月后,裂痕便已浮现。
AI 工程师必备:八大 LLM 开发核心技能
很多人以为使用大语言模型(LLM)只是“写提示词(prompting)”。 但如果目标是打造生产级(production-grade)的 AI 系统,仅仅依赖提示词远远不够。 图片 真正的 LLM 开发需要系统性的工程能力:模型如何设计、部署、优化与运维。
提示词工程还没玩明白,又多了一个新词叫上下文工程!
这两年在AI圈子里,真的是新名词、新概念、新模型层出不穷,貌似隔段时间不出现一个新词感觉整个行业都退步了一样,大家都还在学习怎么使用好Prompt Engineering(提示词工程)的时候,这不Context Engineering(上下文工程)这个新词就出来了。 这篇内容来分享一下关于Context Engineering(上下文工程)这个新词的介绍、提示词工程和上下文工程的区别、以及二者在实际工作中的作用是什么,毕竟,现在AI圈子里面的新东西还是要跟上节奏学习的。 首先还是要先说一下这个背景,也就是为什么会提出一个Context Engineering(上下文工程)概念,以及它所解决的问题是啥。
Sklearn 实现高效机器学习的 19 个最优雅的技巧
了解 19 个 Sklearn 功能,它们可以直接而优雅地替代你手动执行的常见操作。 通过查阅Sklearn 的API 参考[1],我发现最常用的模型和函数只是该库功能的冰山一角。 尽管有些功能非常局限,只用于极少数的边缘情况,但我发现许多估算器、变换器和实用函数,可以更优雅地修复人们手动执行的常见操作。
告别被动挨打,国内厂商正迎接AI赋能的主动防御新时代
当前,网络安全威胁的复杂性和智能化程度进入前所未有的快速发展,传统的被动防御模式已难以招架。 在这种背景下,AI赋能的主动防御正在国内推动网络攻防范式的变革。 这种变革不仅仅是简单地升级现有安全工具,而是从根本上改变安全攻防的规则,推动企业从被动响应转向安全左移的主动防御。
阿里最新模型真的猛! 真肝实测:硬刚GPT5,技压DS、月暗,情商比GPT5高,读懂下棋大爷淋雨4小时的倔犟,但我发现了一个问题
编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)越来越有趣了! 连续两天,中国队一天推出了一个万亿参数模型。 昨天是Kimi的k2-0905,今天凌晨,则是阿里的Qwen3-Max-preview!
马斯克人形机器人再曝光:仿生手部引争议,Optimus 3原型疑云重重
近日,互联网企业赛富时创始人 Marc Benioff 在社交媒体平台 X 上发布了一段走访特斯拉的视频,展示了疑似 Optimus 3 . 人形机器人的原型。 这一视频迅速引发了科技界和公众的广泛关注,尤其是关于其仿生手部设计的讨论,使这一新一代机器人陷入了技术真实性与实用性的争议之中。
突发!Claude AI 宣布封禁中国控股公司,在哪都不行
今天,Claude AI 的母公司 Anthropic 突然发布了一项新政策:即日起,Anthropic将不再对中国控股公司及其海外子公司开放服务。 图片那么,作为一名开发者,我们最关心的问题就是:这背后为什么会发生? 对我们会有什么影响?
金融服务巨头Visa的新应用:AI竟能替你花钱!这意味着什么?
这家金融服务巨头周四宣布推出新的开发者工具,使智能体能够直接接入Visa的支付基础设施,从而实现公司所称的“智能体商业”——一种AI机器人可以根据消费者偏好和消费限额,从商品发现到结账全程自主完成的系统。 此举让Visa站在了可能彻底改变人们在线购物方式的技术变革前沿。 消费者无需再浏览网站或手动下单,而是设定参数,由智能体在多个商家之间自主寻找、评估并购买商品。
没PhD,算什么AI研究员!LeCun论文竟要28岁辍学生审批,发文「暗讽」内讧升级
Meta内部的AI大戏,剧情又加码了! 最近,首席科学家LeCun亲自下场,发了一篇帖子,字里行间疑似在「内涵」新BOSS——Alexandr Wang。 这是一段写给AI领域的记者和评论家们的话——在AI领域工作的人,并非都是「研究员」。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉