资讯列表
AI 工程师必备:八大 LLM 开发核心技能
很多人以为使用大语言模型(LLM)只是“写提示词(prompting)”。 但如果目标是打造生产级(production-grade)的 AI 系统,仅仅依赖提示词远远不够。 图片 真正的 LLM 开发需要系统性的工程能力:模型如何设计、部署、优化与运维。
9/8/2025 2:32:00 AM
新叔
提示词工程还没玩明白,又多了一个新词叫上下文工程!
这两年在AI圈子里,真的是新名词、新概念、新模型层出不穷,貌似隔段时间不出现一个新词感觉整个行业都退步了一样,大家都还在学习怎么使用好Prompt Engineering(提示词工程)的时候,这不Context Engineering(上下文工程)这个新词就出来了。 这篇内容来分享一下关于Context Engineering(上下文工程)这个新词的介绍、提示词工程和上下文工程的区别、以及二者在实际工作中的作用是什么,毕竟,现在AI圈子里面的新东西还是要跟上节奏学习的。 首先还是要先说一下这个背景,也就是为什么会提出一个Context Engineering(上下文工程)概念,以及它所解决的问题是啥。
9/8/2025 1:55:00 AM
DateForAI
Sklearn 实现高效机器学习的 19 个最优雅的技巧
了解 19 个 Sklearn 功能,它们可以直接而优雅地替代你手动执行的常见操作。 通过查阅Sklearn 的API 参考[1],我发现最常用的模型和函数只是该库功能的冰山一角。 尽管有些功能非常局限,只用于极少数的边缘情况,但我发现许多估算器、变换器和实用函数,可以更优雅地修复人们手动执行的常见操作。
9/8/2025 1:00:00 AM
云朵君
告别被动挨打,国内厂商正迎接AI赋能的主动防御新时代
当前,网络安全威胁的复杂性和智能化程度进入前所未有的快速发展,传统的被动防御模式已难以招架。 在这种背景下,AI赋能的主动防御正在国内推动网络攻防范式的变革。 这种变革不仅仅是简单地升级现有安全工具,而是从根本上改变安全攻防的规则,推动企业从被动响应转向安全左移的主动防御。
9/8/2025 12:00:01 AM
安全牛
Claude不让我们用!国产平替能顶上吗?
这几天,全球 AI 代码生成的竞争格局,迎来了新的拐点。 在编程领域,曾被视为王者的 Anthropic,似乎正在一步步失去昔日的锋芒,地位开始动摇。 这一方面源于 OpenAI GPT-5 系列模型的强势崛起,在与 Claude Code 的对战中大有「后来者居上」之势,AI 大神 Karpathy 现身说法并开始安利 GPT-5 Pro 的强大代码能力。
9/7/2025 4:45:00 PM
机器之心
SceneSplat: 基于3DGS的场景理解和视觉语言预训练,让3D高斯「听懂人话」的一跃
开放词汇识别与分类对于全面理解现实世界的 3D 场景至关重要。 目前,所有现有方法在训练或推理过程中都依赖于 2D 或文本模态。 这凸显出缺乏能够单独处理 3D 数据以进行端到端语义学习的模型,以及训练此类模型所需的数据。
9/7/2025 4:40:00 PM
机器之心
国内外AI大厂重押,初创梭哈,谁能凭「记忆」成为下一个「DeepSeek」?
谁率先让模型拥有「记忆」,谁就掌握主动权。 「记忆」会是引爆新一轮 AI 浪潮的最后一块拼图吗? 如果时间往前推半年或四五个月,业界对于这一问题可能都是疑惑、不解:彼时 DeepSeek 将大模型推理能力推至高潮引起的余波仍在蔓延,Manus 在全球范围内开启通用 AI Agent 新叙事,人们正沉浸在技术和应用双面开花带来的热闹、狂欢中……「记忆」,有什么好说的?
9/7/2025 4:28:00 PM
机器之心
斯坦福:优化器「诸神之战」?AdamW 凭「稳定」胜出
自 2014 年提出以来,Adam 及其改进版 AdamW 长期占据开放权重语言模型预训练的主导地位,帮助模型在海量数据下保持稳定并实现较快收敛。 随着模型规模迅速扩大,预训练已成为计算密集型任务的典型代表,在大模型研发中往往是最主要的计算开销。 在这种背景下,优化器的设计直接关系到收敛速度与计算成本。
9/7/2025 4:23:00 PM
机器之心
字节跳动Seed推出「机器人大脑」Robix:让机器人学会思考、规划与灵活互动
近日,字节跳动 Seed 团队发布了最新的机器人研究成果——Robix,一个旨在提升机器人思考、规划与灵活交互能力的「机器人大脑」。 标题:Robix: A Unified Model for Robot Interaction, Reasoning and PlanningArXiv::,通用机器人在处理复杂、长程任务时,往往因依赖 “模块化” 拼接的设计而显得僵化。 Robix 的核心亮点在于其一体化架构:将推理、任务规划与人机交互无缝整合到单个端到端多模态模型中。
9/7/2025 4:19:00 PM
机器之心
Anthropic被作家告了,违规下载700万本书,15亿美元和解了
最新消息,AI 初创公司 Anthropic 同意支付至少 15 亿美元,来和解一起作家集体诉讼案件。 此前,这些作家联合指控 Anthropic 盗版了他们的作品来训练其聊天机器人 Claude。 在业界看来,如果该协议获得批准,那么这将是一起具有里程碑意义的和解协议,是美国版权案件历史上金额最高的赔偿,也将是 AI 公司与指控其侵犯版权的作家、视觉艺术家,以及其他相关创意专业人士之间法律纠纷的转折点。
9/6/2025 9:31:00 PM
机器之心
英伟达的局:狂撒15亿美元,从Lambda那租到了搭载自家AI芯片的GPU服务器
Lambda 收入可观,英伟达主导地位稳固,大家都有美好未来据 The Information 最新消息称,英伟达已经与小型云服务提供商 Lambda 达成一笔总额高达 15 亿美元的合作协议,内容是前者将租赁后者搭载英伟达自研 AI 芯片的 GPU 服务器。 具体来讲,总额高达 15 亿美元的合作实际包含两笔交易。 一笔数额是 13 亿美元,协议内容是英伟达将在 4 年内,从 Lambda 租赁 1 万个搭载英伟达自研 AI 芯片的 GPU 服务器。
9/6/2025 9:28:00 PM
机器之心
OpenAI罕见发论文:我们找到了AI幻觉的罪魁祸首
AI 最臭名昭著的 Bug 是什么? 不是代码崩溃,而是「幻觉」—— 模型自信地编造事实,让你真假难辨。 这个根本性挑战,是阻碍我们完全信任 AI 的关键障碍。
9/6/2025 9:26:00 PM
机器之心
00后以1.1亿美金「掀桌」,硅谷AI将书写影视新传奇 终结制片旧时代
最年轻的工程师,和团队一起将产品卖给 Fortune 500 的客户,从 0 带到 10。 她,22 岁,成立自己的公司 —— Cybever, 以「用 AI 生成高精度 3D 虚拟环境」技术闻名,并卖服务给游戏和影视行业。 她,24 岁,接到了美国五大影视公司的一个电话,他们告诉她,不要再卖工具了,是不是也可以考虑下虚拟制片这个方向。
9/6/2025 9:21:00 PM
机器之心
任意骨骼系统的模型都能驱动?AnimaX提出基于世界模型的3D动画生成新范式
本文的主要作者来自北京航空航天大学、清华大学、香港大学和 VAST。 本文的第一作者为北京航空航天大学硕士生黄泽桓。 本文的通讯作者为北京航空航天大学盛律教授与 VAST 公司首席科学家曹炎培博士。
9/6/2025 9:17:00 PM
机器之心
阿里最新模型真的猛! 真肝实测:硬刚GPT5,技压DS、月暗,情商比GPT5高,读懂下棋大爷淋雨4小时的倔犟,但我发现了一个问题
编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)越来越有趣了! 连续两天,中国队一天推出了一个万亿参数模型。 昨天是Kimi的k2-0905,今天凌晨,则是阿里的Qwen3-Max-preview!
9/6/2025 6:54:33 PM
云昭
AI 的下一个战场:小模型崛起
过去一段时间,大模型行业经历了一场风切变。 八月初,腾讯官宣“混元系列小模型”落地,不久后,阿里跟进了两款通义Qwen3-4B。 起初,大家以为只是国内大厂对轰,互秀肌肉罢了。
9/5/2025 9:13:00 PM
齐铖湧
OpenAI 不想再「跪着」买显卡了
如果说过去几年 OpenAI 是靠 GPT 模型打天下,那么现在,它的野心已经远远不止做一家模型公司。 《金融时报》最新消息,OpenAI 正在和博通合作,自研一颗代号 “XPU” 的 AI 推理芯片,预计会在 2026 年量产,由台积电代工。 不同于英伟达 的 GPU,这款芯片不会对外销售,而是专门满足 OpenAI 内部的训练与推理需求,用来支撑即将上线的 GPT-5 等更庞大的模型。
9/5/2025 6:17:00 PM
郑佳美