理论

其实，扩散语言模型在最终解码之前很久，就已确定最终答案

随着扩散语言模型（DLM）在各个领域的快速发展，其已成为自回归（AR）模型有力的替代方案。与 AR 模型相比，DLMs 的主要优势包括但不限于：高效的并行解码和灵活的生成顺序。尽管 DLMs 具有加速潜力，但在实际应用中，其推理速度仍慢于 AR 模型，原因在于缺乏 KV-cache 机制，以及快速并行解码所带来的显著性能下降。

9/3/2025 1:59:34 PM

从复刻魔术开始，RoboMirage打开了机器人仿真的新世界

在具身智能的发展路径中，如何获得海量且高质量的数据是行业绕不开的核心问题。如果说大语言模型依赖于互联网规模的语料库，那么具身智能的成长同样需要规模化的交互经验。现实中，收集这些数据的代价极高：机械臂等硬件部署成本高，单台投入就需数万元，且难以规模化；数据采集环节依赖经验丰富的数采员且耗时漫长。

9/3/2025 1:59:02 PM

苹果机器人负责人也被小扎挖走了！浙大校友，任职Meta机器人技术一号位

苹果又失去了四名AI研究员，其中三人是华人。彭博社长期跟踪苹果公司的古尔曼称，苹果机器人研究小组首席AI研究员Jian Zhang将跳槽到Meta，且消息已获Meta证实。除了已经实锤的Jian Zhang，古尔曼还爆料，基础模型团队也有三人即将离职。

9/3/2025 1:58:18 PM

Mistral AI刚刚免费开放企业级AI功能——这对ChatGPT构成重大威胁

总部位于巴黎的AI初创公司Mistral AI(被誉为欧洲版的OpenAI)，周一宣布大幅扩展其企业级业务平台Le Chat，这一动作直接挑战现有的企业AI服务商，通过提供先进的记忆功能和广泛的第三方集成——而且对用户完全免费——来打破市场格局。此次发布包含两大核心功能：记忆系统：可在多轮对话中保留上下文。连接器目录：支持超过20个企业级平台，包括Databricks、Snowflake、GitHub、Atlassian和Stripe。

9/3/2025 1:56:50 PM Michael

谈谈AI在石油石化行业应用的几点思考

一、背景2025年8月26日，国务院正式印发了关于深入实施人工智能加行动的意见，提出要充分发挥我国数据资源丰富，产业体系完备，应用场景广阔的优势，加强人工智能与各领域深度融合，助力传统产业转型升级，培育新兴产业发展新动能，推动经济高质量发展，人工智能的快速发展正在对全球经济社会产生深远影响，成为激发经济增长活力和推动高质量发展的新动能。国家数据局发布的全国数据资源调查报告显示，2024年我国开发或应用人工智能的企业数量同比增长36%，高质量数据集数量同比增长27.4%，有力支撑人工智能训练和应用。利用大模型的数据技术企业和数据应用企业，同比分别增长57.21%和37.14%。

9/3/2025 10:08:22 AM 晓晓

只会「氛围编程」，永远成不了真正工程师！还差这几个关键环节

Cursor等智能IDE相继推出，带来了更智能的编程体验。与此同时，Claude 4等基座大模型的编码性能不断提升。再加上Andrej Karpathy的大力推广，Vibe Coding迅速走红，已成野火燎原之势。

9/3/2025 9:10:00 AM

底层逻辑的转变：从AI代码生成，到真正的开发伙伴关系

译者 | 核子可乐审校 | 重楼Claude 4甫一亮相，市场就被其强大的推理和编程能力折服。但在连续使用数月之后，我意识到大模型真正的革命不在于生成更好的代码片段，而是其中蕴藏的自主性潜力。很多人更多关注AI编程的语法正确性、基准测试得分和代码有效率，但我在对Claude 4的实际测试中体会到：能够全面理解开发目标、持续寻求解决方案并自主克服障碍的AI系统正在出现。

9/3/2025 8:13:03 AM 核子可乐

如何将暗数据转化为AI驱动的商业价值

在当今数据充盈的环境下，企业正成为海量非结构化数据的管理者，这些庞大的数据宝库涵盖文档、邮件、视频等内容，本质上是一种尚未开发的竞争优势——潜在洞见的财富，等待被激活。挑战不在于数据的积累，而在于如何有效提炼出可操作的情报。 AI正是关键的转型工具，能够将这些“暗数据”转化为可观的业务价值。

9/3/2025 7:00:00 AM Asif Hasan

Swagger 全量注解应用指南：从@Tag到@SecurityScheme，全面掌握API设计

本文是Swagger注解的完整参考指南，详细解析了6大类40 个核心注解的使用方法和实战场景。从基础的@Tag、@Operation到高级的@SecurityScheme、@Callback，每个注解都配有清晰的代码示例和实际应用案例。包含全局配置、多安全方案、复杂响应结构、Webhook回调等企业级场景，帮助你构建专业级的API文档系统。

9/3/2025 4:15:00 AM 肖哥谈架构

系统梳理 RAG 系统的 21 种分块策略

检索增强生成（RAG）是许多 AI 工程师又爱又恨的技术（包括我）。没错，因为从理论上看，它简单极了：“从你的定制数据中检索正确的上下文，然后让大语言模型基于此生成回答”。但在实践中，你不得不面对海量杂乱无章的数据 —— 这些数据以你见过的最混乱随机的格式存储，接着就是数日绞尽脑汁的试错：调整文本块（tweaking chunks）切换嵌入模型（switching embedding models）替换检索器（swapping out retrievers）微调排序器（fine-tuning rankers）重写提示词（rewriting prompts）而模型依然回复：“我找不到足够的信息来回答你的问题”。

9/3/2025 4:00:45 AM Baihai IDP

借助 AgentCore Memory 为智能体应用添加记忆功能

在构建智能体（Agentic）应用时，上下文是决定模型响应质量的关键因素。各类智能体框架（如 LangGraph、CrewAI 等）的核心作用，本质上是构建包含充足上下文的增强型提示词（Prompt），帮助模型生成贴合需求的结果。而记忆系统作为上下文的重要来源，能让智能体记住交互历史、用户偏好等关键信息，大幅提升应用的个性化与连续性。

9/3/2025 4:00:00 AM 大模型之路

Cursor这几个天花板级别的技巧，让你轻松成为Cursor高手！

cursor 无疑已经成为了 AI 编辑器之王，以至于很多公司招聘都要求需要使用过 cursor。如果你完全没接触过 AI 工具，似乎已经与世界脱节了！并且 AI 更新的速度如此之快，掌握像 cursor 这样的工具已经成为一种必需。

9/3/2025 1:48:00 AM 游云

RAG 不止能检索！它还能在 LangGraph 中当“工具调用大脑”

Retrieval-Augmented Generation（RAG）是一种结合信息检索和大型语言模型（LLMs）来回答用户查询的方法。传统上，这涉及将检索器直接连接到生成流水线。然而，通过 LangGraph 和 LangChain，我们可以进一步模块化这个过程，将检索器暴露为一个可调用的工具。

9/3/2025 1:45:00 AM AI研究生

云端即未来！全球首个搭载云端Agent编程团队的IDE来了！

过去两年，Cursor几乎成了程序员心中的“神兵利器”，无数人惊叹于它那高超的理解代码上下文、自动补全等能力，但也有不少人发现，当项目一旦从“小脚本”走向“企业级应用”，Cursor 依旧只是一个聪明的助手，而不是一支真正能并肩作战的开发团队。如今，一款来自中国的新工具 —— Vinsoo Code 悄然登场。 Vinsoo Code没有止步于“写代码更快”，而是创造性地首次将云端多Agent协作引入 IDE，把 AI 从“个人助理”升级为“虚拟开发团队”，让需求分析、代码生成、测试、部署乃至文档撰写，都能在一套流程里完成。

9/3/2025 12:45:00 AM liuxin

别误会00后了！美国千人调查揭秘：85%学生都用AI，首要目的不是偷懒

GenAI席卷全球，高校课堂成为最前沿的实验场。有人担心学位贬值、课堂失守；有人则看到新技术催生的新机遇。刚刚，国外的「Inside Higher Ed」发布了最新的调查。

9/2/2025 5:42:47 PM

马斯克发布《宏伟蓝图4》：特斯拉80%价值在于机器人，还意外露出了一款新车

一家自动驾驶公司，却把未来押在了机器人？是的，你没听错~这就是特斯拉最新正式发布的《Master Plan Part IV》（以下简称宏伟蓝图4）所透露的信息。而且马斯克进一步补充了具体数值——80%。

9/2/2025 5:38:25 PM

结构高度合理、具备理想特性，华东师大等提出分子生成新方法，协同生成原子与化学键

编辑丨coisini随着分子生物学、结构生物学、组合化学及人工智能（AI）技术的进步，药物研发范式已从随机筛选转向理性药物设计。理性药物设计主要包括两种策略：基于配体的药物设计（LBDD）和基于结构的药物设计（SBDD）。其中，SBDD 因现有分子生成模型常忽略结构可行性与类药性，会产生不真实的三维分子。

9/2/2025 2:31:00 PM ScienceAI

DeepMind爆火论文：向量嵌入模型存在数学上限，Scaling laws放缓实锤？

这几天，一篇关于向量嵌入（Vector Embeddings）局限性的论文在 AlphaXiv 上爆火，热度飙升到了近 9000。要理解这篇论文的重要性，我们先简单回顾一下什么是向量嵌入。向量嵌入就像把文字、图片或声音这些复杂的东西，转化成一个多维空间里的「坐标点」。

9/2/2025 1:02:00 PM 机器之心

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ OmniParser V2 在 Windows 系统上的详细安装与运行指南

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉