资讯列表

分类

标签

全美60万岗人类出局，三年暴省126亿！机器人大军入厂

全美60万岗人类出局，三年暴省126亿！机器人大军入厂

这个时代最有戏剧性的两类新闻，竟在同一天出现：一则写着「亚马逊将在美国扩招25万人」；另一则写着「亚马逊计划让机器人取代60万个岗位」。前者出现在新闻发布会上，后者藏在泄露文件里。「招人」与「裁人」也只是计算出的结果。

10/27/2025 9:13:00 AM

AI黑化如恶魔附体！LARGO攻心三步，潜意识种子瞬间开花 | NeurIPS 2025

AI黑化如恶魔附体！LARGO攻心三步，潜意识种子瞬间开花 | NeurIPS 2025

你的AI助手真的安全吗？你敢信吗？只要在AI的「脑子」里注入一段精心「调制」的「想法」，就能让它自己「黑化」，说出本不该说的秘密。

10/27/2025 9:12:00 AM

可攻可防，越狱成功率近90%！六大主流模型全中招 | EMNLP'25

可攻可防，越狱成功率近90%！六大主流模型全中招 | EMNLP'25

大型语言模型（LLMs）在信息处理、内容生成等领域应用广泛（如LLaMA、DeepSeek、ChatGPT），但随着其与现实场景深度融合，安全问题愈发凸显：可能被用于传播网络犯罪指令、虚假信息等有害内容。尽管开发者通过监督微调（SFT）、基于人类反馈的强化学习（RLHF）等技术优化模型安全性，但面对复杂的越狱攻击，现有防护机制仍存在不足。现有越狱攻击主要分为两类，均存在明显缺陷：手动构造提示词攻击：如PAIR、PAP等，依赖黑箱模板操控，模型更新后模板易失效，可解释性差、泛化能力弱。

10/27/2025 9:11:00 AM

硅谷的「十万大裁员」：Meta按代码量裁员

硅谷的「十万大裁员」：Meta按代码量裁员

一个阴郁的清晨，在旧金山Salesforce公园的亲子歌谣活动上，一位年轻的父亲——同时也是一名软件工程师——推着婴儿车若有所思。几天前，他刚收到Salesforce的裁员通知，成为这家市值2400亿美元的软件巨头最新一轮裁员中的一员。同一时间，Salesforce首席执行官马克·贝尼奥夫（Marc Benioff）正在公开赞美人工智能如何提高生产力。

10/27/2025 9:10:00 AM

超94%类别第一！3D点云异常检测与修复新SOTA | ICCV'25

超94%类别第一！3D点云异常检测与修复新SOTA | ICCV'25

在制造质检、机器人抓取与3D打印等场景中，3D点云的异常检测日益关键，但实际应用却常遭遇两大难题：一是物体姿态随机、形变细微，传统离散化表示（体素、点云、视角投影）容易丢失几何细节；二是检测之后如何修复缺陷，业界缺少能直接生成高保真「正常模板」的方法。为突破这两道关卡，上海科技大学与密歇根大学联合团队提出Pose-Aware Signed Distance Function（PASDF）框架，通过显式姿态对齐与连续的SDF形状表示，实现「检测—定位—修复」的一体化闭环。论文地址：： AUROC分别为80.2%与90.0%的最新成绩，并在点级定位、可视化修复方面表现突出。

10/27/2025 9:09:00 AM

小模型用推理反而性能下降15%！1.6M配对样本揭示推理能力真相

小模型用推理反而性能下降15%！1.6M配对样本揭示推理能力真相

大家好，我是肆〇柒。在大语言模型领域，推理能力（reasoning）已成为备受推崇的技术亮点。从OpenAI的o1推理系列到开源社区的Qwen和Mistral模型，业界纷纷推出推理专用模型，思维链（Chain-of-Thought）更是成为标配。

10/27/2025 9:08:20 AM 肆零柒

AI人格分裂实锤！30万道送命题，撕开OpenAI、谷歌「遮羞布」

AI人格分裂实锤！30万道送命题，撕开OpenAI、谷歌「遮羞布」

实锤！ LLM也有自己的「价值观」？想象一下，你让AI帮你做一个商业计划，既要「赚钱」，又要「有良心」。

10/27/2025 9:08:00 AM

DATAMIND：构建专业级数据分析智能体的可扩展方法论

DATAMIND：构建专业级数据分析智能体的可扩展方法论

大家好，我是肆〇柒。今天来看看来自浙江大学与阿里巴巴集团联合研究团队的最新工作——《Scaling Generalist Data-Analytic Agents》。这项研究不仅提出了名为 DATAMIND 的高质量数据合成与智能体训练框架，更训练出了在多项基准上超越 GPT-5 的开源数据分析智能体 DATAMIND-14B，为构建专业领域 Agentic AI 提供了一套可复现、可扩展的方法论。

10/27/2025 9:00:09 AM 肆零柒

奥特曼抢走小扎印钞机！Meta「占领」OpenAI，20%都是前同事

奥特曼抢走小扎印钞机！Meta「占领」OpenAI，20%都是前同事

扎克伯格在硅谷「不讲武德」翘OpenAI的墙角。但如果你扒开OpenAI的外衣往里一看，嘿，OpenAI里面竟然也藏着另一个Meta！三年前，OpenAI还是一个让世界惊叹的研究实验室。

10/27/2025 8:59:00 AM

Atlas来了！ChatGPT嵌入浏览器，用谷歌的引擎，革谷歌的命

Atlas来了！ChatGPT嵌入浏览器，用谷歌的引擎，革谷歌的命

三十年前，一行代码引发了互联网的第一场战争。 Netscape Navigator打开了图形化网页的大门，微软的Internet Explorer紧随其后，用预装的方式夺走了它的灵魂。而Google Chrome作为一匹黑马，杀出重围并在几十年位居榜首。

10/27/2025 8:58:00 AM

日本AI王者，CTO是Transformer之父，刚拿下世界编程竞赛冠军

日本AI王者，CTO是Transformer之父，刚拿下世界编程竞赛冠军

今年的国际编程竞赛ICFP（International Conference on Functional Programming）的冠军队伍名为「Team Unagi」，团队来自日本初创AI研究公司Sakana AI，其中的AI系统不仅帮助他们加速解决方案，更为人类队友带来了全新的解题思路。 ICFP 2025编程大赛高度开放，「任何手段皆可」，鼓励各路奇思妙想和工具（包括AI）自由登场。 Sakana AI团队选择了一条独特的「人机共创」道路。

10/27/2025 8:57:00 AM

AI 编程热潮下的万字思考 — 规避风险，善用其利

AI 编程热潮下的万字思考 — 规避风险，善用其利

在 AI 技术席卷软件工程的今天，我们是否真的可以仅凭“氛围”和直觉，就构建出可靠、安全且可维护的生产级系统？我们今天为大家带来的这篇文章，作者的核心观点是：“氛围编程（vibe coding）”与“AI 辅助的工程实践”存在本质区别，前者虽在创意激发和快速原型中具有价值，但绝不能替代结构化的工程方法。文章通过多个维度深入探讨了这一观点：从 FAANG 团队的实际工作流程切入，指出真正的 AI 辅助的工程实践是在严格的设计、审查和测试框架内使用 AI 作为“效能倍增器”。

10/27/2025 4:00:00 AM Baihai IDP

90%的团队都在用的 Agentic AI 设计模式解析

90%的团队都在用的 Agentic AI 设计模式解析

在当今大语言模型（LLM）应用爆发式增长的背景下，大多数应用仍停留在“智能自动补全”的阶段——你问一句，它答一句。但真正的 Agentic AI（智能体AI）则更进一步：它能制定计划、调用工具、自我检查，甚至在处理高风险任务前主动寻求人类确认。本文将带你了解实践中真正有效、被超过 90% 的生产级系统所采用的核心 Agentic AI 设计模式，包括它们的含义、适用场景以及清晰的架构图解（文中有图片链接可查看完整架构图）。

10/27/2025 3:11:00 AM 大模型之路

系统提示词稳住AI

系统提示词稳住AI

为什么你问同一个问题，AI 每次回答的风格都不一样？很大概率是因为没有写“系统提示词”。 • 它是对 AI 的行为规则与角色定位的隐藏指令。

10/27/2025 2:25:00 AM 红绿灯灯灯灯

大白话谈 AI：什么是 RAG 中的 Rerank？

大白话谈 AI：什么是 RAG 中的 Rerank？

一、回顾下 RAGRAG 的基本工作流程RAG 的全称是 "Retrieval-Augmented Generation" ，翻译成人话就是"检索增强生成"。听起来还是很专业对吧？让我用一个生活中的例子来解释。

10/27/2025 1:55:00 AM 玄武后端技术栈

LLM 应用评估综合指南（多轮对话系统、RAG、AI Agent）

LLM 应用评估综合指南（多轮对话系统、RAG、AI Agent）

随着大语言模型应用从简单的文本生成，发展到复杂的多轮对话机器人、检索增强生成（RAG）系统乃至智能体（Agent），我们应如何科学、有效地评估它们的性能，确保其稳定可靠？我们今天为大家带来的文章，作者的观点是，对现代 LLM 应用的评估，必须超越传统的 NLP 评估指标，转向一个分场景、系统化的评估体系，综合运用新兴的评价指标与自动化框架，从而全面地衡量系统的综合表现。作者系统梳理了从传统 NLP 评估指标（如 BLEU、ROUGE）到现代 LLM 基准测试（如 MMLU）的演进，并重点阐释了“LLM-as-a-judge”这一新兴评估范式。

10/27/2025 1:50:00 AM Baihai IDP

三分钟看懂ChatGPT技术原理

三分钟看懂ChatGPT技术原理

引言与目标本文旨在为普通观众提供大型语言模型（如ChatGPT）的全面介绍。目标是建立理解LLM的"心智模型"，解释其工作原理、优势与局限。 LLM既有神奇之处，也有明显缺陷和"尖锐边缘"（潜在风险）需警惕。

10/27/2025 1:35:00 AM 知识药丸

【n8n入门篇】n8n新手看过来！n8n +windows+docker化部署，喂饭级教程

【n8n入门篇】n8n新手看过来！n8n +windows+docker化部署，喂饭级教程

安装 docker打开 docker 官网。要查看电脑的架构是 ARM 还是 AMD，可以通过以下步骤使用 WIN R 快捷键来实现：使用系统信息工具：按下 Win R 快捷键，打开“运行”对话框。输入 msinfo32，然后按 Enter 键。

10/27/2025 1:22:00 AM 子龙

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词）最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品 GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ Mac也能跑Qwen3，一文看懂本地部署qwen 3配置要求

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉