资讯列表
硅谷的「十万大裁员」:Meta按代码量裁员
一个阴郁的清晨,在旧金山Salesforce公园的亲子歌谣活动上,一位年轻的父亲——同时也是一名软件工程师——推着婴儿车若有所思。 几天前,他刚收到Salesforce的裁员通知,成为这家市值2400亿美元的软件巨头最新一轮裁员中的一员。 同一时间,Salesforce首席执行官马克·贝尼奥夫(Marc Benioff)正在公开赞美人工智能如何提高生产力。
10/27/2025 9:10:00 AM
超94%类别第一!3D点云异常检测与修复新SOTA | ICCV'25
在制造质检、机器人抓取与3D打印等场景中,3D点云的异常检测日益关键,但实际应用却常遭遇两大难题:一是物体姿态随机、形变细微,传统离散化表示(体素、点云、视角投影)容易丢失几何细节;二是检测之后如何修复缺陷,业界缺少能直接生成高保真「正常模板」的方法。 为突破这两道关卡,上海科技大学与密歇根大学联合团队提出Pose-Aware Signed Distance Function(PASDF)框架,通过显式姿态对齐与连续的SDF形状表示,实现「检测—定位—修复」的一体化闭环。 论文地址:: AUROC分别为80.2%与90.0%的最新成绩,并在点级定位、可视化修复方面表现突出。
10/27/2025 9:09:00 AM
小模型用推理反而性能下降15%!1.6M配对样本揭示推理能力真相
大家好,我是肆〇柒。 在大语言模型领域,推理能力(reasoning)已成为备受推崇的技术亮点。 从OpenAI的o1推理系列到开源社区的Qwen和Mistral模型,业界纷纷推出推理专用模型,思维链(Chain-of-Thought)更是成为标配。
10/27/2025 9:08:20 AM
肆零柒
AI人格分裂实锤!30万道送命题,撕开OpenAI、谷歌「遮羞布」
实锤! LLM也有自己的「价值观」? 想象一下,你让AI帮你做一个商业计划,既要「赚钱」,又要「有良心」。
10/27/2025 9:08:00 AM
DATAMIND:构建专业级数据分析智能体的可扩展方法论
大家好,我是肆〇柒。 今天来看看来自浙江大学与阿里巴巴集团联合研究团队的最新工作——《Scaling Generalist Data-Analytic Agents》。 这项研究不仅提出了名为 DATAMIND 的高质量数据合成与智能体训练框架,更训练出了在多项基准上超越 GPT-5 的开源数据分析智能体 DATAMIND-14B,为构建专业领域 Agentic AI 提供了一套可复现、可扩展的方法论。
10/27/2025 9:00:09 AM
肆零柒
奥特曼抢走小扎印钞机!Meta「占领」OpenAI,20%都是前同事
扎克伯格在硅谷「不讲武德」翘OpenAI的墙角。 但如果你扒开OpenAI的外衣往里一看,嘿,OpenAI里面竟然也藏着另一个Meta! 三年前,OpenAI还是一个让世界惊叹的研究实验室。
10/27/2025 8:59:00 AM
Atlas来了!ChatGPT嵌入浏览器,用谷歌的引擎,革谷歌的命
三十年前,一行代码引发了互联网的第一场战争。 Netscape Navigator打开了图形化网页的大门,微软的Internet Explorer紧随其后,用预装的方式夺走了它的灵魂。 而Google Chrome作为一匹黑马,杀出重围并在几十年位居榜首。
10/27/2025 8:58:00 AM
日本AI王者,CTO是Transformer之父,刚拿下世界编程竞赛冠军
今年的国际编程竞赛ICFP(International Conference on Functional Programming)的冠军队伍名为「Team Unagi」,团队来自日本初创AI研究公司Sakana AI,其中的AI系统不仅帮助他们加速解决方案,更为人类队友带来了全新的解题思路。 ICFP 2025编程大赛高度开放,「任何手段皆可」,鼓励各路奇思妙想和工具(包括AI)自由登场。 Sakana AI团队选择了一条独特的「人机共创」道路。
10/27/2025 8:57:00 AM
AI 编程热潮下的万字思考 — 规避风险,善用其利
在 AI 技术席卷软件工程的今天,我们是否真的可以仅凭“氛围”和直觉,就构建出可靠、安全且可维护的生产级系统? 我们今天为大家带来的这篇文章,作者的核心观点是:“氛围编程(vibe coding)”与“AI 辅助的工程实践”存在本质区别,前者虽在创意激发和快速原型中具有价值,但绝不能替代结构化的工程方法。 文章通过多个维度深入探讨了这一观点:从 FAANG 团队的实际工作流程切入,指出真正的 AI 辅助的工程实践是在严格的设计、审查和测试框架内使用 AI 作为“效能倍增器”。
10/27/2025 4:00:00 AM
Baihai IDP
90%的团队都在用的 Agentic AI 设计模式解析
在当今大语言模型(LLM)应用爆发式增长的背景下,大多数应用仍停留在“智能自动补全”的阶段——你问一句,它答一句。 但真正的 Agentic AI(智能体AI) 则更进一步:它能制定计划、调用工具、自我检查,甚至在处理高风险任务前主动寻求人类确认。 本文将带你了解实践中真正有效、被超过 90% 的生产级系统所采用的核心 Agentic AI 设计模式,包括它们的含义、适用场景以及清晰的架构图解(文中有图片链接可查看完整架构图)。
10/27/2025 3:11:00 AM
大模型之路
系统提示词稳住AI
为什么你问同一个问题,AI 每次回答的风格都不一样? 很大概率是因为没有写“系统提示词”。 • 它是对 AI 的行为规则与角色定位的隐藏指令。
10/27/2025 2:25:00 AM
红绿灯灯灯灯
大白话谈 AI:什么是 RAG 中的 Rerank?
一、回顾下 RAGRAG 的基本工作流程RAG 的全称是 "Retrieval-Augmented Generation" ,翻译成人话就是"检索增强生成"。 听起来还是很专业对吧? 让我用一个生活中的例子来解释。
10/27/2025 1:55:00 AM
玄武后端技术栈
LLM 应用评估综合指南(多轮对话系统、RAG、AI Agent)
随着大语言模型应用从简单的文本生成,发展到复杂的多轮对话机器人、检索增强生成(RAG)系统乃至智能体(Agent),我们应如何科学、有效地评估它们的性能,确保其稳定可靠? 我们今天为大家带来的文章,作者的观点是,对现代 LLM 应用的评估,必须超越传统的 NLP 评估指标,转向一个分场景、系统化的评估体系,综合运用新兴的评价指标与自动化框架,从而全面地衡量系统的综合表现。 作者系统梳理了从传统 NLP 评估指标(如 BLEU、ROUGE)到现代 LLM 基准测试(如 MMLU)的演进,并重点阐释了“LLM-as-a-judge”这一新兴评估范式。
10/27/2025 1:50:00 AM
Baihai IDP
三分钟看懂ChatGPT技术原理
引言与目标本文旨在为普通观众提供大型语言模型(如ChatGPT)的全面介绍。 目标是建立理解LLM的"心智模型",解释其工作原理、优势与局限。 LLM既有神奇之处,也有明显缺陷和"尖锐边缘"(潜在风险)需警惕。
10/27/2025 1:35:00 AM
知识药丸
【n8n入门篇】n8n新手看过来!n8n +windows+docker化部署,喂饭级教程
安装 docker打开 docker 官网。 要查看电脑的架构是 ARM 还是 AMD,可以通过以下步骤使用 WIN R 快捷键来实现:使用系统信息工具:按下 Win R 快捷键,打开“运行”对话框。 输入 msinfo32,然后按 Enter 键。
10/27/2025 1:22:00 AM
子龙
MCP 与 API 网关:二者不可互换
MCP 与 API 网关在架构和协议层面存在本质差异,企业应采用专为 MCP 设计的网关方案以保障安全性与可扩展性,而非简单复用传统 API 网关。 我服务的许多组织正在快速采用 模型上下文协议(MCP),以便通过 AI 智能体将服务和数据连接到 AI 模型。 但他们也遇到了熟悉的挑战:既要保护 MCP 服务器和工具的访问安全,又要实现路由、限流、可观测性和开发者门户等能力。
10/27/2025 1:22:00 AM
Jimmy Song
StereoAdapter:北大首提自监督,适配水下双目深度估计
水下环境中的深度感知对水下机器人自主导航、目标检测和三维重建等任务至关重要。 相比单目方法,双目视觉可以通过双目相机直接获得具有度量尺度的3D深度,避免了单目深度固有的尺度不确定性。 然而,将现有视觉算法直接应用于水下场景会遇到显著挑战。
10/27/2025 1:13:00 AM
新智元
LangGraph 记忆系统实战:反馈循环 + 动态 Prompt 让 AI 持续学习
代理系统或者 RAG 方案,基本都需要一个双层记忆架构,这样 LLM 既能保持对当前上下文的专注,又能记住过往交互的内容。 短期记忆负责单个会话内的即时信息管理,长期记忆则跨会话存储知识,让系统能够持续学习和进化。 两者配合,代理才能表现出连贯性、上下文感知能力,看起来更加智能。
10/27/2025 1:11:00 AM
云朵君