理论

OpenAI出手，Windsurf背刺数百员工？

Sam Altman最近在一次演讲中说："我认为收购是糟糕的，我通常会不惜一切代价避免它们。 "但就在他说这话的时候，一个令人震惊的故事正在硅谷悄然展开。这个故事涉及一家名为Windsurf的AI编程创业公司，一笔30亿美元的收购协议，以及一场被称为"虚假拥抱"的商业阴谋。

7/15/2025 1:35:11 PM

阿丸笔记

RAGFlow引用机制揭秘：LLM引导与后端验证如何协同工作？

昨天知识星球内有个提问：RAGFlow 显示引用为什么不通过提示词直接显示在回答中，而是通过分块后和检索片段比较向量相似度？判断引用出处？能不能直接通过提示词实现。

7/15/2025 12:24:16 PM

韦东东

AGENTGROUPCHAT-V2：大型语言模型多智能体协作的创新思考

大家好，我是肆〇柒。 LLM 多智能体系统在社会模拟和复杂任务解决这两大领域大显身手。在社会模拟里，它们精准地复刻人类社交互动模式，助力我们洞察群体行为背后的社会学；在复杂任务解决场景下，智能体们协同合作，先是制定详尽规划，再按部就班执行，轻松应对复杂局面。

7/15/2025 12:14:44 PM

肆零柒

世界最大的招聘搜索引擎Indeed利用AI技术帮助求职者寻找新工作

Indeed的云原生和数据驱动的数字化转型，使其非常适合快速发展的AI时代，公司CIO兼CSO的Anthony Moisant如是说。 “我们不仅仅是在采用AI技术，我们正在构建一家智能体公司，在这里人类智慧与同理心能够与机器智能相结合。 ”Moisant表示。

7/15/2025 11:20:57 AM

Paula Rooney

终于把 LSTM 算法搞懂了！！

大家好，我是小寒今天给大家分享一个超强的算法模型，LSTM。 LSTM（长短期记忆网络，Long Short-Term Memory）是一种特殊的循环神经网络（RNN）算法，专门设计用来解决传统RNN在处理长序列数据时存在的梯度消失和梯度爆炸问题。它通过引入细胞状态和门控机制，使得模型能够捕捉和保存长期依赖信息，从而有效地处理序列数据中的长期依赖关系。

7/15/2025 10:41:44 AM

程序员小寒

使用 SHAP 使机器学习模型变的可解释

大家好，我是小寒今天给大家分享机器学习中的一个关键概念，SHAPSHAP 是一种用于解释机器学习模型输出的统一框架。它基于博弈论中的 Shapley 值，用来量化每个特征对模型预测结果的贡献度。帮助我们理解模型为什么做出这样的预测。

7/15/2025 10:29:17 AM

程序员小寒

硅谷大戏！Scale AI刚卖身就被集体拉黑，谷歌OpenAI无情断供

听说了吗？不久前，Meta花费143亿美元收购了28岁少年Alexandr Wang创办的数据标注公司Scale AI近一半的股份。别小看这个数据标注公司，这一笔交易让Meta在AI竞赛中直接提升了实力，瞬间成为焦点。

7/15/2025 9:47:22 AM

AI 为何能查天气、订机票？揭秘大模型背后的“神秘工具箱”

你有没有想过，为什么 AI 能回答“今天上海天气怎么样？ ”这种实时问题，甚至帮你预订机票？明明它的训练数据截止到去年，怎么会对现在的事情了如指掌？

7/15/2025 9:44:16 AM

红绿灯灯灯灯

RAG系列：复杂文档解析不理想？使用 TextIn xParse 轻松解析多样性 PDF 文档

在RAG系统的建设中，文档预处理是一个非常关键的环节，因为只有将文档中的图表、表格、公式以及手写批注等信息按阅读顺序还原出来，并最终解析为Markdown格式，这样才能够构建高质量的知识库和高效的信息检索系统，让LLM更好的读懂文档，最终给到用户更准确更全面的回答。目前的文档解析工具算是百花齐放了，有很多优秀的开源工具（MinerU、Docling、Unstructured等等）,在我之前的文章也有讲过。今天给大家测评一款优秀的文档解析工具 - TextIn xParse[1] ，看下它的文档解析能力到底如何，希望通过我的测评能够给大家带来更多更好的选择。

7/15/2025 9:31:31 AM

燃哥讲AI

比Adam更有效，POET从谱不变原理出发，让LLM训练又稳又快

Zeju Qiu和Tim Z. Xiao是德国马普所博士生，Simon Buchholz和Maximilian Dax担任德国马普所博士后研究员，Bernhard Schölkopf是德国马普所所长，Weiyang Liu是香港中文大学计算机系助理教授。随着大型语言模型（LLM）推动人工智能领域取得突破性进展，如何实现高效、稳定的超大规模模型训练，始终是该领域最富挑战性的核心议题之一。

7/15/2025 9:27:29 AM

谷歌发布首个嵌入模型：MTEB排行榜第一，超过OpenAI

今天凌晨1点，谷歌发布了首个Gemini嵌入模型刷新了MTEB榜单记录成为第一，并且价格很便宜每100万token只要0.15美元，已经开放API。根据谷歌在多文本嵌入基准测试平台MTEB上的测试结果显示，Gemini嵌入模型平均分达到了68.37，大幅度超过了OpenAI文本嵌入模型的58.93分。在双语挖掘、分类、聚类、指令检索、多标签分类、配对分类、重排、检索、语义文本相似性等测试中，全部都非常出色成为目前最强嵌入模型。

7/15/2025 9:07:00 AM

Windsurf打工人被谷歌做局24小时后获收购！华人AI编程明星出手，接收250名员工

AI编程赛道，局势突变。距离谷歌以24亿美元挖走Windsurf创始团队仅仅72小时，AI编程智能体Devin开发商宣布，已经火速收购Windsurf剩余的全部资产和团队。临时接任CEO的Windsurf前商务主管Jeff Wang感慨“过去72小时就像我职业生涯中最惊险刺激的过山车之旅。

7/15/2025 9:06:00 AM

ICCV 2025 | 清华&腾讯混元X发现「视觉头」机制：仅5%注意力头负责多模态视觉理解

本文的主要作者来自清华大学智能视觉实验室（i-Vision Group）、腾讯混元 X 组。本文的共同第一作者为清华大学自动化系本科生王嘉辉和博士生刘祖炎，本文的通讯作者为清华大学自动化系鲁继文教授。多模态大模型通常是在大型预训练语言模型（LLM）的基础上扩展而来。

7/15/2025 9:00:00 AM

谷歌T5Gemma重燃架构之战！「套壳」反杀Gemma本尊，9B推理快得离谱

2023年以来，大模型的战场由decoder-only架构一统江湖。从GPT家族到LLaMA、Gemma、Mistral，再到Claude、Command-R、Yi系列，能叫得出名字的主流LLM，几乎都是清一色的「纯解码器」（decoder-only）。但今天，Google带着T5Gemma杀回来了——不仅重启了encoder-decoder的技术路线，还略施小技就让它原地起飞，暴打原版Gemma 2。

7/15/2025 8:58:00 AM

MIT满分学霸掏空AI初创，谷歌24亿收购黑幕曝光！数百员工血本无归

OpenAI收购Windsurf在即，突然半路杀出个谷歌！但这波可不是收购，而是釜底抽薪：谷歌直接挖走了整个Windsurf领导层前30位核心AI工程师！为了这次挖角，谷歌豪掷24亿美元！

7/15/2025 8:52:00 AM

具身智能大脑+首个SaaS开源框架，智源研究院刷新10项测评基准，加速群体智能新范式

具身智能大脑全球首个具身智能SaaS开源框架，智源研究院在具身智能领域发力了——“通用具身大脑”RoboBrain 2.0，面向真实物理环境，集感知、推理与规划于一体。全新32B版本凭借时空认知能力的突破，在多项权威具身智能基准上全面刷新纪录。 RoboOS 2.0，作为全球首个具身智能SaaS开源框架，创新性集成MCP协议与无服务器架构，实现轻量化部署，打通智能大脑与异构本体协同通路。

7/15/2025 8:45:00 AM

OpenAgentSafety 框架：AI 智能体安全评估的创新实践

大家好，我是肆〇柒，在 AI 智能体快速发展的当下，它们潜在的安全风险也日益凸显。现有的 AI 智能体安全评估方法存在诸多局限：多数评估依赖于简化现实复杂性的模拟环境，难以准确反映智能体在真实场景下的表现；许多评估仅关注单一领域，如仅测试智能体的网页浏览或代码编写能力，缺乏对多领域综合任务的考察；此外，多轮多用户交互在评估中的缺失，使得难以洞察智能体在复杂人际互动和长期任务执行中的表现与潜在风险。由卡耐基梅隆大学和艾伦人工智能研究所联合提出的 OpenAgentSafety（OA-SAFETY）框架，通过支持智能体与真实工具（如文件系统、终端、浏览器、消息平台等）的交互，并模拟多样化用户意图（包括良性、恶意和模糊意图）以及多轮交互场景，全面覆盖八大关键安全风险类别，系统地揭示了智能体在实际应用中可能存在的安全隐患。

7/15/2025 4:00:00 AM

肆零柒

什么是网络安全转型？成功的最佳实践

在监管压力不断增加和网络威胁不断上升的情况下，高管必须优先考虑网络安全转型，以保护资产、促进增长并确保弹性。在当今的数字世界中，网络安全不应再被抛在脑后，而是企业至关重要的必需品。如果不积极主动地进行网络安全转型，企业将面临监管处罚、运营中断、网络安全漏洞和声誉受损的风险。