理论

LLM能理解数学吗？最新研究揭露大模型数学推理的致命缺陷

LLM能理解数学吗？最新研究揭露大模型数学推理的致命缺陷

你有没有想过，那些在聊天中侃侃而谈的AI大模型，遇到数学题时会是什么样子？就像一个平时很会聊天的朋友，突然被问到复杂的数学问题时支支吾吾的样子。最近有研究团队专门研究了这个问题，结果发现了一些让人意外的真相。

5/27/2025 1:27:00 AM 无影寺

拆解OpenAI最大对手的杀手锏：为什么会是MCP？

拆解OpenAI最大对手的杀手锏：为什么会是MCP？

坦白说，很多人曾与a16z的观察者持相同观点：GPT Wrapper凭借其优雅的抽象层设计，理应成为智能体通信协议的事实标准。但MCP的逆袭轨迹颠覆了所有预测——这个最初仅为Claude Desktop打造隐私优先本地化集成的协议，竟在短短三个月内完成了从边缘工具到生态基石的跃迁。这验证了网络效应铁律：协议价值永远锚定在已有生态密度。

5/27/2025 1:25:00 AM 曹洪伟

深度剖析向量数据库HNSW索引，参数优化与性能权衡

深度剖析向量数据库HNSW索引，参数优化与性能权衡

随着深度学习在特征表示领域的突破，向量嵌入已成为处理和检索非结构化数据（如文本、图像、音频）的核心技术。向量数据库，作为专门存储、管理和查询大规模向量数据的系统，其性能高度依赖于高效的近似最近邻（Approximate Nearest Neighbor, ANN）搜索算法。 HNSW (Hierarchical Navigable Small World) 作为当前业界领先的图 ANN 索引算法之一，因其出色的搜索速度和召回率平衡而备受青睐。

5/27/2025 1:20:00 AM 贝塔街的万事屋

如何给自研 MCP 服务，加上安全认证？

如何给自研 MCP 服务，加上安全认证？

一、举例，对接高德地图 MCP高德地图 MCP Server；复制官网： - 官网提供了创建对接 Key1. 代码使用示例复制对接时，需要设定 sseEndpoint 如果不设定个，Spring AI 默认是对 builder 的 baseUrl 值添加 /sse 的。所以，如果你要对接外部带有验证权限的 MCP 服务，需要手动设置下 sseEndpoint 值。

5/27/2025 1:10:00 AM 小傅哥

硅基模型vs.碳基大脑：AI能否成为超越人类的超级预测者？

硅基模型vs.碳基大脑：AI能否成为超越人类的超级预测者？

如果能精准预测未来，就能在生活中占尽先机，无论是预判房价涨跌，还是捕捉下一个产业风口，预测的魅力都无人可挡。随着 AI 技术的蓬勃发展，一个核心问题开始引发思考：人工智能能否成为超越人类的超级预测者？在这一思潮的推动下，预测领域正加速构建 AI 预测机器人。

5/27/2025 1:00:00 AM 小刀

RAG系列：问题优化 - 意图识别&同义改写&多视角分解&补充上下文

RAG系列：问题优化 - 意图识别&同义改写&多视角分解&补充上下文

在实际业务场景中，知识库不会只有单一领域的知识，可能会存在多个领域的知识，如果对用户问题不提前做领域区分，在对基于距离的向量数据库进行检索时，可能会检索出很多与用户问题不属于同一个领域的文档片段，这样的上下文会存在较多的噪音或者不准确的信息，从而影响最终的回答效果。另一方面知识库中涵盖的知识表达形式也是有限的，但用户的提问方式却是千人千面的，用户遣词造句的方式以及描述问题的角度可能会与向量数据库中存储的文档片段存在差异，这就可能导致用户问题和知识库之间不能很好匹配，从而降低检索效果。为了解决此问题，我们可以对用户问题进行查询增强，比如对用户问题进行意图识别、同义改写、多视角分解以及补充上下文，通过这几个查询增强方式来更好地匹配知识库中的文档片段，提升检索效果和回答效果。

5/27/2025 12:40:00 AM 燃哥讲AI

社区造数服务接入MCP

社区造数服务接入MCP

一、背景今年 MCP 的概念非常火，市面上也涌现出了一大批 MCP 相关工具。作为技术一线者，都会按捺不住地去实操一下，很早的时候就有个设想，如果把我们的测试工具都改造为符合 MCP 服务协议标准，然后全部接入 AI Agent，打造一个集万千工具于一体的智能管家来帮助我们提效，是不是一个很完美的设想。很多宏伟或者天马行空的想法想要真正的落地，必然需要不断向下，拆解成可落地的任务模块，这里我们先从造数开始。

5/27/2025 12:15:07 AM 阿凯

基于图的 RAG 方法总结（GraphRAG、 GraphReader、LightRAG、HippoRAG和KAG）

基于图的 RAG 方法总结（GraphRAG、 GraphReader、LightRAG、HippoRAG和KAG）

在自然语言处理领域，检索增强生成（RAG）技术通过结合外部知识库与语言模型，显著提升了模型在知识密集型任务中的表现。近年来，基于图结构的 RAG 方法成为研究热点，通过引入知识图谱的实体关系建模能力，有效解决了传统 RAG 在多跳推理、长文本理解和全局语义捕捉中的局限性。本文详细分析五种代表性方法：GraphRAG、GraphReader、LightRAG、HippoRAG和KAG ，从实现细节、优缺点及适用场景展开对比。

5/27/2025 12:15:00 AM Goldma

国际劳工组织报告：全球25%就业岗位或受生成式人工智能影响

国际劳工组织报告：全球25%就业岗位或受生成式人工智能影响

近日，国际劳工组织（ILO）与波兰国家研究院发布联合研究报告《生成式人工智能与就业：全球职业受影响程度精编指数》，对生成式人工智能如何重塑劳动世界进行了迄今最详尽的评估。报告指出，全球 25% 的就业岗位可能受到生成式人工智能影响，高收入国家这一比例更高，达 34%。该指数通过整合近3 .

5/27/2025 12:10:00 AM

高手做决策的认知公式：贝叶斯定理及其三重境界

高手做决策的认知公式：贝叶斯定理及其三重境界

“顶级的成功不是因为他们是谁，而是因为他们以什么方式思考，以什么逻辑行动。 ”爱因斯坦有个著名的问题：“你所经历过的最大的挑战是什么？ ”埃隆·马斯克对此足足思考了30秒，给出了一个非常精彩的回答：“确保你有一个可纠错的反馈闭环（making sure you have a corrective feedback loop）”。

5/27/2025 12:00:25 AM

智能体常用策略FunctionCalling和ReAct有什么区别？

智能体常用策略FunctionCalling和ReAct有什么区别？

Dify 内置了两种 Agent 策略：Function Calling 和 ReAct，但二者有什么区别呢？在使用时又该如何选择呢？接下来我们一起来看。

5/27/2025 12:00:00 AM 磊哥

要有野心！创始人揭秘Claude4诞生：有点玄学，很快接入测谎仪！26年出现单人独角兽！做AI像登上太空飞船，MCP快行业标准了

要有野心！创始人揭秘Claude4诞生：有点玄学，很快接入测谎仪！26年出现单人独角兽！做AI像登上太空飞船，MCP快行业标准了

编辑 | 云昭出品 | 51CTO技术栈（微信号：blog51cto）上周五 Claude 4 的发布会上，Anthropic 的 CEO Dario Amodei 与Instagram联合创始人、Anthropic 首席产品官 Mike Krieger 在 KeyNote 最后进行了一场围炉对话。两个人都是创业公司的创始人，又都参与了同一款 AI 产品的打磨与迭代。对于AI 编程，Anthropic 的产品路线图将是什么样子？

5/26/2025 6:40:00 PM 云昭

字节跳动 AdaCoT：基于强化学习的自适应推理触发方法（万字）

字节跳动 AdaCoT：基于强化学习的自适应推理触发方法（万字）

大家好，我是肆〇柒。在当下，大型语言模型（LLM）凭借其强大的语言理解和生成能力，在众多领域展现出了巨大的潜力。然而，尽管 LLM 在处理常规任务时表现出色，但在面对复杂推理任务时，却常常暴露出明显的短板。

5/26/2025 5:16:51 PM 肆零柒

字节开源Dolphin，高精度文档图像解析大模型，创新先分析后解析新范式

字节开源Dolphin，高精度文档图像解析大模型，创新先分析后解析新范式

在数字时代，从扫描文档、图片等非结构化数据中高效、准确地提取结构化信息，是人工智能领域长期面临的挑战。无论是复杂的表格、交织的文本段落，还是难以识别的数学公式，都对文档解析技术提出了严苛要求。传统的解决方案往往依赖于多个专业模型的串联，不仅集成成本高昂，还容易在处理过程中累积误差。

5/26/2025 4:46:38 PM 贝塔街的万事屋

我们成了“真·搬砖工”！亚马逊“编码文化”巨变开始了，程序员正在“仓库工人化”：快乐消失了，为保饭碗纷纷加入正义联盟

我们成了“真·搬砖工”！亚马逊“编码文化”巨变开始了，程序员正在“仓库工人化”：快乐消失了，为保饭碗纷纷加入正义联盟

编辑 | 云昭出品 | 51CTO技术栈（微信号：blog51cto）AI 的到来，也许会让程序员告别重复劳动，走向创意巅峰。但在亚马逊，代码的世界，似乎也正步入流水线时代。一些开发者却感受到另一种“穿越回18世纪机器工厂”般的现实：节奏更快、思考更少、压力更重。

5/26/2025 1:50:15 PM 云昭

金蝶范式：从工具到生态，解码企业管理 AI 新时代

金蝶范式：从工具到生态，解码企业管理 AI 新时代

如今，大模型技术已经成为企业数智化的必修课。然而，如何用上大模型，怎么用好大模型，却让很多企业陷入两难境地。高昂的落地成本、复杂的场景适配需求，以及盲目跟风导致的投入产出失衡，企业最终陷入了“为 AI 而 AI”的困境。

5/26/2025 11:06:01 AM 鸢玮

谈谈如何利用代理系统构建自演化知识图谱

谈谈如何利用代理系统构建自演化知识图谱

如今的数据领导者如同走钢丝。一方面，他们面临着现代化、创新和跟上未来发展的压力。想想看，技术的发展速度远超我们的预期。

5/26/2025 10:11:32 AM 晓晓

Microsoft 推出 Magentic-UI：网页多智能体，革新式人机协作

Microsoft 推出 Magentic-UI：网页多智能体，革新式人机协作

大家好，我是肆〇柒。在当下，现代生产力与网页活动深度交织。从信息检索、表单填写，到精准导航各类仪表盘，网页任务贯穿工作流程始终。

5/26/2025 10:03:42 AM 肆零柒

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ OmniParser V2 在 Windows 系统上的详细安装与运行指南

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉