理论

CIO如何为AI优化数据管理

一项成功的AI计划在很大程度上取决于底层数据的质量，IT领导者们正在提升他们的数据湖、数据仓库和数据湖仓策略，以提供坚实的基础。优质数据对于任何IT计划的成功都至关重要，对于AI项目来说更是如此。糟糕的数据总是会产生糟糕的结果，对于AI来说，风险尤其高，因为不良数据可能导致严重的财务损失、监管罚款和声誉损害。

6/18/2025 7:08:00 AM

Stan Gibson

AI智能体的三种"人格"：为什么99%的人都用错了？

昨天和一位创业朋友聊天，他抱怨说："花了几万块做的Agent客服，效果还不如人工。用户稍微问点复杂的，就答非所问。 " 我问他："你选对Agent类型了吗？

6/18/2025 3:30:00 AM

大数据AI智能圈

AM-Thinking-v1：解锁 32B 模型推理潜力的密码

大家好，我是肆〇柒。本篇想和大家分享一个后训练的模型案例 ——AM-Thinking-v1 模型。这个模型是由贝壳（Ke.com）公司旗下的 a-m-team 团队开发的，他们一直致力于探索 AGI 技术。

6/18/2025 2:30:00 AM

肆零柒

MiniMax Agent的能力，彻底震撼了我

我最近试用了一款叫MiniMax Agent的产品，说实话，体验完之后整个人都不好了。图片你想想，以前我们做个网站，得先构思、找素材、写代码、调UI，光是找合适的图片就要花半天时间。现在这玩意儿，你只要说一句话，它就能帮你搞定一切。

6/18/2025 2:01:00 AM

阿丸笔记

迈向人工智能的认识论：窥探黑匣子的新方法

鉴于上述困难，研究人员正在多个方面进行创新，以更好地理解和控制大型语言模型（LLM）的推理方式。总体而言，两种互补的策略正在形成：机械分析和归因：分解模型的内部计算（电路、神经元、注意力头），将特定的决策或步骤归因于特定的组件。行为评估和约束：设计评估指标和训练框架，区分真正的推理和表面模式，并鼓励模型在中间步骤中讲真话。

6/18/2025 2:00:00 AM

晓晓

腾讯位置服务近期发布了鸿蒙版本导航SDK，是基于腾讯全新的导航引擎构建的地图导航应用程序，深度适配HarmonyOS 5及以上系统版本。开发者可以基于鸿蒙操作系统推荐的ASKTS开发语言调用导航SDK能力，构建鸿蒙版地图导航应用。以下为本次发布重点能力介绍：1.鸿蒙版地图引擎地图能力全面升级了3D化引擎，深度适配了鸿蒙系统技术栈：升级后展示更加真实的3D地图效果，使地图场景呈现更加有深度和立体感升级后的渲染技术能够更高效地处理大量POI，并以更加清晰、美观的方式呈现在地图上图片2.驾车导航能力适配基于多源传感数据融合与AI算法迭代，鸿蒙版导航SDK全面升级重构了SDK定位与导航引擎能力。

6/17/2025 6:05:12 PM

鸿蒙开发者社区

iPhone上也能跑Qwen3了！阿里一口气开源32款MLX模型，适配苹果全家桶！千问打入苹果生态，国行版苹果智能即将落地？！

编辑 | 伊风出品 | 51CTO技术栈（微信号：blog51cto）“源神”千问，又一次闷声干大事！今天刷 Reddit 才发现：昨晚，阿里千问一口气开源了 32 款，适配苹果 MLX 架构的 Qwen3 模型。没错，32 款，就是这么量大实惠。

6/17/2025 5:54:25 PM

伊风

AI助燃数字创新 SUSE Summit 2025创新峰会隆重召开

2025年6月13日全球开源解决方案领导者SUSE在北京隆重举办了SUSE Summit 2025创新峰会。本次峰会以“AI开源智选助燃数字创新”为主题，汇集了行业领袖、技术专家以及众多合作伙伴，深入探讨在生成式AI浪潮下，如何基于SUSE开源模式，利用各种新功能和新技术拨开重重迷雾，快速实现企业级AI创新。 SUSE大中华区总裁陈毅威在新质生产力不断涌现的时代背景下，SUSE中国战略稳步推进。

6/17/2025 5:41:47 PM

反转！AI 推理能力遭苹果质疑后，Claude 合著论文反击：不是不会推理，是输给 Token

近日，Apple 机器学习研究团队发布了一篇名为《思考的幻觉（The Illusion of Thinking）》的论文。图片这篇 53 页的技术报告并非普通评测，而是一记质疑当下主流 LLM 推理能力的重锤。研究者们指出，OpenAI 的“o”系列、Google 的 Gemini 2.5、以及 DeepSeek-R 等所谓“推理型大模型”，本质上并没有从训练数据中学习到可泛化的第一性原理。

6/17/2025 5:19:31 PM

LLM 翻车现场！ChatGPT 挑战 1979《Video Chess》惨败：连车马象都认错

一场 ChatGPT 对战 Atari 2600 的象棋对局火了。具体而言，在一场看似轻松的“AI玩具对决”里，ChatGPT输给了Atari 2600 的象棋引擎，对手只是一台48年前、频率1.19 MHz的8位主机。图片起初，这只是Robert Jr.

6/17/2025 5:16:51 PM

网页编程众测排名：DeepSeek-R1超越Claude 4加冕全球第一

编程王者Claude地位不稳了？？大模型竞技场最新战报出炉，DeepSeek新版R1拿下网页编程第一，小胜Claude Opus 4。

6/17/2025 5:14:01 PM

突破多智能体系统边界，开源方案OWL超越OpenAI Deep Research，获17k star

港大、camel-ai 等多家机构联合提出了一种名为新的名为 Workforce 的创新多智能体框架，以及配套的 OWL（Optimized Workforce Learning）训练方法，在通用 AI Assistant 的标杆基准测试 GAIA 上取得了 69.70% 的准确率，不仅刷新了开源系统的最佳纪录，更是超越了多家商业系统以及 OpenAI Deep Research 的开源方案。该研究成果所有代码均已开源，目前已经在 github 上收获了 17k 的 star。论文标题：OWL: Optimized Workforce Learning for General Multi-Agent Assistance in Real-World Task Automation论文地址：：：多智能体系统的「领域壁垒」随着 LLM 的飞速发展，单一智能体在处理复杂现实任务时逐渐暴露出局限性。

6/17/2025 3:28:03 PM

同一天开源新模型，一推理一编程，MiniMax和月之暗面开卷了

同一天，国内大模型厂商扎堆发起了新模型。 AI「六小龙」中的 MiniMax 和月之暗面各自公布了开源新成果。其中，MiniMax 启动了「MiniMax Week」，并在第一天开源了其最新的长上下文推理 LLM——MiniMax-M1。

6/17/2025 3:24:48 PM

苹果揭示当今先进模型存在严重缺陷，给企业高管敲响警钟

一份具有开创性的苹果研究论文在AI社区引发了轩然大波，该论文揭示了当今最先进模型中存在的严重局限性，这些缺陷此前一直未被发现。论文《思考的错觉》表明，像GPT-4、Deep Seek和Claude Sonnet这样的高级模型所应用的“思维链”推理，在任务变得过于复杂时，会出现“完全的准确性崩溃”。最令人担忧的方面似乎是，一旦任务复杂到一定程度，再投入更多的处理能力、标记或数据也无济于事。

6/17/2025 3:18:33 PM

Bernard Marr