理论
AI记忆革命:能否突破数据牢笼,媲美人脑的适应性?
译者 | 朱先忠审校 | 重楼本文要讨论什么内容? Meta公司努力开发出的CoCoMix(Continuous Concept Mixing:连续概念混合,出自Jihoon等人2025年发表的论文,见【引文1】)框架实现了概念学习,即学习单词背后的概念而不是仅仅预测下一个标记,从而使其具有极强的可操控性和可解释性。 但是,依然存在一个核心问题:即使是概念上非常出色的模型,在训练之后的实际部署中,也可能难以应对细微差别或事实性的回忆挑战。
6/18/2025 8:26:01 AM
朱先忠
使用谷歌的最新应用程序,免费本地运行LLM
译者 | 布加迪审校 | 重楼谷歌的Edge Gallery刚刚让AI界迎来了巨大飞跃。 就在上周,谷歌悄然发布了AI Edge Gallery,这是一款普及AI的应用程序。 谷歌Edge AI可以直接在我们的智能手机上执行强大的语言模型,摆脱依赖云的局面,而且不收订阅费。
6/18/2025 8:12:14 AM
布加迪
亚马逊首席执行官:Agent化的未来对于亚马逊格外重要!谁能精通,谁就能在这家公司产生巨大的影响力;现在的工作方式必然改变
编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)当地时间本周二,亚马逊首席执行官 Andy Jassy 在给员工的一份备忘录中表示:Agent 化的未来,对亚马逊而言格外重要;接下来几个月,我们会进一步加码,让开发 Agent 变得更容易。 而同时,生成式 AI 和 Agent 的落地公司的工作方式必然发生改变。 “某些岗位会减少,新的岗位也会出现。
6/18/2025 7:13:37 AM
云昭
CIO如何为AI优化数据管理
一项成功的AI计划在很大程度上取决于底层数据的质量,IT领导者们正在提升他们的数据湖、数据仓库和数据湖仓策略,以提供坚实的基础。 优质数据对于任何IT计划的成功都至关重要,对于AI项目来说更是如此。 糟糕的数据总是会产生糟糕的结果,对于AI来说,风险尤其高,因为不良数据可能导致严重的财务损失、监管罚款和声誉损害。
6/18/2025 7:08:00 AM
Stan Gibson
AI智能体的三种"人格":为什么99%的人都用错了?
昨天和一位创业朋友聊天,他抱怨说:"花了几万块做的Agent客服,效果还不如人工。 用户稍微问点复杂的,就答非所问。 " 我问他:"你选对Agent类型了吗?
6/18/2025 3:30:00 AM
大数据AI智能圈
AM-Thinking-v1:解锁 32B 模型推理潜力的密码
大家好,我是肆〇柒。 本篇想和大家分享一个后训练的模型案例 ——AM-Thinking-v1 模型。 这个模型是由贝壳(Ke.com)公司旗下的 a-m-team 团队开发的,他们一直致力于探索 AGI 技术。
6/18/2025 2:30:00 AM
肆零柒
MiniMax Agent的能力,彻底震撼了我
我最近试用了一款叫MiniMax Agent的产品,说实话,体验完之后整个人都不好了。 图片你想想,以前我们做个网站,得先构思、找素材、写代码、调UI,光是找合适的图片就要花半天时间。 现在这玩意儿,你只要说一句话,它就能帮你搞定一切。
6/18/2025 2:01:00 AM
阿丸笔记
迈向人工智能的认识论:窥探黑匣子的新方法
鉴于上述困难,研究人员正在多个方面进行创新,以更好地理解和控制大型语言模型(LLM)的推理方式。 总体而言,两种互补的策略正在形成:机械分析和归因:分解模型的内部计算(电路、神经元、注意力头),将特定的决策或步骤归因于特定的组件。 行为评估和约束:设计评估指标和训练框架,区分真正的推理和表面模式,并鼓励模型在中间步骤中讲真话。
6/18/2025 2:00:00 AM
晓晓
腾讯位置服务导航SDK鸿蒙版再升级!
腾讯位置服务近期发布了鸿蒙版本导航SDK,是基于腾讯全新的导航引擎构建的地图导航应用程序,深度适配HarmonyOS 5及以上系统版本。 开发者可以基于鸿蒙操作系统推荐的ASKTS开发语言调用导航SDK能力,构建鸿蒙版地图导航应用。 以下为本次发布重点能力介绍:1.鸿蒙版地图引擎地图能力全面升级了3D化引擎,深度适配了鸿蒙系统技术栈:升级后展示更加真实的3D地图效果,使地图场景呈现更加有深度和立体感升级后的渲染技术能够更高效地处理大量POI,并以更加清晰、美观的方式呈现在地图上图片2.驾车导航能力适配基于多源传感数据融合与AI算法迭代,鸿蒙版导航SDK全面升级重构了SDK定位与导航引擎能力。
6/17/2025 6:05:12 PM
鸿蒙开发者社区
iPhone上也能跑Qwen3了!阿里一口气开源32款MLX模型,适配苹果全家桶!千问打入苹果生态,国行版苹果智能即将落地?!
编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)“源神”千问,又一次闷声干大事! 今天刷 Reddit 才发现:昨晚,阿里千问一口气开源了 32 款,适配苹果 MLX 架构的 Qwen3 模型。 没错,32 款,就是这么量大实惠。
6/17/2025 5:54:25 PM
伊风
AI助燃数字创新 SUSE Summit 2025创新峰会隆重召开
2025年6月13日 全球开源解决方案领导者SUSE在北京隆重举办了SUSE Summit 2025创新峰会。 本次峰会以“AI开源智选 助燃数字创新”为主题,汇集了行业领袖、技术专家以及众多合作伙伴,深入探讨在生成式AI浪潮下,如何基于SUSE开源模式,利用各种新功能和新技术拨开重重迷雾,快速实现企业级AI创新。 SUSE大中华区总裁陈毅威在新质生产力不断涌现的时代背景下,SUSE中国战略稳步推进。
6/17/2025 5:41:47 PM
反转!AI 推理能力遭苹果质疑后,Claude 合著论文反击:不是不会推理,是输给 Token
近日,Apple 机器学习研究团队发布了一篇名为《思考的幻觉(The Illusion of Thinking)》的论文。 图片这篇 53 页的技术报告并非普通评测,而是一记质疑当下主流 LLM 推理能力的重锤。 研究者们指出,OpenAI 的“o”系列、Google 的 Gemini 2.5、以及 DeepSeek-R 等所谓“推理型大模型”,本质上并没有从训练数据中学习到可泛化的第一性原理。
6/17/2025 5:19:31 PM
LLM 翻车现场!ChatGPT 挑战 1979《Video Chess》惨败:连车马象都认错
一场 ChatGPT 对战 Atari 2600 的象棋对局火了。 具体而言,在一场看似轻松的“AI玩具对决”里,ChatGPT输给了Atari 2600 的象棋引擎,对手只是一台48年前、频率1.19 MHz的8位主机。 图片起初,这只是Robert Jr.
6/17/2025 5:16:51 PM
网页编程众测排名:DeepSeek-R1超越Claude 4加冕全球第一
编程王者Claude地位不稳了? ? 大模型竞技场最新战报出炉,DeepSeek新版R1拿下网页编程第一,小胜Claude Opus 4。
6/17/2025 5:14:01 PM
突破多智能体系统边界,开源方案OWL超越OpenAI Deep Research,获17k star
港大、camel-ai 等多家机构联合提出了一种名为新的名为 Workforce 的创新多智能体框架,以及配套的 OWL(Optimized Workforce Learning)训练方法,在通用 AI Assistant 的标杆基准测试 GAIA 上取得了 69.70% 的准确率,不仅刷新了开源系统的最佳纪录,更是超越了多家商业系统以及 OpenAI Deep Research 的开源方案。 该研究成果所有代码均已开源,目前已经在 github 上收获了 17k 的 star。 论文标题:OWL: Optimized Workforce Learning for General Multi-Agent Assistance in Real-World Task Automation论文地址:::多智能体系统的「领域壁垒」随着 LLM 的飞速发展,单一智能体在处理复杂现实任务时逐渐暴露出局限性。
6/17/2025 3:28:03 PM
同一天开源新模型,一推理一编程,MiniMax和月之暗面开卷了
同一天,国内大模型厂商扎堆发起了新模型。 AI「六小龙」中的 MiniMax 和月之暗面各自公布了开源新成果。 其中,MiniMax 启动了「MiniMax Week」,并在第一天开源了其最新的长上下文推理 LLM——MiniMax-M1。
6/17/2025 3:24:48 PM
苹果揭示当今先进模型存在严重缺陷,给企业高管敲响警钟
一份具有开创性的苹果研究论文在AI社区引发了轩然大波,该论文揭示了当今最先进模型中存在的严重局限性,这些缺陷此前一直未被发现。 论文《思考的错觉》表明,像GPT-4、Deep Seek和Claude Sonnet这样的高级模型所应用的“思维链”推理,在任务变得过于复杂时,会出现“完全的准确性崩溃”。 最令人担忧的方面似乎是,一旦任务复杂到一定程度,再投入更多的处理能力、标记或数据也无济于事。
6/17/2025 3:18:33 PM
Bernard Marr
DeepSeek-R1编程问鼎,媲美Claude 4!2025 AI上半场战报来袭
编程新王,又有一位玩家成功晋级。 刚刚,LMArena公布了最新WebDev Arena排行榜,DeepSeek-R1(0528)冲进第一。 新版DeepSeek-R1编程能力,现与Gemini 2.5 Pro、Claude Opus 4并驾齐驱。
6/17/2025 3:16:15 PM
新智元
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
机器人
数据
大模型
Midjourney
开源
智能
Meta
用户
微软
GPT
学习
技术
AI新词
图像
Gemini
智能体
马斯克
AI创作
Anthropic
英伟达
论文
训练
代码
算法
LLM
Stable Diffusion
芯片
腾讯
苹果
蛋白质
Claude
开发者
AI for Science
Agent
生成式
神经网络
机器学习
3D
xAI
研究
人形机器人
生成
AI视频
百度
工具
计算
Sora
GPU
华为
大语言模型
RAG
具身智能
AI设计
字节跳动
搜索
大型语言模型
场景
AGI
深度学习
视频生成
预测
视觉
伟达
架构
Transformer
编程
神器推荐
DeepMind
亚马逊
特斯拉
AI模型