AI在线 AI在线

资讯列表

人类在被大语言模型“反向图灵测试”

2018 年,我曾在《深度学习》一书中,讲述了人工智能从逻辑运算模型向类脑计算模型转变的历程。 回想 20 世纪 80 年代深度学习算法刚被发明时,计算机性能仅及今日的百万分之一。 那时的我们无法预知,当这些算法随着规模扩大和数据增加会具备怎样的能力。
7/29/2025 2:55:00 AM

只需一次指令微调,大模型变身全能专家天团,8B模型性能反超全微调基线 | ACL25 Oral

只需一次指令微调,即可让普通大模型变身“全能专家天团”? 改造位置自动定位专家协作动态平衡8B模型性能反超全微调基线1.6%,安全指标暴涨10%,推理内存直降30%! 图片当前预训练语言大模型(LLM)虽具备通用能力,但适应专业领域需高昂的指令微调成本;稀疏混合专家(SMoE)架构作为可扩展的性能-效率平衡框架,虽能提升推理效率并灵活扩展模型容量,但其从头训练消耗巨大资源,因此复用密集大模型参数的升级改造(LLM Upcycling)成为更具成本效益的替代方案。
7/29/2025 2:12:00 AM

小学都看得懂!帮你快速了解 Tool、MCP 和 Agent 的基础科普

我们 302.AI 做 MCP 和 Agent 相关开发有一段时间了,期间一直与开发者和用户们保持着密切的交流。 有一个普遍的感受:尽管行业内几乎所有人都听过 MCP、Agent 这些术语,但只有极少数人真正理解它们的本质。 今天,我就基于 302.AI 的实践和成果,分享一些自己的见解,帮大家厘清概念的来龙去脉,并大胆预测一下未来的发展方向。
7/29/2025 12:02:38 AM
ShowMeAI

LLM记忆终极指南:从上下文窗口到高级智能体记忆系统

当你向聊天机器人报上姓名,片刻后它却再次询问"你叫什么"时,这种数字失忆现象暴露出人工智能的关键短板:大型语言模型(LLMs)本质上是无状态的。 它们像金鱼一样"记不住"过去的对话,每次交互都被视为全新事件。 ChatGPT等应用展现的记忆能力,实则是通过在每轮对话中强行插入历史记录制造的 illusion(假象)。
7/29/2025 12:00:00 AM
大模型之路

亚马逊 AI 编程助手 Amazon Q 被曝严重漏洞,近百万用户一度面临被删库风险

AI在线 7 月 28 日消息,据外媒 TechSpot 报道,本月初,一名黑客攻破了亚马逊的生成式 AI 编程助手 Amazon Q,而该工具通过 Visual Studio Code 扩展广泛应用。 攻击者通过注入未经授权的代码成功侵入了 Amazon Q 的开源 GitHub 仓库。 该代码包含了一段指令,如果成功触发,可能导致删除用户文件和清除与亚马逊网络服务账户相关的云资源。
7/28/2025 11:40:43 PM
清源

剑桥大学等机构调查显示:1/6 英国成年人认为减少作业是学校应对学生滥用 AI 的良方

AI在线 7 月 28 日消息,据英国 BBC 25 日报道,根据 YouGov 的一项调查显示,六分之一的成年人认为,减少或取消课程作业是学校应对 AI 滥用的最佳方法。 这项调查由剑桥大学出版社和评估机构委托,结果显示,89% 的成年人认为学生使用 AI 是不被接受的,但几乎一半的人表示,使用 AI 来改进标点和语法是可以接受的。 这项对 2221 名英国成年人的调查发现,46% 的人认为,在学校课程作业中使用 AI 来改进标点和语法是可以接受的,而 44% 的人则不同意。
7/28/2025 11:00:32 PM
清源

AI Agents的“超级大脑”来了 阿里云正式发布无影Agentbay

7月28日,上海世界人工智能大会WAIC上,阿里云正式推出了首款专为AI Agents打造的"超级大脑"——无影AgentBay。 这台云端电脑不仅能执行代码运行、网页浏览、数据分析、程序开发、表格制作等基础任务,还具备视觉理解、自然语言控制、任务解析等多项AI技能,可在Windows、Linux、Android等多个系统间无缝切换,随时调用云上的算力、存储和工具链资源,仅需三行代码即可接入,做到"拎包入住",让AI开发者们彻底告别繁琐的安装和配置。 作为2025年最受瞩目的技术之一,全球AI Agents市场规模已突破50亿美元,年增长率高达40%。
7/28/2025 10:59:00 PM
机器之心

300万播放量打动唱片公司,Suno平台AI音乐创作者获首个商业合约

音乐产业正在见证一个历史性时刻。 Suno平台上播放量最高的人工智能音乐创作者Imoliver近日与独立唱片公司Hallwood达成唱片合约,这一合作标志着AI音乐创作从技术实验走向商业化运营的重要转折点。 300万播放量证明AI音乐商业价值Imoliver是一位独特的人类艺术家,他的所有歌曲均由人工智能创作完成。
7/28/2025 10:42:11 PM
AI在线

PPIO亮相WAIC发布国内首个Agentic AI基础设施平台

在2025世界人工智能大会暨人工智能全球治理高级别会议(WAIC)上,独立分布式云计算服务商PPIO重磅发布国内首个Agentic AI基础设施服务平台,标志着智能体应用开发迎来全新发展阶段。 双版本产品矩阵,覆盖全场景需求PPIO联合创始人兼CEO姚欣在WAIC活动上介绍,该AI智能体平台分为通用版和企业版两大产品线。 通用版以分布式GPU云底座为支撑,为个人开发者与中小企业提供兼具性能、效率、成本优势的智能体开发环境。
7/28/2025 10:42:11 PM
AI在线

智谱发布新一代旗舰开源模型 GLM-4.5,专为智能体应用打造

AI在线 7 月 28 日消息,今天智谱发布了新一代旗舰模型 GLM-4.5,专为智能体应用打造的基础模型。 Hugging Face 与 ModelScope 平台同步开源,模型权重遵循 MIT License。 AI在线附官方介绍要点如下:GLM-4.5 在包含推理、代码、智能体的综合能力达到开源 SOTA,在真实代码智能体的人工对比评测中,实测国内最佳;采用混合专家(MoE)架构,包括 GLM-4.5:总参数量 3550 亿,激活参数 320 亿;GLM-4.5-Air:总参数 1060 亿,激活参数 120 亿;两种模式:用于复杂推理和工具使用的思考模式,及用于即时响应的非思考模式;高速、低成本:API 调用价格低至输入 0.8 元 / 百万 tokens、输出 2 元 / 百万 tokens;高速版最高可达 100 tokens / 秒。
7/28/2025 9:31:58 PM
远洋

阿里巴巴开源视频生成模型通义万相 Wan2.2,首创电影美学控制系统

AI在线 7 月 28 日消息,今晚,阿里开源视频生成模型「通义万相 Wan2.2」,此次共开源文生视频(Wan2.2-T2V-A14B)、图生视频(Wan2.2-I2V-A14B)和统一视频生成(Wan2.2-IT2V-5B)三款模型,其中文生视频模型和图生视频模型均为业界首个使用 MoE 架构的视频生成模型,总参数量为 27B,激活参数 14B;同时,首创电影美学控制系统,光影、色彩、构图、微表情等能力媲美专业电影水平。 开发者可在 GitHub、HuggingFace、魔搭社区下载模型和代码,企业可在阿里云百炼调用模型 API,用户还可在通义万相官网和通义 App 直接体验。 据官方介绍,通义万相 2.2 率先在视频生成扩散模型中引入 MoE 架构,有效解决视频生成处理 Token 过长导致的计算资源消耗大问题。
7/28/2025 8:30:14 PM
远洋

比尔・盖茨:AI 进步速度远超预期,大学毕业生找工作更难

AI在线 7 月 28 日消息,微软联合创始人比尔・盖茨当地时间上周日在接受 CNN 专访时指出,人工智能(AI)技术的进步速度远超他的预期,尤其是在编程和深度研究领域。 盖茨认为,AI 将改变白领和蓝领的工作环境,尤其是对于大学毕业生来说,找工作将变得更加具有挑战性。 他提到,AI 可能会替代某些简单的工作,如电话销售或客户支持,但在人类最具创造力的领域,AI 将更多作为辅助工具使用。
7/28/2025 8:23:37 PM
远洋

智能座舱率先L3!AI Agent上车颠覆体验,千里科技WAIC交卷

贾浩楠 发自 副驾寺. 智能车参考 | 公众号 AI4Auto智能汽车迈进“L3时代”,现在已经有了明确时间表:. 率先落地L3级智能汽车的,既不是新势力,也不是AI科技大厂,反而很有可能是一家自主TOP3车企。
7/28/2025 8:00:25 PM
贾浩楠

这届WAIC,无问芯穹发布了三个「盒子」

「算力是智能时代的土壤,其规模与效率决定着数字未来的疆界。 」7 月 28 日,2025 年世界人工智能大会上,无问芯穹联合创始人、CEO 夏立雪发布了无问芯穹全规模 AI 效能跃升方案,并正式推出三大核心产品:无穹 AI 云、无界智算平台与无垠终端智能。 该方案是一套面向未来智能基础设施的软硬协同系统,为跨地域智算网络、智算集群与多形态智能终端等全规模场景,统一适配多种异构算力,提供从模型调度、性能优化到应用部署的全链路支持。
7/28/2025 7:08:00 PM
机器之心

「幻觉」竟是Karpathy十年前命名的?这个AI圈起名大师带火了多少概念?

取名大王 Karpathy。 万万没想到,「幻觉」这个词,竟然是 AI 大牛 Andrej Karpathy 命名的。 最近,一位网友在「The Thinking Machine」(一本新书)里发现了这么一段描述:「Karpathy 承认他的(神经)网络有局限性:它只是在模仿言语,而不必真正理解其含义,当遇到它不理解的概念时,它就会『骄傲地』生成一些无意义的内容。
7/28/2025 7:01:00 PM
机器之心

EvaLearn:AI下半场的全新评测范式!

在三个月前,OpenAI 研究员 Shunyu Yao 发表了一篇关于 AI 的下半场的博客引起了广泛讨论。 他在博客中指出,AI 研究正在从 “能不能做” 转向 “学得是否有效”,传统的基准测试已经难以衡量 AI 的实际效用,他指出现有的评估方式中,模型被要求独立完成每个任务,然后取平均得分。 这种方式忽略了任务之间的连贯性,无法评估模型长期适应能力和更类人的动态学习能力。
7/28/2025 6:57:00 PM
机器之心

WAIC2025,斑马智行元神AI获国际测评机构全项第一

这两天,阿里通义又重新夺得了最强开源大模型的称号。 两周前,大模型创业公司发布 Kimi K2 模型并同步开源,一举超越 DeepSeek 拿下开源大模型第一。 这就让同属开源阵营的通义有些尴尬。
7/28/2025 6:27:03 PM
鹭羽

钉钉 CTO 朱鸿:AI 已切换到下半场,垂直领域的 AGI 将很快到来

AI在线 7 月 28 日消息,钉钉今天在 2025 世界人工智能大会上举办了“AI 实干派”专场活动,其中钉钉商业总裁杨猛、钉钉 CTO 朱鸿等嘉宾均出席了此次活动。 活动中朱鸿首先指出,AI 已经从上半场切换到下半场,这是企业数据发挥出 AI 生产力价值的关键时刻。 未来几年内,垂直领域的 AGI(通用人工智能)会很快到来。
7/28/2025 6:26:07 PM
潞源(实习)