AI在线 AI在线

理论

比Transformer更强的架构来了?浙大新作Translution,一统卷积和自注意力

自2017年Transformer模型提出以来,Self-attention机制凭借其强大的建模能力,逐渐成为深度学习领域的核心操作。 然而,随着人工智能模型的规模不断扩张,单纯依靠简单直接「堆参数、堆数据」提升性能的模式正逐渐遇到瓶颈。 面对大模型训练代价高昂、性能增长趋缓等挑战,学术界和产业界亟需新的网络架构创新。
10/23/2025 8:25:08 AM
新智元

有了GLM 4.6 Coding Plan,氛围编程轻松上手

译者 | 布加迪审校 | 重楼引言GLM-4.6是Z.AI开放权重编程模型的最新版本,在智能体性能、推理和编程基准测试等方面较GLM-4.5有了显著改进。 虽然它也有适合自托管的开放权重,但全速运行可能会占用大量资源。 因此,许多开发者更喜欢轻量级的订阅选项,这样他们无需笨重的硬件即可使用该模型。
10/23/2025 8:00:00 AM
布加迪

利用AI全方位优化数据分析工作流的实战技巧

我们正畅游在数据的海洋之中,每一次点击、每一笔交易、每一次传感器读数,都在为数字数据库添砖加瓦,这些数据蕴含着无数的洞察与商机,然而,对许多企业而言,这些潜力尚未得到充分挖掘。 尽管如今企业收集的数据量比以往任何时候都要多,但其中高达73%的数据并未用于分析。 数据孤岛,以及数据量之大、流动速度之快、种类之多,让许多传统分析流程不堪重负,导致宝贵的信息被束之高阁。
10/23/2025 7:23:00 AM
David

隐性危机:AI的成本节约为何正在埋下未来隐患

今年的财报电话会议遵循了一个熟悉的模式。 领导团队站在投资者和分析师面前,自豪地宣布AI如何提升了效率、减少了员工数量。 截至6月,平均每天有491人因AI而失业,新闻稿称之为“优化”,董事会称之为“进步”,股价随之飙升。
10/23/2025 7:20:00 AM
Stephen

大模型的脑子会烂掉!而且不能自愈!华人研究论文火了:连续喂垃圾内容,再聪明的模型也变笨,而且自恋、暗黑化

编辑 | 云昭我们每天刷到的那些情绪化标题、碎片化内容、互怼式评论,可能不只是让人变蠢。 最新研究发现——连续几个月让AI刷这些数据,AI也会被带坏。 什么是“AI 脑腐”?
10/22/2025 8:05:41 PM
云昭

中国首个AI开源后端平台,让前端开发彻底“自给自足”了!

AI 只写一半应用这几年,AI Coding 工具的发展实在是太快了,你随便丢给它一个复杂的需求,它就能迅速拆分成一个个任务,生成漂亮的界面,着实是让人震惊不已。 但是深入观察一下就会发现,那只是“一半的应用”:只有前端代码,没有后端,界面漂亮,数据却是假的。 原因很简单,后端要涉及数据库、API、服务器等复杂环境,要想让AI完全自动生成、集成、部署,难度极高。
10/22/2025 3:48:46 PM
刘欣

Plaud与亚马逊云科技的双向奔赴,从初创破局到 170 国覆盖的合作实践

三年的时间,从 Kickstarter 众筹破纪录,到全球累计售出100 万台设备,覆盖 170 个国家和地区,在亚马逊平台多数国家品类占有率超过 95% ,登陆中国市场第三天即登顶天猫、京东、抖音同品类榜首。 Plaud以“口碑驱动”的方式,跑出了一条不同寻常的增长路径。 这一成绩的背后,离不开 Plaud对“对话即智能”的深刻洞察,以及与亚马逊云科技从技术架构到全球化布局的深度协同。
10/22/2025 3:24:55 PM
鸢玮

当AI需要「充电」,科技巨头押注小型模块化反应堆,细节公布

编辑丨coisini随着人工智能(AI)模型参数从千亿级迈向万亿级,其背后的能源消耗已经达到了惊人的程度。 虽然 AI 的爆发式增长给包括科研在内的各行各业带来变革机遇,但其引起的能源危机同样不容忽视。 根据国际能源署(IEA)今年 4 月发布的报告,到 2030 年,全球数据中心的电力需求将增长一倍以上,而人工智能将是这一增长的最重要驱动力。
10/22/2025 11:52:00 AM
ScienceAI

准备好将你的人工智能愿景转变为市场现实了吗?

当今,就企业服务的AI赋能而言,AI Agent已成为科技领域最受关注的前沿方向。 网络上充斥着对自治Agent的设想——它们能自主编写代码、运行业务系统,甚至完成复杂决策任务,而人类只需在一旁品咖啡。 这种充满未来感的愿景确实令人振奋,但现实往往更为复杂:构建一个真正高效、可扩展且稳定的人工智能Agent远非简单地将语言模型接入工具接口并放任其运行那么简单。
10/22/2025 11:32:41 AM
曹洪伟

刚刚,ChatGPT终于可以走遍整个互联网了!OpenAI深夜炸街:原生ChatGPT集成、即时理解、主动执行,浏览器赛道鲨疯了

🧭 一、事件速览OpenAI 发布 ChatGPT Atlas 浏览器。 平台支持:今日起可在 macOS 下载,面向 Free、Plus、Pro、Go 用户开放;企业、教育版处于 Beta 阶段。 其他平台:Windows、iOS、Android 版本即将推出。
10/22/2025 11:24:19 AM

OpenAI入局浏览器,ChatGPT Atlas与Chrome直面硬刚

自ChatGPT爆火后,OpenAI在AI大模型界的关注度一直居高不下。 当地时间周一,OpenAI发布首个浏览器ChatGPT Atlas,正式进军AI浏览器赛道,与谷歌的Chrome直接竞争。 从过往OpenAI推出AI产品来看,有ChatGPT Search,还有独立客户端(Windows/macOS),所以说AI浏览器的诞生并不让人意外。
10/22/2025 11:00:49 AM

OpenAI 招募逾百名前投行人士训练 AI,目标干掉初级银行从业者的重复活

10 月 22 日消息,据彭博社看到的文件显示,OpenAI 已聘请超过 100 名前投资银行家,协助训练其人工智能系统掌握财务建模技能,目标是取代整个行业初级银行从业者所承担的大量重复性工作。 这一团队成员包括来自摩根大通(JPMorganChase & Co.)、摩根士丹利(Morgan Stanley)和高盛集团(Goldman Sachs Group . Inc.)等机构的前员工,隶属于这家初创公司内部一个代号为“水星”(Mercury)的秘密项目。
10/22/2025 10:18:26 AM
远洋

NeurIPS 2025|火山引擎多媒体实验室联合南开大学推出TempSamp-R1强化学习新框架,视频时序理解大模型SOTA!

在人工智能与多媒体技术深度融合的当下,视频时序定位(Video Temporal Grounding) 成为视频理解领域的核心任务之一,其目标是根据自然语言查询,在长段视频流中精准定位出与之匹配的时序片段。 这一能力是智能视频剪辑、内容检索、人机交互、事件分析等众多场景落地的关键基础。 例如,快速定位球赛进球瞬间、影视剧名场面、游戏高光镜头、响应“回放主角微笑片段” 、异常事件查看等需求,均依赖于高效精准的时序定位技术。
10/22/2025 10:16:02 AM
多媒体实验室

OpenAI发布AI浏览器ChatGPT Atlas:重塑网络交互体验,直闯谷歌核心领地

当地时间周一,OpenAI 正式推出 AI 浏览器 ChatGPT Atlas。 这款仅适用于 macOS 系统的产品,以深度整合 ChatGPT 为核心亮点,向谷歌 Chrome 在浏览器市场的霸主地位发起直接挑战。 分析认为,此举不仅是 OpenAI 从单一应用向多元计算平台转型的关键一步,更试图重新定义人们在线工作与网络交互的方式,开启浏览器 “智能体时代” 的新篇章。
10/22/2025 9:36:47 AM
小菲

特斯拉Karpathy对AI Agent的冷静判断:十年成熟论背后的技术理性

为什么一个曾经推动特斯拉自动驾驶技术突破的AI专家,会对当下最火热的AI Agent泼冷水? 最近在红杉资本的AI峰会上,OpenAI创始成员、前特斯拉AI总监安德烈·卡帕西(Andrej Karpathy)发表了一个让很多人意外的观点。 当所有人都在为AI Agent的"即将爆发"而兴奋时,这位技术大牛却给出了一个相当冷静的判断:真正实用的AI Agent,可能还需要十年左右的时间才能成熟。
10/22/2025 9:15:28 AM
阿丸笔记

墙体的AI革命!智能超表面如何让建筑「听懂」6G信号?

5G基站极高的功耗一直被业内诟病。 其主导原因是,基站只能部署在室外,但96%的流量需求却源于室内用户。 信号穿墙而过,强度下降了90%~99.9%。
10/22/2025 9:04:49 AM

一张照片,一个3D「你」:计算所等提出HumanLift,实现高保真数字人重建

创建具有高度真实感的三维数字人,在三维影视制作、游戏开发以及虚拟/增强现实(VR/AR)等多个领域均有着广泛且重要的应用。 尽管现有技术在从多视角图片重建高质量、可动画化的三维人体模型任务中展现出诸多优势,但从单张参考图像重建真实感三维数字人,依旧面临技术复杂、资源消耗大的挑战。 如何兼顾三维一致性与参考图像一致性,重建出高质量、高真实感的人物外观与姿势,以及如何生成高真实度且细节一致的服饰、人脸等,都是亟待解决的难题。
10/22/2025 9:03:00 AM

文本已死,视觉当立!Karpathy狂赞DeepSeek新模型,终结分词器时代

DeepSeek再次让全世界大吃一惊! 他们最新成果DeepSeek-OCR,从根本上改变了游戏规则——文本并非通用的输入。 反而,视觉将取而代之!
10/22/2025 9:01:31 AM