AI在线 AI在线

AI

硅谷AI大佬都在造末日地堡:小扎夏威夷修了465平米,奥特曼承认有加固地下室

科技巨头、亿万富翁、AI押注者&话事人……但你可能没注意到,除了这些身份之外,奥特曼和扎克伯格还有个鲜为人知的共同点:末日堡垒建造者。 所谓末日堡垒,指的是在危机时刻可以长期生存的地下避难所,具备防灾、储粮、自给自足等功能,是科技富豪们眼中的最后保险。 据Wired报道,这个夏天,小扎斥6500万美元巨资,又悄悄在夏威夷考艾岛北部海岸买了962英亩的牧场土地。
8/8/2025 9:17:46 AM

AI修Bug新SOTA:SWE-Bench Lite60.33%修复率,像人一样能积累经验,中科院软件所出品

AI学会像人一样修Bug了! “这个Bug我上周刚修过”“这个报错怎么又来了”“新人怎么又在同一个地方踩坑”……如果你是程序员,是否经常遇到这些令人抓狂的场景? 现有的AI修复工具就像“金鱼”,只有7秒记忆,每次遇到问题都从零开始。
8/8/2025 9:16:00 AM

强化学习+MCP=王炸?开源框架教AI在MCP中玩转工具解决任务,实测效果超越GPT!

强化学习 任意一张牌,往往就是王炸。 专注于LLM RL的科技公司OpenPipe提出全新开源强化学习框架——MCP·RL。 只需一个MCP Server的地址,agent就能自动发现工具、生成任务,通过强化学习在闭环反馈中摸索出最优调用策略。
8/8/2025 9:15:00 AM

谷歌Genie3全网玩疯!画质飞跃720P,网友造出西幻RPG游戏

全网疯玩Genie3,惊叹:这才是真正的大世界! 距离上一代Genie2,才刚刚过去7个多月,谷歌世界模型就像开了倍速进化:原本啥也看不清,突然耳聪目明一跃来到720P画质,原来只有几十秒的限时体验,现在也直接拉长到好几分钟。 世界类型也真正实现多重宇宙折叠,自然、历史、奇幻应有尽有。
8/8/2025 9:13:00 AM

又是浙大校友!AI眼镜“隔空取物”,戴上即可随心选中现实世界任意物体

只靠说话和AI眼镜互动,确实有点不方便。 现在新玩法来了! 数字替身帮你“隔空抓物”,混合现实即时选择现实世界的物体作为上下文。
8/8/2025 9:04:00 AM

字节&MAP重塑大模型推理算法优化重点,强化学习重在高效探索助力LLM提升上限

强化学习(RL)范式虽然显著提升了大语言模型(LLM)在复杂任务中的表现,但其在实际应用中仍面临传统RL框架下固有的探索难题。 一个普遍存在的现象是:在训练过程中,模型的熵值迅速下降,推理路径趋于固化,导致“利用(exploitation)”远超“探索(exploration)”,严重失衡。 这种过早收敛不仅削弱了模型的多样性生成能力,也限制了其性能上限的进一步突破。
8/8/2025 9:02:00 AM

人工智能能否实现类人记忆?探索思想上传之路

译者 | 涂承烨审校 | 重楼记忆帮助人们记住“我是谁”。 它保存着人们的经历、知识和情感。 过去,记忆被认为只存在于人脑中。
8/8/2025 8:01:07 AM
涂承烨

供应链管理中高价值AI应用场景的识别

AI已融入供应链的几乎所有解决方案中,成为提升销售额和利润率、同时引发人们浓厚兴趣的手段。 在竞争日益激烈的环境中,许多企业为抢占先机或保持竞争力,纷纷急于采用AI技术,但有时方式过于表面、效果不佳,最终未能创造真正的价值。 例如,在供应链应用领域,只有一小部分AI应用能通过显著的投资回报率创造真正的价值,AI已成为现实,但许多解决方案无法有效满足企业需求,更不用说克服实际的供应链挑战了,因此,关键是要透过表象,确保任何实施都能兑现承诺。
8/8/2025 7:05:00 AM
Fabrizio

Self-Play Critic:以“对抗博弈”创新大语言模型推理评估

大家好,我是肆〇柒。 今天,我想和大家聊一项创新的评估思路——Self-Play Critic(SPC)。 大型语言模型(LLM)目前已成为我们生活和工作中不可或缺的工具。
8/8/2025 3:00:00 AM
肆零柒

一篇120页AI4Research(科学研究AI)最新系统性综述

尽管AI在科学研究中的应用取得了显著进展,但目前仍缺乏对AI在科学研究(AI4Research)中应用的全面综述,为了填补这一空白,提出了一个全面的AI4Research调查,旨在提供一个统一的视角,并系统地分类AI在研究中的应用。 AI4Research的主流流程和分类,可以分为五个关键领域:(1)用于科学理解的AI,(2)用于学术调查的AI,(3)用于科学发现的AI,(4)用于学术写作的AI,以及(5)用于学术同行评审的AI。 这些领域各自有助于提升AI融合研究与出版的有效性和效率。
8/8/2025 2:22:00 AM

AI 智能体记忆机制详解

是否总感觉你在和 AI 助手重复着同样的对话? 你告诉它一些重要的事情,五分钟后,它就忘了。 很长一段时间以来,这就是和大多数 AI 进行对话的现实情况。
8/8/2025 2:15:00 AM
Baihai IDP

构建 AI 护城河的六大常见误区分析

这篇文章是反面教材:介绍六种最常见的误区 —— 它们看似是护城河,实则因未能夯实金字塔的核心能力层,而在悄然削弱你的竞争优势。 误区一:“我们拥有数十年积累的数据,因此占据优势。 ”现实情况:历史数据往往分散杂乱、标注混乱,或尘封在无人愿意触碰的旧系统中。
8/8/2025 2:11:12 AM
Baihai IDP

AI Agent系统的安全能力及可信治理的“三道防线”

在AI技术加速演进与广泛落地的当下,Agent系统作为具备自主感知、推理与执行能力的智能体,正日益成为企业智能化转型的核心驱动。 然而,随之而来的系统复杂性、任务自治性以及跨域协同能力,也引发了前所未有的安全挑战与治理难题。 为了构建一个既高效运行又可控可信的Agent系统,亟需在架构层面引入系统性的安全防护与治理机制。
8/8/2025 2:10:00 AM

AI应用开发的三个挑战

虽然AI技术已经广泛应用到许多业务场景,但真正成熟且有价值的AI应用还是凤毛麟角,常见的应用主要集中在AI助手和知识库之类,虽然企业管理者也希望将AI真正嵌入到管理流程和业务流程中,但效果还有待验证。 之所以如此,一方面,LLM与AI技术还有待进一步完善和提高,另一方面,大多数企业缺乏合格的AI开发人员。 除去这两方面的原因,我认为主要受制于AI应用开发面临的三个挑战。
8/8/2025 2:00:00 AM
张逸少

告别适配器:通用工具调用协议(UTCP)如何简化 AI 工具通信

UTCP 让任何 AI 代理都能直接跟任何工具对话——不管是 HTTP、gRPC、WebSocket,还是你的本地 CLI——无需包装器、无延迟、无锁定。 什么是 UTCP? UTCP 是一个全新标准,专为帮助 AI 代理与各种外部工具沟通而设计,不论这些工具用的是什么语言、风格或接口。
8/8/2025 1:45:00 AM
AI研究生

炸裂!Apipost离线可用+AI全栈覆盖,2s开启速度无敌了!

Apipost是一款面向开发人员,包括前端、后端、测试人员以及团队协作的API开发管理工具,它集API文档开发、设计、调试、Mock、自动化测试及管理于一体,已形成从API设计、调试、文档生成、自动化测试到性能测试和管理的完整闭环,尤其在AI大模型集成、文档智能化生成领域持续突破,成为国内数百万开发者和测试人员构建高效研发链路的核心工具。 与其他传统工具相比,Apipost最大的优势在于无需登录即可使用,支持离线调试,同时保持了对复杂测试场景的支持;笔者近期在使用Apipost最新V8.1.20版本时还发现,其开启速度只需2s。 一、Apipost核心优势Apipost非常适合需要团队协作、注重文档管理和轻量体验的API开发团队。
8/8/2025 12:00:00 AM

AI生死局仅存6位玩家!Claude之父:大模型天生就有“搞钱”冲动!做了CC才能懂模型如何进化!即使AI停滞,产品还要再做十年

出品 | 51CTO技术栈(微信号:blog51cto)说起来,今天已经立秋了,但 AI 圈的这个“盛夏”显然还没结束。 这几天,几大巨头接连出招,行业硝烟味渐浓。 明天大概率还有GPT-5要出来炸场。
8/7/2025 5:01:36 PM
伊风

刚刚,GPT-5内测抢先泄露!推理强到离谱,智商被曝140超越人类天才

就在明天,GPT-5总算要靴子落地了。 周五凌晨,GPT-5、GPT-5 Mini和GPT-5 Nano将同时推出。 全网用户都可以立即通过API和ChatGPT访问这三个模型。
8/7/2025 4:21:27 PM