AI在线 AI在线

理论

OpenAI/微软争夺AGI控制权!重组谈判激烈,年底谈不成软银700亿或撤

OpenAI就重组问题与微软持续进行了胶着的谈判,重写合作合同,至今悬而未决。 今年年底是一个关键节点,关系到软银对OpenAI的100亿美元投资能否到账。 OpenAI在接受了微软的注资后,双方的利益诉求点始终处在不同的轨道上。
8/28/2025 3:27:22 PM

AI加持气候模拟:华盛顿大学等12小时跑出一千年模拟,快了数千倍

编辑丨&想象一下,一部拍摄了长达 50 年的连续剧——还是纪录片,这其中的视角记录不能说乏善可陈,只能说是枯燥无味。 诚然自然的美景的确引人注目,但倘若就这么持续关注 50 年? 这就是过去科学家在面对地球模型时的窘境。
8/28/2025 2:02:00 PM
ScienceAI

波士顿动力机器狗侧空翻炸场!穿轮滑鞋照样能翻

刚刚,风头被中国机器人盖过的波士顿动力,又整了个大活! 前后空翻我还能理解,这侧空翻? (不是哥们,你真会啊!
8/28/2025 1:24:54 PM

专治智能体盲跑!微软发布AI Agent 五大可观测性,打通任督二脉

今天凌晨,微软在官网发布了AI Agent 5大可观测性最佳实践,以帮助开发者深度解决智能体盲跑、自动化流程不可控等难题。 智能体可观测性的主要好处包括:在开发早期检测并解决问题;验证智能体是否符合质量、安全和合规标准;优化生产中的性能和用户体验;维护智能体的信任和问责制等。 同时还展示了5个应用案例,让大家更直观地了解这项技术。
8/28/2025 11:55:15 AM

刚刚,全球AI百强榜发布!ChatGPT稳坐第一,DeepSeek第三,前50有22个来自中国

就在刚刚,a16z最新一期的「Top 100消费级GenAI应用榜单」出炉! 本期榜单传递出一个最核心信息:AI产品竞争的生态格局正日趋稳定! 网页排行前50移动应用排行前50不论是你常用的DeepSeek、豆包、夸克,还是一直领先的ChatGPT和Gemini,或者是新进榜单Lovable等,这场AI产品的「百团大战」依然在继续!
8/28/2025 10:07:18 AM
新智元

从汉语言文学学生到鸿蒙先锋:林子亿的跨界成长与生态探索

当汉语言文学的诗意撞上鸿蒙开发的代码,会迸发出怎样的创新火花? 林子亿,这位汉语言文学专业的大二学生,用行动给出了答案。 作为十年"花粉"的他自2019年HarmonyOS发布后便埋下技术火种,2022年正式踏上鸿蒙开发之路。
8/28/2025 9:44:07 AM

谷歌"香蕉"模型nano banana震撼发布!图像编辑能力碾压所有对手

想象一下这个场景:你正在设计一个品牌Logo,客户突然要求修改颜色、调整字体,还要保持角色的一致性。 以往你可能需要在Photoshop里折腾半天,但现在,只需要一句话就能搞定——"把这个logo改成蓝色调,让角色表情更友善一些"。 这不是科幻电影,而是谷歌刚刚发布的Gemini 2.5 Image模型,代号"Nano Banana"正在创造的现实。
8/28/2025 9:17:50 AM
阿丸笔记

不靠高薪靠信仰!以文化破局,Anthropic凭「使命驱动」杀出AI人才血路

如今的大模型厂商,如足球豪门一样争夺开发者,动辄开出百万甚至千万的年薪。 例如Meta花五千万年薪来招募AI工程师,身价已经超过了足球明星姆巴佩和内马尔。 在Meta与OpenAI等科技巨头之间,顶尖AI人才的争夺战已近白热化。
8/28/2025 9:15:00 AM

破解人机协作密码:工作技能拆成两层,AI执行人类决策成功率狂飙 | ICML 2025

人类和AI在工作中如何协作? 耶鲁和南大的研究人员合作的这篇论文讲清楚了。 这篇论文提出了一个数学框架,通过把工作技能拆分成两个层次来解释这个问题,具体包括:决策层子技能(decision-level subskill):确立目标、界定问题、权衡取舍的认知工作。
8/28/2025 9:12:00 AM

告别「面瘫」配音,InfiniteTalk开启从口型同步到全身表达新范式

传统 video dubbing 技术长期受限于其固有的 “口型僵局”,即仅能编辑嘴部区域,导致配音所传递的情感与人物的面部、肢体表达严重脱节,削弱了观众的沉浸感。 现有新兴的音频驱动视频生成模型,在应对长视频序列时也暴露出身份漂移和片段过渡生硬等问题。 为解决这些痛点,Infinitetalk 引入 “稀疏帧 video dubbing”。
8/28/2025 9:11:56 AM

从需求分析到代码生成,LLM都能干点啥?一文读懂291个软工Benchmark!

近年来,ChatGPT、Llama等大语言模型在软件工程领域的能力突飞猛进,从需求分析、代码生成到测试与维护几乎无所不能。 但一个核心问题是:我们如何客观评估这些模型在不同软件工程任务中的表现? 在SE领域,Benchmark既是分数卡,让不同模型在同一标准下比拼;也是方向盘,引导技术改进与未来研究方向。
8/28/2025 9:10:00 AM

当数字世界的“万能钥匙”被滥用,谁来守护核心资产?来自火山的 MCP 安全授权新范式

摘要本文旨在深入剖析火山引擎 Model Context Protocol (MCP) 开放生态下的 OAuth 授权安全挑战,并系统阐述火山引擎为此构建的多层次、纵深防御安全方案。 面对由 OAuth 2.0动态客户端注册带来的灵活性与潜在风险,我们设计了从“事前预防”到“事中限制”,再到“事后兜底”的完整安全闭环。 该体系通过授权前二次确认、令牌身份与权限隔离、以及 API 级别精细化管控等关键举措,在确保 MCP 生态灵活开放的同时,最大限度地保障用户资产与数据安全,构建值得信赖的开发者生态。
8/28/2025 8:41:23 AM

揭秘Mem0的卓越架构:打造真正拥有记忆的AI系统

在人工智能应用迅猛发展的当下,聊天机器人已成为企业服务用户、个人提升效率的重要工具。 然而,许多开发者都遭遇过这样的尴尬场景:花费数周精心打造的聊天机器人在演示时表现出色,能流利回答问题、提供帮助,看似智能十足。 但当用户次日再次访问时,机器人却仿佛患上了“失忆症”,只会机械地问“今天我能为您提供什么帮助?
8/28/2025 7:52:17 AM
大模型之路

预测型AI vs. 生成型AI:哪种更适合你的企业?

根据Resume Builder最近的一项调查,66%的美国管理者在裁员决策时曾咨询过ChatGPT或其他大型语言模型。 大多数管理者也会使用AI来决定加薪(78%)和晋升(77%),这些数据反映出GenAI正在渗透到业务流程中,这些流程本不应依赖它。 基础模型并非为处理高风险、领域特定的情况而设计,正是这些场景最为敏感。
8/28/2025 7:44:00 AM
Gershon

正确采用AI,防止影子AI迅速蔓延的实战经验

企业采用AI已不再是理论,而是正在发生的现实——无论企业是否做好准备。 员工正在使用公开可用的AI工具完成实际工作:总结文档、撰写邮件、生成报告、翻译资料、编写代码、解答问题。 他们并非因为被强制去做,而是因为这些工具能快速、有效地解决实际问题。
8/28/2025 7:26:00 AM
Tyler

企业成功部署智能体的关键要素

毫无疑问,智能体——那些能够在企业工作流中自主、异步运作的系统——目前正是企业界的热门话题。 然而,越来越多的人担心,这些讨论大多停留在口头上,充满炒作,却缺乏实质性支撑。 例如,Gartner指出,企业正处于“期望膨胀的顶峰”,这是在失望感出现之前的一段时期,因为供应商尚未用真实的、可落地的案例支撑其承诺。
8/28/2025 7:09:00 AM
Taryn

从3000万到1777.9 Token:LogicRAG用动态逻辑图实现“零预建图的高效推理

大家好,我是肆〇柒。 今天要和大家分享的是一项来自香港理工大学的研究——LogicRAG。 这项工作挑战了当前主流的GraphRAG范式,提出了一种无需预建图、按需生成动态逻辑结构的新型RAG框架。
8/28/2025 1:00:00 AM
肆零柒

「精而巧」的端侧大模型为何火了?

大模型爆火伊始,很多厂商提的最多的就是自家的模型(云端大模型)参数有多大,性能有多好。 但近两年,相较云端大模型外,端侧大模型的热度被炒的越来越高。 很重要的原因在于,越来越多的厂商开始布局端侧大模型赛道。
8/27/2025 4:05:39 PM