AI在线 AI在线

理论

破解人机协作密码:工作技能拆成两层,AI执行人类决策成功率狂飙 | ICML 2025

人类和AI在工作中如何协作? 耶鲁和南大的研究人员合作的这篇论文讲清楚了。 这篇论文提出了一个数学框架,通过把工作技能拆分成两个层次来解释这个问题,具体包括:决策层子技能(decision-level subskill):确立目标、界定问题、权衡取舍的认知工作。
8/28/2025 9:12:00 AM

告别「面瘫」配音,InfiniteTalk开启从口型同步到全身表达新范式

传统 video dubbing 技术长期受限于其固有的 “口型僵局”,即仅能编辑嘴部区域,导致配音所传递的情感与人物的面部、肢体表达严重脱节,削弱了观众的沉浸感。 现有新兴的音频驱动视频生成模型,在应对长视频序列时也暴露出身份漂移和片段过渡生硬等问题。 为解决这些痛点,Infinitetalk 引入 “稀疏帧 video dubbing”。
8/28/2025 9:11:56 AM

从需求分析到代码生成,LLM都能干点啥?一文读懂291个软工Benchmark!

近年来,ChatGPT、Llama等大语言模型在软件工程领域的能力突飞猛进,从需求分析、代码生成到测试与维护几乎无所不能。 但一个核心问题是:我们如何客观评估这些模型在不同软件工程任务中的表现? 在SE领域,Benchmark既是分数卡,让不同模型在同一标准下比拼;也是方向盘,引导技术改进与未来研究方向。
8/28/2025 9:10:00 AM

当数字世界的“万能钥匙”被滥用,谁来守护核心资产?来自火山的 MCP 安全授权新范式

摘要本文旨在深入剖析火山引擎 Model Context Protocol (MCP) 开放生态下的 OAuth 授权安全挑战,并系统阐述火山引擎为此构建的多层次、纵深防御安全方案。 面对由 OAuth 2.0动态客户端注册带来的灵活性与潜在风险,我们设计了从“事前预防”到“事中限制”,再到“事后兜底”的完整安全闭环。 该体系通过授权前二次确认、令牌身份与权限隔离、以及 API 级别精细化管控等关键举措,在确保 MCP 生态灵活开放的同时,最大限度地保障用户资产与数据安全,构建值得信赖的开发者生态。
8/28/2025 8:41:23 AM

揭秘Mem0的卓越架构:打造真正拥有记忆的AI系统

在人工智能应用迅猛发展的当下,聊天机器人已成为企业服务用户、个人提升效率的重要工具。 然而,许多开发者都遭遇过这样的尴尬场景:花费数周精心打造的聊天机器人在演示时表现出色,能流利回答问题、提供帮助,看似智能十足。 但当用户次日再次访问时,机器人却仿佛患上了“失忆症”,只会机械地问“今天我能为您提供什么帮助?
8/28/2025 7:52:17 AM
大模型之路

预测型AI vs. 生成型AI:哪种更适合你的企业?

根据Resume Builder最近的一项调查,66%的美国管理者在裁员决策时曾咨询过ChatGPT或其他大型语言模型。 大多数管理者也会使用AI来决定加薪(78%)和晋升(77%),这些数据反映出GenAI正在渗透到业务流程中,这些流程本不应依赖它。 基础模型并非为处理高风险、领域特定的情况而设计,正是这些场景最为敏感。
8/28/2025 7:44:00 AM
Gershon

正确采用AI,防止影子AI迅速蔓延的实战经验

企业采用AI已不再是理论,而是正在发生的现实——无论企业是否做好准备。 员工正在使用公开可用的AI工具完成实际工作:总结文档、撰写邮件、生成报告、翻译资料、编写代码、解答问题。 他们并非因为被强制去做,而是因为这些工具能快速、有效地解决实际问题。
8/28/2025 7:26:00 AM
Tyler

企业成功部署智能体的关键要素

毫无疑问,智能体——那些能够在企业工作流中自主、异步运作的系统——目前正是企业界的热门话题。 然而,越来越多的人担心,这些讨论大多停留在口头上,充满炒作,却缺乏实质性支撑。 例如,Gartner指出,企业正处于“期望膨胀的顶峰”,这是在失望感出现之前的一段时期,因为供应商尚未用真实的、可落地的案例支撑其承诺。
8/28/2025 7:09:00 AM
Taryn

从3000万到1777.9 Token:LogicRAG用动态逻辑图实现“零预建图的高效推理

大家好,我是肆〇柒。 今天要和大家分享的是一项来自香港理工大学的研究——LogicRAG。 这项工作挑战了当前主流的GraphRAG范式,提出了一种无需预建图、按需生成动态逻辑结构的新型RAG框架。
8/28/2025 1:00:00 AM
肆零柒

「精而巧」的端侧大模型为何火了?

大模型爆火伊始,很多厂商提的最多的就是自家的模型(云端大模型)参数有多大,性能有多好。 但近两年,相较云端大模型外,端侧大模型的热度被炒的越来越高。 很重要的原因在于,越来越多的厂商开始布局端侧大模型赛道。
8/27/2025 4:05:39 PM

Meta两员大将回流OpenAI,30天爆赚800万?刚入职闪回巢,小扎钞能力失效

成立仅两个月,小扎「梦之队」MSL已痛失三位核心大脑。 最新爆料称, 两位前OpenAI员工Avi Verma和Ethan Knight,加入Meta一个月再次回流到OpenAI。 1亿美金诱人薪酬包,也没能留住顶尖人才,难道小扎的「钞能力」真的失效了吗?
8/27/2025 3:39:11 PM

马斯克狂烧14万亿,5000万H100算力五年上线!终极爆冲数十亿

世界首富马斯克,这次宣布决定All in AI了。 5年内实现5000万张H100的算力。 要知道,他已经有了全世界最强的Colossus超算集群,AI算力等价于约20万张H100。
8/27/2025 3:16:34 PM

Claude抢跑OpenAI!上线插件杀入浏览器赛道!更放话:大势所趋!竞品昨日刚翻车,泄露用户密码!网友:AI别打钱给缅甸!

出品 | 51CTO技术栈(微信号:blog51cto)赢了 OpenAI 一步,没想到是 Claude 率先杀入 AI 浏览器赛道! Anthropic 已经启动“Claude for Chrome”内测,让AI 直接在网页里替你“点点点”,帮你订外卖、筛房源、甚至处理企业表单。 图片加入waitlist:,就被Claude端上了桌,这无疑是一场抢占先机的豪赌。
8/27/2025 2:02:32 PM
伊风

ICML 2025 | AI虚拟细胞落地重大进展:清华AIR,水木分子等首创并开源多尺度空间转录组学基础大模型SToFM

作者 | 论文团队编辑 | ScienceAIAI 大模型竞赛风起云涌,垂直领域竞争激烈。 AI 基础大模型的能力正进一步向各科学研究领域渗透,而生物及生命科学就是 AI 大模型的下一个战场。 2025 年可以视为 AI 虚拟细胞元年。
8/27/2025 2:01:00 PM
ScienceAI

谷歌「最强图像模型」横扫一切!3毛钱P图打懵OpenAI,PS要不存在了

刚刚,谷歌正式发布最先进的图像模型,Gemini 2.5 Flash Image。 如果说它的另一个名字,nano-banana,你就一定知道了! 「最强图像模型」这个称号可以说是被全球网友亲自认定。
8/27/2025 1:38:13 PM

谷歌Nature震撼发文,Gemini教练暴打专家!医学双料冠军,秒出睡眠报告

AI医学的圣杯,可能先被谷歌DeepMind夺下。 最近,谷歌全新健康大语言模型(PH-LLM)正式发布——一款微调Gemini的「个人睡眠和健康」模型。 图片论文地址:,瞬间转化为可视化的内容。
8/27/2025 1:35:16 PM
新智元

谷歌nano banana正式上线:单图成本不到3毛钱,比OpenAI便宜95%

昨晚,神秘且强大的图像生成与编辑模型 nano banana 终于正式显露真身。 没有意外,它果然来自谷歌,并且也获得了一个正式但无趣的名字:gemini-2.5-flash-image-preview。 据介绍,该模型具有「SOTA 的图像生成与编辑能力、惊人的角色一致性以及闪电般的速度」。
8/27/2025 9:25:00 AM

一篇讲透AI客服:百万级实战心法

大家好,我是坤哥,好久不见! 今年我们的 AI 客服业务迎来了猛增,实现了十倍增长和百万营收。 我们团队也做了很多 AI 客服的项目,积累了不少实战经验,包括如何获客等这些经验我相信无论是对 AI 客服还是其他智能体的从业者我相信都有一些帮助在此把这些经验整理成文,希望能对大家有帮助。
8/27/2025 9:16:00 AM
坤哥