AI在线 AI在线

有目的地设计人工智能:意图矩阵

在竞相添加“智能”功能的过程中,许多产品陷入了一个陷阱:推出人工智能是因为他们可以,而不是因为他们应该。 当团队争相实现自动化时,他们常常不会停下来思考:人工智能在这里扮演什么角色? 它应该接管一切,还是协助用户?

有目的地设计人工智能:意图矩阵

在竞相添加“智能”功能的过程中,许多产品陷入了一个陷阱:推出人工智能是因为他们可以,而不是因为他们应该。当团队争相实现自动化时,他们常常不会停下来思考:人工智能在这里扮演什么角色?它应该接管一切,还是协助用户?它应该追求完美,还是仅仅快速且有用?

为了指导更好的决策,我提出了AI 意图矩阵——一个帮助团队更高效地利用资源的框架,尤其是在最大限度地减少代币成本和计算浪费方面。每次调用大型语言模型都会产生成本,既有文字成本,也有技术成本。不必要地默认使用高精度、全自动模式的功能可能会在用户不需要或不信任的输出上消耗代币。

该矩阵基于两个轴:增强 ↔ 自动化,以及满意↕ 优化。通过明确某个功能是需要优化质量还是仅仅满足于现状,以及它应该自主运行还是在监督下运行,产品团队可以更负责任地界定 AI 功能。这可以减少过度设计,降低服务成本,最重要的是,确保 AI 真正有用,而不仅仅是令人印象深刻。

轴 1:增强与自动化

增强是指利用人工智能辅助并提升人类能力——人类仍处于控制之中,指导或批准人工智能的输出。自动化是指利用人工智能在极少人工干预的情况下自主替代或执行任务。此轴定义了人类参与该功能的程度。

有目的地设计人工智能:意图矩阵

AI 增强(人机交互):在这里,AI 充当智能助手或辅助功能。系统可以提供建议、见解或草稿输出,但最终做出决策或最终编辑的是人类用户。当任务复杂、依赖于上下文或需要人类判断时,增强功能很常见。在涉及细微差别或道德考虑,或者 AI 尚未 100% 可靠且需要监督的情况下,增强功能非常有用。让人类参与进来可以增强信任和问责制。例如,社交媒体平台可能使用 AI 标记有害内容,但最终决定权在人类手中。当“决策会带来重大的道德或法律后果”或“技术尚未成熟到无法在没有人工输入的情况下可靠运行”时,这种方法非常宝贵。缺点是,需要人工参与会限制速度和可扩展性——如果 AI 处理大量内容的速度比人类审核的速度快,则可能会造成瓶颈。

人工智能自动化(完全自主):在这种模式下,人工智能系统可以自行完成任务或做出决策,无需人工持续输入。自动化非常适合定义明确、处理量大或实时任务,在这些任务中,人工的速度或可用性是制约因素。当人工智能能够自行达到可靠的准确度,并且任务的规模或频率足以让人类操作员不堪重负时,自动化的效果最佳。典型的例子包括自动分类电子邮件的垃圾邮件过滤器,或每月无需人工干预即可处理工资单的算法。在“人工参与”的设置中,人们可能会监控自动化系统,并且仅在出现异常情况时进行干预——例如,信用卡欺诈检测系统会自动阻止可疑交易,但会对边缘情况发出警报。完全自主可以显著提高效率和可扩展性,但这需要用户确信人工智能在极少的监督下也能正常运行。此外,自动化也存在自满情绪的风险:如果用户过于依赖人工智能运行,他们可能无法及时发现故障。因此,团队必须仔细决定一项任务是否安全 且 适合自动化,或者是否让人类参与其中可以增加必要的安全性和意义。

值得注意的是,增强与自动化并非总是严格的二元对立。许多成功的解决方案将两者融合,将某些子任务自动化,同时将最终决策或控制权留给人类。“自动化不能简化为‘手动’和‘自动’之间的简单二元对立。相反,它需要在我们认为自动化有用的任务和我们参与仍然有意义的任务之间找到适当的平衡。”在产品设计中,这意味着要问:用户是否希望在这里受到监督?他们喜欢自己做这部分工作,还是更愿意让人工智能来处理?

理解这一核心原则有助于团队正确定位其 AI 功能。如果用户重视流程中的控制力或技巧(例如,许多人喜欢编辑照片或撰写文字),那么纯自动化的解决方案可能会适得其反,因为它会消除人为因素。在这种情况下,提供 AI 增强功能(用户可以接受或调整的建议)可以保留用户的自主权和乐趣。相反,如果一项任务繁琐耗时(例如,在数千个日志文件中查找异常),自动化可以大幅提升效率,让用户腾出时间进行更高级的工作。

总结:增强技术以人为中心,AI 只是工具;而自动化则以AI为中心,人类参与监督或置身事外。两者本质上并无优劣之分——选择取决于使用情境、利害关系和用户偏好。接下来,我们将探讨与之相交的第二个维度:AI 输出的质量和目标。

轴 2:优化与满足

并非所有 AI 功能都需要产生完美的结果。有时“足够好”确实够用了。我们矩阵的第二个维度涉及AI 输出的质量标准和目标。

优化(最高质量的输出):在这方面,该功能旨在实现尽可能最准确、最高质量或最佳的结果。容不得任何差错或平庸。优化AI 功能通常用于高风险场景或质量至关重要的场景:例如,诊断疾病的 AI 系统,遗漏的细节可能危及生命;或者生成法律合同语言的 AI,精度至关重要。在这些情况下,产品团队实际上是在说:“这需要达到(甚至超过)人类专家的水平。”优化通常需要付出巨大的努力——更复杂的模型、更多的训练数据、更严格的评估——以尽可能降低错误率。

令人满意的(足够好的输出):在这方面,该功能对“足够”或满足基本阈值的输出感到满意,特别是如果实现更多目标会花费不成比例的更多时间或资源。令人满意的( “满足”和“足够”的组合)一词由诺贝尔奖获得者赫伯特·西蒙创造,用来描述旨在获得令人满意的解决方案而不是最佳解决方案的决策。从设计角度来看,令人满意的 AI 功能可以提供满足用户需求的结果,即使它并不完美。这通常适用于速度、效率或成本比完美更重要的用例。例如,对于内容作者来说,能够在几秒钟内快速起草博客大纲的 AI 可能比花费数小时制作“完美”文章的 AI 更有价值 - 因为草稿只需要作为人类作者继续创作的起点。满足感侧重于实用主义:“追求令人满意或足够的结果,而不是最佳解决方案”,尤其是在寻找完美解决方案“需要耗费不必要的时间、精力和资源”的情况下。在很多情况下,收益递减效应会发挥作用——稍好一点的结果可能无法证明实施起来过于复杂。用户本身通常更喜欢现在就得到快速的答案,而不是以后再得到完美的答案。

总结一下这条轴线:优化功能力求达到一流的输出,可能在高风险或竞争激烈的质量用例中需要用到;而令人满意的功能则满足于“足够好”,这通常能够实现速度、规模和用户便利性。这两种方法都能创造价值——关键在于将方法与用户的实际需求相匹配。定义了这两个轴线后,我们现在可以将它们组合成一个矩阵,并检查由此产生的四个象限。

有目的地设计人工智能:意图矩阵

当我们绘制“增强 ↔ 自动化”与“满意↕ 优化”之间的对比图时,我们得到一个包含四个象限的矩阵:1)高风险辅助,2)日常AI助手,3)自主且高精度,4)自主且低风险。每个象限代表了AI赋能功能的一种独特策略。

象限 1:增强 + 优化(高风险辅助)

在这个象限中,人工智能正在增强用户,质量标准也设定得极高。这些功能是人工智能作为辅助的功能,适用于高风险或专家级任务。其逻辑是,人工智能可以通过提供洞察力、准确性或速度来提升人类的表现,但仍然需要人类来掌控,因为决策至关重要。这种结合允许人类拥有“第二双眼睛”来处理海量数据,而人类的判断则负责处理细微差别和最终决定。

有目的地设计人工智能:意图矩阵

产品示例(医疗保健):想象一下放射学软件平台中的一项功能:当放射科医生检查 X 光片或 MRI 时,AI 算法会并行运行,突出显示看起来可疑的区域(可能是肿瘤的阴影或细微的骨折线)。医生会查看这些突出显示的内容,然后确认或排除它们。AI 必须高度准确地标记出它们——太多的误报会浪费医生的时间或削弱医生的信任;而漏报(遗漏的问题)则更糟糕。因此,系统会进行调整以优化灵敏度和特异性。这种增强的工作流程并不能取代医生(事实上,医生不会接受仅由 AI 进行的自动诊断),但它可以优化结果:患者受益于医生 + AI 的综合智能。AI 有效地扩展了医生的能力——它可能可以从数百万张图像中检测出模式(这是人类终其一生都无法做到的)——而医生则提供情境判断和问责。

设计考量:此象限中的功能需要建立用户对AI辅助的信任。透明度至关重要——例如,展示AI提出建议的原因(可解释的AI)——以便人类能够验证其推理。由于人类是最终裁决者,因此用户界面应该方便人类查看和调整AI输出。另一个实用技巧:团队通常会逐步引入此类功能。例如,AI可以先以“静默”模式运行以证明其准确性(显示未经批准实际上不会执行的建议),以便用户在完全依赖它之前了解其价值。这可以降低AI过度干预的风险。如果成功,增强+优化功能可以实现两全其美:人类的专业知识与机器的精确度相得益彰。

象限 2:增强 + 满意(日常 AI 助手)

第二象限可以说是当今许多用于提高生产力和创造力的“酷炫”AI功能所在。在这里,AI再次成为人类的助手(功能增强),但我们并不介意AI的输出只是一份草稿或初步建议。其目标是提高效率、激发创造力或处理繁琐的工作——而不是一次性做到完美。人类用户需要对AI提供的内容进行审核、调整或迭代。

有目的地设计人工智能:意图矩阵

产品示例(生产力 - 写作):一个现实世界的例子是 Gmail 的智能撰写功能,它会在您键入电子邮件时建议下一个单词或短语。这是一种增强功能(您正在写作;它只是提供帮助)并且绝对令人满意 - 这些建议通常很平凡,但这没关系,因为它们可以快速处理样板。如果建议不是您想要的,您可以忽略它并继续输入。当它起作用时,它可能会为您节省一些击键次数(例如,在输入“让我知道...”后完成“如果您有任何疑问,请告诉我”。它快速且便宜。没有人期望智能撰写能够创作小说或关键任务备忘录;它的价值在于缓解写作过程中的小摩擦。这种低风险的增强功能受到了用户的热烈欢迎,因为它不会强加或打扰 - 它只是为了提供帮助,加快平凡的子任务。

设计考虑:对于增强 + 满意功能,关键在于实现人机交互的无缝衔接和低摩擦。用户应该感到掌控一切,并能够轻松地控制 AI。由于 AI 并非总是正确,因此界面应该易于编辑或重试。例如,在写作助手中,如果第一次输出没有用,您可能会提供其他建议或提示 AI 从不同角度思考的方法。设定正确的用户期望也很重要:传达 AI 的辅助和起草功能,而不是提供最终的完美答案。当用户理解这种心态时,他们会更加宽容错误,并能有效地利用该工具(就像将其视为头脑风暴一样)。从开发的角度来看,此象限中的功能通常可以逐步交付 - 您可以发布一个运行良好率可能有 70% 的测试版,这是可以接受的,因为用户会直接忽略无用的 30%。这是一个很好的实验空间,因为人工智能错误的代价通常只是小小的不便,而不是灾难性的失败。

象限 3:自动化 + 优化(自主精度)

这个象限指的是全自动系统,它们几乎不需要人工输入即可运行,并且性能标准非常高。这类人工智能功能(甚至整个产品)基本上可以让你说:“人工智能,你来掌控一切——只要确保操作正确就行。” 它们往往出现在需要快速或大规模地做出决策或采取行动,且超出人类能力范围,并且一旦出错将造成严重后果的情形下。换句话说,除非你非常有信心人工智能能够持续达到或超越人类水平的结果,否则你不会将其自动化。

有目的地设计人工智能:意图矩阵

产品示例(企业 SaaS - AIOps):设想一个提供自动事件检测和响应的云服务平台。该功能使用人工智能监控服务器上数百万个日志事件和指标。如果检测到严重异常(例如,指示服务器可能崩溃或存在安全漏洞企图的峰值),它会自动采取行动(例如,隔离部分网络或重启服务)以防止问题发生。这就是自动化:它不会立即请求操作员的许可,因为延迟可能会造成灾难性的后果(如果服务中断或正在遭受攻击,每一秒都至关重要)。但是,由于这些操作会影响正常运行时间、数据完整性和安全性,因此决策必须高度准确。人工智能需要进行优化,以便真正检测到真正的问题,同时最大限度地减少误报。如果它过于敏感并不断“狼来了”,可能会不必要地扰乱运营;如果它过于松懈,可能会错过事件。实现这种平衡是一个优化问题。在实践中,开发此类功能的团队可能会实施广泛的测试,甚至冗余(例如,一个AI模型标记问题,另一个验证步骤在采取行动之前确认问题,以减少错误)。他们也可能允许一定程度的可配置性——例如,让客户端设置AI触发操作必须达到的阈值(本质上是在他们自己的语境中定义“足以采取行动”的含义)。

设计考量: 自动化+优化功能本质上是最敏感且风险最高的。它们需要在部署前后进行严格的验证。实施监控和回退机制是明智之举:如果AI遇到越界场景或其置信度较低,它应该采取故障安全措施(例如,移交给人工或更简单的安全模式)。从产品管理的角度来看,你应该思考一个想法是否真的需要从第一天起就完全自动化并实现高精度。有时,从增强+优化象限开始,然后再过渡到完全自动化会更安全。例如,AI可以先向操作员推荐操作(增强),一旦证明其始终正确,再过渡到自动执行这些操作。这种分阶段的方法可以建立信任并及早发现问题。此外,还要考虑责任和用户信任:如果你的自主AI犯了错误,谁来承担后果?你将如何沟通?许多公司将此象限中的功能限制在内部流程或极其严格控制的环境中,正是为了避免公开错误。然而,如果操作得当,自动化+优化系统可以带来超人的效率和质量——就像一位时刻警惕的守护者,在任何人察觉问题之前就处理好一切。对于某些运营任务来说,这是不可多得的宝藏,但必须谨慎负责地执行。

象限 4:自动化 + 满意(自主效用)

最后一个象限涵盖了AI自主运行的功能,只要结果足够好就足够了。这些功能通常是互联网时代激增的大规模个性化和规模导向型功能——在这种情况下,为数百万用户提供大致正确的结果远胜于为少数用户提供完美结果。在这种情况下,错误或次优结果的成本在单例情况下较低。通常,用户甚至可能察觉不到AI是否准确,或者他们可以轻松地忽略或纠正它。其优势在于,这些功能可以达到大规模,或处理人类团队无法处理的海量数据,从而提供原本无法实现的价值。在每种情况下,AI都可以自行做出大量微决策,虽然它的目标是发挥作用,但不必每次都做到完美。

有目的地设计人工智能:意图矩阵

电商产品推荐

产品示例(电子商务 - 推荐):这个象限最著名的例子或许是电子商务推荐引擎(“购买 X 的顾客也购买了 Y”和个性化产品建议)。这些系统会为每次用户访问自动生成推荐。这些商品并非人工挑选——全是由人工智能通过分析购买数据生成的算法。这些推荐总是用户想要的理想商品吗?当然不是。但即使其中一些建议是相关的,它们也能提升购物体验和销量。这种方法的成功显而易见:亚马逊的推荐引擎贡献了其约35% 的收入。这项自主功能能够根据用户的兴趣匹配产品,其价值高达数十亿美元。购物者可能会忽略一些不相关的推荐,但由于系统会根据数据进行改进,并且经常会显示有吸引力的商品,因此它的价值是完全合理的。错误(不相关的推荐)的成本很小,可能只浪费用户一点时间,而个性化的规模却带来了巨大的商业价值。

设计考量:对于自动化+满意度功能,覆盖率和恢复是关键的设计方面。由于人工智能并非完美无缺,您需要思考:系统将如何处理它无法有效解决的情况?在推荐系统中,“失败”仅仅是用户忽略了不好的推荐——这通常没什么问题,但您仍可能需要监控点击率等指标,以确保整体质量保持在一定阈值以上。本质上,您需要用可衡量的指标来定义“足够好”的含义(例如,X% 的用户点击了推荐,或者聊天机器人解决了 Y% 的咨询),并确保该功能符合该标准并随着时间的推移不断改进。恰当地传达目的也很重要。用户通常甚至没有意识到人工智能功能何时“令人满意”——他们只看到输出。但如果存在混淆或期望过高的可能性,那么提示一下该功能的作用会有所帮助。例如,人工智能生成的标题可能带有编辑选项和注释“自动生成的标题”——表示它可能并不完美,并邀请用户根据需要进行调整。

从开发角度来看,这个象限很有吸引力,因为它可以带来高投资回报率:完全自动化意味着可以轻松扩展,“足够好”意味着你可以快速迭代,而无需在发布时追求完美。许多人工智能功能的最小可行产品 (MVP) 都从这里开始——以自动化的方式做一些有用的事情,证明其价值,然后再进行改进。然而,必须确保“低风险”是真正的低风险。如果一个自主功能偶尔会做出一些真正让用户不满或造成损害的事情,那么它实际上就不是低风险的,而更应该属于需要优化并采取保障措施的领域。矩阵有助于标记这些区别。

专注于重要的事情

在这个充斥着人工智能炒作的时代,最难的问题并非“我们可以自动化什么?”,而是“什么值得自动化?”。人工智能意图矩阵提供了一个实用的视角:你是将人工智能应用于提升体验的地方,还是仅仅增加了复杂性?通过精心构思,将概念置于这张图上,我们确保思考的是正确问题:我们是否让用户在他们想要的地方掌控一切?我们是否正在将技术推向其可靠的极限?这种人工智能真的能提升用户体验吗?还是我们只是在增加复杂性却收效甚微?

使用此矩阵作为指南,避免 人工智能过度使用——在某些情况下,热情可能会促使我们将用户更希望合作的事情完全自动化,或者在快速获得结果时要求完美。它还可以突出显示何时不应使用人工智能。如果某个功能创意在这些维度上无法明显受益于某种智能,那么或许更简单的解决方案才是最佳选择。正如 Google PAIR 指南所建议的那样,引入人工智能的合理性应该以用户体验的显著提升为前提,否则甚至会降低体验。

相反,利用矩阵来发现黄金——那些能够取悦用户并创造价值的人工智能机会。这些机会可能是增强功能,让用户感觉自己像拥有人工智能助手的超人,也可能是自动化技术,可以在隐形的情况下大规模处理繁琐的任务。确保你的目标与团队的能力和技术所能支持的范围相匹配。从有限的、“足够好”的人工智能功能开始,满足用户的实际需求,然后在学习的过程中不断扩展,这完全没问题(而且通常也是明智之举)。合理的范围成功胜过范围过大的失败。

在人工智能时代,人们很容易相信我们应该打造“万物皆人工智能”。但智慧在于明辨是非。有些事情应该留给人类,有些事情可以交给机器。最好的人工智能功能要么赋予用户权力,要么退居幕后处理繁琐的事务,而了解你的目标是什么,就等于成功了一半。通过沿着人工智能意图矩阵的两个轴线进行思考,产品团队可以更好地驾驭人工智能带来的无限设计选择。

相关资讯

哥德尔90年前的「不完备性定理」,奠定了计算机与AI的理论基础

大神早已远去,而他的光芒仍在人间。
6/18/2021 2:19:00 PM
机器之心

AI红队:构建安全AI只是梦想

负责微软100多个GenAI产品红队测试的团队得出结论,构建安全可靠的AI系统的工作永远不会完成。 本周发表的一篇论文中,包括微软Azure首席技术官Mark Russinovich在内的作者们描述了团队的一些工作,并提出了八项建议,旨在“使红队测试工作与现实世界的风险相一致”。 论文的主要作者、微软AI红队(AIRT)研究员Blake Bullwinkel和他的25位合著者在论文中写道:“随着GenAI系统在越来越多领域的应用,AI红队测试已成为评估这些技术安全性和可靠性的核心实践。
1/20/2025 11:24:56 AM
Paul Barker

知乎直答:AI 搜索产品从 0 到 1 实践探索

一、知乎直答产品介绍知乎直答是具有强社区属性的通用 AI 搜索产品,但并非社区版 AI 搜索。 知乎直答具有以下几大优势:认真专业:与知乎专注专业内容生产的调性相符,严格把控参考来源与质量,确保回答认真且专业。 连接创作者:可在使用中关注、与创作者交流互动获取专业见解。
1/20/2025 10:40:08 AM
王界武
  • 1