我记得第一次听说ChatGPT的时候;我错误地以为这只是又一股潮流,会随着时间的流逝而消逝。也许我太天真了。计算机怎么可能取代真正的创造力呢?
几个月后,我第一次真正接触到生成式人工智能。当时,我和一位亲近的家庭成员聊天,他问我是否尝试过这项技术,并学习如何将其融入到我的工作中——那是在 2023 年。当时现在基本上仍然如此,我对 ChatGPT 试图取代我作为一名作家几十年来磨练技艺的努力感到非常不满。
这位家庭成员从事科技工作,他花了很多时间学习如何将人工智能融入到他的工作中,因为他的行业和环境需要他这样做。他似乎对我忽视人工智能对我的工作可能产生的影响感到受伤。
“你不明白,”他激动地说道,也许这只是我的想象,但我记得他说话时语气中带着一丝绝望,“ Buzzfeed 已经裁掉了一部分员工,用人工智能取而代之。情况很严重。”
他所表达的观点是显而易见的。
如果我不小心,那么无论我写作水平有多高,无论我花了多少年时间磨练我的技艺,无论我写了多少篇文章并重写,无论我参与了多少个项目,这些都不重要,因为归根结底,ChatGPT 比雇用我更便宜,而且可以完成我的工作(这是有争议的,我们稍后会讨论这个问题)。
当时,我勉强同意尝试用人工智能来检验大型语言模型(LLM)能做什么。它们真的有可能取代作家和创意人员吗?这个问题很重要,因为我们如何定义艺术家和创意人员,以及如何定义我们的工作都至关重要:我将在本文后面再次讨论这一点。
不用说,当时我对此并不感冒,坦白说,我的感觉至今仍未改变。如果说有什么不同的话,那就是在花了更多时间研究 ChatGPT 的成果之后,我比以往任何时候都更加确信,人工智能现在不会,也永远不会取代真正的人类,无法充分发挥他们的创造力并进行创作。
为什么我现在要分享我的观点,尤其是当这个话题已经被讨论透彻了的时候?
两年来,我一直在琢磨这个话题,不断形成和完善我的观点。自从第一次谈论 ChatGPT 以来——出于对家人的爱,当然,也出于对自己未来的担忧——我决定加入其中,看看人工智能能带来什么。
我让AI根据提示生成文章。我让它生成图片。我给了它我的工作描述和简历,并让它生成求职信。(它编造了我的简历中找不到的计算机科学经验,因为工作描述需要。)我还让它帮我构思论文和文章的标题。我还让它以潜在读者或客户的身份来评论我的文章。
每当我提出一些想法并征求它的意见时,它总是非常乐于助人。它会让我思考某个想法是否足够犀利,价值主张是否清晰,以及我是否彻底回答了我想要提出的问题。此外,当它提供标题创意时,它的目标成功率更高。然而,我必须与软件进行长时间的对话,不断地输入信息,将不同的词语匹配在一起,将一个想法与另一个想法结合起来,并且通常以它的建议作为切入点。
我还开始了一段旅程,与来自不同背景的人们——技术人员、艺术家、退休软件专业人员、学生等等——讨论使用人工智能的利弊。
这种分歧从一开始就很明显。技术人员普遍非常支持人工智能,因为它是下一个大趋势,正在改变整个行业;而艺术家(通常更确切地说是作家)则需要克服这种分歧,学习如何在自己的作品中使用人工智能。
艺术家和作家,也就是创意人士——无论专业与否——显然都反对人工智能。我们所有人都觉得,哪怕只是想想人工智能能够取代人类的创造力,都是荒谬的。对于我们所有以更具创造力的视角看待世界的人来说,对于我们所有认识到创造力并非二元技能的人来说,计算机无法模仿创意天赋的本质,这几乎是不言而喻的。
从这些对话中,我了解到一个显而易见的事实:如果你没有足够的资本来支持你的观点,那么你的观点根本就无关紧要。风险投资家和投资者关心的是人工智能,如果这意味着你丢掉工作,那你根本就“不够好”。
我承认,自从人工智能开始取代程序员以来,一些技术人员对此的看法似乎发生了变化,讨论的基调和基调也开始转变。然而,值得注意的是,只有当某事与自己相关时,人们才会关心它,这种人性因素仍然存在。
值得注意的是,随着人工智能生成内容的涌入,谷歌等公司开始重新设计算法,优先考虑真人生成的内容。但这些公司随后也推出了自己的人工智能工具,对这些内容进行筛选,为用户提供经过整理、易于理解的信息——想想每次谷歌搜索结果顶部的人工智能广告词就知道了。
最近,谷歌还推出了更先进的人工智能搜索,并邀请一些用户参与测试。测试中,谷歌会针对用户的初始搜索设置引导性后续问题,潜移默化地引导他们如何处理问题。这不仅危险,因为它会不断潜移默化地影响我们对某个话题重要性的判断,还会强化一些无形的决定因素,例如谁是真正的权威。
在领英上,我每天都能看到一些帖子,说真正的作家被指责使用人工智能撰写文章,因为这些文章看起来像是“人工智能生成的”。就我提到的这个问题而言,楼主使用了破折号,由于破折号并不常用,所以招聘委员会认定这位作家一定是用人工智能撰写了文章。
如果这一切还不够的话,ChatGPT 最近创作吉卜力工作室肖像画的“创新”也引发了大量关于人工智能及其“创造力”的讨论,尤其是在宫崎骏明确表达了他对人工智能的看法之后。社交媒体上许多创作者都积极分享他们对此的看法和观点,当然,绝大多数人都过度使用了这项功能,以至于OpenAI 的 GPU 都“崩溃”了,Sam Altman 在 X 上呼吁大家停止使用它,因为“我们的团队需要休息”。
我第一次接触这些肖像时觉得很有趣,因为我甚至没有意识到自己正在见证这一趋势的开始。
一位家人分享了一张我们用吉卜力工作室工具“重制”的照片,并把它分享到了群聊里。我记得当时觉得它很可爱,也评论了很多。另一位家人也兴奋地加入进来,分享了很多她也用这个工具录入的可爱照片。
但在当时,它们除了是熟悉照片的动画版本之外,并没有什么特别之处。
值得注意的是,虽然我并非吉卜力电影的鉴赏家,但我看过的作品足以让我在一定程度上辨认出其艺术风格。然而,我所获得的灵感,却只是模糊地取材于流行的动画艺术流派。随着动画艺术的日益流行,从动画中寻找灵感也就不足为奇了。
直到一天之后,当世界震惊之时,我才意识到这其实是照片的“吉卜林化”。
带着这样的背景,我回头看了看同样的照片,说实话?它们看起来空洞无物。它们完全没有吉卜力艺术风格的精髓。我不仅没有发现宫崎骏的艺术风格和 ChatGPT 的作品之间有任何本质联系,而且我完全无法理解这怎么会被认为是吉卜力艺术的翻版。
宫崎骏的艺术充满生命力,蕴含着他对所做之事的热爱和激情。每一笔挥动,每一次肌肉痉挛,每一次他完成一幅画作时平静的微笑——都蕴含在他作品的定格画面中。他作品背后的创造力,交织在我们在屏幕上看到的每一幅画作之中。
ChatGPT 输出的只是 0 和 1。
对于那些可能将ChatGPT的行为称为致敬的人,我不认同这种想法,因为致敬是“公开表达的特殊荣誉或敬意”,而要做到这一点,就需要反过来考虑艺术家的哲学、作品和理想。宫崎骏对人工智能的看法自2016年以来就已被记录在案,这不仅被完全忽视,而且宫崎骏甚至称人工智能生成的动画是“对生命本身的侮辱”。
从我后来在网上看到的内容来看,宫崎骏本人对自己艺术的看法与世界上大多数人肯定无关。事实上,有些人甚至开始评论“日本创作者现在肯定很沮丧”,并分享(大概是)他们自己用 ChatGPT 生成的照片。
我在 Instagram 上看到一条评论,有人分享了这个工具,让他们有机会用 ChatGPT 创作吉卜力风格的卡通画,记录他们生活中的某个特殊时刻。不过,这一点我不敢苟同。
AI 没有创造任何东西。使用 AI 制作这些照片的人也没有创造任何东西。AI 不是“创造者”。而且,无论软件和代码给用户带来怎样的创造和创造力的幻觉,用户都无法用它创造任何东西——就这个词的真正含义而言。
现在,我听到了你的声音:“好吧,普里扬卡,这是你的观点,但你也没有说什么新东西。”我听到了,如果你再忍耐一会儿,我可能会成功地以一种你以前从未听过的方式提出你已经听过的论点。
(或者,也许我不会。但如果至少先读一下我的文章,ChatGPT 将无法生成到达那里的旅程:))
让我们暂时回顾一下书面文字。
像 ChatGPT 这样的人工智能项目需要大型语言模型学位。这意味着什么?
语言学习模型(LLM)是一种人工智能程序,可以“识别和生成文本等”。该程序能够读取海量数据——几乎涵盖整个互联网,数百万GB的信息——并且基于机器学习构建。具体来说,LLM使用“深度学习”——一种机器学习技术,来学习单词、句子、语法以及其他元素如何协同运作。之后,它们可以与你对话、撰写求职信、生成图像。
现在,我们来思考一下什么是“深度学习”。深度学习是机器学习的一个子集,旨在识别复杂模式并像人类一样建立联系。普通的计算机程序需要精确的输入才能提供相关的输出,而深度学习理论上甚至可以处理不精确的数据,并仍然与用户分享相关的输出。
但是我们今天是如何讨论机器学习和深度学习的呢?
人工智能的故事可以追溯到一位非常著名的数学家和计算机科学家——艾伦·图灵。20世纪50年代,图灵在其论文《计算机器与智能》中首次提出了“机器能思考吗?”的问题。他根据维多利亚时代的室内游戏改编了图灵测试(或模仿游戏),以判断机器是否具有思考能力。
在室内游戏中,两名参与者(一男一女)与询问者隔离,询问者必须根据参与者对问题的回答来确定哪个参与者是男人,哪个参与者是女人。
图灵对此进行了修改,用计算机程序代替了一名参与者,看看审讯者能否识别出哪个是计算机,哪个是人类。他的论点是,如果审讯者无法区分机器和人类,那么机器就可以被认为具有“思考”能力,或者说拥有人工智能。
多年来,这个问题的定义和探索也发生了变化,从一种非此即彼的二元论,演变为一种思维谱系。这意味着,后来的研究人员和科学家对机器“思考”与否的观点提出了质疑。他们更倾向于认为,计算机当然可以进行一些“思考”,但这种思考能力能否得到改进?能否得到进一步的推动和发展?
最终,这一进程不断发展,机器学习和深度学习领域成为计算机科学和编程的一部分,每个领域都在推动计算机的能力,并测试它们能够模仿和产生多少人类的思维范围。
然而,值得注意的是,在每一个节点上,我们都在寻找人类如何定义计算机思维的迹象。“计算机”一词的字面含义是:它“计算”。它生成。而且它能以惊人的速度进行计算。
然而,即使我们选择采用非二元方法来提问,计算机本身在其构造上仍然是二元的。而创造——这远远超出了我们所能理解的范围,对于一台天生就具有二元性的机器来说,根本无法实现。
创造是什么意思?
字典中“创造”的定义是“使(某物)存在”。
人工智能可以把已经创作出来的东西——人类已经创造的东西——重新包装,使其焕然一新。正因如此,许多公司为了省钱,开始替换作家、艺术家和创意人员。
从表面上看,人工智能确实给人一种创造的幻觉。然而,如果你深入挖掘——这是我们每个人都迫切需要做的——人工智能实际上所做的只是将不同版本的已创建片段拼凑在一起,呈现出一个“新”的输出。它回收利用已经存在的东西,从而营造出创造的幻觉。
现在,我得先承认,我也开始使用 ChatGPT 了。它帮我节省了大量时间,而且作为一个在家办公的作家,它还能让我从别人那里获得对我所写内容或想法的评价。
事实上,我现在要完全坦白的是,ChatGPT 建议用“讲故事者的蓝图”这个名字,而且我很喜欢这个混合的隐喻。(蓝图给我的感觉更科学,而我们通常不会把讲故事等同于科学。)所以我很感激它能成为一个很好的头脑风暴伙伴,甚至很感激它的想法。
为了写这篇文章,我做了另一个实验。我让 ChatGPT 想出一个词。
答复如下:
我内心热爱科技的那一部分会想:“哇,这太酷了!”它创造了一个新词。我想,从某种程度上来说,它确实创造了一个新词。但根据字典里“创造”的定义,我现在自相矛盾了。
但是,让我们深入探讨一下。为此,我们需要学习一些语言学和语言发展方面的知识。
如果你在词典里(在线词典或其他方式)查一个词的意思,你就会找到它的词源。一个词的词源是什么?
词源学是“研究词语的起源及其含义在历史过程中的变化方式的学科”。
这很重要,因为词语很少是“被创造”出来的。我有时会开玩笑地把说话比作用嘴发出声音,而我们一致认为这些声音指的是某个特定的概念或物体。诚然,这种说法过于简化了,尤其是在人类复杂的语言系统下。
语言可以被设计,可以被构建,可以拥有使用规则(语法),但无法完全被创造。语言是表达和交流的工具。就ChatGPT或任何生成式人工智能的巨大成功而言,它们做到了所有技术一直以来都在做的事情——学会了如何使用工具,并且比任何人类都更快地使用它。
我一位英语专业的好朋友曾经说过,没有两个词的意思完全相同。它们可能非常接近,但永远不会完全相同。这种特殊性和细微差别在当下至关重要,因为虽然我们大多数人会互换使用这些词,但它们的词源、来源和历史都会影响它们的效果。
为了写这篇文章,我甚至询问了 ChatGPT 它能够创造什么。
这里的词语运用很重要——ChatGPT 将“创造”和“生成”用作同义词。但创造和生成本质上是不同的。在“lumesce”的例子中,ChatGPT确实生成了一个新词,但实际上并没有创造一个词。
“创造”(create)一词源于拉丁语词根 creā̄t- 或 creā̄re。根据牛津大学出版社的解释,其拉丁语原文有以下含义:“生育,(指男性)孕育,(指女性)诞生,(指上帝、自然等)使之存在,生产,促成,导致,指定。”
将拉丁语词根与其他罗曼语进行比较,牛津英语词典与盎格鲁-诺曼语中的creer , crier有共同之处,即无中生有、生产、制造。
这个词也出现在古法语、加泰罗尼亚语、西班牙语和意大利语中。其含义为“神圣的存在或自然力量”。其及物动词形式为“使之存在,使之产生;尤其是在之前不存在的地方产生”。
相比之下,“生成”则是一个更具数学或计算性的术语,在英语中用作“创建”的同义词。在其原始语境中,它被定义为“通过对初始集合执行指定的数学或逻辑运算来生成(一组或一系列项目)。”
当我们注意到这两个词之间的细微差别时,ChatGPT 的功能就更容易理解了。ChatGPT 的功能是生成文本和图像。另一方面,它不负责创建它们。
ChatGPT 虽然承认自己无法像人类一样进行创作,但它声称自己能够生成文本,因此拥有“创作能力”。但这其实是一个漫不经心的回答,而且也算是一种敷衍了事的回答。(讽刺的是:这机器怎么能像人类一样呢?)
ChatGPT 指出它可以创造,然后进一步详细说明它所做的一切都与创造行为无关。创造、创造力和创造的根本在于从无到有。人类在进行创造性活动时,实际上是深入自身,将潜能转化为具体形态。
这种为了廉价的重复而拒绝创造力和需要大量练习和投入的独特技能的做法,实在令人担忧。更糟糕的是,人们竟然傲慢无知地将两者等同起来。
在艺术领域(甚至是像市场营销和平面设计这样的企业领域)取得成功,就像我们如今所取得的成功一样,或许是近来才出现的现象。但这些工作的出现,是为了回应人们对创造性表达人类体验的需求。如今,作为一个社会,我们的行为表明,我们宁愿让计算机告诉我们作为人的意义,也不愿付给某人一份足以维持生计的薪水,让他自己去实现这一点。
如果你现在还在听我解释,请允许我花点时间澄清一下:我并不认为自己是“反人工智能”人士,而且我真心看到了它的潜力。(尽管我已经听到了那些只看到我沮丧情绪的人的嘲笑。)我现在的问题不是,也从来不是人工智能的本质是什么。我的问题在于,人们宁愿追求自身的便利,也不愿实践可持续发展人类社会的模式。
我不认为人类创造的工具比使用这些工具的人对结果负有更大的责任。我以前对社交媒体也说过同样的话。一个物体本身通常是中性的。它的使用方式决定了人类对它做出的定性判断。我们需要扪心自问,我们如何使用人工智能,以及我们究竟是在利用它实现真正的进步,还是在以进步的名义自我放纵。
我经常听到关于人工智能为何如此普及的说法是“它节省了我们的时间和金钱”。因此,它更“划算”。但我们必须扪心自问:事实真是如此吗?
生成式人工智能对环境的影响已屡见不鲜,但当代经济体系似乎并未考虑修复这一环境影响所需的成本,更遑论未来。我们总是被动应对自身造成的问题,而不是在问题出现之前主动考虑所有相关因素。
在《麻省理工学院新闻》的这篇文章中,材料科学与工程系教授、麻省理工学院新气候项目脱碳任务负责人艾尔莎·A·奥利维蒂 (Elsa A. Olivetti ) 分享道:“我们需要一种更具情境性的方式来系统、全面地理解该领域新发展的影响。由于进步速度太快,我们还没有机会跟上衡量和理解利弊的能力。”
然而,“新开发项目”的定义再次显得过于方便。如果规则规定,新开发项目若未充分了解其对环境的影响,且开发商未考虑采取措施来抵消其影响,就不能被视为完整,那么从这个角度来看,根本就不存在任何新开发项目。
我想到的一个比喻是,一个人突然意识到自己可以以每小时150英里的速度开车,但他不知道发动机的实际性能,不知道要经过哪些地形,甚至没有考虑是否会穿过居民区。他们只知道自己可以以每小时150英里的速度行驶,老天爷啊,我们最好看着他们开。
这些公司都说“人工智能更便宜”,实际上他们是在说“人工智能让我的生活更轻松,而且我不需要承担其负面影响的成本”。
人工智能在未来可能产生的成本,即忽视软件整体影响的真正成本(即使目前看不见),使成千上万的人失业,使他们的思想闲置(不要与进行冥想和沉思的人混淆),最终导致人们收入捉襟见肘,阻碍了不同背景的人们进入创意领域,阻碍了艺术家响应内心的创作召唤,这是最终必须承担的。
此外,扭转环境负面影响所需的成本也必须在未来承担。风笛手总会来敲门。
我并不是说我们需要停止人工智能技术的所有发展,而是建议我们以更负责任的态度看待它的设计和推动人类前进的过程。
我听到的另一个论点是:“嗯,事情就是这样的。” 这话挺有道理的。然而,这种论证的结论性语气很容易让人联想到“上帝创造了世界”这种宗教思想。
值得记住的是,人为设计的系统与神圣的(对于那些相信神灵存在的人来说)之间存在差异。社会结构并非神授的准则(与许多人的论点相反),它们表面上是由我们自己设计的,并且是为我们自己设计的。
这种将神圣意志与人类结构混为一谈的做法十分危险,因为它会滋生懒惰。它会导致人们对自身工作所影响的人们漠不关心。它会导致人们忽视科技带来的那些虽然看不见却又迫在眉睫的成本,而这些成本最终都将由我们自己或我们的子孙后代来承担。
“我感觉我们正接近世界的末日。我们人类正在对自己失去信心。”这是宫崎骏的评论,他对人工智能生成的动画表达了极度的厌恶。
视觉艺术、写作、动画都是人类体验的表达,它们以最佳形式展现了人性中最好和最坏的一面。宫崎骏关于人类失去自我信心的论点看似极端,但却有理有据。
我们宁愿让电脑告诉我们该如何感受,也不愿冒险将自己置于弱势地位,与另一个人(以及他们的判断力、偏见和经验)谈论我们的想法。我们宁愿接受电脑给出的“足够好”的评价——或者坦白说,在很多情况下,是平庸的评价——当我们本应接受其他人给出的评价时,尤其是在职场上,大多数人都会犹豫不决,不愿强迫自己超越。
那么现在怎么办?
也许你比我更擅长 ChatGPT 的提示写作,可以让软件像我一样写出整篇文章。但是,ChatGPT 可以尝试模仿我的风格,却无法复制我走到今天这一步的历程。
它不能让我有这样的经历:被告知我可能会失业,并且被告知有钱人的想法(即使不是专业知识)比我自己的生活经历更重要时,我感到很受伤和沮丧。
它无法每天去找我父亲一次,谈论人类的傲慢,倾听他的观点并修正自己的观点。它无法体会我每次谈话时的感受,也无法让这种情感和感受影响我走过的这段旅程。
尽管有些人可能会争辩说“对话并不能激发创造力”,而 ChatGPT 每天要处理数百万次对话,但我还是要敦促他们不要混淆形式和本质。对话的形式很容易被误解。但对话不仅仅是两个人用嘴发出我们赋予其意义的声音。它是两个人试图通过一种沟通方式来理解彼此,并理解周围的世界。
我见过也读过一些关于人工智能“意识”的争论。我不想深入探讨这个问题。但即使是生成式人工智能最坚定的捍卫者也不得不承认,无论人工智能是什么,它永远不可能像人类一样。如果你认为ChatGPT挑战创意人员“更好”,很遗憾,我不得不反对。通过以新的排列组合重新加工过去的数据和故事,它不断地以新的方式重塑过去。
用人工智能取代创意人员的风险在于,我们最终可能会阻止艺术家们将他们的一生奉献给他们的艺术创作宫崎骏指出,创作过程中经历的痛苦很重要。为什么?
将痛苦转化为美的能力在历史上屡见不鲜。更重要的是,每一次的迭代都至关重要。每一次痛苦,无论是身体上的还是精神上的,都会带来影响。
说到我的创作过程,当我坐下来写作时,一个项目需要投入大量的精力,直到真正动笔,更不用说敲击键盘了。我会静静地坐着,思考主题,让它慢慢在脑海中扎根,渗透到我的脑海里。而对于非虚构类写作,我需要整理思绪,进行研究,并与专业人士和专家交流,最终创作出一篇扎实的作品。
进行创意写作时,我常常需要开始写一篇,然后慢慢推进,每次写50到100个字,直到水坝决堤,文字奔涌而出。说实话,文字是自己选择的。它们并不总是会自己出现,然后我就会打开词典。对我来说,人物是自己塑造的。我不会给我故事里的人物赋予特质,而是他们告诉我他们是谁,以及他们所处的环境造就了他们。
这对很多人来说可能听起来很奇怪,但我认识的大多数作家都会表达类似的方法和过程。创作就是将潜能释放出来。你无法“控制”它,当然也无法规定它的局限性(例如,只允许它基于过去的数据运作)。它存在于过去、未来和现实的领域中。
如果我们扰乱这一进程,只关注其中某个要素,那么我们就会破坏创造力的本质。事实证明,人工智能在其中某个方面很有帮助。
技术对于进步至关重要。但艺术和文化也同样重要,即使它并不总是得到应有的重视。如果我们需要找到下一个达芬奇、拉贾·拉维·维尔马、勒奎恩或宫崎骏,我们就需要提供一个让这些思想能够蓬勃发展的环境。
我真心相信人工智能的出现是为了满足某种需求。人类正在探索星空,正在探索深海。我们正在制造纳米芯片,开发处理能力更强的计算机。人工智能在帮助人类突破极限的同时,也严重影响着我们独立思考的能力,以及挖掘人类超越二元论的面向的能力,而创造性元素就是其中一种体现。
我们必须谨慎,切勿只见树木不见森林。ChatGPT 或许是下一个激动人心的事物,它能为那些因种种原因无法通过自身努力满足创造力需求的人带来创造力的幻觉。然而,生成式人工智能带来的即时满足感,远不及激发创造力所带来的痛苦、付出的努力和艺术。
人工智能无疑具有实用性,我相信它支撑了人类更宏大的抱负——但它服务于谁?它如何服务?我们必须小心,不要沦为将一个物体变成超越其用途的东西的牺牲品。