生成式AI的进步带来了“创意奇点”,但我们准备好了吗

转载
560 天前
9886
Yangz

文章转载来源:Yangz

撰文:Jesse Damiani

来源:FreeThink

图片来源:由无界 AI工具生成

2022 年,像 Midjourney、OpenAI 的 DALL-E 2 和 Stable Diffusion 这样的文本-图像生成器开始进入公众视野,引发了关于“生成式人工智能”在创意生产中的作用的激烈辩论。而当 ChatGPT 在 11 月推出,并在 5 天内突破百万用户大关时,人们对人工智能工作替代的担忧从视觉艺术家扩大到了包括作家、记者和文案人员。然后,初创企业和现有企业都纷纷推出了一波新的人工智能产品,从语音克隆和化身替代,再到界面设计和代码协同机器人。突然间,感觉没有哪一类人类创造性劳动可以免受自动化的影响。几个月来,人们对自身艺术在没有许可或报酬的情况下被纳入训练数据而感到愈发愤慨,成千上万的艺术家在去年 12 月参加了“No AI Art”的在线抗议活动。

就像之前的国际象棋一样,艺术被认为是人类的典型成果,但生成式人工智能的快速发展使这种想法变得复杂。多年来,算法无处不在,影响着我们的工作、社会生活和娱乐,但生成式 AI 的一连串创新甚至让怀疑论者感到惊讶。对这些技术的担忧也引发了对奇点的重新讨论,这个术语用来描述技术进步的时刻,通常以“人工超级智能”的形式,以超过人类能力的速度爆炸,给文明带来不可预见的变化,并呈现出人类被取代的新现实(想想科幻小说中敌对的机器人接管)。

我不认为“奇点”已经到来,而且通过归纳人类的视角来构筑机器智能也有问题。不过,我确实相信最近生成式 AI 的进步已经将我们拉入了一个不那么世界末日的“创意奇点”,颠覆了创意生产和相关产业的基本规范。

说实话,我对“颠覆”的言论有点反感,但作为作家、策展人和未来学家在新兴技术领域工作了十年之后,我不得不承认,这并不像平常的商业废话。正如艺术家、学者 Mat Dryhurst 最近所说:“人们对那些从事技术工作的人说一切都将改变感到非常疲惫,这是可以理解的,遗憾的是,目前看来,一切都将改变。”大型多模态模型的出现,比如谷歌的 PaLM-E 和 OpenAI 的 GPT4——研究人员声称后者展示了“人工通用智能”的“火花”,因为它能够在没有特殊提示的情况下跨领域解决问题——感觉像是人工智能影响未来的指标。与此同时,该领域知名人士的许多热心宣言感觉与现实脱节。此外,他们忽略了过去不那么极端但更适用的经验教训,这些教训在面对炒作时必须加以重申,而炒作往往会抹去指导性的教训。

如果创意奇点已经发生,那我们该怎么办?为了弄清这一点,我借鉴了我根据科学哲学家 Thomas Kuhn 的范式概念开发的框架:一组概念、理论或模式,形成具有解释力的全球组织模型。这个框架将现实视为与人类一起发展的东西 -- 它是我们对真实事物达成共识的能力的总和。我们创造的技术和符号系统(识字、算术、代码等)实际上扩展了现实的内容。大规模的机器学习工具是当代范式的一个组成部分,我称之为“后现实”。如果像马歇尔 - 麦克卢汉所说的那样,艺术作为一个“遥远的预警系统,可以随时告诉旧文化它正在发生什么”,那么艺术家和其他一直在研究、实验和使用人工智能的创造性专业人士的贡献为这个新世界提供了关键信号。


外星生命体


在 1999 年的一次采访中,David Bowie 试图说服记者 Jeremy Paxman,互联网不是一种渐进的创新,而是艺术创造、传播和体验方式的巨大变化。Bowie 说:“我认为我们实际上正处于令人振奋和恐惧的边缘。”“它不仅仅是一种工具,它是一种外星生命体。”

今天,在生成式人工智能的支持者中也有一种类似的情绪。但新的可能究竟是什么?是否会出现新的创造力和社会动态模式,这种变化的影响和副产品是什么?谁会受到最大的影响?为了从噪音中分辨出信号,这些问题将从以下四个角度分析,包括自动化和创造性劳动,强化和速度,美学和艺术性,以及融合和涌现。

自动化与创造性劳动

从表面上看,我们很容易理解数十亿人现在可以使用强大的工具进行创造性的表达,或者艺术家可以将他们实践中的繁琐环节自动化。但是,房间里的大象 -- 最直接影响大多数人的 -- 是这些工具如何与工作和生计相交。

Mashinka Firunts Hakopian 是 ArtCenter 设计学院技术与社会正义副教授,也是《The Institute for Other Intelligences》的作者,研究人工智能已有近十年,重点关注 AI 与现实世界系统的交互。该推理小说研究围绕技术的神话如何经常掩盖其创造的现实。在这本书中,她将哲学家和科学史学家 Donna Haraway 对所谓“客观”系统的批评延伸到了人工智能。她强调,所有数据都表现出隐含的政治色彩,通常反映了现有的权力结构。

“我们现在看到的关于劳动力的问题与多年来围绕新兴技术和劳动力出现的问题是连续的,它们重现了许多相同的空白点和遗漏,”Hakopian 在接受采访时说。“例如,围绕生成对抗网络和图像生成器的争论一直以被提取的艺术家的劳动为基础,但很少有人关注正在训练这些模型的数据工作者的劳动,以及其中的劳动条件。他们正在接受培训。”

我们所理解的创造力的概念被包裹在历史规范中,这些规范影响着被认为有价值(从而可复制)的表达类型。

“在我们现在看到的输出中,哪些形式的视觉效果以及哪些人的愿景被突出显示、复制、提取或重新混合?”哈科皮安说。“有一个奇怪的悖论,我们认为这些工具非常新颖,但通常情况下,它们所生产的最终是现有经典的复制品。”

除了使用生成工具进行创作外,艺术家在反思工具的缺失方面也发挥了重要作用 --"滥用" 工具,以发现其弱点。艺术家 Minne Atairu 在一系列不同的项目中使用机器智能,包括在她的 Lumen 奖获奖系列 IGÚN 中对算法审美标准的检验和对贝宁青铜器的重新想象。这样的作品证明了艺术家是如何将这些工具严谨地结合起来,产生新颖的艺术表达,甚至审问用于创造他们作品的模型的偏见。但 Hakopian 提醒说,我们在寻找成功适应创造性工作中正在进行根本性转变的艺术家和设计师时,跳过了一个关键步骤。

Hakopian 说:“责任的负担反而应该由生产这些技术的科技公司的基础设施层、在这个艺术和设计生态系统中招揽劳动力的雇主和客户以及监管机构来承担”。

当涉及到劳动力时,人工智能似乎将遵循当前的经济和政治模式,而不是取代它们。此外,随着大型现有企业、初创企业和政府机构被锁定在 AI 创新军备竞赛中,很容易看到多极陷阱是如何通过创意奇点而加剧的:为了降低成本,公司整合了他们的员工队伍,将创意任务转移到零工(甚至“幽灵”)工作上,并抵消了越来越多的创意人员,这些创意人员随后会争夺日益减少的职位空缺。事实上,这已经发生了。

当然,凭借生成式人工智能,新的工作也将被创造出来,而且比上头条的提示工程师名单更细致。此外,随着大型现有企业、初创企业和政府机构被锁定在人工智能创新军备竞赛中,很容易看到多极陷阱是如何通过创意奇点而加剧的:为了寻求降低成本,公司整合他们的劳动力,将创意任务迁移到临时工(甚至是 "幽灵")工作中,并抵消越来越多的创意人员,然后他们竞争日益减少的空缺职位。事实上,这已经在发生了。

当然,生成式人工智能也将创造新的就业机会,而且比上头条的提示工程师名单更细致。但有待解决的问题是,这个数字是否能跟上被削减的工作,以及周围的行业和政府将如何应对这种震荡。

强化与速度

生成式人工智能增强了我们的创造能力和内容生产的速度。Alexander Reben 是一位艺术家和机器人专家,他的艺术研究和实验以幽默和荒诞的形式来揭示人工智能的潜力和限制。在与其的合作过程中,包括他在克罗克艺术博物馆的个展 AI Am I 和即将出版的《I Create Like the Word: Poetry in the Age of Machine Intelligence》,Reben 和我一直在讨论他所谓的“人机共生”,这是他自 2012 年以来一直追求的研究方向。这个术语是对更传统的“人机协作”的一个转折,不仅仅是一个语义上的繁荣。它同时反映了他对技术在人类进化中的作用的信念,并将他与机器的接触定位为与学习实体的新兴关系的表达,而不仅仅是惰性的艺术材料。

“人机共生的想法源于技术是与人类密不可分的东西,”Reben 在采访中说。“发明石器和其他放大我们能力的外部手段,使我们能够,例如,有更多的卡路里和时间来做诸如发明科学和哲学的事情。技术一直是一个非常人性化的东西。”

从拉伸的画布到颜料,所有的艺术创作工具都曾经是新技术。生成式人工智能是扩大我们艺术创作能力的一长串此类创新中的最新一项。但是,这些新工具的独特之处 -- 特别是像 Auto-GPT 这样的新“AI 代理”产品 -- 是它们在创作过程中的代理和自学程度。

“我们现在看到的自动化类型与我们在工业革命等其他自动化时期看到的不同。,”Reben 说。“我们现在正在实现脑力劳动与体力劳动的自动化,但我不认为我们有充分的准备。”

突然有能力以这种方式增强我们的思想,将给观众体验艺术和创造性表达的方式带来复杂的问题。Lauren Lee McCarthy 是一位艺术家,也是加州大学洛杉矶分校设计媒体艺术项目的副教授,p5.JS(一个用于创意编码的 JavaScript 库,被世界各地的许多数字艺术家使用)的创造者。作为一个有开发数字艺术和工具的实践经验的人,她想知道这种新的文化生产模式的涟漪效应。在她看来,在她看来,新人工智能工具的速度将影响算法“可发现”的人,可能更青睐那些能够快速制作和分享内容的人,而不是那些花更多时间开发工作的人。反过来,这可能会影响公众与有意义的艺术联系的能力。

“我认为我们将看到此类工作的减少,因为它在经济上的可持续性较差,”McCarthy 说。“如果这真的成为一种趋势,那将意味着文化,以及我们通过周围的艺术文化处理、理解世界能力的巨大损失。因为这就是艺术的作用:它为我们提供了一种理解正在发生的事情的方式。所以一切都发生得更快了,在适当的时间和空间里创造的工作更少了。”

1930 年,著名经济学家 John Maynard Keynes 预言,到 21 世纪初,技术进步将带来一个“闲适丰富的时代”,每周只工作 15 小时。在通用任务中部署生成式智能体,会不会为人类开辟更多的自由时间,以更充分地探索他们自己的创造性?这是许多人都会接受的愿景。然而,即使在最乐观的情况下,这条道路也将是崎岖不平的,因为生成工具也可能在提高生产力的同时创造出新的分心形式,但朝着这个方向迈出的一步是协作者(copilot),一种可以扮演不同角色的轻型人工智能代理。对于创造性的任务,机器人扮演着“空白页杀手”的角色,帮助训练有素的艺术家和新手启动创造性的努力,无论是帮助想象一篇文章的开篇,还是人物的概念,或是一系列绘画的模拟模型。

对于非艺术家来说,协作者可能会将工作自动化,以腾出时间来完成创作任务,无论是作为个人助理还是作为针对特定知识任务的代理人。就像曾经有“一个应用程序”,我们现在可以想象“一个协作者”,尽管我们必须考虑到幻觉和潜在的对齐问题。这种增强是一把双刃剑;对一些人来说,它促进了非结构化的时间,对另一些人来说,它增加了竞争和对他们时间的要求(并最终可能将人与人之间的互动分化为一种“奢侈”的体验)。但是,将知识任务移交给协作者的趋势可以促进更多人类能力的深层价值:想象力、好奇心、综合能力、存在感和相互联系——与此同时,创造性能力可以通过生成工具分散到创造性职业之外的人身上。

美学和艺术性

创意奇点将意味着美学和艺术家工作方式的转变。McCarthy 解释说,生成式人工智能创造了一个新的社会环境,公众将期待艺术家进行反思,而不是担心它将使人类的努力失效。

“我认为艺术家的角色始终是使用可用的媒体工具,并提供独特的人类或艺术视角,”McCarthy 说。“我不确定这是否可以自动化。”

也许 ChatGPT 会成为推出 10 亿本书的机器人,但有多少能够引起公众的兴趣让其真正去阅读?在这些人中,又有多少会认为这些书与人写的书有竞争力?从这个意义上说,最高层次和最概念化的创作形式——源于艺术家与世界的深度接触,他们的手艺,以及激发他们实践的问题——似乎与自动化绝缘。如果有什么不同的话,公众将比以往任何时候都更需要这些审讯来弄清楚发生了什么。对于这些艺术家来说,生成引擎将加入一系列可能的工具和材料,这些工具和材料可能有助于制作给定的艺术品。

随着人工智能能力赋予更多的人执行专业质量的创意产出的能力,它们将延续几十年来的艺术趋势:将价值集中在概念和美学执行的结合上。在这个数字中,有一定比例的人将是那些本来觉得被禁止参与艺术的人;如果他们有足够强大的想法(至少在理论上),他们将能够产生有意义的概念性艺术。另一方面,更多的人将能够为了乐趣而从事新的创造性活动,而不是为了追求工作或事业。

“最大的潜力在于这种表达的民主化,人们能够根据自己的想象力创造产出,这在过去可能对他们来说很难,无论是由于缺乏技能、能力还是知识,”Reben 说。“一个明显的例子就是相机。从前,摄影需要很高的技能,而且,需要像氰化物这样的化学品来处理。现在,每个人的口袋里都有一台相机。”

在 2010 年代,用生成对抗网络(GANs)和其他形式的机器学习创造的艺术有一个独特的外观,可以在 Memo Akten、Sofia Crespo、Jake Elwes、Mario Klingemann、Anna Ridler 等人的作品中看到。Ingrid Hoezl 和 Remi Marie 将其称为“软图像”(以及后来的“后图像”),其中基于图像的作品 " 不再是一个坚实的世界的表现,而是……一个可编程的数据库视图。这些美学已经让位于更合理和逼真的输出(见:穿着蓬松大衣的教皇)。但是,即使生成工具产生了越来越像人类的图像,创意奇点也会引起新的美学。作家和音乐家 K Allado-McDowell 指出了使用文本 - 图像引擎的四个“副作用”:幻觉、杂糅、变异的语言和占有。

“湿粘土决定了陶艺家的动作;人工智能系统通过潜意识地摄取文字/图像地图来塑造思维,”麦克道尔在《Side FX》中写道‌。“神经网络的内心世界在艺术家的内心世界模型中被挖掘和模仿。”

这些作为人类的综合体(无论多么有缺陷、偏见)而创造的人机反馈回路,代表了创造力的新历史背景。长期以来,“孤独的天才”艺术家的神话一直饱受诟病,而创意奇点进一步削弱了其相关性。这也意味着模型将在我们日常遇到的美学中发挥巨大作用——无论是 ChatGPT 生成语言的方式、Midjourney 生成图像的方式,还是 Runway 插入视频的方式。如果没有各种各样的参与者的投入,这就有可能使创造力同质化,而不是扩大或增强它。此外,模型和数据集的局限性也将决定给定媒体的可见度。例如,到目前为止,与 3 D/扩展现实、表演、舞蹈和装置艺术等相比,易于为机器打包的艺术媒介——文本、平面图像和声音——产生了更多的关注、投资和创新。随着时间的推移,这可能会影响到谁会遇到不同类型的艺术,以及艺术家在选择形式时做出的决定。对于公众来说,机器生成的内容的扩散甚至可能对他们对现实的理解产生深刻的影响。

这也引发了围绕生成式 AI 调动的艺术创作模仿模式的问题:cover、仿冒品和模仿品。在越来越多的人工智能生成的歌曲之后,Grimes 宣布将与任何使用人工智能语音克隆的歌曲平分版税。

即使超越了法律或技术方面的考虑,模仿其他艺术家的能力对艺术家如何发展他们的技艺有着深远的影响。史蒂夫・乔布斯 (Steve Jobs) 曾引用福克纳(引用 Stravinsky)) 的名言:“优秀的艺术家抄袭,伟大的艺术家窃取。”艺术家发展他们的诗学、风格和独特的表达语言的一个重要方法是,深入研究启发他们的作品。通过把有影响力的作品作为源点,分析它们,玩弄各种元素,并重新配置它们,艺术家们才有了他们自己的力量。而当我们达到任何人都可以在提示的眨眼间生成高保真模仿的程度时,情况就会发生变化。

Holly Herndon 和 Mat Dryhurst 普及了“spawning”一词,即用人工智能创造与他人相似的作品。作为对“heart on my sleeve”的回应,Herndon 区分了能够模仿某个艺术家和能够带来同等程度的关心和艺术意图。当每个人都能以所有其他艺术家的风格进行翻唱时,一种集体文化就会出现,它不仅决定了年轻艺术家的学习方式,也决定了他们遇到的人。最近 Wes Anderson 在 TikTok 和 Instagram 上的趋势也表明,知名艺术家可能会受到人工智能生成的 riff 的影响 -- 将他们的作品压缩成夸张或刻板的表现。

作家 Ted Chiang 则认为,对于年轻作家来说,任何形式的大语言模式的输出都不是一个有益的起点:“如果你是一个作家,在你写出原创的东西之前,你会写出很多非原创的作品。而花在这些非原创作品上的时间和精力并没有被浪费……这正是使你最终能够创造出原创作品的原因。花费在选择正确的词和重新安排句子以更好地相互衔接上的时间,可以教你如何通过散文传达意义。”

因此,模仿是艺术家教育和机器美学的另一个重要(和棘手)特征,我们唯一可以确定的是,这一现象将促使艺术家发展其技能的方式发生重大转变。

融合与涌现

创意奇点还意味着,创意能力将在那些原本不认为自己会有创意的人中变得普遍。考虑到现有的先例 -- 想想 YouTube 上的用户生成的视频 -- 当能力变得普遍时,文化会以意想不到的方式改变,并推动新的媒介和表达形式。

“也许我们对什么是创造性产出的理解会改变,”McCarthy 说。“这可能最终与某人生成图像或文本或其他东西是不同的,后者可能会变得更加普遍,并更多地用于我们今天与 meme 的交流方式。”

Stephen Marche 将即将到来的时代称为 Big Blur,因为所有的书面内容都将伴随着一个问题:”人还是机器?“我认为,这种模糊超越了我们遇到的内容的来源或真实性,实际上从根本上改变了知识在后现实中的生产、组织和应用方式。随着创造性的冲动(无论在历史上如何被限制)渗透到其他领域,它将引起更深层次的转变:来自其他领域的最佳实践和见解将相互渗透。创造力成为一种跨领域传输思想的血红蛋白。

经济学家 Noah Smith 将人工智能称为“第三种魔法”,称其为一种大规模的元创新,在历史(传递信息)和科学(推导关于世界如何运作的一般原则)的发展之后,更新了我们了解世界的方式。人工智能 -- 特别是深度学习 -- 与科学方法不同的一种方式是,它能够在大量的数据中识别模式,而不需要任何关于它应该找到什么的特定想法。这种获取信息的方法意味着,在很多情况下,洞察力是有效的,但不一定是可解释的(通过所谓的“黑匣子”问题)。

“[M] 任何像语言这样的复杂现象都有潜在的规律性,这些规律性难以概括但仍然可以概括,”Smith 写道。“如果你有足够的数据,你可以创建一个模型(或者,如果你愿意的话,一个 'AI')可以编码许多(全部?)人类语言极其复杂的规则,并将它们应用到此前从未存在过的对话中。”

我们已经在“AI cryptids”CrungusLoab 以及 DALL-E 2 假定的秘密语言(即 Apoploe vesrreaitais)的示例中瞥见了这些奇怪的可能性。

通过这种方式,我们的知识范式变得更加符合创造力的运作,遵循 Alfred North Whitehead 的主张,即艺术“是将一种模式强加给经验,而我们的审美享受是对模式的认可。”但是,这种“没有理解的控制,没有知识的权力”与知识的关系要求在公共和私营部门建立强大的安全,道德和“慢人工智能”设备,以倡导公平的模型和发展过程,防止我们已经通过算法文化目睹的偏见结果的加剧(例如预测性监管、贷款评估)。此外,它还要求个人不要完全依赖大型科技公司的人工智能产品,因为这些公司的市场和利益相关者的激励可能会首先限制可以探索的创造力形式。


后现实中的创意奇点


在 Covid-19 初期写的一篇文章‌中,Elizabeth Dias 概述了当通过其在希腊原文中的用法(apokalypsis)来理解时,天启是如何意味着揭示或启示而不是世界末日。通过这个角度,奇点现象是连续体上的关键揭幕点,而不是单一的、夸张的大灾变。尽管我对教条式的奇点主义感到恼火,但我确实相信,创意奇点是一个揭示时刻,是人类创造力进化中的一个重要发展。它迫使我们面对创造性劳动在生成工具出现之前就已经被贬低的方式,以及外部力量如何利用人工智能作为加速器。它还揭示了人类的好奇心、批判性思维和分析的价值 -- 这些仍然无法轻易实现自动化,而这些对于转化“旧文化”正在发生的事情至关重要。不同的人对它的影响会有不同的感受。对一些人来说,它将带来日常工作的巨大转变,对另一些人来说,它将激发新的创造性倾向,否则这些倾向可能一直处于休眠状态。对另一些人来说,它甚至不会有什么影响。

与此同时,正在发生的是,我们正在建立新的模式识别引擎,促进人类思想和表达的融合,形成新的知识和创造力生态。这并不意味着它们一定是良好的生态环境——要确保它们引导我们接近支持者认为可能出现的阳光的结果,还需要努力。“创意奇点”是对所有学科贡献者的邀请,不仅在科学和技术领域,也在人文和其他领域,参与塑造一个新兴的知识和创造力的环境,也即新现实。