游戏业奉为神器的AIGC,过半艺术家却评价“没啥帮助”,为什么?

转载
496 天前
10258
AI梦工厂

文章转载来源:AI梦工厂

来源:gamelook

GameLook报道/大AIGC时代下,从海外的暴雪、育碧、Unity到国内的网易、腾讯等行业领头羊,全球游戏工业界已经身先士卒,开启了AI大模型技术落地的全面探索。

在这其中,又以文生图技术最为接近普及。Stable Diffusion等开源文生图工具如今已经成为游戏美术工作者的左膀右臂,如暴雪等公司也推出自研生成模型,帮助开发者更便捷地进行美术创作。工业界已经展开双臂,普遍接纳AIGC技术,但在一些姊妹行业,AIGC的推广之路依然坎坷。

艺术家调研报告:AI还是做不了高端路线

纯艺术行业就是最具代表性的一个例子。由于近日,一家海外生成式AI艺术公司Playform AI向500名艺术家与数字设计师发出了问卷调查,结果显示,有超过一半的艺术家在尝试过DALL-E、Midjourney等文生图AI后认为无法帮助他们进行创作。

Playform AI公司定位于艺术生成平台,因此此次受访的创作者大多数来自纯艺、数字设计、摄影等较为传统的行业背景。同样在该调查中,仅有18%的的创作者表示会每日在创作中使用AI生成工具。另外,6成艺术家认为AIGC工具生成的图像质量达不到他们的质量标准。

一边是游戏美术界的热火朝天,一边是纯艺界的相对冷淡。在GameLook看来,这其中的差异相当有趣。表面上看,游戏画师与数字艺术家们均以画图为业,但在背后,两个行业对最终交付产物的需求大相径庭。对商业游戏画师们来说,产出符合项目需求的美术资源是第一要务。而对于艺术家们来说,他们需要的最终产物更加“高端”,不仅需要精雕细作的作画质量,还要兼顾有个人色彩的艺术表达与风格要更加重要。

目前的AI能够借由海量的原始训练材料生成出精致的画面。但从原理上说,AI对画面中的元素还尚处拼贴的程度,难以形成对画中元素的“理解”。因此,由AI生成的画作往往有细节走线凌乱,光影关系经不起推敲,乃至肢体扭曲的问题。对于对细节品质要求更高的行业来说,AI无疑还无法满足艺术家的需求。

这种理解的缺乏自然也让画面构图等技巧的调整变得十分困难。更多的时候,AI所做的只是集于输入文本和参数进行排列组合。从根本上说,AI的作画难以形成思想性的表达,因而此次接受受访的艺术家们也表示,仅有三成认为AI生成的产物可以反映出艺术家自己的风格。

此外,艺术家们还对AI有着各种各样的批评。例如,仅有3成艺术家认为AI画图的版权不存在问题,而过半艺术家认为依然有版权隐忧。艺术家们还不满称,眼下的AI模型依然很难对最终产出进行精准控制,AI生成的分辨率与细节控制也无法满足他们的需求。

相对于高度流水线化的游戏行业来说,主打精工细作纯艺市场并没有受到AIGC的太多冲击。不过,艺术家们也一定程度地出现了身份危机。


商业以外的另一个维度


AIGC为我们带来了生产力的极大进步,但随之而来的则是无止境的焦虑。诸如“画家要被取代了!”这样的言论曾经大行其道,也是美术行业从业者对AIGC警惕心理更强的原因。

在失业焦虑的同时,与其坐以待毙,我们不妨借着这个机会打破固有的认知,重估人类的竞争价值。我们可以看到,眼下的AIGC仍然有太多的缺憾与短板。例如,它无法像人类一样思考。对艺术创作来说,这是致命伤,因此优秀的创意与人文思想在AI到来的时代只会变得更加珍贵。

Playform AI的创始人Ahmed Elgammal在近期撰写了一篇文章《为什么AI艺术的时代已经过去了》,向我们分享了他的有趣思考。

Ahmed Elgammal是一名履历独特的跨学科人才——作为罗格斯大学人工智能艺术实验室的负责人,他既接受了扎实的艺术教育,也对人工智能技术有深入浅出的理解。而在Ahmed Elgammal看来,与其说AI时代即将到来,进而取代人类,不如说眼下的AI大模型太熟稔与“模仿人类思考”,这样反而扼杀了属于AI的创造力。Ahmed Elgammal认为,“AI艺术”的时代实际上已经结束。

GameLook编译了Ahmed Elgammal的这篇好文:

现在每个人都在谈论创造性人工智能和“人工智能艺术”,谈论一个新的创造性AI时代的到来,而它将取代艺术家的工作。我们看到来自艺术家和艺术界的巨大反弹。然而事实恰恰相反:“AI艺术”时代实际上可能已经结束。

究竟发生了什么?首先,让我澄清一下“AI艺术”的含义。

A.I.并不创造艺术,而是创造图像。使这些生成的图像成为艺术的是AI背后的人类艺术家——那些向机器输入数据、操纵旋钮并策划输出的艺术家。因此,我使用“AI艺术”这个术语来谈论人类艺术,这些艺术将AI作为创作过程的一部分,具有不同程度的自主性。我们正在进入一个大量使用此类工具的时代。然而,这些工具激发出艺术天才火花的时代可能已经过去了。

是什么让艺术迸发出火花?当毕加索在1907年创作《亚维农的少女》时,这幅画曾引起争议,并遭到了他身边朋友的反对。就连毕加索的立体主义同事乔治-布拉克(George Braque)也不喜欢这幅画。直到1939年,当这幅画在纽约现代艺术博物馆展出时,它才被公众接受并认可为立体主义的先驱。乔纳森-琼斯(Jonathan Jones)在《卫报》的百年庆典上写道: “艺术作品最终会沉淀下来,变得受人尊敬。但是,100年过去了,毕加索的这幅作品仍然是如此新鲜,如此令人不安,称其为‘杰作’简直是一种贬低。”

图:毕加索《亚维农的少女》

科林-马丁代尔(Colin Martindale)在1990年出版的《The Clockwork Muse》一书中开创的美学心理学理论可以很好地解释令人不安的挑战在艺术发展中的作用。他认为,艺术进化背后的主要力量是艺术家通过创新来对抗习惯。然而,如果艺术家创新太多,他们的艺术就会过于震撼,观众就会不喜欢。好的艺术家能够在创新和不太令人震惊之间找到最佳平衡点。伟大的艺术家则是那些更进一步的艺术家。

人工智能能否超越“好”而达到“伟大”的程度?当生成对抗网络(GAN)出现时,一些艺术家注意到了这项新的人工智能技术。你可以在大量图像上训练这些模型,它们可以为你生成新的图像。2017年,当我们对西方艺术中的经典肖像进行GAN训练时,它生成了一些令人不安的变形肖像,这让我想起了弗朗西斯-培根1963年创作的Henreitta Moraes肖像。然而,这两者之间有一个根本的区别: 培根的意图是让肖像产生变形扭曲的效果,而人工智能只是生成时不听话而已。

图:弗朗西斯-培根《Three Studies for Portrait of Henrietta Moraes》

随着GAN的出现,我们进入了机器“失败美学”的时代。一些评论家将其与“故障艺术”联系在一起。事实上,GAN所带来的惊喜让艺术家们对其产生了浓厚的兴趣。该领域的许多人称之为“恐怖谷效应”。

正是这种恐怖谷和偶然性让人工智能艺术在2017年至2020年间变得有趣。2019年,我与艺术史学家玛丽安-马佐内(Marian Mazzone)一起做了一项研究,我们采访了几位在创作过程中率先使用人工智能的艺术家。我们发现,“艺术家将人工智能理解为自己创作过程的主要推动力”。特别是,艺术家们发现AI在两个方面非常有用:创作灵感和创作数量。创作灵感是艺术家们发现AI给他们带来新想法、新方向和新的艺术创作方式的地方。

图:使用GAN生成的人物肖像,制作于2007年

与当下的一片声讨的氛围不同,人工智能艺术在2017年至2020年间受到了艺术界的欢迎。

2018年10月,佳士得拍卖行拍卖了一幅由GAN生成的人工智能肖像画,与上述变形肖像画类似。2019年3月,苏富比拍卖了艺术家马里奥-克林格曼(Mario Klingemann)的作品。曼哈顿的HG Contemporary于2019年2月举办了一次展览,展出了我自己的作品。2019年夏天,伦敦巴比肯中心展出了不同的人工智能艺术家的作品。人工智能艺术在2018年迈阿密Scope和2019年纽约Scope等艺术博览会上受到欢迎。北京中国国家博物馆于2019年11月举办了为期一个月的人工智能艺术展,吸引了100万观众。

在此期间,媒体对人工智能艺术进行了积极报道。艺术市场欢迎人工智能艺术家,也没有人呼吁禁止人工智能艺术。但后来究竟发生了什么?

图:Mario Klingemann肖像作品《Memories of Passersby》

早期的人工智能模型与今天基于提示的大模型之间的一个根本区别是,早期的模型是在较小的图像集上进行训练的。这使得艺术家可以根据自己的视觉参考资料训练自己的人工智能模型。而如今的大模型则是在未经艺术家同意的情况下,在从互联网上获取的数十亿张图片上预先训练出来的。这带来了大量的版权问题。这种庞大的系统会抹去艺术家的身份。我的作品与您的作品之间的区别仅仅取决于我们在提示中使用了哪些关键词来引导系统。无怪乎版权局拒绝为此类系统生成的艺术作品授予版权。捕捉艺术家身份是摄影作品在19世纪末能够获得法院版权的主要原因。

在过去几年中,人工智能在生成高质量图像和逼真图像方面的表现越来越好。它在模仿训练数据方面的能力也在不断提高。一种新的交互方式已被引入,主要是使用文本提示来控制生成。如今,文字prompt已经成为人工智能生成图像的主要方式。人工智能生成技术的这些进步已经使人工智能能够很好地按照我们在精心制作的文字提示中发出的指令生成我们想要的任何图像,无论是照片还是插图。惊喜仅限于我们可能得到的想法的变化。通过多次重复,我们可以得到我们想要的令人惊叹的高保真、高分辨率图像。

文字输入帮助人工智能走出了“恐怖谷”,但它扼杀了惊喜。这是因为这些模型同时接受了文字和图像的训练,并学会了将视觉概念与语言语义联系起来。这使得模型更善于创造人物形象和模仿可以用文字描述的风格。

图:Refik Anadol作品《Unsupervised》 收藏于纽约现代艺术博物馆

但另一方面,将语言作为训练的一部分会使模型在创建灵感视觉变形时受到很大限制。A.I.现在打造的视觉输出受限于我们的语言,失去了在视觉上自由操作像素而不受人类语义影响的自由。

从某种意义上说,人工智能正变得越来越像我们,它不再能够在我们看待世界时提供补充和挑战。

当然,人工智能在生成过程中仍然会出现令人惊讶的失败。我们仍然能看到长着四只手指和三条腿的人物。然而,这种愚蠢的失败并不一定有趣。创造性灵感并不是新一代人工智能所失去的唯一东西。使用文本生成图像的理念可能会限制艺术家的灵感,因为艺术家们是视觉型思维者。借助文字描述他们想要的东西会增加一层额外的、不自然的语言抽象。

A.I.正在成为生成大量图像的工具,而不是让艺术家们为之兴奋的共同创作伙伴。A.I.正变得非常善于循规蹈矩,但其中的艺术火花却荡然无存。艺术家必须深入挖掘,超越文字提示词,以不同的方式使用人工智能,这样才能找到艺术的火花。