强人工智能驱动下的Web3.0“美学大爆炸”

转载
859 天前
3208
巴比特资讯

文章转载来源:巴比特资讯

作者:刘秋杉,杭州时戳信息科技有限公司 首席研究员

“随着新的 AI 图像工具越来越多越来越强大,未来普通人也可以一个人完成过去需要一整个专业团队的‘创意到视频制作’的工作,让更多人的想象力释放出来。AI 不仅会帮助人类跳出自己的审美意识创作一些超越我们理解的艺术作品和图像,也可以帮助我们成为‘人类风格’创作的大师。 AI 正在引发一场想象力革命。”

(视频国内链接:https://video.weibo.com/show?fid=1034:4802295599398982

近期一段由顶级 AI 艺术工具 Stable Diffusion 辅助生产的短视频火爆了推特,它的名字叫“穿越时间”——由数百张精美绝伦的图片串帧而成,完美再现了地球从最早诞生生命时刻起到构想人类未来世界的全过程,数十亿年浓缩为短短两分钟。看过该视频的人无不为之震撼,不禁联想到《爱,死亡和机器人》第一季中的“冰河时代”,而那个承载浓缩文明的“冰箱”便是今天的 Stable Diffusion。人类的想象力和创造力竟然可以如此轻松地落地成像,AI 正在引发一场超越边界的全民美学革命!

Stable Diffusion 带给人的认知冲击不止于此,再来看一看它的一键“文字转视频”功能。也是一段火遍推特的短视频:原始片段为一个网球教练在打球的动态,创作者使用 Stable Diffusion 输入文字改变了背景,从沙滩、月球、火山边,一路到了冬天的森林、乡村、城市……令人惊讶的是,背景的变换都是在文字输入的瞬间实时完成的,而且这是动态的视频。这令很多专业的特效行业从业者都感到震惊,因为即便对他们来说,做这样的一个背景切换视频也是十分耗时耗力的,而今天只需要任何小白用户动动键盘、说说话便能够瞬间完成,且效果好无 PS 痕迹。

从第一性原理角度看待未来,Stable Diffusion 既然能够将图片生成做到“登峰造极”,而电影的本质其实是序列帧,序列帧就是图片,因此从图片原子不断组合成电影级的视频片段便顺理成章。这个过程不仅极大地解放了枯燥的生产力,似乎也预示了一个充满新创业机遇的未来。今天的人们已经习惯了人类基于现实生活创作的短视频消费,未来应该还有一片更加无限广阔的视频消费领域亟待开发,那便是人与 AI 共创出现实世界不存在的“平行宇宙”。

欢迎来到由“巨石强森”主导的“赛博朋克 2077”世界。很抱歉没有征得强森本人的同意,便被小红书上的天才创作者们用 Stable Diffusion 写进了一个 2077 年的平行时空,而该“强森”的灵魂本质其实是一段输入 Stable Diffusion 的文字(专业叫法为 prompts)。是的,你所看到的这几张强森是由纯文字生成的。你也可以在自己构建的平行宇宙(假如叫 1880 年的侦探悬疑世界)中使用这个强森,但前提是你需要向原始的创作者索要到“灵魂文字 prompts”,并且学会使用 Stable Diffusion 吧。

这真的很令人产生无限遐想啊!似乎有个更大胆的(但在法律范围并不被提倡的)想法:聚集起所有名人和经典英雄形象,发起全民连载漫画,依托小红书、抖音等元宇宙平台,还原真正的“头号玩家”。不过因此可能面临老美各大经纪公司的强烈封杀,最终或许真的走出一条去中心化创作之路。好在“时空缔造利器” Stable Diffusion 选择站在与千千万万创作者们同一条阵营,完全开放了图片版权,甚至开放了源代码,并允许用户免费使用该工具,允许后继的创业者们使用开源框架构建起更加开放而生猛的内容大生态。正如 Stability AI(Stable Diffusion 公司实体)首席执行官和创始人 Emad Mostaque 在一篇博文中写道:“我们期待着围绕这个和进一步的模型出现的开放生态系统,以真正探索潜在空间的边界。”使图像生成民主化!多么令人向往的新新世界啊。

美好的路上总是充满荆棘和不确定性,强大的 Stable Diffusion 也迎来了第一次正面挑战。由社群粉丝们构建的推特账户近日遭到了封禁,而该账号一直以来都是最强有力宣传 Stable Diffusion 作品的“Meme 媒介”。全球几百万人正是通过在推特上看到这些无比华丽的图片作品而对 Stable Diffusion 产生了浓厚兴趣,进而加入到社群成为使用用户和坚定的 AI 艺术传播者。Stable 创始人 Emad 在社群里解释了封禁的原因:艺术家们认为 AI 画得更好,生产的很多图已经分辨不出 AI 的痕迹,艺术家们很反感,便举报了它。是的,你也会在推特上经常看到很多艺术家到处贴声明,让人们不要“亲近” AI 作品,因为“太可恶了”。这是一个很显著的人与 AI 对立的场景,但我们期待的世界不应该如此,AI 会是可以帮助这些艺术家们变得更加强大和更具传播性的一种工具,而非“反叛者”。

人们只看到了生产结果的震撼,但却忽略了生产的过程,其实也是极具辛苦和专业性的创造。相比于小白使用者,专业的艺术家和设计师更懂得如何把一幅高质量的画作描述得更加清楚,比如构图、画风修饰词、画家名字。而这些文字 prompts 才是决定一副 AI 作品是否优质、与众不同的关键所在,这些文字 prompts 也才是图片背后真正的价值载体和版权载体。更关键的是,也只有专业的艺术家和设计师才能对生产出来的 AI 画作进行二次修改,以去除不合理、不美观的地方,并增加自己独到的艺术理念。

(专业的中国山水画艺术家比小白玩家更能生产出一副优质的 AI 山水画)

其实大多数专业艺术家们对 AI 创作抱有理解与合作的心态,因为它可以启发到人们认知边界未能触碰的更广阔的想象力空间,带给艺术家源源不断的灵感,解放大量的前期工作,并且可以尝试拓宽自己的固有画风,寻求更高阶的创作之路。就像在阿尔法狗席卷世界棋坛之后,虽然大多数顶级棋手开始了心灰意冷,但仍有奋发的后人选择与 AI “和解”,借助 AI 之手磨练棋技。出生于 2000 年的申真谞是第一位成为围棋世界冠军的 00 后,并在今年 2 月 25 日击败了中国选手柯洁。如柯洁赛后所言申真谞的全盘棋路有 71% 的 AI 吻合率,是的,申真谞的棋王之路离不开 AI 这个“一生的对手”和“老师傅”,并给他留下了“申真智能”的棋坛外号。申真谞每天都要花费 5 个小时与 AI 对练,会仔细学习 AI 的棋路,在《柯洁输了!但他不是输给了韩国人,而是这个AI围棋时代》一文解释道:

“训练时,他偶尔也看不懂 AI 的棋路,刚开始会坚持自己的风格,拒绝相信 AI,但后来发现,往往都是 AI 棋高一着。于是在与 AI 下棋训练的过程中,他会仔细学习 AI 的棋路,盯着胜率分布图,当有一手导致胜率骤降的时候,他就会停下来仔细研究那一手,直至搞清楚为何出现胜率下降。另外,当一场比赛结束后,他会把比赛过程导入 AI 系统进行分析,看看 AI 会怎么下,然后从中学习,与自己的落子进行比较。在他看来,AI 能极大扩充他对围棋的想象力,打破了他对围棋的固有观念。”

也正如柯洁赛后发声:“太难了,我依旧很努力,但申真谞太强了,我下的时候,完全不知道怎么输的!”画外音我们斗胆补充一句,小申比阿法狗强,围棋没法下了。

同样的道理还发生在历史上照相机诞生的时刻,虽然当时任何人都可以用照相机完成之前艺术家耗费心血才能完成的写实肖像画,但肖像艺术家却比普通人更懂得用照相机拍出更好的图片,因为他们更懂构图,更会观察,也正是由于他们的推动,才使得摄影成为一门真正的艺术。在今天的时代,很多设计师不得不为甲方的需求奔波劳神,被不断地催稿,根本没有时间和心力进行优质创作,而 AI 完全可以帮助他们应对甲方早期的需求变更,直至确定后,才开始真正的潜心创作。同时在 AI 的加持下,很多一般水平的设计师也有望赢得大甲方的青睐。所以 AI 其实让更多的设计师“腰杆子挺起来了”,正如公众号“槽边往事”的《AI绘画会不会抢画师饭碗》一文提出的观点:

“头部画师忙不过来,腰部以下画师没啥大活。有了AI绘画之后,其实真正受益的是颈以下画师,因为他们得到了一个效率工具。在非常短的时间内,他们就可以说生成过得去的图像,PS小修小改一下,就可以交给甲方。甲方爸爸要求再多,AI改得快啊,二次生成又不是多麻烦的事情。

生产效率释放了,需求同样会得到释放。这等于是凭空多出一个市场来,提供了大量的新工作机会。

AI绘画不单不会抢走画师饭碗,难说还能提供更多大米,让更多人吃上饭,甚至吃上饱饭。”

不止于帮助专业艺术家,AI 艺术也能启迪专业的作家成就更好的文字想象力和配图,同时优秀的配图还能具备文字传播所不具备的“Meme”属性,吸引更多的读者“闻图而来,带字而归”。究其本质,文字和图片背后的共性便是“想象力”。非常赞同 Midjourney(另外一个顶级 AI 艺术工具)创始人 David Holz 的观点:

“我们认为,(AI绘画工具)不是关于艺术或深度伪造(deepfake)的问题,而是,我们如何扩大人类物种的想象力?当计算机比 99% 的人类更擅长视觉想象力时,这意味着什么?这并不意味着我们将停止想象。汽车比人的速度快,但并不意味着我们不再行走。远距离移动大量物体时,我们需要发动机,无论是飞机、船只还是汽车。我们认为这项技术是想象力的发动机。因此,这是一件非常积极和人性化的事情。”

并且,Midjourney 真的做到了,它构建了一个容纳 100 万人的“想象力加速器”——

大多数人不知道他们想要什么。你说:“这里有一台机器,你可以用它画任何东西,你想要什么?”他们说:“狗”。你说:“真的吗?”然后他们说:“粉红色的狗”。所以你给他们一张狗的图片,他们就说“好吧”,然后去做别的事情。

然而,如果你把他们放在一个小组里,他们会说“狗”,其他人会说“太空狗”,还有人会说“阿兹特克太空狗”,然后突然之间,人们明白了这些可能性,你正在创造一种被增强的想象力,一个可以用这种新能力学习和娱乐的环境。因此,我们发现人们真的喜欢一起想象,所以我们让(Midjourney)更具社交性。我们有一个巨大的 Discord 社区,大约有 100 万人在这些共享空间中共同想象。

我被“你正在创造一种被增强的想象力,大约有 100 万人在这些共享空间中共同想象”这句话给震撼到了,仿佛看到了那个具有无限可能性的崭新未来,整个人也变得精神抖擞、激情四射。这个世界不需要内耗与熵增,需要的是科技的创新和想象力的进步。

一个由百万人组成的社区,他们的想象力被人工智能增强了

想象力在公共领域被增强后,可以创造出前所未有的“图像物种”,就像 David Holz 向人们介绍的 Journey 小姐——

它(Midjourney 工具)喜欢使用很多蓝色和橙色,有一些最喜欢的颜色和最喜欢的面孔。如果你给它一个非常模糊的指示,它会用它喜欢的方式来创作。所以,我们不知道为什么会发生这种情况,但它喜欢画一张特别的女人脸——我们不知道它来自哪里,来自我们的 12 个训练数据集之一——但人们只是称它为 Miss Journey。

Journey小姐的油画肖像

我们仿佛离“数字原生”的时代不远了。人们曾畅想元宇宙会经历三阶段:

1、 数字孪生(Digital Twin)

现实物理世界向数字世界的映射,以数字化方式创建物理实体的虚拟实体。

2、 数字原生(Digital Native)

完全超脱于现实世界的认知,直接在数字世界中创造现实世界从未有过的虚拟实体。

3、数字永生(Digital immortality)

人类的意识与记忆可以上传到元宇宙当中,最终实现数字世界与现实世界的二元融合,人类在元宇宙中数字化永生,即虚拟人创造虚拟实体。

《元宇宙:通往无限游戏之路》指出元宇宙三阶段

除了现实世界不存在的“人类”,顶级 AI 艺术工具还能重塑“历史”,比如在元宇宙中制造并永久留存完全不一样的“清明上河图”。不禁令后世人深思,到底该相信那个世界的“清明上河图”;“张择端,你永生了吗”?

微软最新推出的顶级AI艺术工具女娲输出的“新清明上河图”

(用 Stable Diffusion 和 Dalle2 在元宇宙中重新创造出一个地球上从未有过的新世界影像吧!)

AI 在数字原生艺术和元宇宙构建领域的“潘多拉魔盒”已经正式开启,吸引了无数创业者将其商业化——

(1)可以即时卖钱的“提示工程”

如前所述,AI 工具需要的文字 prompts 是生产优质作品的关键所在,也是日后构建宏大元宇宙世界的真正“源代码”,而一家名为 PromptBase 的初创公司便打起了它的主意。PromptBase 直接构建了一个交易市场,允许用户通过交易平台买卖提示词(Prompt),目前每个提示词售价 1.99 美元,同时平台向卖家抽成 20%。正如“量子位”介绍的——

平台上已上架不少提示词,生成内容范围从新闻标题、运动队标志、针织娃娃到动物的正装照,应有尽有。

拿“Knitted Doll”这款来说,它能保证让AI生成可爱且风格一致的针织娃娃,但每次生成的具体样式则是随机的。

宛如一款AI盲盒。

目前,PromptBase 仅托管在 DALL·E 2 和 GPT-3 上测试的提示,但创始人 Ben Stokes 对外称,未来平台将拓展到其它系统,最终目的是服务于一种全新的职业——提示工程师(Prompt Engineers)。

未来的提示工程师们,你们准备好赚钱了吗!元宇宙不仅属于像抖音短视频一类的创作者,还属于启发人们接力创作的“提示者”。

(2)一张 AI 图成本 0.03 美金 VS 传统付费图片版权库

在中国,很多企业和商用创作者都需要从专门的商用图片版权平台(如视觉中国)付费购买图片作品,成本花销比较高,而且难以随心所欲地找到完美契合的图片。今天,起码在真实风景和人物摄影这个版块,人们只需要向 Dalle2 支付两毛钱便能立即获取跟自己需求完美定制的 AI 风景。

相信,这一切刚刚开始!

(3)传统社交平台焕发新的活力

近日全球最大的短视频社交平台 TikTok 集成了“AI 绿幕” (AI Greenscreen) 的新选项,即 AI 艺术创作。用户现在可以在对话框里输入一段文字,不到 5 秒,TikTok 便能生成一张竖版画作,用作短视频的背景。

具备社交属性的 AI 艺术有望带来裂变式的 meme 传播效应。我们称之为,强大的 AI 生产力与最大创作者网络组织的结合会带来“美学的暴力传播”。

AI 艺术生产力的意义在于——既成就专业,也普惠大众。让专业的更接近大众,让大众的更理解专业。站在一个平等的平台上,才能开展相互理解的对话。Web3.0 和元宇宙需要共创,但这个“共”字,我们之前太过狭隘了,总以为人是主角,同样这个“创”字,我们总以为是创作,实际上应该是创造。创造意味着所产出之物可影响万物,具有无边界的渗透力。借助 AI 的力量,让我们一起迎接 Web3.0 时代下的“美学大爆炸”!