AI绘画碰上经典古诗词,当真是笑不活了

转载
340 天前
9631
绘声绘影

文章转载来源:绘声绘影

来源:量子位

图片来源:由无界 AI生成

用AI给“中文难度10级”的古诗词、文言文配插图,会是什么Style?

B站百万网友会告诉你:堪比“灵魂出窍”,直接绷不住了。

具体啥情况?请各位观众老爷来看VCR。

现在展示的是李白《将进酒》名场面,这下可是真·300杯:

网友:连羊都是喜羊羊

这,已经是“很正常”的了。不信来看最“出圈”的诗圣杜甫名篇《茅屋为秋风所破歌》:

此作一出,网友当即给到“最高评价”:

太抽象了,真有艺术细菌,哈尔的移动城堡之杜甫版……

继续往下看,那叫一个触景生情、情不自禁、禁(jing)天动地……

(注:以上作品展示均来自于B站up主@当铺小说家,已获授权)

噗!各位观众,看到这里可还蚌得住?

没想到有一天AI绘画会以这种“清奇”的姿势被打开。如今在B站,这种玩法已经成为热门创作风向。

这种玩法为什么会火?从网友的点评中可以窥见一二:

“既形象又抽象”、“既写实又魔幻”、“既无厘头又好像很合理”。

今天量子位就在此献上一期特别节目:连线AI绘图与国学经典。

俺们也忍不住动手试了试。


“灵魂出窍”的古文插图


上面所展示的作品的原作者曾在评论区透露,创作时使用的是Midjourney。那咱就也先用Midjourney来试试。

这里首先为大伙儿献上《桃花源记》名场面:

晋太元中,武陵人捕鱼为业。
缘溪行,忘路之远近。
忽逢桃花林,夹岸数百步,中无杂树,芳草鲜美,落英缤纷。
渔人甚异之,复前行,欲穷其林。

怎么说?就,很是正常。其实Midjourney等工具能生成这种比较“精美”的图,大伙儿可能早前就已经见过很多了。

但关键是,怎么能创作出那种“灵魂出窍”的感觉??有一说一,还是很吃提示词的。

我们在倒腾了很多遍之后,终于使用GPT-4,get到了一点“精髓”。

咳咳,白居易的《琵琶行》前来应战。

浔阳江头夜送客,枫叶荻花秋瑟瑟。
主人下马客在船,举酒欲饮无管弦。
醉不成欢惨将别,别时茫茫江浸月。
忽闻水上琵琶声,主人忘归客不发。

接下来直接上高潮:

轻拢慢捻抹复挑,初为霓裳后六幺。
大弦嘈嘈如急雨,小弦切切如私语。
嘈嘈切切错杂弹,大珠小珠落玉盘。

?是不是有点那味儿了?

这就来分享一下我们的制作过程。

就拿“浔阳江头夜送客,枫叶荻花秋瑟瑟”这句来说,我们一开始先把它输给了GPT-4,让GPT-4来解析。(虽然GPT-4的解析可能还会有点问题,比如“王之涣”,但这里对后面生成图片影响不大)

然后加上自己的提示词:

请你根据上面这首古诗的描述帮我生成1幅符合意境的画面,要求画面夸张抽象,输出图像尺寸16:9。

根据这样的提示词,GPT-4生成的图片,可以说不仅正常,而且很“美”:

同样的提示词,再尝试一遍,依旧很不戳:

接下来,让整个图片风格“异变”,其实只需要加上一点“调料”:

请你根据上面这首古诗的描述帮我生成1幅符合意境的画面,要求画面夸张、抽象、拟人化、具有幽默感,输出图像尺寸16:9。

GPT-4这回直接像是“喝大了”?,很是上头:

和之前完全是两种感觉:

一个词就可能让模型整个输出朝向完全不同的方向,难怪ChatGPT等爆火之后,会出现“提示词工程师”这类新职业。

除了这种玩法,我们还尝试不逐句prompt,直接让GPT-4根据《醉翁亭记》中的一段话,生成连环画:

你还别说,你还真别说……

当然也可以有更多玩法,比如根据AI绘出来的图猜猜这是哪句诗?

搭配上AI视频工具,静止的画面也可以动起来:


写在最后


这类视频在B站爆火之后,正如开头提到的,不少网友评论AI绘制的配图“无厘头”中透着合理,“既形象又抽象”。

更有甚者表示,想当年背书那会儿脑子里就是这种画面。

有人认为观看这种图片,可以加强对古文的记忆,也有人认为AI绘画不能“过度”无厘头解读诗词。

值得一提的是,文章开头视频作者、B站up主@当铺小说家也在相关视频评论区置顶了一段话,其中写到:

趣味同时不逾矩,雅致而又知分寸。

那么家人们喜欢这类作品吗?还有上面根据AI绘出来的图猜是哪句诗,应该很好猜吧?