AI画画催生新职业:现在出售DALL·E2提示词就能赚钱,平台抽成20%

转载
864 天前
10456
奇幻空间

文章转载来源:奇幻空间

来源:AI新媒体量子位( ID: QbitAI)

衡宇 发自 凹非寺

DALL·E 2、GPT-3提示词在线交易平台,了解一下?

最近,一家初创公司PromptBase,允许用户在该平台买卖提示词(Prompt),提示词售价为1.99美元。PromptBase将向卖家抽成20%。

平台上已上架不少提示词,生成内容范围从新闻标题、运动队标志、针织娃娃到动物的正装照,应有尽有。

△用户尝试用DALL·E 2生成包含皮卡丘形象的图片

拿“Knitted Doll”这款来说,它能保证让AI生成可爱且风格一致的针织娃娃,但每次生成的具体样式则是随机的。

宛如一款AI盲盒。

目前,PromptBase仅托管在DALL·E 2和GPT-3上测试的提示,但创始人Ben Stokes对外称,未来平台将拓展到其它系统,最终目的是服务于一种全新的职业——提示工程师(Prompt Engineers)。

什么是提示工程?

提示工程(Prompt Engineering)是伴随预训练模型和少样本学习诞生的概念,可用很小的代价让AI执行全新的任务。

换句话说,就是把任务用文字描述出来喂给AI,AI理解之后便能直接执行,无需再次训练。

创建具有特定画家风格的图像就是一个典型案例,比如输入提示“日出时分安坐在田野里的狐狸,莫奈风格”,你将得到:

提示的描述风格没有固定,任君选择。

你想在得到的图像中有一只考拉,有一辆自行车。你可以写作“一幅考拉骑自行车的儿童画”,也可以写“一张考拉骑车的老照片”。

如此自由度,让GPT-3的生成文字和DALL·E的生成图像等应用风靡一时。

不过对于人类玩家来说,想要让AI稳定的生成自己满意的作品也不是一件容易的事。

网络上不断有人在分享自己试验出来的技巧,让人眼花缭乱。

猜猜看,使用DALL·E返回“一幅非常漂亮的画,画中一座山紧邻瀑布”和“一幅非常非常非常漂亮的画,画中一座山紧邻瀑布”两个提示,哪个输出的结果会更好?

答案是后者。

因为DALL·E 2对“非常”这个词赋予了极高的权重。2022年斯隆研究奖获得者,MIT电子工程与计算机科学系助理教授Phillip Isola在Twitter上做了个有趣的试验。用0个very和22个very分别修饰了“一幅画,画中一座山紧邻瀑布”这一提示。

最终结果对比如下:

△0个very(1、2行)和22个very(3、4行)修饰提示后分别输出的图像

果然,“very”数量越多,图像就更精美。

另外德克萨斯大学奥斯汀分校的一项研究中,研究人员记录了大量使用DALL·E 2生成图像的提示词,其奇怪程度堪称“魔咒”。

拿这俩不知所云的词组举例:

1、Apoploe vesrreaitais(以下简称词组1)2、Contarra ccetnxniams luryca tanniounons(以下简称词组2)

是真·不知所云,翻译软件看了都能原地懵圈。

但在DALL·E这儿,词组1的代表着“鸟”,词组2代表着“虫子/害虫”。

如果告诉DALL·E“词组1 eat 词组2”,你会获得这样的图:

现在是否能够理解,为啥把提示比作“咒语”了——一些不知道在说啥的词,恰好对应着系统的一些内部逻辑。

总的来看,提示一定程度上快捷地满足了“所需”。

但要玩转这些AI还需要讲究很多技巧,对懒人来说,在PromptBase这类平台上购买提示,省事儿多了。

提示卖钱,这个商业模式成立么?

来正经说说买卖提示这事儿。

此前,以DALL·E为主, 许多研究人员和爱好者已经发布过免费的流行AI系统提示词资源。

作为最早将提示词商业化的公司之一,PromptBase饱受争议。实际上,AI社区内部一直存在着关于哪些研究应该或可以商业化的争论。

出售提示并不违反任何AI提供商的服务条款,也没人能阻止PromptBase客户使用购买的提示。

不过,由于背后涉及一系列道德和法律问题,不乏有人将其视为不该打开的“潘多拉魔盒”。

首先是信息泄露问题。

研究表明,在大量公共数据(如GPT-3)上训练的语言系统在输入某些提示时,会“泄漏”更人信息,包括姓名和地址等。

再者,如果提示DALL·E 2生成“宝可梦的3D模型”,就难免涉及对任天堂公司的侵权问题。

△用户尝试用DALL·E 2生成包含皮卡丘形象的图片

研究人员还推测,DALL·E 2的“咒语”,可以绕过其违禁词过滤器,从而生成一些原本禁止的图像,比如暴力图像。

以及,虽然PromptBase表示会严格审查,确保提示不违反任何“AI生成规则”,但如果业务增长、市场扩大,严格的审查水平可能难以维持。

德国萨尔州学院的计算语言学家 Vagrant Gautam也认为提示商业化可能会导致提示滥用。

同时,她也觉得这是一把双刃剑。毕竟,提示可以卖钱,懂技术的人可以把副业搞起来了。

“提示商业化指出了提示工程的重要性,以及创造力、耗时、对抗性思维等所需技能的重要性。”Gautam说。

用户对提示商业化的抱怨,主要集中在免费调整提示的次数太少。

但转头一想,人们又必须采取这种反复试验、对抗性的方法来搞明白怎么促使生成模型,完成自己的“所需”。

看到这里,你是否会购买提示词呢,或者会不会考虑出售提示词赚点外快?

参考链接:[1]https://promptbase.com[2]https://techcrunch.com/2022/07/29/a-startup-is-charging-1-99-for-strings-of-text-to-feed-to-dall-e-2/