GPT给数字人装上大脑?

转载
557 天前
9652
看见Metaverse

文章转载来源:看见Metaverse

作者:科技新知

图片来源:由无界 AI工具生成

ChatGPT的横空出世,算是接管了元宇宙的“疯狂游戏”。由后者衍生出的数字人产业,虽然商业路径屡受质疑,但如今借着AI东风,再次被炒得火热。

除了百度、阿里等大厂加码布局外,不少上市企业更是闻风而动,迅速冲到了新市场的牌桌面前。天娱数科、万达信息、蓝色光标、奥飞娱乐等,均提到正在研发相关技术,并且试图将数字人接入ChatGPT。

落地到应用上,包括蒙牛、钟薛高等消费品牌,纷纷推出数字代言人;众多车企、银行推出数字员工;薇娅背后的谦寻也在近期被曝出联合虚拟偶像“星瞳”,开启直播带货的尝试。

更为直观的感受是,打开短视频平台的直播间,AI数字人主播已经取代了不少真人主播,进行24小时无间断带货,甚至像咨询顾问刘润等在更新视频内容时,也都由数字人代替。

并且与此前不同,新一批的数字人,从外观上看几乎和真人一模一样,口型也和所要说的内容保持一致,只是在互动上还常常答非所问,无法实现情绪共鸣。

顺应趋势,以抖音为代表的各大内容平台,开始规范人工智能生成内容,发布行业规范,给出公开态度,这也意味着接下来的市场爆发或在眼前。

那么,为什么已经“凉”过一次的数字人突然又爆火?进入GPT时代数字人会普及吗?未来数字人发展还存在哪些难点?有替代真人的可能性吗?


旧瓶装了新酒


大多数人会以为,数字人是伴随元宇宙的概念诞生的,但其雏形问世的时间还要更早。

2007年,日本公司Crypton Future Media就借助“初音未来”这一IP角色在年轻人心中打上“虚拟偶像”的烙印。尽管“元宇宙”一词可以追溯到1992年发布的科幻小说《雪崩》,但直到2021年Facebook更名为“Meta”后,“数字人”的说法才开始真正走入大众视野。

中国数字经济百人会发布的《数字人:数字经济新赛道》报告称,整个2021年数字人相关企业融资共有2843起,融资金额达2540亿元。

在元宇宙概念的加持下,大众对数字人的热情不亚于当初的初音未来。虚拟博主一夜暴涨百万粉丝的案例比比皆是;更有数字人偶像参加综艺选秀,甚至B站还专门开设了虚拟人直播区。

但风吹过后,有时也很难开出新花。

开发元宇宙业务本就是一项资本密集型的项目,而产业基础设施目前尚不成熟,这也导致诸多投资者损失重大。

仅一年多时间,以Meta为代表的互联网大厂开始因为元宇宙入不敷出,在扎克伯格一句“我错了,我对此负责”后,数字人市场也随之遇冷,逐渐淡出市场视线。

直到2022年底ChatGPT横空出世,接棒元宇宙成为全球科技领域的超级大风口。数字人作为信息技术交叉融合的前沿呈现,再次被推到了聚光灯下。业内人士普遍认为,将能够产生长时间、多轮次、有逻辑文字互动的ChatGPT与数字人相结合,那么一个无限向人类思维靠近的虚拟人即将诞生。

一些热衷追逐前沿的个人或团队,率先进行了尝试。

“这是我的首个数智人分身。”在展示了一期由“本人”出镜的短视频节目后,数字经济学者刘兴亮告诉观众,视频中与他形象、音色几乎一模一样,甚至同样夹杂着山西口音的主播并非他本人,而是以他为原型制作的数字人。

国内著名商业咨询顾问刘润更是将其视频中几乎所有真人出镜部分内容,换成了“分身”。

国外拥有180万粉丝的Snapchat网红Caryn Marjorie,更是开发了AI版本的自己,结合GPT-4,靠利用不同版本的Caryn AI,和粉丝谈恋爱,按分钟收费。

除了视频博主,线上讲师、带货主播、导游、导览等职业,也成了数字人批量“上岗”的热门领域,相关企业纷纷落地产品。

几天前,万达集团首批数字人亮相,这些数字分身采用真人主播形象,并且做到了一人化身多种角色;另外薇娅背后的谦寻也是开始加班加点培训虚拟带货主播;甚至各种定制数字人的广告都已随处可见。

当然,最让行业兴奋的还是,各大平台对数字人的态度开始转变。

因为不得到平台的肯定和支持,博主、商家心里总会忐忑,担心账号有被封禁等风险,继而让服务商也无法顺利推进和解决行业的需求。不过随着抖音率先公开表态,发布平台规范,预计接下来,会有更多互联网平台跟进。

与元宇宙时期相比,现在的数字人明显更加大众化。一位业内人士直言,“去年数字人还只是大企业或网红专属,现在基本上到了每个人都能有自己数字化分身的阶段”。而在「科技新知」看来,其中原因与大模型爆发、成本下降以及应用场景开拓相关。


供给侧突破


从技术实现路径来看,目前国内的数字人厂商主要以NLP技术、多模态融合交互、大模型、XR技术为底。

而随着AI技术的提升和数据资源的丰富,以及更加先进的机器学习算法和深度学习模型的引入,数字人的智能水平得到了大幅提升。其中多模态AI技术使得数字人的交互能力更上一个台阶,感知能力、思维决策、内容输出能力都得到显著改善,在思想、语言、行为上和真人更加接近、更加智能化。

此外,ChatGPT的出现也为业内提供了发展捷径。无论在哪种场景下,交互才是数字人的核心。如果说精美的CGI仅仅为这些数字人提供了一层漂亮的皮囊,那么它还需要一个真正“有趣的灵魂”和“聪明的大脑”。这就是大规模语言模型的用武之地。

数字人与生成式AI的结合,是整个产业发展的关键节点,二者正在产生相互作用。中国传媒大学国家重点实验室中心首席科学家沈浩认为,生成式AI的引入将为虚拟数字人赋予“最强大脑”。业内专家也纷纷表示,虚拟数字人有望成为ChatGPT应用的最佳化身和接口。

数字人和ChatGPT本质上皆是智能度相对较高的人机交互。虚拟数字人可以向ChatGPT发出请求,获取ChatGPT的回答,并将内容呈现给用户,对于企业来说甚至不需要单独训练,便可在短时间内批量生产数字人。目前已有企业在进行这方面的尝试,例如虚拟技术服务商世优科技。

AI技术除了给数字人带来有趣的灵魂外,同时也覆盖了数字人生产运营全流程,为行业带来了更低的成本和更高效率,成为产品快速普及的基础。

事实上,高昂的制作和运营成本一度让不少中小企业望而却步。以此前火爆的“美妆达人柳夜熙”为例,公开信息显示,其3到4分钟的视频制作周期为一个多月,成本高达几十万元。曾经复杂的训练样本数据采集,也导致数字人定制过程长,一定程度上限制了其快速应用落地。

如今,随着技术进步,数字人的制作时长和成本都在持续降低,甚至不少企业都开始了工厂式批量生产。

最开始,业内做一个数字人需要几个月,去年是以几周为单位,今年做一些2D小样本数字人已经可以达到小时级,并且成本降至千元级别。现在只需要录制几分钟的真人口播视频、几句语音素材形成一个“小样本”,再通过基于自监督机制的通用多模态模型经过大规模数据训练,就能获得与真人形象、语音近似的数字人。

在直播行业,数字人的成本优势更为明显。一名采用数字人直播的企业负责人提到:“一个AI主播定制费用是8000元,一年系统使用费8万多元,而一个真人主播平均月薪两万元,一年也要24万元,可以省下来10多万元。二十个主播,一年就可以节省 200 万元。”这还不算“闲时流量”所带来的效益。

更智能的表现以及更低的成本,也挖掘出更广泛的应用场景。之前数字人主流应用可能仅局限在代言、虚拟偶像等轻度互动场景,现在除直播带货外,就连一些博主的日更都采用数字人,另外一些投资顾问、销售甚至医院医师等都逐渐出现数字人的身影。

不过仍要注意,虽然快速低成本生成的数字人在服务性需求契合度上有较大成长,训练完成基本可以接入应用场景;但客观来说,更精细的打磨和团队可控性等等,还都有待完善。


待填的空白


自人工智能问世,“AI威胁论”的探讨就从未停歇。ChatGPT火爆之际,也有人立刻列出了“最可能被ChatGPT取代的职业”清单,数字人带货的爆火也让“取代李佳琦”成了直播行业关注的热点。

不过现在鼓吹AI数字人将全面取代主播、大V等业态,还属言之过早。

首先需要明白的一点,现阶段的数字人主播,还算不上“真正的AI”。

「科技新知」在浏览多个数字人直播间后发现,几乎所有“主播”只能根据前期输入的文本进行复述,动作也是循环播放的,交互能力和随机应变能力几乎为零。

另外,并非所有用户都对数字人抱有好感。“一旦发现不是真人在直播,我会立刻滑走。”一位热衷于在直播间购物的消费者为此做出了解释,自己通常是被主播极具特色的个人风格所吸引,而数字人主播即便再逼真,也很难复刻这种“人情味”。“一个很简单的细节,你打在公屏上互动的语句,主播都看不懂、无法完成互动,甚至无法展示产品,那直播带货的意义何在?”

人机语音交互服务商一知智能CTO李一夫认为,目前生成式AI通过大模型形成答案的速度还比较慢,而交互场景对于实时性的速度要求又非常高,所以当前生成式AI还不能直接运用到数字人的交互上,这个也是未来需要大模型去解决的问题之一。

从平台角度来看,虽然已经有平台明确为数字人发放通行证,但平台强调的重点在于内容是否优质,然而在抖音、快手、视频号上,这些AI直播在某种程度上算是经过了包装的录播和无人直播,既称不上优质,也得不到流量扶持。

所以,未来数字人运营人员还是需要花费精力研究如何获取流量,如何制定更好的内容,并把这些输入小模型,以生成更好地运行脚本。

其次,数字人技术在应用时也需要十分谨慎。

2018年图灵奖得主Geoffrey Hinton曾表示,非常担忧AI所带来的虚假信息传播。这并非空穴来风,国内外饱受AI变脸困扰的明星不在少数。网络上曝出的以人脸、声音合成技术为手段进行诈骗的活动也屡见不鲜。甚至,如果数字人技术用在了直播现场,一旦出现黑客侵入等问题,可能会产生极大负面影响。

因此,在进一步规模化应用之前,数字人技术的安全性保障、数字人运营团队权限的可控性、相关部门的立法监管等方面都有待完善。

经过元宇宙、GPT的双重洗礼,数字人虽已不是新生事物,但行业对其认识还存在不少空白。整体来看,数字人的进化路径由拟人化走向同人化,最终将走向超人化,实现归真超实。当然这个过程中,如何给用户前所未有的情感体验,让用户接纳,如何建设好周边生态,教育好用户,如何建立行业规范标准,健全监管制度,都将成为这个新生产业发展的关键所在。