中国银行原行长李礼辉:AI迭代与算力竞争

转载
302 天前
3589
AIGC

文章转载来源:AIGC

作者|中国银行原行长李礼辉

来源|中国金融杂志

图片来源:由无界 AI工具生成

美国微软的人工智能实验室OpenAI于2022年11月30日推出的人工智能聊天程序ChatGPT,2个月内突破月活跃用户1亿大关,成为数字世界最受欢迎的产品,被称为人工智能技术发展的奇点。ChatGPT的全称是Chat Generative Pre-trained Transformer,可以理解为“具有生成能力、经过预训练的人机对话转换程序”。ChatGPT有基于超级算力的学习能力、逻辑能力和语言能力,能够学习、掌握和运用大数据库中各门各类的知识,能够学习、理解和使用人类的语言和表达方式,能够区分语境进行人机对话交流,能够完成撰写邮件、论文、文案、视频脚本、代码以及翻译等任务。2023年2月7日,微软将ChatGPT整合到Bing搜索引擎和Edge浏览器,解决负荷过载问题;3月14日发布GPT-4,建立文本到图像的映射关系,支持图片输入、表格输入和以图编程、据图写作等应用。

ChatGPT带动全球AI应用扩展。Google的Bard使用人工智能技术,将生成式AI融入电子邮件、图片编辑和在线工作工具,以前仅向美英开放,现在扩展到180个国家。2023年3月16日,百度推出生成式AI产品“文心一言”,可以用于商业文案制作、文学写作、数理推算、中文理解、多模态生成等场景。

OpenAI用于ChatGPT学习和预训练的数据基本上是开放和共享的,总体上获得了无断层的数据供给。ChatGPT能够领先同行脱颖而出,关键因素在于,OpenAI从2015年以来投入巨大财力、人力培育超级算力,终于形成AIGC(AI Generated Content/人工智能生成内容)的技术优势。有人最近做了一个测试,挑选评定人类理性思维的4类经典测试任务,包括语义错觉类任务、认知反射类任务、证伪选择类任务、心智程序性任务共26道题目,对ChatGPT进行测试,GPT-3.5的正确率为58%,GPT-4的正确率高达88%,高于人类62%的平均正确率。

ChatGPT的成绩应该能够证明,人工智能技术的创新和应用已经进入迭代升级的新阶段。AI迭代当然可以为开发者创造商业价值,例如目前ChatGPT Plus用户每月须支付20美元,OpenAI的市场估值大幅攀升。至于AI迭代对数字经济社会的贡献,则有待经济学家的评估和测算。

我们必须关注的是,AI迭代揭示的数字技术变局对我国数字经济发展可能造成的冲击和挑战。


一是算力集中与算力竞争


算力主要指数据计算的能力。人们一般认为,数字经济时代,数据成为生产要素,算力构成新生产力。作为基础设施的算力包括以服务器为中枢的硬件和以算法程序为核心的软件。2022年我国算力总规模达到每秒180E(1.8万亿亿次/1.8万京次)FLOPS(浮点运算),据说排名在美国之后居全球第二。

在数字技术应用中,人工智能、大数据、云计算都需要巨大的算力支撑,人工智能计算能力反映最前沿的算力。算力也在很大程度上决定金融竞争力。在金融领域,智能化的信用评估、客户筛选、风险定价、风险控制、投资顾问、保险精算、数字员工等,无不需要数据和算力的支撑。

算力基础设施的建设需要持续投入巨大的财力、人力,要花得起钱,找得对人,还要耐得住寂寞,这就势必导致算力集中。一是向主要国家集中,据非官方统计,美、中两国的算力占全球算力的60%左右。二是向资本巨头和科技巨头集中,绝大多数小企业自有的财力、人力不足以自建有价值的算力。

因此,算力竞争在很大程度上将是主要经济体之间的国家级竞争,以及资本巨头之间、科技巨头之间的企业级竞争。我们需要探讨的是,如何构建一个能够占领全球技术高地的国家级算力基础设施;如何构建一个技术可信任、资源可共享、商业可持续、市场主体可受益的算力生态圈。


二是数据鸿沟与数据治理


不同领域、不同场景的应用程序各有不同的性能、不同的覆盖范围,因而对数据要素各有不同的需求。并非所有的应用程序都需要预训练,都需要大规模的数据。但立足于国家级、企业级的算力竞争,就必然要求国家级、企业级的数据支持。要打造与ChatGPT媲美的生成式人工智能程序,就一定需要无断层、无障碍的数据供给。

问题在于,派生于行政体制、支付模式、地缘政治的数据鸿沟,将对我国的算力建设和算力产出构成实质性制约。

我国具有海量数据规模和丰富应用场景的优势,但公共数据资源的共享模式和移动支付数据的共享模式都不够完善,影响数据要素价值的深度开发。例如,涉及企业的信用数据和行为数据,分散在金融监管部门、金融机构、工商行政管理、税务、海关等不同的局域系统中,开放共享的水平不高,形成行政性的数据鸿沟。我国移动支付用户规模高达9亿,数字化支付成为主要数据入口,互联网平台拥有超大规模的个人数据和企业数据,但互联网平台与金融机构之间的数据关连、数据共享尚未达成成熟的模式,数据鸿沟有待填充。

美国具有全球领先的经济实力和军事实力,科技实力是美国国力的基础性支撑。美国占有全球数据资源,包括西方国家及多数发展中国家的数据资源,这是美国科技创新的结构性优势。在地缘政治环境中,美国联合西方国家对中国设置的技术壁垒不断升级,很有可能从高端芯片、核心软件延伸到数据资源领域,人为制造数据鸿沟。

我们需要探讨的是,如何完善数据治理体系,构建适应数据特征、符合数字经济发展规律、能够保障国家数据安全的数据基础制度,充分实现数据要素价值;如何把握全球数据共享的方向和原则,参与数据跨境流动,在维护数据主权的同时,充分利用全球数据资源,打造算力竞争优势。


三是AI合成与AI信任


AI合成是指应用深度学习、虚拟现实等生成类算法制作图像、音频、视频、虚拟场景等深度合成内容。随着AI合成拟真水平的进化,人们开始担忧AI虚假与AI操纵对社会构成的威胁。

据统计,在爱奇艺、腾讯视频、优酷、抖音、YouTube、Twitter等10家主流平台上,2021年新发布的深度合成视频作品24317件,比2017年增长13.5倍。深度合成内容关注度呈指数级增长,市场动力充沛,2021年新发布的深度合成视频的点赞数超过3亿。

深度合成内容模糊了真实和虚假的边界,最新的深度合成算法可以对抗通用的技术性甄别,甚至可以制作高仿的拟真声纹。菜鸟级别的AI虚假已经被用于实施经济诈骗,还可能被用于诋毁个人信誉和企业商誉。骨灰级别的AI操纵则可能被用于抹黑政治人物或政权实体,操弄负面舆情,制造政治恶意,破坏政治信任,激化社会矛盾。

因此,我们迫切需要重构AI信任。需要探讨的是,如何在技术上和制度上有效对抗AI虚假,如何建立防范AI操纵的防火墙,维护数字经济时代的国家安全。

面对AI迭代和算力竞争的新形势,我们必须加快构建高水平的算力基础设施和先进的数据基础制度,激活数据要素潜能,做强做优做大数字经济,增强经济发展新动能,构筑国家竞争新优势。

第一,建设布局合理、全球领先的算力基础设施。

2023年2月中共中央、国务院印发的《数字中国建设整体布局规划》提出:系统优化算力基础设施布局,促进东西部算力高效互补和协同联动,引导通用数据中心、超算中心、智能计算中心、边缘数据中心等合理梯次布局。整体提升应用基础设施水平,加强传统基础设施数字化、智能化改造。推动公共数据汇聚利用,建设公共卫生、科技、教育等重要领域国家数据资源库。

长三角、珠三角和京津冀3大经济圈是数据发生、数据计算和数字技术人才的集聚区,西部北部一些地区则具有电价低、气温低的优势。算力基础设施的布局和建设,应该锚定全球领先的目标,统筹国家级与企业级,集成新中心与老中心,兼顾人力资源与运营成本。我相信,长三角人工智能超算中心、北斗卫星大数据融合应用产业基地、扬州的德衡数据江苏金融产业园、腾讯的云计算数据中心等,都将成为算力基础设施的标杆。

建设算力基础设施,需要专业化的企业、专业化的队伍。这次扬州论坛的承办方,德恒数据具有数据中心投资建设、运营管理和研发创新的优势,华为和联通具有信息与通讯基础设施建设、软件开发和移动服务的优势。这样一些科技创新的主体,“软硬兼施”,“形神具备”,能打能干,爱拼会赢,是中国的骄傲。

第二,建设优质供给、合规流通的数据要素共享体系。

2022年12月初,中共中央、国务院颁发《关于构建数据基础制度更好发挥数据要素作用的意见》,对构建数据基础制度、更好发挥数据要素作用制定规范,被称为“数据20条”。

数据基础制度涵盖数据产权制度、数据要素流通和交易制度、数据要素收益分配制度、数据要素治理制度等4个方面。数据产权界定为数据资源持有权、数据加工使用权、数据产品经营权,分别建立公共数据、企业数据、个人数据的确权授权机制,保护数据要素各参与方合法权益,完善数据全流程合规与监管规则,构建规范高效的数据交易场所,培育数据要素流通和交易服务生态,构建数据安全合规有序跨境流通机制,健全数据要素由市场评价贡献、按贡献决定报酬机制,更好发挥政府在数据要素收益分配中的引导调节作用,建立政府、企业、社会多方协同的安全可控、弹性包容的数据要素治理制度。

这是我国数字经济基础制度建设的指南,我们要认认真真执行和落实。一是遵循发展规律,创新制度安排,完善数据要素市场体制机制;二是坚持共享共用,释放价值红利,增强数据要素共享性、普惠性;三是强化优质供给,促进合规流通,提高数据要素供给数量和质量;四是完善治理体系,保障安全发展,积极有效防范和化解各种数据风险;五是深化开放合作,实现互利共赢,积极探索数据跨境流动与合作的新途径新模式。

第三,建设可信、可靠、可控的数字安全制度。

数字技术创新驱动经济发展和社会进步,同时也给国家经济安全和社会安全带来风险和挑战。例如,基于人工智能技术的数据造假和信息操纵,基于区块链架构的去中心化金融,还有基于开源软件的恶意木马和技术依赖。

对AI虚假与AI操纵必须高度警惕。重点是提升深度合成内容鉴别技术,及时发现并证明AI虚假,提供对抗AI虚假的公共服务;建立AI信任制度,在立法和执法层面明确禁止AI造假和AI欺诈,赋予合格企业AI信任标志,在国家层级建立预防AI操纵的防火墙,维护数字经济时代的国家安全。

去中心化金融既是未来全球金融监管的热点,也可能是未来国际金融竞争的热点。应有必要深入分析分布式对等架构、去中心化架构等数字化技术已经具备及潜在的“颠覆性”性能,重点研究去中心化金融工具穿越金融基础设施屏障、穿越货币金融主权边界的可能路径,研究技术对策和政策预案,构建数字金融安全屏障。

软件开源正在渗透越来越多的软件产品,可信的开源能够成为数字技术创新的可行路径。在开源格局中,一是要建立软件安全技术标准,建立软件的审核和认证制度,防止存在安全隐患、甚至存在恶意木马的开源软件进入我国;二是加大投入,加大政策扶持,鼓励我国自己的科研机构、科创企业和数字技术人才开发具有自主产权的软件,实现核心软件基础性能、扩展性能、安全性能的优化和均衡,促进我国软件产业的进步与成长。