运营商大模型,数字中国的一枚“落子”

转载
311 天前
5159
脑极体

文章转载来源:脑极体

2023年以来,三大运营商相继推出自己的大模型,布局动作和规模不小,也让不少问题萦绕在读者心头:

中国并不缺大模型,为什么运营商还要做大模型?

目前,“百模大战”的竞争烈度已经翻倍,2023年11月发布的《北京市人工智能行业大模型创新应用白皮书(2023年)》显示,仅北京地区的AI大模型数量就达到115个,约占全国的一半。

在全国多达两百多个“竞品”中,运营商大模型真的不可或缺吗?

运营商靠通信起家,在大模型人才、算法、工程能力、供应链上,无法与互联网公司、AI企业等玩家拉开大的优势。运营商做大模型,主打一个“题海战术”。

我们简单梳理了一下2023年三大运营商做大模型的进展,从下图可以看到,每家都面向多个行业,推出了多个大模型,中国电信前不久一口气发布了12个垂类行业大模型,这在AI圈都是非常炸裂的。



做大模型可以,但有必要这么卷自己吗?

本文就从运营商“落子”大模型,看看背后数字中国基础设施的棋局,以及接下来,运营商大模型的“棋路”走向。

“数字中国”的棋局,运营商持续落子

中国运营商做大模型的热情高涨,和海外运营商形成了鲜明的对比。

欧美运营商并不是不关注AI、不做大模型,但往往选择与谷歌、Meta、OpenAI、微软等科技企业合作,并且,更重视在业务中引入AI能力,大部分都没有推出自研大模型。

比如,AT&T就通过部署OpenAI工具,打造Ask AT&T智能问答系统,沃达丰则基于谷歌云构建AI Booster平台,用生成式AI来转录电话,使能客服应用。为数不多的自研大模型,比如德国电信与韩国SKT计划研发的大语言模型,也是针对电信企业需求定制的。

总体来看,国内三大运营商对大模型,无论是反应速度、研发深度,还是覆盖广度,都格外突出。

为什么会出现这种情况呢?就必须提到运营商在数字中国基础设施中的特殊位置。

相信很多人都不会否认,大模型及各种智能应用的需求飙升,需要与之匹配的数字基础设施。而中国正面临着“一卡难求”的算力供给可持续问题,面临着海外高性能算卡断供的供应链风险,面临着国计民生行业数据计算处理的安全考量。同时,大模型要支撑全社会数字化、智能化转型,还会面临经济效益与公共普惠之间怎么平衡的问题。

此前,中国创造性提出并实施了东数西算工程,通过算力的集约型发展和集中化使用,有望解决大模型算力荒、算力贵、能耗成本高等问题。

2022年2月“东数西算”工程正式全面启动,国家算力枢纽节点启动建设。目前看来,确实发挥了应有的作用。最典型的体现是,从以前单一的“东数西存”“东数西备”,发展出了“东数西训”“东数西渲”这样的应用模式,有效提升了算力资源使用率。将AI模型训练、影视动画渲染等放到西部地区数据中心完成,已经成为东数西算的新业态。

大模型到来之后,大数据、大算力也指向了高耗电、高带宽。“东数西算”工程任重道远,进一步推动全国一体化大数据中心建设重大工程,夯实大模型背后的数字基础设施,运营商在三个方面,起到了不可替代的角色:

1.数据流得动。“东数西训”表面上只提到了“数”和“训”,其实背后很重要的一点是“运”,大模型超大规模的数据参数,需要一个发达的数据网络进行传输,实现数据灵活的跨区域的流动。过去几年里,运营商参与到全国范围内的新型数据中心建设。一位IT从业者告诉我,“跨区域的数据流动,这个需求第一个提出来的就是中国移动,它们要实现数据在东西地区的流动,我们才设计了这个功能”。运营商的通信网络,是大模型数据和算力流动的“承重墙”。

2.行业信得过。千行百业使用大模型,安全永远是第一位的。尤其是国计民生行业,出于数据安全方面的考虑,无法使用公有云服务去训练大模型。假如数据丢失了,对很多央企和政府部门来说,就是政治责任。所以,这些行业应用大模型,对服务商的全栈自主、可信可靠,提出了更高的要求。有国家背书的运营商,无疑可以打消这些领域对大模型的存、算、运等方面的安全顾虑。

3.社会用得起。“东数西算”工程的八大枢纽、十大数据中心集群,通过大模型,真正被千行百业“用起来”,运营商可以利用自身在云基础设施、算力成本、资源调配等优势,提供普惠的公共算力服务,加速 AI大规模普及,让大模型深度渗透到行业场景与应用中。从这个角度看,运营商布局大模型,也将进一步强化“东数西算”数字中国基础设施的社会效益。

总的来说,大模型提供了一个契机,让运营商不仅仅作为算力基础提供商,还可以整合自身在全国一体化算力网络、政企市场、云服务等领域的多种优势,更积极地参与到智能化升级与数字化转型中,重构自身在数字化业务中的竞争优势。

运营商落子大模型,不想错过“数字中国”这盘大棋局。

四子围城,运营商的安全地带

如开篇所说,在风起云涌的全球大模型竞赛中,运营商无论是人才、技术、激励体系等,都难以跟谷歌、微软、OpenAI、BAT这样的科技大厂竞争。所以欧美运营商才普遍选择与科技企业合作,而非自研大模型。

国内运营商就“艺高人胆大”吗?这也太瞧不起深耕AI十多年的中国AI企业与科研院所了吧。非也。

下围棋的人知道,围棋的基本常识是围出一个己方的安全区域,对方不能下子,有时候四子围城就足以锁定胜局。而从开篇的图表中,我们可以看到运营商做大模型的普遍特征:

1.都不做通用大模型,而是打造自己的基座模型;

2.都加紧贴合场景,尤其是国计民生重点行业,垂类行业大模型一个比一个多;

3.都不比拼模型参数,而是比拼数据积累、算力服务、MaSS、生态开源等。



显然,运营商也很清楚,自己的优势并不是跟OpenAI、百度、科大讯飞、清华、中科院等AI“大拿”拼算法、拼技术创新性,而是需要强调四种能力:

能力一:安全。目前很多省市政府,已经把AI大模型纳入本地区的中长期发展规划,推进产业转型升级。国计民生行业用大模型,“国云”“红云”是最优选,基于运营商大模型及Mass服务,获得安全可信的大模型训练和部署环境,结合行业私有数据进行训练精调,服务于业务。

能力二:网络。运营商的高速网络,实现跨域的东数西算、东数西存、东数西训和云边协同,支持当地数字经济的发展,能有效带动了运营商大模型相关算力、服务。比如中国电信天翼云,就在贵州优先布局大模型训练算力,并将贵州逐步建成大模型训练中心,天翼云的政务大模型“慧泽”也在贵州的县市落地。



能力三:AI。中国运营商之所以能在大模型浪潮中,比欧美运营商更快响应,正是在过去几年的数字化转型中,运营商也参与了产业AI化的进程,积累了很多算法能力。中国电信的中电信人工智能科技有限公司,累计申请专利200余项,并在18项国际AI竞赛中荣获冠亚军;中国移动于2013年成立“九天”团队,目前已经在机器视觉、语音、自然语言处理、网络智能化等领域,形成了超370项AI能力。中国联通也不例外,自研了60多项核心算法,鸿湖大模型在2022年就启动研发。

能力四:定制。解决垂直行业细分领域的业务问题,需要深度定制,运营商此前服务了大量的垂直行业的客户,积累了庞大的业务数据,当其他大模型厂商头痛于行业专有数据稀缺、客户关系难建立的时候,运营商反而可以弯道超车,凭借良好的客情关系、用户行为数据积累、行业场景洞察,率先“抢跑”垂类行业大模型。

比如中国电信TeleChat对外与智慧政务结合,为政务客户提供政务短信智能化多轮问答服务;中国移动重点推进2B领域企业应用,输出客服领域的智能交互服务,以及企业通话等网络智能化能力。中国联通联合行业推出的医疗算网大模型,也发挥了其在数据、网络上的优势。

通过大量的垂类行业大模型,满足客户的定制化需求。这种拼数量的“题海战术”,估计会在2024更加激烈地上演。

运营商做大模型,采取“四子围城”的策略,用自己的独特优势,围出了一个比较有竞争力的“发育空间”。

劫争之地:运营商大模型的产业纵横

看到运营商大模型的独特优势,也要正视其难关与挑战。正如高手对弈,有时候一个棋子被对方围住,又有能力在下一步将对方围住,这个拉扯争夺主动权的过程,被称为劫争,让整个棋局变得复杂。

现实中的大模型,也并不是一个“技术-商业”的简单游戏,中间存在着大量的影响因素和不确定性,再加上两百多个国产大模型的激烈竞争,都让运营商大模型的前景,存在着很多未知。

其中有几个地方,是很可能影响成败的“劫争之地”:

首先是服务能力。

行业使用大模型,并不是给一个大模型就完了,还需要一系列数据治理、算力服务、模型工具、场景洞察等体系化支持。甚至有的企业,大量话术、专家经验都没有文本化、数字化,需要大模型服务商从数据采集开始做。大模型等数字化业务,与传统通信类业务相比,需要更强的服务精神,更高的服务效率,更主动的服务意识,这对偏向于保守的通信运营商来说,是一个挑战。

然后是产品化能力。

服务能力的体现之一,就是降低客户应用大模型的门槛。以百度、科大讯飞为代表的AI企业,都非常强调产品的工程化能力,提供完善、全面的工具链支持,从开发平台、工具化组件一应俱全。目前,三大运营商也都推出了大模型MaaS 能力和工具,为客户提供一站式服务,这些产品能否真正帮助企业解决大模型训推痛点,还有待更充分的数据和案例。

另外,数字化有场景杂、伙伴多的特点,运营商能否以开放心态发展生态伙伴,还要打一个问号。

大模型使能数字化转型升级,并不是一家厂商就能完成的,产业内有大量繁杂、细分的场景,需要依靠伙伴去触达、去满足,没有伙伴,就没人去为用户解决那些隐藏在深处的痛点。

在产业链中更具话语权的运营商,能否以开放、共赢、合作的心态,汇聚大模型上下游企业伙伴,为伙伴赋能商业价值,形成繁荣的大模型创新生态,目前还难下定论。



这些“劫争之地”,也会成为接下来,其他大模型服务商如AI科技企业、公有云厂商等,与运营商展开争夺的校场。

如果说OpenAI等科技大厂是“大模型特种兵”,抢占的是前沿技术突破的先头高地,那么运营商大模型,则是稳扎稳打的“步兵团”,具备全面开花、深度落地的作战能力。

而作为网络强国、数字中国的主力军,运营商必须将大模型这步棋,走好走稳。