回望AI的发展历程,我们可以清晰地捕捉到几个关键的节点。AI 1.0没有学习能力,无法处理不确定性问题。其后令AI渐入佳境的,则源于由深度学习所触发的AI第二波浪潮即AI2.0。互联网、移动互联网等所产生的海量数据,给机器提供了学习、挖掘和试错的对象。
但伴随此而生的问题是目前的深度学习过于依赖大数据,在一些小数据量的场景下,深度学习效果会非常有限。真正的AI应该像人类大脑那样,通过“小数据”也能进行自我学习,这也是走向AI3.0时代必须要直面解决的命题。
究竟该如何在保证AI模型能力的前提下,大幅度减少所需花费的数据量,打通AI”任督二脉“呢?8月25日,同盾科技合伙人兼人工智能研究院院长李晓林教授,作为国际上最早将云计算、大数据、大规模深度学习、物联网研究贯穿一体的行业执牛耳者,在SIGKDD·SDBD2020 第二届智能数据和区块链应用国际研讨会上带来《知识联邦:用“小数据”实现“大智能”》的专题分享,提出了他的解决方案。
1
2
当前大背景下,数据孤岛是制约AI发展的重要阻碍,公司内部和子公司的部门之间存在很多数据壁垒。不同机构之间的壁垒问题更甚。与此同时,隐私暴露或者数据泄露亦是当下面临的十分严重的社会问题,并且大有成为监管“重灾区”之势。比如脸书(facebook)曾在欧盟因数据泄露遭受巨大罚款。李晓林教授表示:消除各行业的数据孤岛,创新模式让数据协作是未来的趋势,而在此之间,知识联邦可以发挥重要作用。
李晓林强调:知识联邦不是一种单一的技术方法,是一套理论框架体系,是人工智能、大数据、密码学等几个领域交叉融合的产物,使其可以以更合规的方式来打破数据孤岛,在利用数据的同时,做到保护数据隐私。知识联邦的目标就是打造数据安全的人工智能生态,通过数据安全交换协议来有效利用多方的数据,进行知识共创、共享和推理,实现数据可用不可见。
知识联邦结构分为4层,信息层、模型层、认知层和知识层。信息层包括了技术安全查询,模型层包括很多模型,如线性模型、树模型,一些常用的金融模型和深度学习模型,认知层是有迁移学习跨媒体表达和基层学习等等。
知识层包括知识推理、知识融合,图神经网络和知识表达、知识发现。底层包括了密码学,安全的分布式通信,计算机网络,分布式机器学习、深度学习和强化学习等;数据方面则包括了跨样本、跨特征、复合型联盟;功能上包括联邦共享、联盟计算、联邦学习、联邦预测、联邦推理。上面应用场景覆盖了智慧金融、智能金融、智能医疗、智能政务、智能智慧城市、智慧教育等。
李晓林指出:知识联邦的核心理念就是”数据可用不可见,知识可创可共享“,MIT曾有一篇文章说到,“根据梯度的更新,可以反推出原始数据。”但这个问题在知识联邦模型中是不存在的。知识联邦是在密文空间的梯度上面做聚合,所以是属于安全的,未来,同盾科技也希望跟各界同仁一起打造标准化的交换协议。
3
谈及知识联邦的场景应用,李晓林教授以金融反欺诈、疫情预报、艾滋病防控等为例,重点介绍到:知识联邦可以打破数据孤岛,把认知层给提取出来,认知层提取出来之后,再通过加密的手段与第三方做一些融合。通过使用一些迁移方式,或者原协议的方式,从而将各个机构的数据壁垒打破,达到联防联控的效果,这样便可运用至反欺诈,或者做企业征信。比如说一个小微企业,它信息非常有限,那么它有可能有一些关联交易或者关联公司,企业主以及他的社交关系,社交网络、社会活动等等这些信息都能够串联利用起来,这些知识图谱组合起来,可以更有效的判断企业的信用情况。
我们再看知识联邦在此次新冠疫情(Covid-19)大环境下的应用,李晓林表示:同盾科技以知识联邦为基础的疫情预报系统能做到像天气预报一样去预测未来几天实际病例的情况。此前,该模型预估的复工时间也相当准确。基于知识层的解决方案,同盾科技可以做到预报艾滋病的传染路径。艾滋病本身也很私密,很多病友通过一些社交关系去看病的医院,诊疗数据都十分私密,而这个私密性所导致的结果非常难预报,导致艾滋病一爆发就难以控制了。那么这时候知识联邦就能够通过时空人群的流动,时空演变的去可视化以及通过知识图谱、社交网络、人际关系来做一些判断,甚至大众在社交网络上的一些活动和信息都可以传达出来。甚至通过这个知识层,可以预测基因的一些变化。因为传染艾滋之后,它的基因会有所变化。如果将这个基因突破变化的过程结合起来,将会得到相当准确的判断。
文章所载观点仅代表作者本人
且不构成投资建议
敬请注意投资风险
来源:
发布人:算力智库
声明:该文观点仅代表作者本人,不代表火讯财经立场。火讯财经系信息发布平台,仅提供信息存储空间服务。
如文章涉及侵权, 请及时致函告之,本站将第⼀时间删除⽂章。邮箱:840034348@qq.com