文章转载来源:论道隐私计算
随着移动互联网、云计算等信息技术蓬勃发展,数据在人们的生产生活中发挥着显著作用,数据共享和利用也已成为越来越多的业务场景规划和落地应用中必不可少的部分。
1982年,我国姚期智院士提出了经典「姚氏百万富翁」问题:两个百万富翁在街头偶遇,双方想竞奢,但他们都不愿暴露自身资产,如何在没有第三方的情况下,推断出谁更富有?
「姚氏百万富翁」问题只是数据流通共享问题的一个缩影,而对这个问题的不同解答则催生出了现如今隐私计算技术体系之一的多方安全计算的几个重要发展阶段——
自百万富翁问题被提出以后,多方安全计算的学术研究开始有论文从理论层面验证不同安全模型下多方安全计算的可行性。这些算法都存在效率低的通病,尚且不能实用。
随着协议的不断改进和计算成本的不断优化,此时理论研究逐渐与实际问题相结合,并有了一定的研究成果。
出现了一些成功部署多方安全计算的实例以及一些利用多方安全计算实现隐私保护的应用程序,同时,一些行业巨头开始尝试将技术落地在数据市场等领域解决多方数据安全交换的问题。
由于多个国家和地区发布数据保护法规,业界希望用此技术来解决数据使用的合规性问题,相关标准制定工作也渐次展开,多领域开始关注和尝试多方安全计算技术。
近几十年来,学术界对多方安全计算的研究蓬勃发展,多种技术路线齐头并进,可实用化的理论研究成果相继出现,为多方安全计算在多场景的应用带来了可能,这项技术也渐渐被越来越多人熟知。
Secure Multi-Party Computation译为多方安全计算,是一种密码学领域的隐私保护分布式计算技术,即在保证多个参与方获得正确计算结果的同时,无法获得计算结果之外的任何信息,从而保证各方数据的安全和私密。
多方安全计算起源于著名计算机科学家、图灵奖得主姚期智教授在1982年提出的百万富翁问题,用密码学技术代替可信的第三方,在保障参与者隐私安全的同时完成计算任务。
目前来说,多方安全计算理论已经衍生出多个技术分支,包括秘密分享(Secret-Sharing)、 不经意传输(Oblivious Transfer) 、混淆电路(Garbled Circuit) 、隐私集合求交(Private Set Intersection)、隐私信息检索(Privacy Information Retrieval)等关键计算协议。
混淆电路又称姚氏电路(Yao's GC),是姚期智教授于1986年针对百万富翁问题提出的解决方案,其核心技术是将两方参与的安全计算函数编译成布尔电路的形式,并将真值表加密打乱,从而实现电路的正常输出而又不泄露参与计算的双方私有信息。
秘密分享是信息安全和数据保密中的重要手段,也是多方安全计算和联邦学等领域的一个基础应用技术。秘密分享通过把秘密进行分割,并将秘密在n个参与者中分享,而每个参与方只能拿到原始数据的一部分。
当想要还原真实数据时,需要所有人把各自所分得的数据放在一起才能实现,缺一不可。秘密分享技术所具备的安全性能被用于保护重要信息,防止信息被丢失、被破坏、被篡改。
不经意传输在1981年由Michael O. Rabin提出,消息发送方发信息给接收方,接收方以1/2的概率接受信息,因此协议交互结束后,消息发送方并不知道接受方是否接受了信息,而接收方能准确地知道自己是否得到了信息,从而保护了接受者的隐私安全,也保证了数据传输过程的正确性。
隐私集合求交是指持有数据的两方能够计算得到双方数据集合的交集部分,而不会泄露交集以外的任何数据集合信息。隐私集合求交通常具备半可信场景、数据最小化、安全双方计算等特点,从而保证数据的安全性。
除此之外,在不同的应用场景中,技术人员与公司会根据需求采用不同的算法来设计多方安全计算方案,随着数据安全和个人隐私等问题日益受到重视,多方安全计算也成为了隐私安全的重要支撑技术。
多方安全计算的优势在于,该技术已经经过大量学术界、工业界的检验,可信性高,并且各个参与方对其所拥有的数据有绝对的控制权,多方安全计算要求中间计算结果也不可泄露,保证基本数据和信息不会泄露。
但另一方面,多方安全计算采用的是密码学路径,会消耗更大的算力,承担巨大的性能代价,而其技术的落地还受到网络带宽、延迟等因素制约。
因此,即便多方安全计算已经存在多年,但由于在计算多个功能时使其可扩展和高效所涉及的挑战,它在落地层面有不小的难度。
不过,目前这样的问题正在逐渐被国内外众多知名科技公司一一攻破,并应用于各类的解决方案中。
蚂蚁集团是移动支付平台支付宝的母公司,为构建数字时代的可信链接网络,促进产业协作和价值创造,蚂蚁集团通过融合交叉区块链、AIoT、数据分析和智能风控等技术,打造出了旗下区块链品牌蚂蚁链,并基于蚂蚁链推出了蚂蚁链摩斯多方安全计算平台。
摩斯多方安全计算平台是一种大规模多方安全计算商用平台,基于多方安全计算、隐私保护、区块链等技术,实现数据可用不可见,解决企业数据协同计算过程中的数据安全和隐私保护问题,助力机构安全高效地完成联合风控、联合营销、联合科研等跨机构数据合作任务,驱动业务增长。
从制造和物流到农业和运输,人工智能(AI)在过去十年中的扩展已经彻底改变了众多行业,想要在其工作流程中采用AI的组织会经历模型验证过程,在验证过程中就有数据泄露的风险。
对此,微软构建了一个开源框架——EzPC:简单安全的多方计算,是一套基于多方安全计算的加密协议,使多方能够协作计算其私有数据的功能,而无需向另一方或任何其他方透露该数据。
在与斯坦福大学的合作中,微软利用EzPC首次实现了生产级AI模型的安全验证,证明无需共享数据即可准确执行AI模型验证。
华控清交信息科技(北京)有限公司是由清华大学于2018年6月发起的信息技术公司;专注于研究、开发和建设基于现代密码学和博弈论的大数据安全融合技术、标准和基础设施。
华控清交推出了PrivPy多方安全计算平台,在保障数据“可用不可见 可控可计量”的前提下,实现了支持通用计算类型、高性能、集群化和可扩展的解决方案。
谷歌在2019年就推出了多方安全计算开源项目:Private Join and Compute,可以快速连接不同数据集的数字列信息,并计算其中数据的总和、计数或平均值,但计算结果只能通过解密才能查看一一这意味着你只能获得结果,而计算过程中的数据是无法获得的。Private Join and Compute旨在帮助组织使用保密的数据集进行协同工作。
谷歌预计Private Join and Compute将在 "广泛的领域" 找到应用场景,这些领域需要组织一起共同协作,而不透露数据中所代表的个人的任何信息,包括(但不限于)公共政策、多样性和包容性、医疗保健和汽车安全标准。
尽管距离技术的大规模落地还比较遥远,但多方安全计算已经在金融、医疗、政务、云计算等领域有了广泛的应用布局。下面我们介绍几个多方安全计算主流的应用场景。
多方安全计算技术在涉及跨机构数据合作的领域将会有更多的发挥空间,例如金融行业。
以金融机构的借贷业务为例,首先须对借款人或企业的资质、资产情况进行审核,避免金融风险。传统方式采用线下人工审核借款方资格,一方面,耗时又耗力,另一方面,数据结果无法多机构通用,免不了效率降低。
但如果借助多方安全计算技术实现隐匿查询功能,通过其他机构的征信信息、客户公共评价信息、商务经营信息、收支消费信息等可以对借款人或企业进行全方位的信贷能力评估,也能够保证这些外部信息的安全性和准确性。
具体而言,查询方采用多方安全计算技术隐藏被查询对象的关键信息,数据提供方只匹配查询结果却无法获知具体对应哪个查询对象,同时保护查询方的查询意图和数据提供方的数据。
在多方情况下进行数据信息挖掘时,参与者往往不愿意共享数据,只愿意共享数据挖掘的结果,这种情况在医疗领域非常常见。
随着医疗行业的数字化得到政策和技术推进,很多的医院和医疗机构积累了大量数据,但这些病人留下的数据都是敏感信息,对隐私保护和数据安全的需求自然会更加强烈。
隐私计算技术也是最先被应用于临床医学研究、基因分析等医疗场景。
应用安全多方计算可以在保护各方数据信息不被泄露的同时多方协作完成数据挖掘。由此,医疗机构、基因测序公司、科研机构等数据提供方,能够实现一些跨机构、跨地域的数据互联互通,在药品研发、药物诊断或者是疫情精准防控方面有了一些相关的落地。
在政务数据应用中,政务机构需要对企业风险进行监测,但主管部门目前接入的数据有限,对地方企业缺乏具体了解,但想要打通各级政务单位的数据则可能面临合规性的风险,于是导致数据孤岛的出现。
但若是需要联合各级单位的数据源,通过多方安全计算可以获得有效的数据输出,从而避免公众形成“公共机构掠夺企业数据”的不安。
通过多方安全计算技术设计的新型政务数据开放开发模型,可以让来自各方的政务数据汇聚成一条河流,实现跨部门数据的融合共享及开发利用,从而充分发挥政务数据资产的价值。
现实投票选举通过采用投票箱、有公信力的计票人或者全程录像直播等方式来确保投票的公平公正。
而在电子投票时,人们并不能确保电脑、手机等网络环境绝对安全,投票结果也有可能被恶意篡改,因此电子投票对于投票人的投票信息是否被正确提交、投票人信息是否不会被除计票人以外的其他人获取等方面提出了更严苛的要求。
而安全多方计算则提供了一个良好解决方案。例如,Cramer等人基于多方安全计算技术提出了首个多选一电子投票方案,之后Damgard等人又提出了多选多的电子投票方案。在1992年,多名日本科学家又提出了FOO电子投票协议以解决电子投票的安全性和准确性问题。
数据想要资产化,首先得实现数据确权。
在多方安全计算的助力下,数据提供方可以规定数据的用途、用量、有效期等使用属性,数据的使用者在拿到数据后只能在授权范围内合理地使用数据,并能够将剩余数据的使用权再次转让给第三人。
多方安全计算技术将数据交易的本质由数据所有权转向数据使用权,数据的所有权和使用权的合理剥离保障原始数据所有者的权益,因此企业或个人更会将数据视为一种重要的资产在数据市场上进行交易,从而促进了数据大规模应用。
虽然隐私计算还处于发展初期阶段,但多方安全计算作为其中一项生命力强大的技术,正在为丰富多样的落地应用场景持续提供了强有力的底层技术支持。
尽管多方安全计算在应用层面相对诞生较早,但正如文中所说,其实操难度相对较高,因此往往又会与其他隐私计算方式相结合,诸如联邦学习或者TEE,这样的结合可以在满足数据安全的前提下,最大限度发挥出各项隐私计算的优势。
我们也看到多方安全计算本身在政务、医疗和金融方面的应用,可以说凭借其理论性的优势,多方安全计算在隐私计算不断开花结果,诞生了一批不错的应用。
同时,在多方隐私计算的理念上,我们还看到了像零知识证明(Zero-Knowledge Proof)这样更前沿的科学,尽管零知识证明依然处于重要攻克的关键阶段,但人们对它的期待不亚于在隐私计算中挑起的一颗新“明珠”,因此多方安全计算本身就受到了诸多隐私爱好者的挑战,不管是资本还是创业者。
但从目前多方隐私计算的发展来看,我们还需要从系统的精度与性能方面加以提升,并不断提高系统的易用性,毕竟一个良好的系统还需要密码学家全程参与实在缺少应用性。
另一方面,正如我们上文所说,多方安全计算还需要通过与其他技术的融合来提供它系统本身的安全性,毕竟单一的隐私计算方式还是缺少完备的系统,而这也是隐私计算本身发展的一个大趋势。
或许,随着越来越多计算方式的加入,我们会看到更好的多方安全计算出现,也会有更多有趣的技术方式被发现或者被攻克,毕竟多方安全计算规模化应用还不足5年,依然还有很多期待。
来源:论道隐私计算
发布人:暖色
声明:该文观点仅代表作者本人,不代表火讯财经立场。火讯财经系信息发布平台,仅提供信息存储空间服务。
如文章涉及侵权, 请及时致函告之,本站将第⼀时间删除⽂章。邮箱:840034348@qq.com