【大文观链】大数据时代,区块链如何将“数据隐私安全”变为商机?

2050 天前
905

链得得注:【大文观链】,是链得得App推出的区块链技术分析系列栏目。由链得得App独家作者马文佩,对区块链、数字货币市场中前端技术方案进行应用层讲解与热点事件的技术层分析。每个工作日与大家一同分享“链圈技术宅”的那些头脑日常。

大数据=没隐私

随着移动互联网、云计算和大数据技术的广泛应用,移动互联网、云计算和大数据等技术的快速发展,孕育并产生了各种新的服务模式和应用,例如打车、外卖等基于位置的服务。这些服务和应用一方面采集用户的相关信息,另一方面为用户提供精准化、个性化的服务,给人们的生活带来了极大便利。然而,所采集信息中往往含有大量包括病史、收入、身份、兴趣及位置等在内的敏感信息,对这些信息的共享、收集、发布、分析与利用等操作会直接或间接地泄露用户隐私,给用户带来极大的威胁和困扰。因此,用户隐私保护已成为人们广泛关注的焦点。

在今年的3·15晚会上,央视曝光了多个外呼公司利用机器人拨打外呼电话,而数据来源则是所谓“探针盒子”。 “探针盒子”可在用户手机无线局域网处于打开状态时,窃取用户手机号码及个人信息,再通过匹配标签,就可以精确的获得每个路人的个人信息并用于广告营销。

在这种背景下,世界各国监管机构都对数据利用和隐私保护进行了立法。最典型的是去年5月《通用数据保护条例》(即GDPR)在欧盟范围内正式执行。该条例规定,企业处理个人数据的业务流程必须在设计和默认情况下构建数据保护,这意味着个人数据必须使用假名(pseudonmisation)或完全匿名(data anonymisation)进行存储,并且默认使用尽可能最高的隐私设置,以避免公开数据未经明确同意被使用。对违规企业的处罚最高可达其收入的4%。

今年一月,法国数据保护机构CNIL宣布,对谷歌处以5000万欧元(约合5700万美元)的罚款,原因是它没有向用户正确披露如何通过其搜索引擎、谷歌地图和YouTube等服务收集数据,以展示个性化广告。

一方面,大数据技术及其带来的衍生服务正在互联网行业占据越来越重要的地位,根据IDC发布的数据,截止到2018年底,中国大数据解决方案市场软硬服总额达到388.8亿元人民币,并有望在2023年超过800亿元人民币,全球市场则将超过3000亿美元。而另一方面,由于日益增多的数据泄露事件,世界各国对于隐私保护的监管也越来越严厉。英国欧华律师事务所( DLA Piper Global Law Firm )一月发布的一份报告显示,自2018年5月25日《通用数据保护条例》(GDPR)实施至2019年1月28日(数据保护日),共有41,502起数据泄露被通报。但该数据仅统计了28个欧盟成员国中的21个,且未包含挪威、冰岛和列支敦士登等虽不是欧盟成员国却归属欧洲经济区(EEA)的GDPR辖区。在这段时间内,监管机构对GDPR违规行为的处罚就有91起。

隐私计算的概念

在这种背景下,兼顾隐私保护和数据利用的计算方式就成为了企业和学界研究的重点,2016年,中国科学院信息工程研究所副总工程师李凤华提出了隐私计算的概念。他认为,隐私计算是面向隐私信息全生命周期保护的计算理论和方法,是隐私信息的所有权、管理权和使用权分离时隐私度量、隐私泄漏代价、隐私保护与隐私分析复杂性的可计算模型与公理化系统。隐私计算涵盖了信息搜集者、发布者和使用者在信息产生、感知、发布、传播、存储、处理、使用、销毁等全生命周期过程的所有计算操作,并包含支持海量用户、高并发、高效能隐私保护的系统设计理论与架构。

简单来说,隐私计算是从数据的产生、收集、保存、分析、利用、销毁等环节中对隐私进行保护的方法。从另一个角度来说,隐私计算是一门“合规化”的生意:各国对于隐私数据的监管越严厉,隐私计算行业的发展前景就越大。正因为这个原因,在以GDPR为代表的一匹严厉的数据隐私保护规定出台后,从事隐私计算行业的企业就越来越多,其中也不乏区块链企业涉足其中。

区块链如何改变隐私计算

区块链技术由于其技术上先天适用于解决信任问题,所以也被隐私计算行业所青睐,公信宝、万象区块链等都是国内具有代表性的、利用区块链技术解决隐私问题的企业。

其中,公信宝采用的是基于TEE(可信硬件)的可信计算协议(Trusted Computing Protocol,简称 TCP)。可信执行环境(TEE) 是Global Platform(GP)提出的概念。是移动设备主处理器上的一个安全区域,其可以保证加载到该环境内部的代码和数据的安全性、机密性以及完整性。TEE提供一个隔离的执行环境,提供的安全特征包含:隔离执行、可信应用的完整性、可信数据的机密性、安全存储等。该技术的核心是企业和个人可以把数据处理模型部署在区块链上,在链下Intel SGX可信执行环境中处理隐私数据,最终把可验证结果存储到链上并更新状态。

万象区块链(PlatOn)采用的是基于MPC(安全多方计算,Secure Multi-Party Computation)的方式。MPC是一种在无可信第三方的情况下,安全地计算一个约定函数的方式,也是电子选举、门限签名以及电子拍卖等诸多应用得以实施的密码学基础。矩阵元的核心是通过部署MPC节点,各参与方可以在本地数据不被归集、隐私数据不被泄露的前提下,共同执行既定逻辑的运算,获取共同想要的数据分析结果。计算参与方只需参与计算协议,无需依赖第三方就能完成数据计算,并且各参与方拿到计算结果后也无法推断出原始数据。

隐私计算虽然是近几年随着大数据技术的告诉发展而出现的新概念,但其核心理念却是随着互联网诞生就出现的:可信计算(Trusted Computing)由TCPA(可信赖运算平台联盟,Trusted Computing Platform Alliance)提出,这个术语来源于可信系统,并且有其特定含义:如果一个实体的行为总是按照预期的方式和目标进行,那它就是可信的。从技术角度来讲,“可信的”(Trusted)未必意味着对用户而言是“值得信赖的”(Trustworthy)。确切而言,它意味着可以充分相信其行为会更全面地遵循设计,而执行设计者和软件编写者所禁止的行为的概率很低。其主要思路是在计算机硬件平台上引入安全芯片架构,通过提供的安全特性来提高终端系统的安全性。

可信计算一度被批评为“垃圾技术”,反对者们认为可信计算背后的那些公司并不那么值得信任,这项技术给系统和软件设计者过多的权利和控制。换句话来说,他们认为这种技术“太中心化”了。这也是区块链技术天生适合隐私计算的主要原因。

虽然区块链能够解决信任的问题,但其他问题依然存在:

首先,区块链的公开透明和全节点验证,数据将流经区块链上的每个全节点,使其无法很好的处理隐私数据:公有链隐私保护一直是一个区块链行业头痛的问题。

针对这个问题,业内已经有同态加密、零知识证明等较为成熟的技术来实现链上数据的隐私保护了。其中,公信宝主要采用的是零知识证明(zero-knowledge proofs,简写为ZKPs),指的是证明者能够在不向验证者提供任何有用信息的情况下,使验证者相信某个论断是正确的协议。在区块链中,节点之间利用零知识证明的方式就可以在不向验证者提供任何有用信息的情况下,使验证者相信这个区块是合法的。

万象区块链(PlatOn)主要采用的是同态加密。同态加密是一种加密形式,它允许人们对密文进行特定形式的代数运算得到仍然是加密的结果,将其解密所得到的结果与对明文进行同样的运算结果一样。换言之,这项技术令人们可以在加密的数据中进行诸如检索、比较等操作,得出正确的结果,而在整个处理过程中无需对数据进行解密。

其次,大数据巨规模、多样化、高增速等特征以及大数据应用的迅猛发展对隐私保护服务请求的用户容量、并发程度和能效优化提出了极高的要求。在这个过程当中,明文大数据分析会导致隐私泄露,而将数据加密之后,大规模数据密态化又会极大的影响分析效率。

这个问题实际上并不止出现在区块链隐私计算过程当中,这是一个大数据行业普遍存在的问题:

对于公信宝这样采取TEE方案的项目而言,由于所有计算过程都在链下的可信任环境中,所以不存在密态数据的计算效率问题:加密数据进入可信硬件中进行解密、计算、加密,最终得到加密数据,形成一个黑箱,在保证安全的同时保证了效率。

对于采用MPC技术的项目来说,MPC至今已经发展了30余年,目前效率在迅速提升,约比明文计算慢两个数量级,目前已支持中大规模商用。另一方面,以万象区块链为例,其主要研发方向是VC(可验证计算)。计算任务都在链下进行,通过VC在在链上生成简短的可验证证明,让每个任务只需要执行一次,其他节点无需重复计算就可以快速验证,以此减少验证上的算力浪费,提升系统的整体性能和效率。

综上所述,区块链在隐私计算行业的应用已经相对成熟。万象区块链的PlatON在其矩阵元体系中占据了重要地位,公信宝也在4月10日发布了其《可信计算协议白皮书》,表示平台会平衡“数据隐私权”和“数据商业效率”之间的关系,公信宝创始人兼CEO黄敏强也向链得得表示,其可信计算协议将结合公信宝、布洛克城、数据交易所等应用构建全新的数据价值平台。

随着5G等全新技术的出现和应用,大数据行业的发展又将进入一个全新的阶段。伴随着大数据行业发展的隐私计算在未来也必然会拥有更大的发展前景。