圆桌共话:如何冲破数据高墙,连线“数智未来”?

原创
1538 天前
14158

自从数据正式被纳入生产要素,联邦学习、区块链隐私计算等新算法涌现,业界围绕算法数据的讨论不绝于耳。如何寻求数据安全与隐私保护的平衡点?如何把握智能数据与区块链的融合趋势?

8月25日,SIGKDD·SDBD2020 第二届智能数据和区块链应用国际研讨会在线上圆满举办。圆桌会议作为重要剧目压轴登场,上下半场,集结业内知名专家学者,热议前沿话题。 

1

如何冲破高墙,实现数据价值共享

圆桌会议上半场主题为“数据赋能场景,如何驱动产业创新?”由新加坡管理大学终身教授 朱飞达主持,特邀科大讯飞大数据研究院执行院长  谭昶、普元信息大数据产品线经理  臧一超、上海万向区块链股份公司副总经理、万向区块链实验室负责人 杜宇、锘崴科技创始人 王爽 展开深入探讨。

朱飞达教授表示,数据经济经历了三个阶段。第一阶段数据只是商业活动的副产品,人们更多用数据理解过去。第二阶段是大数据与数据经济的兴起,数据被少部分企业垄断而得利。第三阶段则是数据驱动经济,数据成为驱动所有机构组织的共享资产。

从联邦学习、迁移学习到区块链隐私计算,算法也未曾放慢脚步。那么,究竟是数据先行还是算法先行?

在实践层面 谭昶表示算法和数据同等重要,原始数据的获取是进行有效算法的基础,反向数据依赖高质量算法加工得到结果才能落地应用场景。

臧一超认为数据和算法并驾齐驱,基于数据质量的重要性,我们会进行数据应用全生命周期管理。过程中,通过数据治理结合算法构建数据服务平台,形成企业内部的数据生产力。

杜宇从企业自身角度出发,认为在工业板块中数据更为重要,各类工厂也在积极进行数字化转型;站在金融投资视角,算法更为重要,人工智能加上人类智能才能做好投资。投资数据基础单薄的创新型企业,考量的是基于算法解决实际问题的产品服务能力。

王爽持有的观点是数据和算法同等重要,但是不同场景下的医疗场景重要程度有所不同。如新药研发领域,美国FDA批准通过现有的真实世界证据研究的数据支撑推进新药研发,数据重要性不言而喻;如智慧婴儿辅助诊断领域,ImageNet的引入带来分析精度的提高,但模型的精度离不开数据支撑,需要隐私计算技术打通各方数据源,二者缺一不可。

与此同时,未来创新型企业的算法优势受到数据共享、大厂开源工具代码的冲击。开源代码使开发者们得以站在巨人肩膀上前进,而初创公司原有的技术能力或失去市场优势。与会嘉宾分别就开源潮流及其对数据生态和技术未来发展的影响展开对话。

大厂将核心的能力开源是推动产业创新的非常好的手段,如果说是有竞争的话,也是非常良性的竞争。臧一超表示公司本身大量引入开源的架构并基于开源的架构做自主创新,形成标准的产品后加入开源的组织。商业化公司利用开源补技术短板,商业化包装行业解决方案回馈开源社区,起到相互促进的作用。

专业的人做专业的事,谭昶坦言开源本身对于专业人员是好事,从业人员应积极为开源社区贡献代码。作为IT、 AI企业,源于开源又高于开源,将数据加工成专业化商业化的软件投入市场,可构建良好的商业生态。

王爽对于开源是非常拥护的。他认为开源可以建立信任的,内部架构对于外界是透明的,外界可以充分信任隐私保护构架的源起数据保护的,这是建立信任的过程。此外开源可以帮助技术普及,更快深入客户。涉及具体的应用场景,需要商业化运作或专业团队进行定向的优化支持。

参与者共同加入、做大社区,开源代码与区块链的精神气质最为相符。杜宇积极拥抱开源。他表示区块链从比特币一开始都是开源的,极大推进行业发展周期,通过技术方式建立信任实质都是源自开源的基础,受到专业人士的欢迎。商业角度而言,开源消除了行业技术壁垒,企业可将精力转移在解决商业问题和商业模式探索上。

 

综合来看,对于计算机行业,大家共同关注的问题是如何让数据治理使用更加高效;而在非计算方面,数据使用成本等方面鲜有关注,这也引起更全面深入的思考。我们在行业间或公司间,或者个人用户与商业团体之间数据的流通、分享、租赁真正的障碍在哪里?

杜宇表示目前而言数据孤岛是最大问题。区块链倡导开放共享,从公有链开始所有的交易记录全部开放透明,而实际落地,企业、金融机构不会将真正的交易记录与商业机密暴露出来,个人隐私数据不愿公开。政府不同部门、政企之间竖起数据高墙,痛点在于如何打通。区块链加隐私计算技术可以实现产业上下游的数据有效协同共享。

臧一超以智慧园区为例,为中小企业提供数据服务必然涉及税务等个人隐私与数据安全问题,那么,基于目前技术理念如何丰富数据服务生态是关键所在。

谭昶认为数据作为新的生产要素,国内相关法律法规以及数据市场的基础设施亟待完善。只有这样,企业才能实现互信条件下的数据交换。

王爽则认为技术层面区块链加隐私计算能够实现医药领域的数据溯源,法律法规层面积极推动个人隐私保护法、食品安全法及相关国家标准制定,共同实现数据安全有序流动。

2

跨洋巅峰对话,紧跟数智融合趋向

 

圆桌会议下半场主题为“释放数据价值,区块链有何妙用”,由算力智库创始人 燕丽主持,KILT Protocol 创始人Ingo Rübe、Phala Network CEO佟林、树图区块链Conflux联合创始人 伍鸣、 Chainlink中国社区总监 Philip 共同参与。

远在德国的Ingo Rübe开启跨洋对话,他介绍道,团队三年前启动波卡生态项目KILT Protocol,并专注基于区块链的“可验证数字凭证”功能开发,实现信任的传递

佟林介绍团队基于波卡的跨链协议、集成跨链协议后,为很多的区块链和平行链来提供隐私计算的服务。简言之帮助区块链打上马赛克,并且实现数据的可用不可见。

伍鸣表示团队主要通过设计创新的账本结构及共识新解决现有公链性能、共识算法瓶颈的问题,提升以太坊吞吐率,缩短交易确认时间;通过生态兼容,减少或者解决以太坊开放拥堵问题。

Philip希望将预言机(中间件)部分做到去中心化,因为数据源分散,从多个数据源多个节点获取数据上传到区块链,保证去中心化应用的安全可靠,并且不会被攻击。

在区块链和数据的结合层面,嘉宾从各自所在的领域就变化和认知的作了阐述。具体来看,区块链和数据未来可能产生何种内在联系,协作的业务场景端本身如何发挥作用和连接。

伍鸣认为区块链本身是可靠的分布式账本,可以作为可靠数据的载体,承载具有最大价值的数据,如金融信用数据,因此区块链和数据密不可分,区块链承载的数据还能实现通证化。

佟林则指出,目前链上的数据种类和数量远小于链下数据。链上数据的特点是可见即可用,不可见(加密数据)则不可用,但利用隐私安全计算可以实现链上数据的可用不可见。

Philip表示以太坊为代表的第二代区块链,实现了图灵完备的智能合约,它让区块链从数据结构变为世界计算机。团队希望推动智能合约的落地应用,为外部数据准备,可使区块链行业和外部数据结合更为紧密。

Ingo Rübe认为区块链未来应用面临的最大挑战是数据保密性,如Google或Facebook的互联网巨头形成大数据孤岛,数据泄露风险推动监管完善。另外数据高墙林立,对创新型企业服务能力提出更高要求。

实际上,区块链在处理数据或是提炼数据价值的过程中面临多维度挑战,挑战与难点在哪里?与会嘉宾各抒己见。

Philip认为储存、传输、挖掘隐私,对于提炼数据价值都很重要,数据的传输是要优先于其他方法去实现,所以挑战是在保障数据的安全性以及隐私性前提下,将数据准确上链。

Ingo Rübe则从法理上思考了区块链的数据安全性——到底怎样才算安全?GDPR在2012年制定时并未考虑到区块链,但区块链上的数据加密归根结底是数学问题,终究可以解决,因此仍应先聚焦立法问题。

 

 

文章所载观点仅代表作者本人

且不构成投资建议

敬请注意投资风险