联邦学习新时代即将到来?标准化联邦交互协议FLEX开源!

原创
1461 天前
1700

你还记得大名鼎鼎的超文本传输协议(HTTP)协议吗?作为互联网应用最为广泛的一种网络传输协议之一,它的出现奠定了整个互联网时代数据通信的基础。

现在,联邦学习领域的“HTTP协议”也诞生了!由同盾科技人工智能研究院自主研发的标准化联邦交互协议:FLEX(Federated Learning EXchange)近日在全球最大的开源社区平台GitHub上开源,也在人工智能顶会NeurIPS的联邦学习研讨会SpicyFL 2020上首次公布。联邦学习的发展即将拉开新的篇章。

联邦学习体系林立,更广阔的空间亟需打通

“看联邦学习了么?最近又有什么新的技术进展!”这大概是人工智能从业者常挂在嘴边的一句话。

作为时下最火的数据安全类技术之一,联邦学习已经走入了银行、证券、保险、医疗、政务、城市管理等各类应用场景。

这有着深刻的时代背景。

社会进入互联网时代至今,企业生产、管理,运营过程的数字化已经在许多行业逐步实现,数据的积累和数据价值的挖掘成为目前关注的重点。除了应用自身积累的数据资源外,使用其他企业机构、其他行业有价值的数据自然成为破解难题的方法之一。与之对应的,如何在使用过程中保障数据的安全,保障个人隐私不被泄露,禁止未授权数据被不当地传播、存储和使用成为了难题。

联邦学习被视为化解这个难题的绝佳技术。联邦学习(Federated Learning)的本质是一种分布式机器学习技术,可以在不交换数据样本的情况下,在多个分散的边缘设备或服务器上训练算法。以达到在数据“可用不可见”的基础上进行安全联合建模的作用。

2017年谷歌AI在《联合学习:协作机器学习没有集中训练数据》的博客文章中首次引入“联邦学习”的概念。2019年,谷歌实现了首个产品级的联邦学习系统,主要侧重针对C端,在移动手机上运行的联邦平均算法和分析。

在国内,以同盾科技知识联邦体系为代表的科技力量,针对B端对于联邦学习技术的研究和应用也在如火如荼地展开,提升到高级别的联邦学习,致力于最终打造可信AI 3.0,帮助中国率先实现下一代人工智能的突破。随着越来越多的机构投身到联邦学习领域,除带来技术的跃迁之外,各联邦之间也出现了一种山头林立、体系割裂的趋势,联邦学习技术的初衷就是为打破数据孤岛而生,而如今却可能带来了新的“孤岛”现象,那么有没有一种方法能打通这么多不同的联邦学习技术架构和应用体系,让联邦能在更广的疆域和空间尺度展开呢?

同盾科技近期开源的FLEX协议为这个宏大的设想提供了方案。

FLEX 何以定义新时代的到来?

“目前市场上各家开发的联邦学习产品五花八门,在实际应用上各不兼容,这就形成了产品上新的数据孤岛和系统孤岛。”同盾科技合伙人、人工智能研究院院长李晓林教授谈起开源FLEX的初衷时表示,他也在NeurIPS-SpicyFL 2020研讨会的圆桌论坛上宣布FLEX开源,不但打破数据孤岛,而且打破系统孤岛。我们希望未来联邦学习技术能够真正成为数据价值互联互通的桥梁和纽带,这就需要有一套标准化的联邦协议去定义技术交互流程,我们的FLEX协议做到的就是这样的事情。

FLEX(Federated Learning EXchange,FLEX)是同盾科技人工智能研究院为知识联邦体系打造的一套标准化的联邦协议。它约定了联邦过程中参与方之间的数据交换顺序,以及在交换前后采用的数据加解密方法。只要参与各方能够遵守这些约定,就可以安全地加入到联邦中提供数据或使用联邦服务。

FLEX协议主要包括两层内容:

l 应用协议:这一层协议是面向联邦算法的,为联邦算法提供多方数据交换的应用支撑。协议中会约定多方间数据交换的顺序和采用的具体密码算法。联邦过程中采用的通信协议也会被封装在这里。

l 公共组件:是上层应用协议所依赖的基础密码算法和安全协议,比如同态加密、秘密分享等。

在整个FLEX协议中,对于基础架构、通信和安全三方面进行了详细的阐述和约定,适用于跨特征、跨样本和迁移联邦学习三种场景下的多种不同算法,清晰的对联邦学习技术过程中联邦共享、联邦预处理、联邦计算、联邦训练、联邦预测、公共组件和联邦安全性等流程进行了阐释和约定,是当前首个开源并定义完整的标准化联邦协议。

同盾科技FLEX协议的开发与开源为联邦学习技术的发展应用奠定了更好的基础。通过FLEX协议,各类高校、研究机构、企业和个人可以对联邦学习技术的开发实现与安全性检测进行更进一步的研究与验证,促进不同行业更快落地联邦应用。

比如在智慧金融领域,FLEX定义的联邦技术可以应用在反欺诈、反洗钱、智能风控、用户画像挖掘、智能交叉营销等场景,帮助金融机构打通内部各部门的数据价值,并利用更多不同外部数据源的价值。在智慧政务领域,政府部门不同委办局的数据将能够在统一的联邦平台上打通,为政府管理和百姓生活提供更好的支持保障。在智慧医疗领域,不同医院的就诊数据、病史信息能够利用联邦模式共享,为医学研究发展和百姓的就医提供便利。

目前,同盾科技的FLEX协议已经在GitHub上进行了开源,后续也将逐步进行完善和更新。李晓林教授对于FLEX协议充满了期待:“我们非常欢迎和希望业界研究使用FLEX协议,也希望更多对联邦学习技术感兴趣的人能够加入到技术的探讨和优化中来,这正是我们开源协议的意义。”