阿里云隐私计算工程落地实践与部署案例

导读:隐私计算领域在学术理论方面取得突破创新的同时,也亟需将该技术进行工业化应用与推广。本次分享的题目为阿里云隐私计算工程化最佳实践。此次分享主要介绍了阿里云隐私增强计算平台Datatrust如何将基于密码学、差分隐私技术的联邦学习、安全多方机器学习、安全多方sql分析、PSI(隐私集合求交)等隐私计算技术运用于隐私增强的工程化开发中。讲座具体包含以下四部分内容:

  • 工程化思考
  • 工程化设计
  • 落地实践
  • 价值主张

01

工程化思考

隐私增强工程与传统的产品开发工程相比有哪些变化与区别?会遇到哪些挑战?Datatrust总架构开发师列举了其中五个方面的思考。

1. 稳定性

隐私计算应用于跨地域、跨机房、跨网络的环境。不同的计算方常使用不同的硬件资源,且使用者往往不是专业的运维人员。这些因素要求了隐私计算产品的稳定性。

2. 可维护

对于政府机房不联网等特殊情况,需要高效便捷的方法对产品进行更新,比如制作多版本迭代部署的手册。此外,多端多版本隐私协议需要考虑兼容性问题。

3. 性能和成本

隐私计算计算量大,资源消耗高,如何利用用户的已有资源、地域位置等条件,优化计算过程,降低网络流量,从而用最小的成本实现最大的性能?

4. 客户交付

在客户使用隐私计算产品的过程中,产品的系统、流程、协议需要是可自证安全的。同时,产品要适应不同的网络环境,给予用户适度的权限。

5. 兼容性

产品可以支持多种数据库,如HBase、RDS、ODPS;计算框架,如Hadoop、Spark;传输通道,如S3,OSS的使用。

--

02

工程化设计

1. 工程架构

Datatrust平台的工程架构涵盖四个维度:解决方案、产品能力、无量工程框架、安全技术与理论。

2. 产品版本

  • 混合云版本

该版本中,负责任务调度的功能模块由云上协调中心负责。客户端仅需部署安全多方计算的本地计算引擎。混合云版本的优势有:参与方分工明确,功能聚焦化;只需要云上协调中心对外暴漏接口,适用于金融场景。

  • 独立版本

独立版本中,每一个参与方实现任务配置、调度、计算的全过程。该版本方便客户进行个性化的产品设计。

3. 部署架构

  • 独立部署

在独立部署架构的设计中,一方客户的私域部署了多方任务调度引擎、本地调度执行引擎、LSCC客户端,而另一个客户域仅部署LSCC客户端。该架构适用于点对点交付的场景。

  • 云上部署

云上部署把任务调度引擎部署在第三方机构。计算方均需访问第三方机构。该架构适用于中心化的场景。

4. 模块插件化

政府、互联网、金融企业等机构拥有不同的数据库、计算引擎、存储介质等资源。Datatrust对配置源、数据源、计算引擎等环节进行模块化抽象,以插件的形式满足不同机构的资源条件。

--

03

落地实践

1. 疫苗接种名单处理

Datatrust对医院的城市居民疫苗接种名单与社区居民名单数据进行安全多方计算,服务社区获得居民疫苗未接种名单。

2. 电力精准供给

Datatrust利用电力公司和税务部门两方的数据,通过联邦机器学习技术进行建模分析,预测未来电力供应需求,帮助税务部门制定更合理的电力供应策略,提高电力供给精准度。

3. 信用卡促活

Datatrust利用PSI技术,实现电商平台和银行机构之间的数据共享,促进电商客户使用银行卡支付,保证银行用户的消费粘性。

4. 金融风控

Datatrust协助不同银行进行联合机器学习,提高建模的准确性,协助金融机构提高风控能力。

--

04

价值主张

随着数字化社会的蓬勃发展,数据成为新型生产要素。隐私计算等科技工具如同电网一般,发挥着社会基础设施的作用。隐私计算数据网络正逐渐打通行业壁垒,实现行业间安全的数据互联互通。

今天的分享就到这里,谢谢大家。


分享嘉宾:梁爱平 阿里云 Datatrust总架构师

编辑整理:白皓名 上海交通大学

出品平台:DataFunTalk


01/分享嘉宾

梁爱平|阿里云 Datatrust总架构师

十年左右大数据平台和数据安全相关经验,目前主要负责Datatrust架构设计和开发,完成了Datatrust本地计算引擎、双层调度、安全多方协议编译器等隐私计算平台重要模块的架构和实现。


02/关于我们

DataFun:专注于大数据、人工智能技术应用的分享与交流。发起于2017年,在北京、上海、深圳、杭州等城市举办超过100+线下和100+线上沙龙、论坛及峰会,已邀请超过2000位专家和学者参与分享。其公众号 DataFunTalk 累计生产原创文章700+,百万+阅读,14万+精准粉丝。

发表评论
留言与评论(共有 0 条评论) “”
   
验证码:

相关文章

推荐文章