隐私计算要纵深发展势必要提升算力,兼顾安全
通信产业网|2022-06-07 15:47:29
作者:通文来源:通信产业网

【通信产业网讯】日前,《中华人民共和国网络安全法》迎来正式实施5周年,作为国家实施网络空间管辖的第一部法律,其在中国网络安全发展史上也具有里程碑式意义,为隐私计算发展奠定了坚实基础。

微信图片_20220607154508.png

科技的迅猛发展为社会生活带来了极大的便捷性,但随之而来的是海量个人信息的收集与处理,这些数据的开发利用、价值挖掘、跨境流动等生产活动将给数据安全或个人信息保护带来巨大挑战,而隐私计算联邦学习“数据可用不可见”的技术特性,为培育高质量的数据要素市场提供基础性技术支撑。

何为隐私计算?据了解,隐私计算,是一种由两个或多个参与方联合计算的技术和系统,参与方在不泄露各自数据的前提下通过协作对他们的数据进行联合机器学习和分析。换言之,在隐私计算技术的加持下,数据的处理与分析过程可保持不透明、不泄露、无法被恶意攻击及被其他非授权方获取。

隐私计算发展已走过40余年历程,目前我国也已出台相关法律法规促进隐私计算、数据要素市场发展。从2019年的《中国共产党第十九届中央委员会第四次全体会议公报》首次提出将数据明确纳入生产要素,到2020年《关于构建更加完善的要素市场化配置体制机制的意见》首提培育数据要素市场,再到2022年《关于加快建设全国统一大市场的意见》提出要培育统一的技术和数据市场,政策的推动持续完善数据市场。

在数字经济快速发展,中小企业持续上云的大背景下,宏观层面对于数据要素布局正持续走向深化、细化,数据要素实现安全、高效价值流通,隐私计算作为关键技术解,平衡安全、效率及可用性是当务之急,可信联邦学习应时而来。

找寻效能与安全平衡点

无疑,隐私计算技术为应对个人隐私保护、数据安全隐患和数据孤岛等数据流通的关键难题提出了一种创新的解决思路,成为平衡数据利用与安全的重要路径之一。当前,我国隐私计算技术在政策环境、技术体系和产业态势方面均具备了良好的发展基础,而平衡安全与效率成为重点。

在日前结束的“联邦学习安全效率与开源生态”线上论坛上,众多专家、学者就如何寻求效能与安全的平衡点开展了广泛交流。该论坛由中国信息通信研究院云大所、清华大学智能产业研究院、深圳数据交易有限公司共同指导,FATE开源社区、开放群岛(Open Islands)开源社区、智能投研技术联盟(ITL)联合主办。

传统观点认为,虽然隐私计算是打破数据安全流通的创新解但存在顾此失彼的局面,即注重效率往往需要降低安全性,聚焦安全性又易使效率大打折扣。基于此背景,可信联邦学习的概念被提出。

加拿大皇家科学院及工程院两院院士、开放群岛(Open Islands)开源社区执行主席、智能投研技术联盟(ITL)主席、FATE开源社区技术指导委员会主席杨强指出,在合规、保护隐私安全的前提下,充分发挥数据的价值,促使数据要素高效流通,可信联邦学习基于这样的目标而提出,数据与模型安全可证明,模型性能可使用,效率可控,决策可监督,模型可监管以及普惠,是可信联邦学习的主要特征。

同时,对于可信联邦学习的安全与效能,杨强院士指出,理论研究结果显示,安全和效能是存在的,但不可能有绝对的安全和绝对的效能。若要同时提高效能与安全,需要在二者间寻求一个平衡点,借助威胁模型进行考量。可以定义一个隐私保护的评级系统,具体包含四个维度:数据、算法模型、威胁、保护机制。在四者同时确定情况下,才能够给出一个比较明确的安全评级。杨强院士表示,“目前,安全评级的确立工作还在进行中,希望通过各方合作,共同建立。”杨强院士说。

效率问题本质上是算力提升问题

算力是隐私计算发展的关键。香港科技大学智能网络与系统实验室主任,星云Clustar创始人陈凯教授认为,不解决算力和通信问题,隐私计算的大规模应用将无从谈起。归根结底,隐私计算的效率问题也是算力问题,提高效能需要依靠算力提升。

如何提升效率?FATE开源社区TSC Maintainers成员、星云Clustar CTO张骏雪表示,从技术侧来看,要解决隐私计算的效率问题,需要结合具体企业、具体业务,来进行具体分析,选择最适配的基础构建组件,而不是强行追求统一的方式。“隐私计算可信联邦学习的未来是多技术、多方案融合并举的,要选择最能落地的方案来提升效率。目前,星云Clustar也通过参与FATE开源社区,推动互联互通及标准化建设,以实现可兼容不同类型的加速器促进隐私计算发展。”张骏雪说道。

据他透露,星云Clustar依托自身的算力加速能力及硬件产品隐私计算加速卡,充分应对联邦学习等隐私计算场景,为某互联网银行解决了因使用同态加密而产生的计算压力与延时问题,使端到端性能提升10倍,成功推动联邦学习系统高效运转落地。星云Clustar也与香港科技大学开展联合研究,在技术层面实现奇异值分解效率颠覆式提升,使得奇异值分解效率从全同态方法所需的2年加速到2分钟。

开源开放找寻新拐点

数据要素市场的互联互通离不开多方主体共同创新、开放协作。

针对场景应用中可信联邦学习的价值及挑战,中国工商银行大数据人工智能实验室资深经理胡国强认为,有效标准及体系的缺失是目前可信联邦学习体系建设的痛点。作为联邦学习落地典型场景的银行业,考虑到数据高度敏感,业务涉及机构众多且不同机构之间对于数据开放度和信任度不一等情况,对联邦学习的需求主要体现在可用性、易用性、灵活性以及产品或方案标准化的加强。

据中国信通院调研统计显示,55%的国内隐私计算产品是基于或参考了开源项目。有分析认为,隐私计算技术发展和规模化应用的关键是构建生态,让生态各方连接和协作。而开源项目天然具备技术开放性和迭代能力,各方的互联互通成为生态构建的关键。

中国信息通信研究院云计算与大数据研究所大数据与区块链部副主任闫树表示,当前,隐私计算安全要实现从理想研究安全到产品实现安全的跨越,必须要经过3个标准核验:算法安全,密码安全和产品安全,展望未来,我们认为,对于隐私计算安全性的提升,多技术融合是一个很大的趋势。多方安全计算、联邦学习、TEE三者之间互相融合以取长补短、查漏补缺,从而提升每一个技术的安全性。所有的技术都是各有优劣,它都是无法完全兼顾的,所以这里面就需要结合应用场景,结合各种各样的使用的过程,来综合选择合适的技术不断提高产品的安全性。

目前,国内外主流的隐私计算参与方之间,存在多元化的技术差异,从“数据孤岛”到“计算孤岛”,推动规范与标准完善,促进数据链条各方的互联互通迫在眉睫。中国信通院发布的《隐私计算白皮书(2021年)》指出,开源协同正加速隐私计算的技术迭代。技术复用,开发门槛低,以及问题发现和修复敏捷性等天然优势,开源对于技术变革与规模化起到正向推动作用。

事实上,开源可以有效提高在统一规范约束下数据交易平台的互联互通性、数据流通共享效率以及数据增值能力,帮助中国自主可控开源技术得到更好的发展,促进实体经济跟数字经济的融合。同时,隐私计算作为数据要素流通的重要技术支撑,已有大部分厂商使用开源代码。因此,希望通过基于隐私计算技术的开源社区来撬动整个数据要素流通市场的构建。

无疑,隐私计算联邦学习的发展图景,既有数据要素市场需求与隐私保护合规要求的双重机遇,同时也面临着技术、应用标准化及安全、效率平衡的不小挑战,相信,在产学研用各方通力合作、开放共荣的努力下,终将打开一个更具生命力、可持续的科创新境遇。

2

责任编辑:党博文

【欢迎关注通信产业网官方微信(微信号:通信产业网)】

版权声明:凡来源标注有“通信产业报”或“通信产业网”字样的文章,凡标注有“通信产业网”或者“www.ccidcom.com”字样的图片版权均属通信产业报社,未经书面授权,任何人不得复制、摘编等用于商业用途。如需转载,请注明出处“通信产业网”。

发表评论
×
<xmp id='Elo'><var></var></xmp><blockquote id='USmhIq'><tt></tt></blockquote>
    <address id='KjfekppY'><optgroup></optgroup></address><code id='LZtCnDjb'><comment></comment></code><del id='Ltluqr'><strike></strike></del>
      <strike></strike>
      <u id='dHixiL'><u></u></u>
      <marquee id='Sd'><abbr></abbr></marquee><blink id='unRKu'><b></b></blink><em id='xa'><marquee></marquee></em>