隐私计算法律与合规研究白皮书年隐私计算联盟中国信息通信研究院云计算与大数据研究所年月引言自党的十九届四中全会将数据列为生产要素以来数据的开放共享交换流通成为大数据产业发展的重点快速发展的隐私计算等数据流通新技术为产业破局提供了关键思路成为建设和完善数据要素市场的重要抓手隐私计算是指在保证数据提供方不泄露原始数据的前提下对数据进行分析计算的一系列信息技术实现数据在流通与融合过程中的可用不可见从隐私计算实现的目标来看能实现隐私保护的同时支持数据价值分析的技术方案都可被列入隐私计算的范畴其中典型的技术路线包括多方安全计算是多个参与方基于密码学技术共同计算一个目标函数保证每一方仅获取自己的计算结果无法通过计算过程中的交互数据推测出其他任意一方的输入和输出数据的技术联邦学习可以实现在本地数据不出库的情况下通过对中间加密数据的处理来完成多方对共享模型的机器学习训练可信执行环境是将软硬件方法构建的安全区域与其他应用和操作系统隔离开使得操作系统和其他应用无法访问或更改该安全区域中的代码和数据从而达到保护敏感数据和代码效果的技术同态加密是基于数学难题的计算复杂性理论的密码学技术能确保在密文上直接进行计算后对输出进行解密得到的结果和直接明文计算的结果一致零知识证明是基于密码学技术证明者能在不向验证者提供任何有用信息的情况下使验证者相信某个论断是正确的差分隐私是通过对数据集添加噪声避免相邻两个数据集在发布聚合计算结果时单条数据记录的泄露数字经济兴起以来各国通过法律法规和国际条约来规范数据的采集和使用提出了授权同意匿名化安全审查等一系列合规要求其目的在于保障国家安全市场竞争秩序个人隐私人身及财产安全个人数据自主权利等法益在数据合规日趋收紧的背景下隐私计算提供了合规前提下充分挖掘数据价值促进数据流通的一种可行的技术解决方案但与此同时如何评估隐私计算技术及产品的合规性如何约定参与方的权利义务以及如何规避法律风险等问题也成为行业普遍关心的热点话题本白皮书从隐私计算的合规意义和常见的误区入手对隐私计算的参与方及相互间的法律关系进行定义和分析在此基础上详细分析了隐私计算参与方应关注的法律和合规要点并给出相应安全和合规方面的建议为进一步分析隐私计算的合规提升效果我们对广告营销企业融资风控个人信贷风控和人脸识别四个场景的技术方案及其隐私保护效果进行了分析最后基于隐私计算发展的现状和未来的需求产业和监管的互信互动将有助于进一步推进隐私计算乃至数字经济的发展本白皮书通过对产业的健康发展进行展望以期隐私计算为数据价值的挖掘和国民经济的发展带来更大的价值版权声明本报告版权属于隐私计算联盟及中国信息通信研究院云计算与大数据研究所并受法律保护转载摘编或利用其它方式使用本报告文字或者观点的应注明来源隐私计算联盟中国信通院云大所违反上述声明者本院将追究其相关法律责任编写委员会主要编写单位排名不分先后中国信息通信研究院云计算与大数据研究所清律律师事务所华控清交信息科技北京有限公司蚂蚁科技集团股份有限公司上海富数科技有限公司同盾科技有限公司北京德和衡上海律师事务所中移动信息技术有限公司中国联合网络通信有限公司研究院北京数牍科技有限公司联易融数字科技集团有限公司参与编写单位排名不分先后北京市竞天公诚律师事务所京东科技控股股份有限公司编写组主要成员排名不分先后仵姣姣闫树吕艾临侯宁熊定中庄媛媛靳晨王云河彭晋白晓媛昌文婷方竞姜康彭宇翔孟丹娄鹤陈国彧朱明烨范东媛王鑫曹咪张立彤史金雨金银玉单进勇陈永侠陈曦魏凯孙中伟李帅袁立志朱垒目录一隐私计算的合规意义一隐私计算有助于提升数据合规二隐私计算应用的常见误区二参与主体及其法律关系一参与主体的定义和主要职能二参与方的法律定性三隐私计算的法律和合规要点一明确数据处理的合法性基础二事先评估全流程风险三参与方管理四数据源合规五关注技术方案的安全性六明确计算模型的归属七关注产出结果的合规性八关注自动化决策的风险九日志审计和监督机制四隐私计算的应用实例效果评估一广告营销场景二个人融资风控场景三小微企业信贷风控场景四金融穿透式监管场景五人脸识别场景五隐私计算合规发展的展望一鼓励创新留足空间二以点带面逐步深入三多方参与各尽其能四层级分明分类监管第一章隐私计算的合规意义年数据安全法与个人信息保护法的出台与网络安全法一同形成了数据合规领域的三架马车这标志着数据合规的基本法律架构已初步搭建完成在此基础上关注重点行业新兴技术的法律和司法解释也在今年密集发布一方面为产业技术的发展提供了更为清晰的指引另一方面也意味着监管强度日渐收紧合规压力日益凸显因此不同行业不同主体间的数据融合流通面临较大的合规压力平衡数据价值挖掘需求和满足合规要求成为数据流通产业急需解决的问题一隐私计算有助于提升数据合规数据安全法第三条指出数据安全是指通过采取必要措施确保数据处于有效保护和合法利用的状态以及具备保障持续安全状态的能力第七条也表明国家保护个人组织与数据有关的权益鼓励数据依法合理有效利用保障数据依法有序自由流动促进以数据为关键要素的数字经济发展可以看出数字经济的发展需要在保护数据安全的基础上发挥数据的使用价值隐私计算技术得以在不转移或泄露原始数据的前提下实现数据融合可用不可见的效果为数据要素的融合流通提供了一种可能的合规技术解隐私计算有助于履行安全保障义务隐私计算可作为防止未经授权访问减少个人信息泄露篡改和丢失的一种技术手段还可以实现在不获知其他参与方原始数据的情况下处理数据因此隐私计算可被理解为是一种加强数据安全的技术措施有助于保障数据处理过程中各方的数据安全为防范安全风险提供技术支撑从法律层面而言应用隐私计算也属于履行法律要求的数据安全保护义务有利于优化数据应用安全环境和维护相关数据主体的权益我国相关主要法律条款如表所示网络安全法第四十二条网络运营者不得泄露篡改毁损其收集的个人信息未经被收集者同意不得向他人提供个人信息但是经过处理无法识别特定个人且不能复原的除外网络运营者应当采取技术措施和其他必要措施确保其收集的个人信息安全防止信息泄露毁损丢失在发生或者可能发生个人信息泄露毁损丢失的情况时应当立即采取补救措施按照规定及时告知用户并向有关主管部门报告数据安全法第二十七条开展数据处理活动应当依照法律法规的规定建立健全全流程数据安全管理制度组织开展数据安全教育培训采取相应的技术措施和其他必要措施保障数据安全利用互联网等信息网络开展数据处理活动应当在网络安全等级保护制度的基础上履行上述数据安全保护义务个人信息保护法第五十一条个人信息处理者应当根据个人信息的处理目的处理方式个人信息的种类以及对个人权益的影响可能存在的安全风险等采取下列措施确保个人信息处理活动符合法律行政法规的规定并防止未经授权的访问以及个人信息泄露篡改丢失一制定内部管理制度和操作规程二对个人信息实行分类管理三采取相应的加密去标识化等安全技术措施四合理确定个人信息处理的操作权限并定期对从业人员进行安全教育和培训五制定并组织实施个人信息安全事件应急预案六法律行政法规规定的其他措施第六十九条处理个人信息侵害个人信息权益造成损害个人信息处理者不能证明自己没有过错的应当承担损害赔偿等侵权责任表数据安全义务相关法律条款隐私计算有助于防止数据滥用个人信息保护法确立了个人信息处理的最小必要原则该原则应当贯穿数据处理的始终最小必要原则可被理解为要求企业和公共机构等数据处理者以实现产品和服务目的为标准在功能可实现的前提下保持克制在最小范围内收集并使用个人信息个人信息采集阶段的最小必要合规要求较容易达到例如将产品使用功能框定在具体范围内梳理需要采集的数据目录并严格将数据采集限制在目录范围内等等但数据使用环节的最小必要要求则较难达到同时也往往因缺乏事中事后的监督与审计机制而难以对数据的后续失控流转追责数据的可用不可见能够有效防止数据明文在使用时被复制而导致的数据滥用得以保证数据的机密性和完整性例如多方安全计算运用密码学算法对数据进行密文计算可信执行环境等机密计算使用软硬件方法构建的安全区域保护其中的数据如果可信执行环境中的代码是按照最小必要的原则设计的那么基于可信执行环境的技术方案也是可控的能够满足最小必要原则的在此基础上参与方可以实现对每一次的数据使用进行授权在授权后再由各参与方共同签订合约明确算法逻辑数据用量和使用次数控制数据滥用成为数据使用过程中践行最小必要原则的技术解隐私计算有助于实现一定条件下的匿名化根据个人信息保护法匿名化是指个人信息经过处理无法识别特定自然人且不能复原的过程从定义而言绝对的匿名化是指无论关联多少数据都无法识别个人无论采用何种技术都不能复原个人信息的状态然而在现有技术发展水平下绝对的匿名化在统计等场景外暂时无法实现绝对的匿名化也会大大减损数据的使用价值可能将导致数据在大多数应用场景中无法使用这与个人信息保护法中促进个人信息合理利用的原则存在一定程度的抵触因此匿名化应当是在一定条件下例如在可实现的算力合理时间范围内等的相对匿名化换言之当一种技术方案能够实现还原部分原始数据所需要的时间算力等成本远远超出使用该部分数据可能获得的价值时我们认为这种技术方案已经实现了事实上的相对匿名化使用隐私计算技术本身不需要对数据进行事先的匿名化处理但隐私计算技术可作为匿名化技术方案的一个组成部分多方安全计算同态加密零知识证明和差分隐私等技术能够实现输入数据和输出数据的隐私保护是实现相对匿名化的有效手段此外结合了数据加密去标识化可信执行环境访问控制等技术的综合解决方案通过构建可信受控的计算环境对个人信息进行去标识化加密等处理使所有的计算均基于处理后的数据展开并通过技术手段对试图关联或还原个人信息的高危行为进行拦截可以实现数据计算过程中的可算不可识在计算结果输出时在可信受控环境中对计算结果进行差分隐私泛化等处理有助于保障数据在非受控环境下无法重识别全方位降低隐私泄露和重标识风险实现在一定条件下的匿名化隐私计算有助于减轻授权同意的合规隐患以个人数据为例在传统中心化的建模中参与方可以获取到各方的原始数据因此可能接触到原始数据的所有参与方都应当受到个人信息保护的诸多复杂限制授权同意是实践中个人数据使用最主要的合规基础之一复杂高昂难落地的授权同意合规负担一定程度上阻碍了数据的流通包含隐私计算的技术方案有助于降低参与方在数据融通中的授权同意压力两种技术方案的授权同意模式如图所示图两种技术方案授权同意的差异在隐私计算中假设获取数据的一手数据源首先获得了个人信息主体没有权利瑕疵的授权同意或在获取数据后对数据进行的脱敏加密处理使计算数据满足了法律要求的匿名化要求那么输入模型的数据不再属于个人信息的范畴此后其他参与方对数据的计算和分析也因此可能不再需要经过个人信息主体的重复授权从而减少了数据流通过程中由授权引发的法律风险和成本支出为了进一步降低合规风险我们仍建议参与方在选择授权同意作为主要合规基础时根据具体涉及数据的类型和敏感程度将授权同意与去标识化匿名化的技术方案加以有机融
信通院 隐私计算法律与合规研究白皮书 2021
文档预览
中文文档
44 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共44页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 路人甲 于 2022-05-26 13:25:07上传分享