一种基于差分隐私保护技术的区块链数据共享平台及方法与流程

文档序号:20205212发布日期:2020-03-27 22:38阅读:2334来源:国知局
一种基于差分隐私保护技术的区块链数据共享平台及方法与流程

本发明涉及数据处理技术,特别涉及一种基于差分隐私保护技术的区块链数据共享平台及方法。

技术背景

近两年来,大数据发展浪潮席卷全球,预计到2020年全球数据总量将达到40zb,全球大数据市场规模将达到800亿美元。数据体量的爆发式增长导致数据的安全、流通、共享以及隐私保护问题逐渐体现,尤其是在共享经济领域,数据技术已经成为共享经济进一步发展的最大瓶颈。如何在对数据提供者隐私进行安全管理的同时实现数据共享,成为当前数据技术领域的重要课题。



技术实现要素:

本发明为解决现有的数据共享过程中的隐私保护问题,提出以下技术方案:

基于本发明的一个方面,本发明提供一种基于差分隐私保护技术的区块链数据共享平台,所述数据共享平台架构包括数据上传模块、数据访问模块、差分隐私数据处理模块、智能合约模块,所述智能合约模块与所述数据访问模块连接。

优选地,所述数据上传模块与所述智能合约模块连接,用于数据提供者上传数据信息至数据共享平台。

优选地,所述数据信息包括数据目录及数据格式。

优选地,所述数据访问模块用于数据访问者发送需求数据查询请求和/或发送需求数据交易请求。

优选地,所述智能合约模块中的智能合约可以被数据访问模块调用,数据访问者发送需求数据交易请求,同时调用智能合约,在得到网络节点验证后,将部分或全部需求数据交易请求写入区块链中发送给数据提供者。

优选地,所述智能合约模块中的智能合约可以被数据上传模块调用,数据提供者利用数据访问者的公钥解密其密文,验证需求数据交易请求的真实性;数据提供者分析需求数据交易请求,利用数据访问者的公钥加密需求数据,调用并确认智能合约,然后将提供的需求数据进行广播,在得到验证后,将完整的交易信息放入区块链中,同时将提供的需求数据发送给数据访问者。

优选地,所述智能合约模块中的智能合约在试图访问数据表的所有节点上运行。

优选地,还包括差分隐私数据处理模块,所述差分隐私数据处理模块与所述智能合约模块连接;所述差分隐私数据处理模块包括分级访问控制模块和数据优化模块,所述差分隐私数据处理模块向隐私数据添加噪声实现差分隐私保护;所述数据优化模块用于提升加噪数据的精度。

基于本发明的另一个方面,提供了一种基于差分隐私保护技术的区块链数据共享方法,数据共享的处理步骤包括:

数据提供者上传数据信息至数据共享平台,在得到网络节点验证后,将数据信息写入区块链;

数据访问者发送需求数据查询请求,在数据共享平台中查找、检索需求数据;

分级访问控制模块向隐私数据添加噪声实现差分隐私保护;

数据优化模块对经过差分隐私处理产生的加噪数据进行优化;

数据访问模块调用智能合约模块中的智能合约,数据访问者发送需求数据交易请求,同时调用智能合约,在得到网络节点验证后,将部分或全部需求数据交易请求写入区块链中发送给数据提供者;

被数据上传模块调用智能合约模块中的智能合约,数据提供者利用数据访问者的公钥解密其密文,验证需求数据交易请求的真实性;数据提供者分析需求数据交易请求,利用数据访问者的公钥加密需求数据,调用并确认智能合约,然后将提供的需求数据进行广播,在得到验证后,将完整的交易信息放入区块链中,同时将提供的需求数据发送给数据访问者。

优选地,所述分级访问控制模块向隐私数据添加噪声实现差分隐私保护的过程包括如下步骤:参数设置:设置数据提供者和数据访问者的信誉度初始值,设置数据数据访问者的角色属性权限度初始值,数据提供者设定数据隐私度;根据数据提供者和数据访问者的信誉度将查询安全可信度与差分隐私的隐私参数量化,并一一映射,每个查询安全可信度等级对应一个隐私参数;对数据提供者的信誉度进行动态评估和反馈。

优选地,所述数据优化模块用于对加噪数据进行优化,过程包括如下步骤:数据优化模块把经过差分隐私添加了噪音的数据导入数据优化的平方根无迹卡尔曼算法中;平方根无迹卡尔曼算法通过先对预测函数和更新函数进行无迹变换,围绕均值选取2l+1个ε点进行初始化;对所得的预测方差阵进行cholesky一阶更新,进而获得方差阵的平方根矩阵;通过更新平方根矩阵来实现滤波对数据的优化处理。

有益效果:

基于本发明的一个方面,本发明提供了一种基于差分隐私保护技术的区块链数据共享平台,包括数据上传模块、数据访问模块、差分隐私数据处理模块、智能合约模块。本发明利用区块链技术实现了数据共享功能,降低了数据共享系平台的成本,提升了平台的信息安全,增强了整个数据交易的透明度。解决现有的存在于数据提供者和数据访问者之间在数据共享过程中导致的隐私泄露问题,通过实现去中介化操作,让数据提供者在为科研机构等分享自身健康等数据的同时能够获得相应的价值收益。

基于本发明的另一个方面,本发明提供了一种基于差分隐私保护技术的区块链数据共享方法,包括:数据提供者上传数据信息;数据访问者发送需求数据查询请求;分级访问控制模块对数据进行差分隐私处理;数据优化模块对数据进行优化;数据访问模块和数据上传模块调用智能合约进行数据交易。本发明借助区块链技术去中心化的原理,通过对数据提供者和数据访问者分别编写其权限相对应的智能合约,实现不可篡改的去中介化数据共享;在数据查询过程中引入基于属性、角色以及信誉度的分级访问控制,实现对差分隐私参数梯度化的合理分配;引入动态反馈机制,实现对提供者信誉度的动态调整;在数据发布前,通过平方根无迹卡尔曼滤波对添加了噪音的数据进行优化,提升数据精度,保障数据的可用性;引入积分机制,即用户通过对数据的共享来获得系统发放的积分,积分发放规则写在对应的智能合约中。通过与科研机构建立奖励制度,让数据提供者获得实实在在的收益,也更大程度的推动数据的供给,以满足科研需求。本发明提出的方法能够更好的对个体用户的健康等隐私数据进行保护,实现对隐私进行安全地权限管理和对数据科学研究价值的充分利用。

附图说明

图1示出了本发明基于差分隐私保护技术的区块链数据共享平台的拓扑结构图;

图2示出了本发明基于差分隐私保护技术的区块链数据共享平台及方法的示意图;

图3示出了分级访问控制模块的示意图;

图4示出了数据优化模块的示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明,此外,需要说明的是,当一个元件被认为是“连接”另一个元件,它可以直接连接到另一元件或者同时存在居中元件,并且包括但不仅限于机械连接、电连接或者通信连接。下面结合附图,以一种基于差分隐私保护技术的区块链数据共享平台及其方法作为实施例来对本发明做详细介绍说明。

如图1和图2所示的一种基于差分隐私保护技术的区块链数据共享平台,包括数据上传模块、数据访问模块、智能合约模块。本发明利用区块链不可篡改的特性,将每笔交易写入区块链的区块内,保障了交易的不可篡改性,即意味着无需第三方认证中心的介入即可实现数据提供者和数据访问者的直接交易。同时,利用区块链的共识机制,可以为用户的数据贡献提供积分奖励;再通过数据访问者(如科研院所、政府部门、保险公司、健身馆等)与医疗机构合作推出的积分兑换服务,实现返利给数据提供者。

优选地,所述数据上传模块与所述智能合约模块连接,用于数据提供者上传数据信息至数据共享平台。

优选地,所述数据信息包括数据目录及数据格式。

优选地,所述数据访问模块与所述智能合约模块连接,用于数据访问者发送需求数据查询请求和/或发送需求数据交易请求。

优选地,所述智能合约模块中的智能合约可以被数据访问模块调用,数据访问者发送需求数据交易请求,同时调用智能合约,在得到网络节点验证后,将部分或全部需求数据交易请求写入区块链中发送给数据提供者。区块链技术中的“智能合约”作为多方协定后按照程序编写的合同,其代码一经执行便不可更改。实施中,智能合约在试图访问数据表的所有节点上运行,然后通过区块链网络广播该块,并且所有的网络节点都验证块,根据所选的一致性算法达成协议,并将块添加到区块链。使用智能合约的主要优点是可以轻松编码任何复杂的访问权限逻辑,具有可强制执行的水平透明度,可追溯性和对临床试验序列的控制。

优选地,所述智能合约模块中的智能合约可以被数据上传模块调用,数据提供者利用数据访问者的公钥解密其密文,验证需求数据交易请求的真实性;数据提供者分析需求数据交易请求,利用数据访问者的公钥加密需求数据,调用并确认智能合约,然后将提供的需求数据进行广播,在得到验证后,将完整的交易信息放入区块链中,同时将提供的需求数据发送给数据访问者。区块链技术中的“智能合约”作为多方协定后按照程序编写的合同,其代码一经执行便不可更改。实施中,智能合约在试图访问数据表的所有节点上运行,然后通过区块链网络广播该块,并且所有的网络节点都验证块,根据所选的一致性算法达成协议,并将块添加到区块链。使用智能合约的主要优点是可以轻松编码任何复杂的访问权限逻辑,具有可强制执行的水平透明度,可追溯性和对临床试验序列的控制。

优选地,所述智能合约模块中的智能合约在试图访问数据表的所有节点上运行。

优选地,所述基于差分隐私保护技术的区块链数据共享平台,还包括差分隐私数据处理模块,所述差分隐私数据处理模块与所述智能合约模块连接;所述差分隐私数据处理模块包括分级访问控制模块和数据优化模块,所述差分隐私数据处理模块用于对交易数据进行差分隐私处理;所述数据优化模块用于提升加噪数据的精度。

优选地,如图3所示,分级访问控制模块的分级访问控制机制主体为数据提供者和数据访问者,分级访问控制机制运行首先需要进行参数设置,包括:设置数据提供者和数据访问者的信誉度初始值,设置数据访问者的角色属性权限度初始值,数据提供者设定数据隐私度;其次,根据数据提供者和数据访问者的信誉度将查询安全可信度与差分隐私的隐私参数量化,并一一映射,每个查询安全可信度等级对应一个隐私参数。本发明实施例中采用laplace(拉普拉斯机制)向隐私数据添加噪声实现差分隐私保护。

具体实施中,查询安全可信度由访问者的可信度和数据提供者的可信度两部分组成,计算公式为:

qt=α·vt+β·dt(1)

其中,qt为查询安全可信度,vt为数据访问者的可信度,dt为数据提供者的可信度,α和β分别为访问者可信度和提供者可信度的权重,且规定α+β=1,对α和β权重的分配依照α:β=vrep:drep来设定,vrep是访问者的信誉度,drep是数据提供者的信誉度。将上述各信誉度量、权限度量和隐私度量量化为0到1之间的标量,具体可以为:评价水平为“低”时,其参考范围为“[0,0.2]”;评价水平为“一般”时,其参考范围为“[0.2,0.6]”;评价水平为“高”时,其参考范围为“[0.6,1]”。同样也可以针对不同的隐私保护需求,进行动态对的调节α和β的权重以实现对数据更好的保护。

实施中,分级访问控制模块所量化的查询的安全可信程度由数据提供者和数据访问者双方的属性值决定,属性值包括双方的信誉度、数据提供者设定的数据隐私度以及数据访问者对应角色属性的权限度。双方的信誉度值越大,表明越可信;访问者的角色或者对应属性的权限越高,所获得的数据越可信;提供者对数据设置的隐私度越低,数据越可信。

访问者可信度vt由访问者的信誉度vrep和对应的角色属性权限度vper两部分组成,权限度和信誉度是服从0到1之间正态分布的随机变量。选用二维高斯函数作为相应的函数,得出访问者可信度vt的计算公式为:

数据提供者可信度dt同样由提供者的信誉度drep和对应设置的数据隐私度dpri两部分组成,考虑到数据隐私度与差分隐私的隐私参数成反比例关系,对公式vt的公式进行了调整,得到提供者可信度dt的计算公式为:

通过公式(1)、(2)、(3),可以计算出查询安全可信度最大值qtmax和最小值qtmin,再将可信等级量化成n个等级,每个可信等级对应一个隐私保护参数ε,则第i个可信等级的区间为

同样,将差分隐私保护参数ε在[0,1]区间内分为n份,与可信等级一一映射。实现更加细粒化、更加安全和快捷的隐私保护。

优选地,本发明还包括数据访问者对数据提供者信誉度的评估与反馈模块,可以增加访问授权的动态性。实施中,数据访问者对数据提供者信誉度的评估与反馈机制在运行时,首先需要为每个数据提供者给予一个默认初始值,当数据访问者对数据提供者的信誉进行评估和反馈后,对数据提供者的信誉度进行相应的升降处理,同时为每个数据提供者设置一个对应于其数据隐私权限的信任阈值,如果数据提供者的信任值大于阈值,则继续保留该数据提供者对应的权限;如果小于信任阈值,则收回权限,不予其提供数据。通过引入评估和反馈机制,可以更好的保障数据的来源和有效性。本实施例中数据访问者对数据提供者信誉度的评估与反馈模块设置在分级访问控制模块内。当然,数据访问者对数据提供者信誉度的评估与反馈模块也可作为一个独立模块存在。

需要说明的是,分级访问控制方法是基于角色和属性的访问控制方法,本发明同时引入对数据提供者和数据访问者信誉度的考量,实现对访问权限分级细化。单纯采用基于角色的访问控制存在诸多不足,如角色的爆炸式增长带来访问控制的配置复杂度呈指数式提升、需要不断进行大工作量的维护且很难保证及时性、用户权限滥用和访问控制粒度较粗等安全问题;而基于属性的访问控制在策略审计方面也更复杂。通过两种访问控制的结合,弥补了单纯的基于属性的访问控制的不足,但仍存在提供者对隐私要求和访问者对数据需求不对等的情况。为此,引入对数据提供者和数据访问者信誉度的考量,结合数据提供者对数据隐私安全级别的设置,动态的量化分析信任度等级并映射到对应的信任等级上,获得相应的隐私保护参数,实现分级访问的控制。同时引入对提供者信誉度的动态反馈机制,依据数据访问者对数据有效性的反馈,来升高或降低提供者的信誉度,实现更好的评估数据的价值和数据有利的共享。优选地,如图4所示,数据优化模块把经过差分隐私处理添加了噪音的加噪数据导入数据优化的平方根无迹卡尔曼算法中,通过初始化ε点,cholesky矩阵方根,预测和更新步骤,实现对添加了噪音后的数据精度的提升。具体实施中,假设数据提供者提供的数据集是非线性的集合。数据集经过分级访问控制模块的处理后被加以符合差分隐私保护的laplace噪声,起到隐私保护的效果,但是在实际的使用中数据的准确性也是不容忽视的问题,尤其是在医疗方面的使用中准确性更为重要。所以引入基于平方根无迹卡尔曼的非线性流数据发布方法,提出了基于平方根无迹卡尔曼滤波的差分隐私数据优化算法dp_srukf,通过在无迹卡尔曼滤波的无迹变换中引入cholesky矩阵方根,在稍微增加计算量的情况下,提高了数据的可用性,同时也保护了数据的隐私。

如图2所示的一种基于差分隐私保护技术的区块链数据共享方法,数据共享的处理步骤包括:

s1:数据提供者上传数据信息至数据共享平台,在得到网络节点验证后,将数据信息写入区块链;

s2:数据访问者发送需求数据查询请求,在数据共享平台中查找、检索需求数据;

s3:分级访问控制模块通过对向隐私数据添加噪声实现差分隐私保护;

s4:数据优化模块对步骤s3中进行差分隐私处理后产生的加噪数据进行优化;

s5:数据访问模块调用智能合约模块中的智能合约,数据访问者发送需求数据交易请求,同时调用智能合约,在得到网络节点验证后,将部分或全部需求数据交易请求写入区块链中发送给数据提供者;

s6:被数据上传模块调用智能合约模块中的智能合约,数据提供者利用数据访问者的公钥解密其密文,验证需求数据交易请求的真实性;数据提供者分析需求数据交易请求,利用数据访问者的公钥加密需求数据,调用并确认智能合约,然后将提供的需求数据进行广播,在得到验证后,将完整的交易信息放入区块链中,同时将提供的需求数据发送给数据访问者。

优选地,步骤s3所述的分级访问控制模块通过对向隐私数据添加噪声实现差分隐私保护的过程包括如下步骤:

s3.1:参数设置:设置数据提供者和数据访问者的信誉度初始值,设置数据数据访问者的角色属性权限度初始值,数据提供者设定数据隐私度;

s3.2:根据数据提供者和数据访问者的信誉度将查询安全可信度与差分隐私的隐私参数量化,并一一映射,每个查询安全可信度等级对应一个隐私参数;本发明实施例中采用laplace(拉普拉斯机制)向隐私数据添加噪声实现差分隐私保护。

s3.3:对数据提供者的信誉度进行动态评估和反馈。

具体实施中,查询安全可信度由访问者的可信度和数据提供者的可信度两部分组成,计算公式为:

qt=α·vt+β·dt(1)

其中,qt为查询安全可信度,vt为数据访问者的可信度,dt为数据提供者的可信度,α和β分别为访问者可信度和提供者可信度的权重,且规定α+β=1,对α和β权重的分配依照α:β=vrep:drep来设定,vrep是访问者的信誉度,drep是数据提供者的信誉度。将上述各信誉度量、权限度量和隐私度量量化为0到1之间的标量,具体可以为:评价水平为“低”时,其参考范围为“[0,0.2]”;评价水平为“一般”时,其参考范围为“[0.2,0.6]”;评价水平为“高”时,其参考范围为“[0.6,1]”。同样也可以针对不同的隐私保护需求,进行动态对的调节α和β的权重以实现对数据更好的保护。

实施中,分级访问控制模块所量化的查询的安全可信程度由数据提供者和数据访问者双方的属性值决定,属性值包括双方的信誉度、数据提供者设定的数据隐私度以及数据访问者对应角色属性的权限度。双方的信誉度值越大,表明越可信;访问者的角色或者对应属性的权限越高,所获得的数据越可信;提供者对数据设置的隐私度越低,数据越可信。

访问者可信度vt由访问者的信誉度vrep和对应的角色属性权限度vper两部分组成,权限度和信誉度是服从0到1之间正态分布的随机变量。选用二维高斯函数作为相应的函数,得出访问者可信度vt的计算公式为:

数据提供者可信度dt同样由提供者的信誉度drep和对应设置的数据隐私度dpri两部分组成,考虑到数据隐私度与差分隐私的隐私参数成反比例关系,对公式vt的公式进行了调整,得到提供者可信度dt的计算公式为:

通过公式(1)、(2)、(3),可以计算出查询安全可信度最大值qtmax和最小值qtmin,再将可信等级量化成n个等级,每个可信等级对应一个隐私保护参数ε,则第i个可信等级的区间为

同样,将差分隐私保护参数ε在[0,1]区间内分为n份,与可信等级一一映射。实现更加细粒化、更加安全和快捷的隐私保护。

优选地,本发明还包括数据访问者对数据提供者信誉度的评估与反馈模块,可以增加访问授权的动态性。实施中,数据访问者对数据提供者信誉度的评估与反馈机制在运行时,首先需要为每个数据提供者给予一个默认初始值,当数据访问者对数据提供者的信誉进行评估和反馈后,对数据提供者的信誉度进行相应的升降处理,同时为每个数据提供者设置一个对应于其数据隐私权限的信任阈值,如果数据提供者的信任值大于阈值,则继续保留该数据提供者对应的权限;如果小于信任阈值,则收回权限,不予其提供数据。通过引入评估和反馈机制,可以更好的保障数据的来源和有效性。本实施例中数据访问者对数据提供者信誉度的评估与反馈模块设置在分级访问控制模块内。当然,数据访问者对数据提供者信誉度的评估与反馈模块也可作为一个独立模块存在。

需要说明的是,分级访问控制方法是基于角色和属性的访问控制方法,本发明同时引入对数据提供者和数据访问者信誉度的考量,实现对访问权限分级细化。单纯采用基于角色的访问控制存在诸多不足,如角色的爆炸式增长带来访问控制的配置复杂度呈指数式提升、需要不断进行大工作量的维护且很难保证及时性、用户权限滥用和访问控制粒度较粗等安全问题;而基于属性的访问控制在策略审计方面也更复杂。通过两种访问控制的结合,弥补了单纯的基于属性的访问控制的不足,但仍存在提供者对隐私要求和访问者对数据需求不对等的情况。为此,引入对数据提供者和数据访问者信誉度的考量,结合数据提供者对数据隐私安全级别的设置,动态的量化分析信任度等级并映射到对应的信任等级上,获得相应的隐私保护参数,实现分级访问的控制。同时引入对提供者信誉度的动态反馈机制,依据数据访问者对数据有效性的反馈,来升高或降低提供者的信誉度,实现更好的评估数据的价值和数据有利的共享。

优选地,如图4所示,步骤s4所述数据优化模块对步骤s3中进行差分隐私处理后产生的加噪数据进行优化过程包括如下步骤:

s4.1:数据优化模块把加噪数据导入数据优化的平方根无迹卡尔曼算法中;

s4.2:平方根无迹卡尔曼算法通过先对预测函数和更新函数进行无迹变换,围绕均值选取2l+1个ε点进行初始化;

s4.3:对所得的预测方差阵进行cholesky一阶更新,进而获得方差阵的平方根矩阵;

s4.4:更新平方根矩阵来实现滤波对数据的优化处理;

s4.5:得到优化数据集。

具体实施中,数据优化模块把经过差分隐私处理添加了噪音的加噪数据导入数据优化的平方根无迹卡尔曼算法中,通过初始化ε点,cholesky矩阵方根,预测和更新步骤,实现对添加了噪音后的数据精度的提升。具体实施中,假设数据提供者提供的数据集是非线性的集合。数据集经过分级访问控制模块的处理后被加以laplace噪声,起到隐私保护的效果,但是在实际的使用中数据的准确性也是不容忽视的问题,尤其是在医疗方面的使用中准确性更为重要。所以引入基于平方根无迹卡尔曼的非线性流数据发布方法,提出了基于平方根无迹卡尔曼滤波的差分隐私数据优化算法dp_srukf,通过在无迹卡尔曼滤波的无迹变换中引入cholesky矩阵方根,在稍微增加计算量的情况下,提高了数据的可用性,同时也保护了数据的隐私。

综上,与现有技术相比,本发明提供了一种基于差分隐私保护技术的区块链数据共享平台及方法,能解决现有的存在于数据提供者和数据访问者之间因交易过程而导致的隐私泄露问题,通过实现去中介化操作,让提供者在为科研机构等分享自身健康数据的同时能够获得相应的价值收益;其次,本发明通过引入对数据提供者和数据访问者信誉度的考量,结合数据提供者对数据隐私安全级别的设置,动态的量化分析信任度等级并映射到对应的信任等级上,获得相应的隐私保护参数,实现分级访问的控制。同时引入对数据提供者信誉度的动态反馈机制,依据数据访问者对数据有效性的反馈,来升高或降低贡献者的信誉度,实现更好的评估数据的价值和数据有利的共享。

以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1