CN114638005A - 基于区块链的数据处理方法、装置及***、存储介质 - Google Patents

基于区块链的数据处理方法、装置及***、存储介质 Download PDF

Info

Publication number
CN114638005A
CN114638005A CN202210301183.5A CN202210301183A CN114638005A CN 114638005 A CN114638005 A CN 114638005A CN 202210301183 A CN202210301183 A CN 202210301183A CN 114638005 A CN114638005 A CN 114638005A
Authority
CN
China
Prior art keywords
data
sensitive information
classified
determining
information type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210301183.5A
Other languages
English (en)
Inventor
喻聪龙
王辰淅
杨卓
李正煜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ant Blockchain Technology Shanghai Co Ltd
Original Assignee
Ant Blockchain Technology Shanghai Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ant Blockchain Technology Shanghai Co Ltd filed Critical Ant Blockchain Technology Shanghai Co Ltd
Priority to CN202210301183.5A priority Critical patent/CN114638005A/zh
Publication of CN114638005A publication Critical patent/CN114638005A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/602Providing cryptographic facilities or services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/64Protecting data integrity, e.g. using checksums, certificates or signatures

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Hardware Design (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本说明书一个或多个实施例提供了一种基于区块链的数据处理方法、装置及***、存储介质,其中方法包括:通过区块链***获取数据处理请求方的待处理数据,待处理数据为对目标数据进行加密所得到的密文数据,目标数据包括数据处理请求方配置的加密秘钥,以及,待分类分级数据的抽样数据和/或元数据,对待处理数据进行解密得到目标数据,根据目标数据,确定待分类分级数据所属的敏感信息类型和敏感信息级别,利用加密秘钥对敏感信息类型和敏感信息级别进行加密,通过区块链***将加密后的敏感信息类型和加密后的敏感信息级别返回至数据处理请求方。

Description

基于区块链的数据处理方法、装置及***、存储介质
技术领域
本文件涉及数据处理领域,尤其涉及一种基于区块链的数据处理方法、装置及***、存储介质。
背景技术
随着互联网技术的发展,通过互联网技术处理的数据越来越多,数据的安全性是当前关注的重点。数据分类分级是各行业对数据进行管理的前提和基础,也是建立统一完善的数据生命周期安全保护框架的基础工作,能够为各行业制定有针对性的数据安全管控措施提供支撑。基于此,有必要提供一种技术方案,以实现数据安全可靠准确的分类分级。
发明内容
本说明书一个或多个实施例的目的是提供一种基于区块链的数据处理方法,包括:通过区块链***获取数据处理请求方的待处理数据。所述待处理数据为对目标数据进行加密所得到的密文数据。所述目标数据包括所述数据处理请求方配置的加密秘钥,以及,待分类分级数据的抽样数据和/或元数据。对所述待处理数据进行解密得到所述目标数据。根据所述目标数据,确定所述待分类分级数据所属的敏感信息类型和敏感信息级别。利用所述加密秘钥对所述敏感信息类型和所述敏感信息级别进行加密。通过区块链***将加密后的所述敏感信息类型和加密后的所述敏感信息级别返回至所述数据处理请求方。
本说明书一个或多个实施例的目的是提供一种基于区块链的数据处理方法,包括:获取待分类分级数据的元数据和/或抽样数据。以及,获取预先配置的加密秘钥。将获取的数据作为目标数据。对所述目标数据进行打包加密,得到待处理数据。通过区块链***将所述待处理数据发送至区块链节点。所述待处理数据用于所述区块链节点确定所述待分类分级数据所属的敏感信息类型和敏感信息级别。接收区块链节点返回的所述待分类分级数据的加密后的敏感信息类型和加密后的敏感信息级别;所述加密后的敏感信息类型和加密后的敏感信息级别基于所述加密秘钥加密得到。
本说明书一个或多个实施例的目的是提供一种基于区块链的数据处理***,包括数据处理请求方的交易设备和区块链节点;所述数据处理请求方的交易设备,获取待分类分级数据的元数据和/或抽样数据。以及,获取预先配置的加密秘钥。将获取的数据作为目标数据。对所述目标数据进行打包加密,得到待处理数据。通过区块链***将所述待处理数据发送至区块链节点。所述区块链节点,获取所述待处理数据。对所述待处理数据进行解密,得到所述目标数据。根据所述目标数据,确定所述待分类分级数据所属的敏感信息类型和敏感信息级别。利用所述加密秘钥对所述敏感信息类型和所述敏感信息级别进行加密。通过区块链***将加密后的所述敏感信息类型和加密后的所述敏感信息级别返回至所述数据处理请求方。所述数据处理请求方的交易设备,接收区块链节点返回的加密后的所述敏感信息类型和加密后的所述敏感信息级别。
本说明书一个或多个实施例的目的是提供一种基于区块链的数据处理装置,包括:第一获取单元,通过区块链***获取数据处理请求方的待处理数据。所述待处理数据为对目标数据进行加密所得到的密文数据。所述目标数据包括所述数据处理请求方配置的加密秘钥,以及,待分类分级数据的抽样数据和/或元数据。第一处理单元,对所述待处理数据进行解密得到所述目标数据。根据所述目标数据,确定所述待分类分级数据所属的敏感信息类型和敏感信息级别。第一发送单元,利用所述加密秘钥对所述敏感信息类型和所述敏感信息级别进行加密。通过区块链***将加密后的所述敏感信息类型和加密后的所述敏感信息级别返回至所述数据处理请求方。
本说明书一个或多个实施例的目的是提供一种基于区块链的数据处理装置,包括:第二获取单元,获取待分类分级数据的元数据和/或抽样数据。以及,获取预先配置的加密秘钥。第二处理单元,将获取的数据作为目标数据。对所述目标数据进行打包加密,得到待处理数据。第二发送单元,通过区块链***将所述待处理数据发送至区块链节点。所述待处理数据用于所述区块链节点确定所述待分类分级数据所属的敏感信息类型和敏感信息级别。数据接收单元,接收区块链节点返回的所述待分类分级数据的加密后的敏感信息类型和加密后的敏感信息级别;所述加密后的敏感信息类型和加密后的敏感信息级别基于所述加密秘钥加密得到。
本说明书一个或多个实施例的目的是提供一种数据处理设备,包括:处理器;以及被安排成存储计算机可执行指令的存储器,所述计算机可执行指令在被执行时使所述处理器实现上述所述的数据处理方法的步骤。
本说明书一个或多个实施例的目的是提供一种存储介质,用于存储计算机可执行指令,所述计算机可执行指令在被处理器执行时实现上述所述的数据处理方法的步骤。
附图说明
为了更清楚地说明本说明书一个或多个实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书一个或多个中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本说明书一个或多个实施例提供的一种基于区块链的数据处理方法的应用场景示意图;
图2为本说明书一个或多个实施例提供的一种基于区块链的数据处理方法的流程示意图;
图3为本说明书一个或多个实施例提供的另一种基于区块链的数据处理方法的流程示意图;
图4为本说明书一个或多个实施例提供的又一种基于区块链的数据处理方法的流程示意图;
图5为本说明书一个或多个实施例提供的一种基于区块链的数据处理装置的结构示意图;
图6为本说明书一个或多个实施例提供的另一种基于区块链的数据处理装置的结构示意图;
图7为本说明书一个或多个实施例提供的一种数据处理设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本说明书一个或多个中的技术方案,下面将结合本说明书一个或多个实施例中的附图,对本说明书一个或多个实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一个或多个一部分实施例,而不是全部的实施例。基于本说明书一个或多个中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本文件的保护范围。需要说明的是,在不冲突的情况下,本说明书中的一个或多个实施例以及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本说明书一个或多个实施例。
图1为本说明书一个或多个实施例提供的一种基于区块链的数据处理方法的应用场景示意图,如图1所示,该场景包括:数据处理请求方的交易设备和区块链***。其中,数据处理请求方可以是企事业单位、团体、组织、个人等。数据处理请求方的交易设备可以为手机、平板电脑、台式计算机、便携笔记本式计算机等终端设备,还可以为服务端。当交易设备是终端设备时,交易设备中可以安装有交易相关的应用,该应用可以是独立的应用程序(Application,简称App),也可以是嵌入到其他应用程序中的小程序。区块链***包括至少一个区块链节点(图1中仅示出1个)。区块链节点中预先部署有数据分类分级方案,该方案可以由行业内的大型企业部署。
本说明书的一种实施方式中,数据处理请求方的交易设备获取待分类分级数据的元数据和/或抽样数据,以及,获取预先配置的加密秘钥,将获取的数据作为目标数据,对目标数据进行打包加密,得到待处理数据,根据待处理数据,响应于数据处理请求方的交易发起操作,向区块链***发起调用链上的智能合约的交易,该交易中携带有待处理数据,该智能合约用于对待处理数据进行分类分级。区块链***中的区块链节点接收到该交易后,基于P2P的方式在区块链网络中广播该交易,并在对该交易共识验证通过后,区块链节点运行相应的智能合约,通过预先部署的数据分类分级方案,对待处理数据进行解密得到目标数据,根据目标数据,确定待分类分级数据所属的敏感信息类型和敏感信息级别,利用加密秘钥对敏感信息类型和敏感信息级别进行加密,并运行预先部署的用于发送信息的智能合约,将加密后的敏感信息类型和加密后的敏感信息级别返回至数据处理请求方。
本说明书一个实施方式中,区块链节点具有TEE(Trusted ExecutionEnvironment,可信执行环境),区块链节点可以在可信执行环境内执行上述过程,运行相应的智能合约,通过预先部署的数据分类分级方案,对待处理数据进行解密得到目标数据,根据目标数据,确定待分类分级数据所属的敏感信息类型和敏感信息级别,利用加密秘钥对敏感信息类型和敏感信息级别进行加密,并运行预先部署的用于发送信息的智能合约,将加密后的敏感信息类型和加密后的敏感信息级别返回至数据处理请求方。
由此,数据处理请求方可以基于区块链***,通过区块链节点对待处理数据进行分类分级,确定待分类分级数据所属的敏感信息类型和敏感信息级别,在区块链环境下实现数据的分类分级,能够达到对数据分类分级过程进行存证的效果,提高数据分类分级的可信度,实现一种安全可靠准确的数据分类分级方式。并且,通过部署链上的数据分类分级方案,可以让大量的数据处理请求方高效安全的进行数据分类分级,提高数据分类分级的服务规模。并且,在TEE内部对数据进行分类分级,可以让数据处理请求方安全高效地使用数据分类分级方案,进一步提高了数据分类分级的隐私性和可信度。
基于上述应用场景架构,本说明书一个或多个实施例中提供了一种基于区块链的数据处理方法。图2为本说明书一个或多个实施例提供的一种基于区块链的数据处理方法的流程示意图,如图2所示,该方法可以包括以下步骤:
步骤S202,通过区块链***获取数据处理请求方的待处理数据;待处理数据为对目标数据进行加密所得到的密文数据;目标数据包括数据处理请求方配置的加密秘钥,以及,待分类分级数据的抽样数据和/或元数据;
步骤S204,对待处理数据进行解密得到目标数据,根据目标数据,确定待分类分级数据所属的敏感信息类型和敏感信息级别;
步骤S206,利用加密秘钥对敏感信息类型和敏感信息级别进行加密,通过区块链***将加密后的敏感信息类型和加密后的敏感信息级别返回至数据处理请求方。
本实施例中,数据处理请求方可以基于区块链***,通过区块链节点对待处理数据进行分类分级,确定待分类分级数据所属的敏感信息类型和敏感信息级别,在区块链环境下实现数据的分类分级,能够达到对数据分类分级过程进行存证的效果,提高数据分类分级的可信度,实现一种安全可靠准确的数据分类分级方式。并且,通过部署链上的数据分类分级方案,可以让大量的数据处理请求方高效安全的进行数据分类分级,提高数据分类分级的服务规模。并且,在区块链节点具有TEE环境时,在TEE内部对数据进行分类分级,可以让数据处理请求方安全高效地使用数据分类分级方案,进一步提高了数据分类分级的隐私性和可信度。
图2中的方法应用在区块链节点上,由区块链节点执行。下面详细介绍图2中的方法流程。
上述步骤S202中,区块链节点通过区块链***获取数据处理请求方的待处理数据。待处理数据为对目标数据进行加密所得到的密文数据。目标数据包括数据处理请求方配置的加密秘钥,以及,待分类分级数据的抽样数据和/或元数据。具体而言,数据处理请求方的交易设备获取待分类分级数据的元数据和/或抽样数据,以及,获取预先配置的加密秘钥,将获取的数据作为目标数据,对目标数据进行打包加密,得到待处理数据,根据待处理数据,响应于数据处理请求方的交易发起操作,向区块链***发起调用链上的智能合约的交易,该交易中携带有待处理数据,该智能合约用于对待处理数据进行分类分级。区块链节点接收到该交易后,基于P2P的方式在区块链网络中广播该交易,并在对该交易共识验证通过后,从该交易中获取待处理数据。
待处理数据为对目标数据进行加密所得到的密文数据。一种情况下,目标数据包括数据处理请求方配置的加密秘钥和待分类分级数据的抽样数据。另一种情况下,目标数据包括数据处理请求方配置的加密秘钥和待分类分级数据的元数据。再一种情况下,目标数据包括数据处理请求方配置的加密秘钥、待分类分级数据的抽样数据和待分类分级数据的元数据。
上述步骤S204中,区块链节点运行预先部署的用于解密的智能合约,通过预先与数据处理请求方约定的解密秘钥,对待处理数据进行解密,得到目标数据。接着,运行预先部署的用于分类分级的智能合约,根据目标数据,确定待分类分级数据所属的敏感信息类型和敏感信息级别。其中,数据处理请求方和区块链节点事先约定有一套或多套秘钥,该秘钥可以为对称秘钥,也可以为非对称秘钥。数据处理请求方根据预先约定的加密秘钥,对目标数据进行打包加密,得到待处理数据,区块链节点根据预先约定的解密秘钥,对待处理数据进行解密,得到目标数据。待分类分级数据所属的敏感信息类型可以举例为,姓名、身份证号、手机号、地址等敏感信息类型,还可以举例为个人自然信息、个人基本信息概况等类型。待分类分级数据所属的敏感信息级别可以举例为,1级、2级、3级等级别。
上述步骤S206中,区块链节点运行预先部署的用于加密的智能合约,利用目标数据中的加密秘钥,对确定的敏感信息类型和敏感信息级别进行加密,得到加密后的敏感信息类型和加密后的敏感信息级别,该加密秘钥由数据处理请求方配置,可以为对称秘钥也可以为非对称秘钥。最后,区块链节点运行预先部署的用于发送信息的智能合约,将加密后的敏感信息类型和加密后的敏感信息级别返回至数据处理请求方。
由以上描述可知,目标数据中包含的数据的种类有三个情况,下面根据目标数据所包括的数据的种类,详细介绍图2中的步骤S204的过程。
一种情况下,目标数据包括数据处理请求方配置的加密秘钥、待分类分级数据的抽样数据和待分类分级数据的元数据。相应地,步骤S204中,根据目标数据,确定待分类分级数据所属的敏感信息类型和敏感信息级别,具体为:
(a1)根据以下确定方式中的至少一种,确定抽样数据所属的敏感信息类型:根据元数据,确定抽样数据所属的敏感信息类型;和,通过将抽样数据与预先配置的数据源进行比对的方式,确定抽样数据所属的敏感信息类型;和,根据数据处理请求方自定义的第一敏感信息类型确定模型,确定抽样数据所属的敏感信息类型;以及,根据预先配置的第二敏感信息类型确定模型,确定抽样数据所属的敏感信息类型;
(a2)根据抽样数据所属的敏感信息类型,确定抽样数据所属的敏感信息级别;
(a3)根据抽样数据所属的敏感信息类型和敏感信息级别,确定待分类分级数据所属的敏感信息类型和敏感信息级别。
另一种情况下,目标数据包括数据处理请求方配置的加密秘钥和待分类分级数据的元数据。相应地,步骤S204中,根据目标数据,确定待分类分级数据所属的敏感信息类型和敏感信息级别,具体为:
(b1)从元数据中获取待分类分级数据的数据存储地址,基于该数据存储地址,获取待分类分级数据的抽样数据;
(b2)根据以下确定方式中的至少一种,确定抽样数据所属的敏感信息类型:根据元数据,确定抽样数据所属的敏感信息类型;和,通过将抽样数据与预先配置的数据源进行比对的方式,确定抽样数据所属的敏感信息类型;和,根据数据处理请求方自定义的第一敏感信息类型确定模型,确定抽样数据所属的敏感信息类型;以及,根据预先配置的第二敏感信息类型确定模型,确定抽样数据所属的敏感信息类型;
(b3)根据抽样数据所属的敏感信息类型,确定抽样数据所属的敏感信息级别;
(b4)根据抽样数据所属的敏感信息类型和敏感信息级别,确定待分类分级数据所属的敏感信息类型和敏感信息级别。
比较上述(a1)-(a3)与(b1)-(b4)两个过程可知,这两个过程的区别在于,前一过程目标数据中包括待分类分级数据的抽样数据,直接基于四种方式中的至少一种,确定抽样数据所属的敏感信息类型,后一过程中目标数据中不包括待分类分级数据的抽样数据,先根据待分类分级数据的元数据,获取待分类分级数据的抽样数据,再基于四种方式中的至少一种,确定抽样数据所属的敏感信息类型。这两个过程的共同点在于,在确定抽样数据所属的敏感信息类型之后,根据抽样数据所属的敏感信息类型,确定抽样数据所属的敏感信息级别,根据抽样数据所属的敏感信息类型和敏感信息级别,确定待分类分级数据所属的敏感信息类型和敏感信息级别。下面对这两个过程进行详细描述。
上述动作(b1)中,元数据中具有待分类分级数据的数据存储地址,该数据存储地址可以包括数据存储服务器的IP地址和数据存储目录,首先,从元数据中获取待分类分级数据的数据存储地址,接着,基于该数据存储地址,获取待分类分级数据的抽样数据。基于该数据存储地址,获取待分类分级数据的抽样数据,具体为:
(b11)根据该数据存储地址,获取待分类分级数据,以及,从元数据中获取待分类分级数据的数据内容描述信息;
(b12)在根据数据内容描述信息,确定配置有与待分类分级数据相对应的数据筛选规则时,根据该相对应的数据筛选规则,对待分类分级数据进行筛选,得到与数据内容描述信息相匹配的数据,在得到的数据中进行抽样,得到待分类分级数据的抽样数据;
(b13)在根据数据内容描述信息,确定未配置有与待分类分级数据相对应的数据筛选规则时,对待分类分级数据进行抽样,得到待分类分级数据的抽样数据。
首先,动作(b11)中,获取数据存储地址处存储的数据,该数据即为待分类分级数据。元数据是描述数据的数据,待分类分级数据的元数据中包含待分类分级数据的数据内容描述信息,比如,数据内容描述信息为“姓名”,表示待分类分级数据的数据内容为“姓名”。从而,获取元数据中记录的待分类分级数据的数据内容描述信息。
本实施例中,预先配置有至少一条数据筛选规则,每条数据筛选规则适用于对应的数据内容。比如,为数据内容“姓名”配置有相对应的数据筛选规则,为数据内容“身份证”配置有相对应的数据筛选规则。数据筛选规则用于筛选得到符合相应的数据内容的数据,从而剔除数据中的脏数据。本实施例中,还根据待分类分级数据的数据内容描述信息,判断是否配置有与待分类分级数据相对应的数据筛选规则。
若配置有,则动作(b12)中,根据与待分类分级数据相对应的数据筛选规则,对待分类分级数据进行筛选,得到与待分类分级数据的数据内容描述信息相匹配的数据,并在得到的数据中进行抽样,得到待分类分级数据的抽样数据。若未配置有,则动作(b13)中,直接对待分类分级数据进行抽样,得到待分类分级数据的抽样数据。
在一个实施例中,待分类分级数据的数据内容描述信息表示待分类分级的数据内容为身份证号,上述与待分类分级数据相对应的数据筛选规则包括正则表达式,则根据与待分类分级数据相对应的数据筛选规则,对待分类分级数据进行筛选,得到与待分类分级数据的数据内容描述信息相匹配的数据,具体为:判断待分类分级数据是否符合该正则表达式,若符合,则将该符合的待分类分级数据作为与待分类分级数据的数据内容描述信息相匹配的数据筛选出来。
举例而言,身份证数据经过推演可以得到正则表达式:/^[1-8][1-7]\d{4}(?:19|20)\d{2}(?:0[1-9]|1[0-2])(?:0[1-9]|[12]\d|3[01])\d{3}[\dX]$/,则符合该正则表达式的待分类分级数据的数据内容为身份证,因此将符合该正则表达式的待分类分级数据作为与待分类分级数据的数据内容描述信息相匹配的数据筛选出来,从而剔除待分类分级数据中的脏数据。
在一个实施例中,待分类分级数据的数据内容描述信息表示待分类分级的数据内容为姓名,上述与待分类分级数据相对应的数据筛选规则包括正态分布函数,则根据与待分类分级数据相对应的数据筛选规则,对待分类分级数据进行筛选,得到与待分类分级数据的数据内容描述信息相匹配的数据,具体为:将待分类分级数据的长度代入该正态分布函数进行计算,得到函数结果,若函数结果符合预设结果要求,则将该待分类分级数据作为与数据内容描述信息相匹配的数据筛选出来。
具体而言,姓名的长度经过采样拟合,最终得到正态分布函数,该函数中,一个字和四个字的名字概率分布比较低,而两个字和三个字名字概率较高。假设名字长度的概率符合正态分布函数:
Figure BDA0003565507220000081
其中u为2.5,
Figure BDA0003565507220000082
为1,x为姓名长度如1,2,3,4,5,f(x)为对应的概率。
则本实施例中,将待分类分级数据的长度代入该正态分布函数进行计算,得到函数结果,若该函数结果符合预设结果要求,比如,该函数结果大于0.5,则将该待分类分级数据作为与数据内容描述信息“姓名”相匹配的数据筛选出来,从而剔除待分类分级数据中的脏数据。其中,待分类分级数据的长度指的是,在数据存储表中,任意一行一列处所存储的数据的长度。
上述动作(b12)中,在筛选得到的数据中进行抽样,得到待分类分级数据的抽样数据。上述动作(b13)中,直接对待分类分级数据进行抽样,得到待分类分级数据的抽样数据。这两个动作中,在数据抽样时,可以抽取预设数量的数据。
尽管元数据中记录了待分类分级数据的数据内容描述信息,但是待分类分级数据仍然存在混入脏数据的可能,因此本实施例中,在配置有与待分类分级数据相对应的数据筛选规则时,根据该相对应的数据筛选规则,对待分类分级数据进行筛选,得到与待分类分级数据的数据内容描述信息相匹配的数据,然后在得到的数据中进行抽样,得到待分类分级数据的抽样数据,从而不需要获取全部的待分类分级数据,利用较小的资源消耗(cpu和内存等),提升数据源质量,提升数据分类分级的精确率。
上述动作(a1)或(b2)中,根据以下确定方式中的至少一种,确定抽样数据所属的敏感信息类型:
(1)根据元数据,确定抽样数据所属的敏感信息类型;
(2)通过将抽样数据与预先配置的数据源进行比对的方式,确定抽样数据所属的敏感信息类型;
(3)根据数据处理请求方自定义的第一敏感信息类型确定模型,确定抽样数据所属的敏感信息类型;
(4)根据预先配置的第二敏感信息类型确定模型,确定抽样数据所属的敏感信息类型;
其中,根据以下确定方式中的至少一种,确定抽样数据所属的敏感信息类型,具体为:
从元数据中获取待分类分级数据的数据内容描述信息,以及,获取预先配置的基于数据内容描述信息确定分类方式的规则,根据数据内容描述信息和基于数据内容描述信息确定分类方式的规则,在上述确定方式中选取至少一种作为目标确定方式,根据目标确定方式确定抽样数据所属的敏感信息类型。
具体而言,首先,从元数据中获取待分类分级数据的数据内容描述信息,比如,数据内容描述信息为“手机号”,然后,获取数据处理请求方预先配置的基于数据内容描述信息确定分类方式的规则,该规则可以指示根据数据内容描述信息,从上述四种方式中选取哪种方式确定抽样数据所属的敏感信息类型。接着,根据获取的待分类分级数据的数据内容描述信息和数据处理请求方预先配置的基于数据内容描述信息确定分类方式的规则,在上述四种确定方式中选取至少一种方式作为目标确定方式,根据目标确定方式确定抽样数据所属的敏感信息类型。
在一个实施例中,上述方式(1)中,根据元数据,确定抽样数据所属的敏感信息类型,具体为:
(11)从元数据中获取待分类分级数据的数据来源描述信息,以及,获取预先配置的基于数据来源描述信息确定敏感信息类型的规则;
(12)根据数据来源描述信息和基于数据来源描述信息确定敏感信息类型的规则,确定抽样数据所属的敏感信息类型。
首先,从元数据中获取待分类分级数据的数据来源描述信息,数据来源描述信息用来描述待分类分级数据的数据来源,该数据来源包括数据的库名称、表名称、行列名称、数据名称等,比如,数据来源描述信息可以为“xx.desens_rule_info.owner”,表示待分类分级数据来自于xx库,desens表、行名称为rule,列名称为info,数据名称为owner。并且,获取数据处理请求方预先配置的基于数据来源描述信息确定敏感信息类型的规则,该规则用于指示在待分类分级数据的数据来源描述信息包括何种内容时,待分类分级数据的敏感信息类型为何种类型。
最后,根据上述获取的数据来源描述信息和基于数据来源描述信息确定敏感信息类型的规则,确定抽样数据所属的敏感信息类型。比如,基于数据来源描述信息确定敏感信息类型的规则中指示,在数据来源的库名称为xx、表名称为desens、行名称为rule、列名称为info、数据名称为owner时,待分类分级数据所属的敏感信息类型为“管理者”。
本实施例中,可以根据待分类分级数据的元数据中记录的待分类分级数据的数据来源描述信息,以及,数据处理请求方预先配置的基于数据来源描述信息确定敏感信息类型的规则,确定抽样数据所属的敏感信息类型,确定方式简单高效。
在另一个实施例中,上述方式(1)中,根据元数据,确定抽样数据所属的敏感信息类型,具体为:
(13)从元数据中获取待分类分级数据的备注信息,以及,获取预先配置的基于备注信息确定敏感信息类型的规则;
(14)根据备注信息和基于备注信息确定敏感信息类型的规则,确定抽样数据所属的敏感信息类型。
首先,从元数据中获取待分类分级数据的备注信息,备注信息可以由数据库维护人员添加,用于记录对待分类分级数据的备注。并且,获取数据处理请求方预先配置的基于备注信息确定敏感信息类型的规则,该规则用于指示在待分类分级数据的备注信息包括何种内容时,待分类分级数据的敏感信息类型为何种类型。
最后,根据上述获取的备注信息和基于备注信息确定敏感信息类型的规则,确定抽样数据所属的敏感信息类型。比如,基于备注信息确定敏感信息类型的规则中指示,在备注信息中包括“owner”时,待分类分级数据所属的敏感信息类型为“管理者”。
本实施例中,可以根据待分类分级数据的元数据中记录的待分类分级数据的备注信息,以及,数据处理请求方预先配置的基于备注信息确定敏感信息类型的规则,确定抽样数据所属的敏感信息类型,确定方式简单高效。
在一个实施例中,上述方式(2),通过将抽样数据与预先配置的数据源进行比对的方式,确定抽样数据所属的敏感信息类型,具体为:
(21)对于预先配置的各个数据源,将抽样数据与该数据源中的数据进行比对,以在抽样数据中确定与该数据源中的数据相同的数据,及确定该相同的数据在抽样数据中的占比;
(22)根据各个占比和各个数据源所对应的敏感信息类型,确定抽样数据所属的敏感信息类型。
首先,区块链节点中预先配置有多个数据源,每个数据源中存储有多条数据。对于每个数据源,将抽样数据与该数据源中的数据进行比对,以便在抽样数据中确定与该数据源中的数据相同的数据,并确定该相同的数据在抽样数据中的数据量占比。比如,对于任意数据源,将抽样数据与该数据源中的数据进行比对,确定得到抽样数据中与该数据源中的数据相同的数据有100条,抽样数据中一共具有200条数据,从而确定该相同的数据在抽样数据中的数据量占比为50%。通过该过程,能够对于每个数据源确定得到一个相同的数据的占比。
然后,在每个占比中选取取值最高的占比,并确定该最高的占比对应的数据源,将该数据源对应的敏感信息类型,确定为抽样数据所属的敏感信息类型。比如,共有数据源3个,分别为星座、民族和国籍,对于星座,上述占比为20%,对于民族,上述占比为90%,对于国籍,上述占比为10%,则确定数据源民族对应的敏感信息类型“民族”,为抽样数据所属的敏感信息类型。
本实施例中,通过预先配置多个数据源,并计算抽样数据中与每个数据源中的数据相同的数据的占比的方式,确定抽样数据所属的敏感信息类型,确定方式简单快速高效。
在一个实施例中,上述方式(3),根据数据处理请求方自定义的第一敏感信息类型确定模型,确定抽样数据所属的敏感信息类型,具体为:
(31)将抽样数据依次输入各个第一敏感信息类型确定模型,获取各个第一敏感信息类型确定模型对抽样数据的第一处理结果;
(32)根据各个第一处理结果,确定抽样数据所属的敏感信息类型;其中,第一敏感信息类型确定模型与敏感信息类型一一对应。
本实施例中,预先训练有多个第一敏感信息类型确定模型,每个第一敏感信息类型确定模型对应一种敏感信息类型,用于识别抽样数据是否该种敏感信息类型。第一敏感信息类型确定模型的训练过程将在后文描述。
动作(31)中,将抽样数据依次输入各个第一敏感信息类型确定模型进行处理,并获取各个第一敏感信息类型确定模型对抽样数据的第一处理结果,第一处理结果可以包括“是”和“否”,“是”表示抽样数据属于相应的第一敏感信息类型确定模型所对应的敏感信息类型,“否”表示抽样数据不属于相应的第一敏感信息类型确定模型所对应的敏感信息类型。
动作(32)中,根据各个第一处理结果,确定抽样数据所属的敏感信息类型。具体地,将处理结果为“是”的第一敏感信息类型确定模型所对应的敏感信息类型,确定为抽样数据所属的敏感信息类型。
第一敏感信息类型确定模型为用户自定义的模型,可以通过以下方式训练得到:获取数据处理请求方通过区块链***上传的模型训练样本和模型训练样本所属的敏感信息类型标签,根据模型训练样本和模型训练样本所属的敏感信息类型标签,训练第一敏感信息类型确定模型。
具体地,敏感信息类型可以是身份证、姓名、手机号等类型。第一敏感信息类型确定模型可以为分类模型,以敏感信息类型为手机号为例,相应的第一敏感信息类型确定模型可以通过以下方式训练得到。首先,数据处理请求方在区块链***上发起交易,该交易携带有多个手机号和除手机号以外的多个其他字符串,并携带有手机号所属的敏感信息类型标签“1”和其他字符换所属的敏感信息类型标签“0”。区块链节点获取该交易,从而获取多个手机号、手机号所属的敏感信息类型标签“1”以及多个其他字符串、其他字符换所属的敏感信息类型标签“0”。区块链节点利用获取的数据训练预先构建的分类模型直至模型收敛,将训练收敛的分类模型作为用于识别手机号的第一敏感信息类型确定模型。
本实施例中,利用数据处理请求方提供的模型训练样本和模型训练样本所属的敏感信息类型标签,训练得到数据处理请求方自定义的第一敏感信息类型确定模型,利用训练好的各个第一敏感信息类型确定模型,识别抽样数据所属的敏感信息类型,具有识别准确可靠的优点。
在一个实施例中,上述方式(4),根据预先配置的第二敏感信息类型确定模型,确定抽样数据所属的敏感信息类型,具体为:
(41)将抽样数据依次输入各个第二敏感信息类型确定模型,获取各个第二敏感信息类型确定模型对抽样数据的第二处理结果;
(42)根据各个第二处理结果,确定抽样数据所属的敏感信息类型;其中,第二敏感信息类型确定模型与敏感信息类型一一对应。
本实施例中,预先训练有多个第二敏感信息类型确定模型,每个第二敏感信息类型确定模型对应一种敏感信息类型,用于识别抽样数据是否该种敏感信息类型。第二敏感信息类型确定模型的训练过程将在后文描述。第一敏感信息类型确定模型与第二敏感信息类型确定模型的区别在于,第一敏感信息类型确定模型为数据处理请求方自定义的模型,利用数据处理请求方提供的训练样本训练得到,第二敏感信息类型确定模型为区块链节点利用自身获取的训练样本训练得到,训练过程与数据处理请求方无关。
动作(41)中,将抽样数据依次输入各个第二敏感信息类型确定模型进行处理,并获取各个第二敏感信息类型确定模型对抽样数据的第二处理结果,第二处理结果可以包括“是”和“否”,“是”表示抽样数据属于相应的第二敏感信息类型确定模型所对应的敏感信息类型,“否”表示抽样数据不属于相应的第二敏感信息类型确定模型所对应的敏感信息类型。
动作(42)中,根据各个第二处理结果,确定抽样数据所属的敏感信息类型。具体地,将处理结果为“是”的第二敏感信息类型确定模型所对应的敏感信息类型,确定为抽样数据所属的敏感信息类型。
敏感信息类型可以是身份证、姓名、手机号等类型。第二敏感信息类型确定模型可以为分类模型,以敏感信息类型为手机号为例,相应的第二敏感信息类型确定模型可以通过以下方式训练得到。获取多个手机号作为正样本,再获取多个手机号以外的其他字符串作为负样本,对正样本和负样本分别设置样本标签,利用设置标签后的正样本和负样本,训练预先构建的分类模型直至模型收敛,将训练收敛的分类模型作为用于识别手机号的第二敏感信息类型确定模型。
本实施例中,利用区块链节点训练好的各个第二敏感信息类型确定模型,识别抽样数据所属的敏感信息类型,具有识别准确可靠的优点。
根据以上描述可知,上述动作(a1)或(b2)中,根据以上(1)-(4)四种确定方式中的至少一种,确定抽样数据所属的敏感信息类型。本实施例中,在根据以上四种确定方式中的至少两种,确定抽样数据所属的敏感信息类型,得到至少两种敏感信息类型之后,还可以获取预先配置的类型筛选策略,该策略可以由数据处理请求方配置,根据该类型筛选策略,在至少两种敏感信息类型中筛选一敏感信息类型,作为抽样数据的最终敏感信息类型。
其中,类型筛选策略可以指定在存在多种方式确定得到的多种敏感信息类型时,以何种方式确定得到的敏感信息类型为准,从而将该种方式确定得到的敏感信息类型作为抽样数据的最终敏感信息类型。比如一个情况下,类型筛选策略中可以记录上述(1)-(4)四种确定方式的优先级,在存在多种方式确定得到的多种敏感信息类型时,将优先级最高的方式确定得到的敏感信息类型作为抽样数据的最终敏感信息类型。
上述动作(a2)或(b3)中,根据抽样数据所属的敏感信息类型,确定抽样数据所属的敏感信息级别,该动作具体为:根据抽样数据所属的敏感信息类型,查找预先配置的类型级别映射关系,得到抽样数据所属的敏感信息级别。
其中,抽样数据所属的敏感信息类型可以包括敏感信息字段,比如手机号、身份证号等。一个实施例中,还可以根据敏感信息字段,查找预先配置的映射关系,得到上一级或多级的敏感信息描述,比如,上一级为个人基本信息、公司基本信息等,再上一级为个人属性信息、公司财务信息等,将上一级或多级的敏感信息描述也作为敏感信息类型。
上述动作(a3)或(b4)中,根据抽样数据所属的敏感信息类型和敏感信息级别,确定待分类分级数据所属的敏感信息类型和敏感信息级别,具体为,将抽样数据所属的敏感信息类型和敏感信息级别,作为待分类分级数据所属的敏感信息类型和敏感信息级别。由于抽样数据来自待分类分级数据,为待分类分级数据的抽样表示,因此将抽样数据所属的敏感信息类型和敏感信息级别,作为待分类分级数据所属的敏感信息类型和敏感信息级别。
另一种情况下,目标数据包括数据处理请求方配置的加密秘钥、待分类分级数据的元数据。相应地,步骤S204中,根据目标数据,确定待分类分级数据所属的敏感信息类型和敏感信息级别,具体为:
(c1)根据以下确定方式中的至少一种,根据元数据,确定抽样数据所属的敏感信息类型:从元数据中获取待分类分级数据的数据来源描述信息,获取预先配置的基于数据来源描述信息确定敏感信息类型的规则,根据数据来源描述信息和基于数据来源描述信息确定敏感信息类型的规则,确定抽样数据所属的敏感信息类型;以及,从元数据中获取待分类分级数据的备注信息,获取预先配置的基于备注信息确定敏感信息类型的规则,根据备注信息和基于备注信息确定敏感信息类型的规则,确定抽样数据所属的敏感信息类型;
(c2)根据抽样数据所属的敏感信息类型,确定抽样数据所属的敏感信息级别;
(c3)根据抽样数据所属的敏感信息类型和敏感信息级别,确定待分类分级数据所属的敏感信息类型和敏感信息级别。
该种情况下,可以从元数据中获取待分类分级数据的数据内容描述信息,以及,获取预先配置的基于数据内容描述信息确定分类方式的规则,根据数据内容描述信息和基于数据内容描述信息确定分类方式的规则,在以上两种确定方式中选取至少一种作为目标确定方式,根据目标确定方式和元数据确定抽样数据所属的敏感信息类型。
相应地,在根据以上两种确定方式中的至少两种,确定抽样数据所属的敏感信息类型,得到至少两种敏感信息类型之后,还可以获取预先配置的类型筛选策略,该策略可以由数据处理请求方配置,根据该类型筛选策略,在至少两种敏感信息类型中筛选一敏感信息类型,作为抽样数据的最终敏感信息类型。
以上是目标数据包括加密秘钥和元数据的情况下,确定待分类分级数据所属的敏感信息类型和敏感信息级别的过程,该过程的详细过程与前面的介绍相同,可以参考前面的描述,这里不再重复。
又一种情况下,目标数据包括数据处理请求方配置的加密秘钥、待分类分级数据的抽样数据。相应地,步骤S204中,根据目标数据,确定待分类分级数据所属的敏感信息类型和敏感信息级别,具体为:
(d1)根据以下确定方式中的任意一种,根据抽样数据,确定抽样数据所属的敏感信息类型;通过将抽样数据与预先配置的数据源进行比对的方式,确定抽样数据所属的敏感信息类型;和,根据数据处理请求方自定义的第一敏感信息类型确定模型,确定抽样数据所属的敏感信息类型;以及,根据预先配置的第二敏感信息类型确定模型,确定抽样数据所属的敏感信息类型;
(d2)根据抽样数据所属的敏感信息类型,确定抽样数据所属的敏感信息级别;
(d3)根据抽样数据所属的敏感信息类型和敏感信息级别,确定待分类分级数据所属的敏感信息类型和敏感信息级别。
以上是目标数据包括加密秘钥和抽样数据的情况下,确定待分类分级数据所属的敏感信息类型和敏感信息级别的过程,该过程的详细过程与前面的介绍相同,可以参考前面的描述,这里不再重复。
在一个实施例中,区块链节点具有可信执行环境TEE,通过TEE执行对待处理数据进行解密得到目标数据,根据目标数据,确定待分类分级数据所属的敏感信息类型和敏感信息级别,以及,利用加密秘钥对敏感信息类型和敏感信息级别进行加密的步骤。还可以通过TEE执行将加密后的敏感信息类型和敏感信息级别返回至数据处理请求方的动作。
本实施例中,在区块链节点具有TEE环境时,在TEE内部对数据进行分类分级,可以让数据处理请求方安全高效地使用数据分类分级方案,进一步提高了数据分类分级的隐私性和可信度。
在一个实施例中,区块链节点在步骤S208中,通过区块链***将加密后的敏感信息类型和加密后的敏感信息级别返回至数据处理请求方之后,数据处理请求方可以根据加密秘钥相对应的解密秘钥,对接收到的信息进行解密,得到待分类分级数据的敏感信息类型和敏感信息级别,从而实现利用区块链上的数据分类分级服务进行数据分类分级的效果。
在一个实施例中,在通过区块链***将加密后的敏感信息类型和加密后的敏感信息级别返回至数据处理请求方之后,还包括:获取待处理数据的获取时间、获取加密后的敏感信息类型和加密后的敏感信息级别的生成时间;根据待处理数据、获取时间、生成时间、加密后的敏感信息类型和加密后的敏感信息级别,生成数据处理记录并存储在区块链***中。
具体地,获取接收到待处理数据的时间,作为待处理数据的获取时间,获取加密后的敏感信息类型和加密后的敏感信息级别的生成时间,将待处理数据、上述获取时间、生成时间、加密后的敏感信息类型和加密后的敏感信息级别,组合为一条数据处理记录并存储在区块链***中,从而达到数据处理过程完整上链便于后期追溯的效果。
以上从区块链节点角度描述了基于区块链的数据处理过程,下面从数据处理请求方的角度出发,描述基于区块链的数据处理过程。图3为本说明书一个或多个实施例提供的另一种基于区块链的数据处理方法的流程示意图,如图3所示,该方法可以包括以下步骤:
步骤S302,获取待分类分级数据的元数据和/或抽样数据,以及,获取预先配置的加密秘钥;
步骤S304,将获取的数据作为目标数据,对目标数据进行打包加密,得到待处理数据;
步骤S306,通过区块链***将待处理数据发送至区块链节点;待处理数据用于区块链节点确定待分类分级数据所属的敏感信息类型和敏感信息级别;
步骤S308,接收区块链节点返回的待分类分级数据的加密后的敏感信息类型和加密后的敏感信息级别;加密后的敏感信息类型和加密后的敏感信息级别基于上述加密秘钥加密得到。
本实施例中,数据处理请求方可以基于区块链***,通过区块链节点对待处理数据进行分类分级,确定待分类分级数据所属的敏感信息类型和敏感信息级别,在区块链环境下实现数据的分类分级,能够达到对数据分类分级过程进行存证的效果,提高数据分类分级的可信度,实现一种安全可靠准确的数据分类分级方式。并且,通过部署链上的数据分类分级方案,可以让大量的数据处理请求方高效安全的进行数据分类分级,提高数据分类分级的服务规模。并且,在区块链节点具有TEE环境时,在TEE内部对数据进行分类分级,可以让数据处理请求方安全高效地使用数据分类分级方案,进一步提高了数据分类分级的隐私性和可信度。
图3中的方法可以由数据处理请求方的交易设备执行。上述步骤S302中,数据处理请求方的交易设备获取预先配置的加密秘钥,并且,获取待分类分级数据的元数据和/或抽样数据。其中,获取待分类分级数据的元数据,可以为,从存储待分类分级数据的数据库中,获取用于描述待分类分级数据的元数据。其中,获取待分类分级数据的抽样数据,具体为:
(1)从待分类分级数据的元数据中获取待分类分级数据的数据内容描述信息;
(2)在根据数据内容描述信息,确定配置有与待分类分级数据相对应的数据筛选规则时,根据该相对应的数据筛选规则,对待分类分级数据进行筛选,得到与数据内容描述信息相匹配的数据,在得到的数据中进行抽样,得到待分类分级数据的抽样数据;
(3)在根据数据内容描述信息,确定未配置有与待分类分级数据相对应的数据筛选规则时,对待分类分级数据进行抽样,得到待分类分级数据的抽样数据。
其中,数据内容描述信息表示数据内容为身份证号;相对应的数据筛选规则包括正则表达式;根据相对应的数据筛选规则,对待分类分级数据进行筛选,得到与数据内容描述信息相匹配的数据,包括:判断待分类分级数据是否符合正则表达式;若符合,则将待分类分级数据作为与数据内容描述信息相匹配的数据筛选出来。
其中,数据内容描述信息表示数据内容为姓名;相对应的数据筛选规则包括正态分布函数;根据相对应的数据筛选规则,对待分类分级数据进行筛选,得到与数据内容描述信息相匹配的数据,包括:将待分类分级数据的长度代入正态分布函数进行计算,得到函数结果;若函数结果符合预设结果要求,则将待分类分级数据作为与数据内容描述信息相匹配的数据筛选出来。
数据请求处理方的交易设备获取抽样数据的过程与区块链节点获取抽样数据的过程相同,因此该过程可以参考前文动作(b11)-动作(b13)的抽样过程,这里不再重复。
上述步骤S304中,交易设备将获取的数据作为目标数据,利用预先与区块链节点约定的秘钥,对目标数据进行打包加密,得到待处理数据。上述步骤S306中,交易设备发起在区块链***上的交易,该交易携带有待处理数据,从而通过区块链***将待处理数据发送至区块链节点进行数据分类分级。上述步骤S308中,交易设备接收区块链节点返回的待分类分级数据的加密后的敏感信息类型和加密后的敏感信息级别;加密后的敏感信息类型和加密后的敏感信息级别基于上述加密秘钥加密得到。
图4为本说明书一个或多个实施例提供的又一种基于区块链的数据处理方法的流程示意图,如图4所示,该方法可以包括以下步骤:
步骤S402,数据处理请求方的交易设备获取待分类分级数据的元数据、抽样数据和预先配置的加密秘钥;
步骤S404,数据处理请求方的交易设备利用与区块链节点的TEE侧约定的RSA公钥加密元数据、抽样数据和加密秘钥;
步骤S406,数据处理请求方的交易设备在区块链***上发起交易,将加密后的数据通过区块链***发送至区块链节点;
步骤S408,区块链节点中的TEE侧调用预先部署的智能合约,利用与交易设备约定的RSA私钥对接收到的数据进行解密,得到元数据、抽样数据和加密秘钥;
步骤S410,区块链节点中的TEE侧调用预先部署的智能合约,根据元数据和抽样数据,确定待分类分级数据所属的敏感数据类型和敏感数据级别;
步骤S412,区块链节点中的TEE侧调用预先部署的智能合约,根据加密秘钥,对待分类分级数据所属的敏感数据类型和敏感数据级别进行加密;
步骤S414,区块链节点中的TEE侧在区块链***发起交易,将加密后的敏感信息类型和加密后的敏感信息级别返回至数据处理请求方;
步骤S416,数据处理请求方的交易设备利用加密秘钥对应的解密秘钥,对加密后的敏感信息类型和加密后的敏感信息级别进行解密,得到明文。
综上,通过以上的基于区块链的数据处理方法,至少具有以下有益效果:
(1)基于TEE和区块链平台实现数据分类分级,能够有效解决分类分级服务使用方和服务提供方之间的信任问题,帮助中小企业能够合规、安全、高效地使用数据分类分级服务;
(2)利用TEE环境进行数据的分类分级,可以让用户安全高效地使用大型企业复杂的分类分级服务,解决了复杂场景下可信分类分级的问题;
(3)结合区块链进行链上分类分级,对用户每次使用分类分级服务进行存证,让可信度进一步提升,通过一套上链分类分级服务部署,可以让大量用户高效安全使用分类分级服务;
(4)利用数据特征分布或正则模型进行抽样前置规则筛选,利用较小的资源消耗(cpu和内存等),提升数据源质量,提升数据分类分级的精确率;
(5)通过元数据规则和AI模型联合使用的方式进行数据分类,在保持识别精度的情况下,提升识别速度,减少***性能消耗,提升了数据分类的体验。
本说明书一个或多个实施例还提供了一种基于区块链的数据处理***,包括数据处理请求方的交易设备和区块链节点;
数据处理请求方的交易设备,获取待分类分级数据的元数据和/或抽样数据,以及,获取预先配置的加密秘钥;将获取的数据作为目标数据,对目标数据进行打包加密,得到待处理数据;通过区块链***将待处理数据发送至区块链节点;
区块链节点,获取待处理数据,对待处理数据进行解密,得到目标数据,根据目标数据,确定待分类分级数据所属的敏感信息类型和敏感信息级别;利用加密秘钥对敏感信息类型和敏感信息级别进行加密,通过区块链***将加密后的敏感信息类型和加密后的敏感信息级别返回至数据处理请求方;
数据处理请求方的交易设备,接收区块链节点返回的加密后的敏感信息类型和加密后的敏感信息级别并解密,得到敏感信息类型和敏感信息级别。
该***的详细描述可以参考前面的方法部分,这里不再重复。
本说明书一个或多个实施例还提供了一种基于区块链的数据处理装置,应用于上述的区块链节点,图5为本说明书一个或多个实施例提供的一种基于区块链的数据处理装置的结构示意图,如图5所示,该装置包括:
第一获取单元51,通过区块链***获取数据处理请求方的待处理数据;所述待处理数据为对目标数据进行加密所得到的密文数据;所述目标数据包括所述数据处理请求方配置的加密秘钥,以及,待分类分级数据的抽样数据和/或元数据;
第一处理单元52,对所述待处理数据进行解密得到所述目标数据,根据所述目标数据,确定所述待分类分级数据所属的敏感信息类型和敏感信息级别;
第一发送单元53,利用所述加密秘钥对所述敏感信息类型和所述敏感信息级别进行加密,通过区块链***将加密后的所述敏感信息类型和加密后的所述敏感信息级别返回至所述数据处理请求方。
可选地,所述目标数据包括所述元数据和所述抽样数据;第一处理单元52,
根据以下确定方式中的至少一种,确定所述抽样数据所属的敏感信息类型:根据所述元数据,确定所述抽样数据所属的敏感信息类型;和,通过将所述抽样数据与预先配置的数据源进行比对的方式,确定所述抽样数据所属的敏感信息类型;和,根据所述数据处理请求方自定义的第一敏感信息类型确定模型,确定所述抽样数据所属的敏感信息类型;以及,根据预先配置的第二敏感信息类型确定模型,确定所述抽样数据所属的敏感信息类型;
根据所述抽样数据所属的敏感信息类型,确定所述抽样数据所属的敏感信息级别;
根据所述抽样数据所属的敏感信息类型和敏感信息级别,确定所述待分类分级数据所属的敏感信息类型和敏感信息级别。
可选地,所述目标数据包括所述元数据;第一处理单元52,
从所述元数据中获取所述待分类分级数据的数据存储地址,基于所述数据存储地址,获取所述待分类分级数据的抽样数据;
根据以下确定方式中的至少一种,确定所述抽样数据所属的敏感信息类型:根据所述元数据,确定所述抽样数据所属的敏感信息类型;和,通过将所述抽样数据与预先配置的数据源进行比对的方式,确定所述抽样数据所属的敏感信息类型;和,根据所述数据处理请求方自定义的第一敏感信息类型确定模型,确定所述抽样数据所属的敏感信息类型;以及,根据预先配置的第二敏感信息类型确定模型,确定所述抽样数据所属的敏感信息类型;
根据所述抽样数据所属的敏感信息类型,确定所述抽样数据所属的敏感信息级别;
根据所述抽样数据所属的敏感信息类型和敏感信息级别,确定所述待分类分级数据所属的敏感信息类型和敏感信息级别。
可选地,第一处理单元52,
从所述元数据中获取所述待分类分级数据的数据来源描述信息,以及,获取预先配置的基于数据来源描述信息确定敏感信息类型的规则;
根据所述数据来源描述信息和所述基于数据来源描述信息确定敏感信息类型的规则,确定所述抽样数据所属的敏感信息类型。
可选地,第一处理单元52,
从所述元数据中获取所述待分类分级数据的备注信息,以及,获取预先配置的基于备注信息确定敏感信息类型的规则;
根据所述备注信息和所述基于备注信息确定敏感信息类型的规则,确定所述抽样数据所属的敏感信息类型。
可选地,第一处理单元52,
对于预先配置的各个数据源,将所述抽样数据与该数据源中的数据进行比对,以在所述抽样数据中确定与该数据源中的数据相同的数据,及确定该相同的数据在所述抽样数据中的占比;
根据各个所述占比和各个所述数据源所对应的敏感信息类型,确定所述抽样数据所属的敏感信息类型。
可选地,第一处理单元52,
将所述抽样数据依次输入各个所述第一敏感信息类型确定模型,获取各个所述第一敏感信息类型确定模型对所述抽样数据的第一处理结果;
根据各个所述第一处理结果,确定所述抽样数据所属的敏感信息类型;其中,所述第一敏感信息类型确定模型与敏感信息类型一一对应。
可选地,第一处理单元52,
将所述抽样数据依次输入各个所述第二敏感信息类型确定模型,获取各个所述第二敏感信息类型确定模型对所述抽样数据的第二处理结果;
根据各个所述第二处理结果,确定所述抽样数据所属的敏感信息类型;其中,所述第二敏感信息类型确定模型与敏感信息类型一一对应。
本实施例中的数据处理方法,能够实现上述的应用于区块链节点的数据处理方法的各个过程,并达到相同的效果和功能,这里不再重复。
本说明书一个或多个实施例还提供了一种基于区块链的数据处理装置,应用于上述的数据处理请求方的交易设备,图6为本说明书一个或多个实施例提供的另一种基于区块链的数据处理装置的结构示意图,如图6所示,该装置包括:
第二获取单元61,获取待分类分级数据的元数据和/或抽样数据,以及,获取预先配置的加密秘钥;
第二处理单元62,将获取的数据作为目标数据,对所述目标数据进行打包加密,得到待处理数据;
第二发送单元63,通过区块链***将所述待处理数据发送至区块链节点;所述待处理数据用于所述区块链节点确定所述待分类分级数据所属的敏感信息类型和敏感信息级别;
数据接收单元64,接收区块链节点返回的所述待分类分级数据的加密后的敏感信息类型和加密后的敏感信息级别;所述加密后的敏感信息类型和加密后的敏感信息级别基于所述加密秘钥加密得到。
可选地,第二获取单元61,
从所述待分类分级数据的元数据中获取所述待分类分级数据的数据内容描述信息;
在根据所述数据内容描述信息,确定配置有与所述待分类分级数据相对应的数据筛选规则时,根据所述相对应的数据筛选规则,对所述待分类分级数据进行筛选,得到与所述数据内容描述信息相匹配的数据,在得到的所述数据中进行抽样,得到所述待分类分级数据的抽样数据;
在根据所述数据内容描述信息,确定未配置有与所述待分类分级数据相对应的数据筛选规则时,对所述待分类分级数据进行抽样,得到所述待分类分级数据的抽样数据。
本实施例中的数据处理方法,能够实现上述的应用于数据处理请求方的数据处理方法的各个过程,并达到相同的效果和功能,这里不再重复。
本说明书一个或多个实施例还提供了一种数据处理设备,该设备用于执行上述的数据处理方法,图7为本说明书一个或多个实施例提供的一种数据处理设备的结构示意图,如图7所示,数据处理设备可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上的处理器1001和存储器1002,存储器1002中可以存储有一个或一个以上应用程序或数据。其中,存储器1002可以是短暂存储或持久存储。存储在存储器1002的应用程序可以包括一个或一个以上模块(图示未示出),每个模块可以包括数据处理设备中的一系列计算机可执行指令。更进一步地,处理器1001可以设置为与存储器1002通信,在数据处理设备上执行存储器1002中的一系列计算机可执行指令。数据处理设备还可以包括一个或一个以上电源1003,一个或一个以上有线或无线网络接口1004,一个或一个以上输入输出接口1005,一个或一个以上键盘1006等。
在一个具体的实施例中,所述数据处理设备为上述的区块链节点,包括有处理器以及被安排成存储计算机可执行指令的存储器,所述计算机可执行指令在被执行时使所述处理器实现以下流程:
通过区块链***获取数据处理请求方的待处理数据;所述待处理数据为对目标数据进行加密所得到的密文数据;所述目标数据包括所述数据处理请求方配置的加密秘钥,以及,待分类分级数据的抽样数据和/或元数据;
对所述待处理数据进行解密得到所述目标数据,根据所述目标数据,确定所述待分类分级数据所属的敏感信息类型和敏感信息级别;
利用所述加密秘钥对所述敏感信息类型和所述敏感信息级别进行加密,通过区块链***将加密后的所述敏感信息类型和加密后的所述敏感信息级别返回至所述数据处理请求方。
可选地,所述计算机可执行指令在被执行时,所述目标数据包括所述元数据和所述抽样数据;根据所述目标数据,确定所述待分类分级数据所属的敏感信息类型和敏感信息级别,包括:
根据以下确定方式中的至少一种,确定所述抽样数据所属的敏感信息类型:根据所述元数据,确定所述抽样数据所属的敏感信息类型;和,通过将所述抽样数据与预先配置的数据源进行比对的方式,确定所述抽样数据所属的敏感信息类型;和,根据所述数据处理请求方自定义的第一敏感信息类型确定模型,确定所述抽样数据所属的敏感信息类型;以及,根据预先配置的第二敏感信息类型确定模型,确定所述抽样数据所属的敏感信息类型;
根据所述抽样数据所属的敏感信息类型,确定所述抽样数据所属的敏感信息级别;
根据所述抽样数据所属的敏感信息类型和敏感信息级别,确定所述待分类分级数据所属的敏感信息类型和敏感信息级别。
可选地,所述计算机可执行指令在被执行时,所述目标数据包括所述元数据;根据所述目标数据,确定所述待分类分级数据所属的敏感信息类型和敏感信息级别,包括:
从所述元数据中获取所述待分类分级数据的数据存储地址,基于所述数据存储地址,获取所述待分类分级数据的抽样数据;
根据以下确定方式中的至少一种,确定所述抽样数据所属的敏感信息类型:根据所述元数据,确定所述抽样数据所属的敏感信息类型;和,通过将所述抽样数据与预先配置的数据源进行比对的方式,确定所述抽样数据所属的敏感信息类型;和,根据所述数据处理请求方自定义的第一敏感信息类型确定模型,确定所述抽样数据所属的敏感信息类型;以及,根据预先配置的第二敏感信息类型确定模型,确定所述抽样数据所属的敏感信息类型;
根据所述抽样数据所属的敏感信息类型,确定所述抽样数据所属的敏感信息级别;
根据所述抽样数据所属的敏感信息类型和敏感信息级别,确定所述待分类分级数据所属的敏感信息类型和敏感信息级别。
可选地,所述计算机可执行指令在被执行时,根据所述元数据,确定所述抽样数据所属的敏感信息类型,包括:
从所述元数据中获取所述待分类分级数据的数据来源描述信息,以及,获取预先配置的基于数据来源描述信息确定敏感信息类型的规则;
根据所述数据来源描述信息和所述基于数据来源描述信息确定敏感信息类型的规则,确定所述抽样数据所属的敏感信息类型。
可选地,所述计算机可执行指令在被执行时,根据所述元数据,确定所述抽样数据所属的敏感信息类型,包括:
从所述元数据中获取所述待分类分级数据的备注信息,以及,获取预先配置的基于备注信息确定敏感信息类型的规则;
根据所述备注信息和所述基于备注信息确定敏感信息类型的规则,确定所述抽样数据所属的敏感信息类型。
可选地,所述计算机可执行指令在被执行时,通过将所述抽样数据与预先配置的数据源进行比对的方式,确定所述抽样数据所属的敏感信息类型,包括:
对于预先配置的各个数据源,将所述抽样数据与该数据源中的数据进行比对,以在所述抽样数据中确定与该数据源中的数据相同的数据,及确定该相同的数据在所述抽样数据中的占比;
根据各个所述占比和各个所述数据源所对应的敏感信息类型,确定所述抽样数据所属的敏感信息类型。
可选地,所述计算机可执行指令在被执行时,根据所述数据处理请求方自定义的第一敏感信息类型确定模型,确定所述抽样数据所属的敏感信息类型,包括:
将所述抽样数据依次输入各个所述第一敏感信息类型确定模型,获取各个所述第一敏感信息类型确定模型对所述抽样数据的第一处理结果;
根据各个所述第一处理结果,确定所述抽样数据所属的敏感信息类型;其中,所述第一敏感信息类型确定模型与敏感信息类型一一对应。
可选地,所述计算机可执行指令在被执行时,根据预先配置的第二敏感信息类型确定模型,确定所述抽样数据所属的敏感信息类型,包括:
将所述抽样数据依次输入各个所述第二敏感信息类型确定模型,获取各个所述第二敏感信息类型确定模型对所述抽样数据的第二处理结果;
根据各个所述第二处理结果,确定所述抽样数据所属的敏感信息类型;其中,所述第二敏感信息类型确定模型与敏感信息类型一一对应。
本实施例中提供的数据处理设备,能够实现上述的应用于区块链节点的数据处理方法的各个过程,并达到相同的效果和功能,这里不再重复。
在一个具体的实施例中,所述数据处理设备为上述的数据处理请求方的交易设备,包括有处理器以及被安排成存储计算机可执行指令的存储器,所述计算机可执行指令在被执行时使所述处理器实现以下流程:
获取待分类分级数据的元数据和/或抽样数据,以及,获取预先配置的加密秘钥;
将获取的数据作为目标数据,对所述目标数据进行打包加密,得到待处理数据;
通过区块链***将所述待处理数据发送至区块链节点;所述待处理数据用于所述区块链节点确定所述待分类分级数据所属的敏感信息类型和敏感信息级别;
接收区块链节点返回的所述待分类分级数据的加密后的敏感信息类型和加密后的敏感信息级别;所述加密后的敏感信息类型和加密后的敏感信息级别基于所述加密秘钥加密得到。
可选地,所述计算机可执行指令在被执行时,获取待分类分级数据的抽样数据,包括:
从所述待分类分级数据的元数据中获取所述待分类分级数据的数据内容描述信息;
在根据所述数据内容描述信息,确定配置有与所述待分类分级数据相对应的数据筛选规则时,根据所述相对应的数据筛选规则,对所述待分类分级数据进行筛选,得到与所述数据内容描述信息相匹配的数据,在得到的所述数据中进行抽样,得到所述待分类分级数据的抽样数据;
在根据所述数据内容描述信息,确定未配置有与所述待分类分级数据相对应的数据筛选规则时,对所述待分类分级数据进行抽样,得到所述待分类分级数据的抽样数据。
本实施例中提供的数据处理设备,能够实现上述的应用于数据处理请求方的数据处理方法的各个过程,并达到相同的效果和功能,这里不再重复。
进一步地,本说明书一个或多个实施例还提供了一种存储介质,用于存储计算机可执行指令,一种具体的实施例中,该存储介质可以为U盘、光盘、硬盘等,该存储介质存储的计算机可执行指令在被处理器执行时,能实现以下流程:
通过区块链***获取数据处理请求方的待处理数据;所述待处理数据为对目标数据进行加密所得到的密文数据;所述目标数据包括所述数据处理请求方配置的加密秘钥,以及,待分类分级数据的抽样数据和/或元数据;
对所述待处理数据进行解密得到所述目标数据,根据所述目标数据,确定所述待分类分级数据所属的敏感信息类型和敏感信息级别;
利用所述加密秘钥对所述敏感信息类型和所述敏感信息级别进行加密,通过区块链***将加密后的所述敏感信息类型和加密后的所述敏感信息级别返回至所述数据处理请求方。
可选地,该存储介质存储的计算机可执行指令在被处理器执行时,所述目标数据包括所述元数据和所述抽样数据;根据所述目标数据,确定所述待分类分级数据所属的敏感信息类型和敏感信息级别,包括:
根据以下确定方式中的至少一种,确定所述抽样数据所属的敏感信息类型:根据所述元数据,确定所述抽样数据所属的敏感信息类型;和,通过将所述抽样数据与预先配置的数据源进行比对的方式,确定所述抽样数据所属的敏感信息类型;和,根据所述数据处理请求方自定义的第一敏感信息类型确定模型,确定所述抽样数据所属的敏感信息类型;以及,根据预先配置的第二敏感信息类型确定模型,确定所述抽样数据所属的敏感信息类型;
根据所述抽样数据所属的敏感信息类型,确定所述抽样数据所属的敏感信息级别;
根据所述抽样数据所属的敏感信息类型和敏感信息级别,确定所述待分类分级数据所属的敏感信息类型和敏感信息级别。
可选地,该存储介质存储的计算机可执行指令在被处理器执行时,所述目标数据包括所述元数据;根据所述目标数据,确定所述待分类分级数据所属的敏感信息类型和敏感信息级别,包括:
从所述元数据中获取所述待分类分级数据的数据存储地址,基于所述数据存储地址,获取所述待分类分级数据的抽样数据;
根据以下确定方式中的至少一种,确定所述抽样数据所属的敏感信息类型:根据所述元数据,确定所述抽样数据所属的敏感信息类型;和,通过将所述抽样数据与预先配置的数据源进行比对的方式,确定所述抽样数据所属的敏感信息类型;和,根据所述数据处理请求方自定义的第一敏感信息类型确定模型,确定所述抽样数据所属的敏感信息类型;以及,根据预先配置的第二敏感信息类型确定模型,确定所述抽样数据所属的敏感信息类型;
根据所述抽样数据所属的敏感信息类型,确定所述抽样数据所属的敏感信息级别;
根据所述抽样数据所属的敏感信息类型和敏感信息级别,确定所述待分类分级数据所属的敏感信息类型和敏感信息级别。
可选地,该存储介质存储的计算机可执行指令在被处理器执行时,根据所述元数据,确定所述抽样数据所属的敏感信息类型,包括:
从所述元数据中获取所述待分类分级数据的数据来源描述信息,以及,获取预先配置的基于数据来源描述信息确定敏感信息类型的规则;
根据所述数据来源描述信息和所述基于数据来源描述信息确定敏感信息类型的规则,确定所述抽样数据所属的敏感信息类型。
可选地,该存储介质存储的计算机可执行指令在被处理器执行时,根据所述元数据,确定所述抽样数据所属的敏感信息类型,包括:
从所述元数据中获取所述待分类分级数据的备注信息,以及,获取预先配置的基于备注信息确定敏感信息类型的规则;
根据所述备注信息和所述基于备注信息确定敏感信息类型的规则,确定所述抽样数据所属的敏感信息类型。
可选地,该存储介质存储的计算机可执行指令在被处理器执行时,通过将所述抽样数据与预先配置的数据源进行比对的方式,确定所述抽样数据所属的敏感信息类型,包括:
对于预先配置的各个数据源,将所述抽样数据与该数据源中的数据进行比对,以在所述抽样数据中确定与该数据源中的数据相同的数据,及确定该相同的数据在所述抽样数据中的占比;
根据各个所述占比和各个所述数据源所对应的敏感信息类型,确定所述抽样数据所属的敏感信息类型。
可选地,该存储介质存储的计算机可执行指令在被处理器执行时,根据所述数据处理请求方自定义的第一敏感信息类型确定模型,确定所述抽样数据所属的敏感信息类型,包括:
将所述抽样数据依次输入各个所述第一敏感信息类型确定模型,获取各个所述第一敏感信息类型确定模型对所述抽样数据的第一处理结果;
根据各个所述第一处理结果,确定所述抽样数据所属的敏感信息类型;其中,所述第一敏感信息类型确定模型与敏感信息类型一一对应。
可选地,该存储介质存储的计算机可执行指令在被处理器执行时,根据预先配置的第二敏感信息类型确定模型,确定所述抽样数据所属的敏感信息类型,包括:
将所述抽样数据依次输入各个所述第二敏感信息类型确定模型,获取各个所述第二敏感信息类型确定模型对所述抽样数据的第二处理结果;
根据各个所述第二处理结果,确定所述抽样数据所属的敏感信息类型;其中,所述第二敏感信息类型确定模型与敏感信息类型一一对应。
本实施例中提供的存储介质,能够实现上述的应用于区块链节点的数据处理方法的各个过程,并达到相同的效果和功能,这里不再重复。
在一个具体的实施例中,该存储介质可以为U盘、光盘、硬盘等,该存储介质存储的计算机可执行指令在被处理器执行时,能实现以下流程:
获取待分类分级数据的元数据和/或抽样数据,以及,获取预先配置的加密秘钥;
将获取的数据作为目标数据,对所述目标数据进行打包加密,得到待处理数据;
通过区块链***将所述待处理数据发送至区块链节点;所述待处理数据用于所述区块链节点确定所述待分类分级数据所属的敏感信息类型和敏感信息级别;
接收区块链节点返回的所述待分类分级数据的加密后的敏感信息类型和加密后的敏感信息级别;所述加密后的敏感信息类型和加密后的敏感信息级别基于所述加密秘钥加密得到。
可选地,该存储介质存储的计算机可执行指令在被处理器执行时,获取待分类分级数据的抽样数据,包括:
从所述待分类分级数据的元数据中获取所述待分类分级数据的数据内容描述信息;
在根据所述数据内容描述信息,确定配置有与所述待分类分级数据相对应的数据筛选规则时,根据所述相对应的数据筛选规则,对所述待分类分级数据进行筛选,得到与所述数据内容描述信息相匹配的数据,在得到的所述数据中进行抽样,得到所述待分类分级数据的抽样数据;
在根据所述数据内容描述信息,确定未配置有与所述待分类分级数据相对应的数据筛选规则时,对所述待分类分级数据进行抽样,得到所述待分类分级数据的抽样数据。
本实施例中提供的存储介质,能够实现上述的应用于数据处理请求方的数据处理方法的各个过程,并达到相同的效果和功能,这里不再重复。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字***“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的***、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书一个或多个时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本说明书一个或多个的实施例可提供为方法、***、或计算机程序产品。因此,本说明书一个或多个可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本说明书一个或多个可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书一个或多个是参照根据本说明书一个或多个实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本说明书一个或多个的实施例可提供为方法、***或计算机程序产品。因此,本说明书一个或多个可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书一个或多个可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书一个或多个可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书一个或多个,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于***实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本说明书一个或多个的实施例而已,并不用于限制本说明书一个或多个。对于本领域技术人员来说,本说明书一个或多个可以有各种更改和变化。凡在本说明书一个或多个的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书一个或多个的权利要求范围之内。

Claims (24)

1.一种基于区块链的数据处理方法,包括:
通过区块链***获取数据处理请求方的待处理数据;所述待处理数据为对目标数据进行加密所得到的密文数据;所述目标数据包括所述数据处理请求方配置的加密秘钥,以及,待分类分级数据的抽样数据和/或元数据;
对所述待处理数据进行解密得到所述目标数据,根据所述目标数据,确定所述待分类分级数据所属的敏感信息类型和敏感信息级别;
利用所述加密秘钥对所述敏感信息类型和所述敏感信息级别进行加密,通过区块链***将加密后的所述敏感信息类型和加密后的所述敏感信息级别返回至所述数据处理请求方。
2.根据权利要求1所述的方法,所述目标数据包括所述元数据和所述抽样数据;根据所述目标数据,确定所述待分类分级数据所属的敏感信息类型和敏感信息级别,包括:
根据以下确定方式中的至少一种,确定所述抽样数据所属的敏感信息类型:根据所述元数据,确定所述抽样数据所属的敏感信息类型;和,通过将所述抽样数据与预先配置的数据源进行比对的方式,确定所述抽样数据所属的敏感信息类型;和,根据所述数据处理请求方自定义的第一敏感信息类型确定模型,确定所述抽样数据所属的敏感信息类型;以及,根据预先配置的第二敏感信息类型确定模型,确定所述抽样数据所属的敏感信息类型;
根据所述抽样数据所属的敏感信息类型,确定所述抽样数据所属的敏感信息级别;
根据所述抽样数据所属的敏感信息类型和敏感信息级别,确定所述待分类分级数据所属的敏感信息类型和敏感信息级别。
3.根据权利要求1所述的方法,所述目标数据包括所述元数据;根据所述目标数据,确定所述待分类分级数据所属的敏感信息类型和敏感信息级别,包括:
从所述元数据中获取所述待分类分级数据的数据存储地址,基于所述数据存储地址,获取所述待分类分级数据的抽样数据;
根据以下确定方式中的至少一种,确定所述抽样数据所属的敏感信息类型:根据所述元数据,确定所述抽样数据所属的敏感信息类型;和,通过将所述抽样数据与预先配置的数据源进行比对的方式,确定所述抽样数据所属的敏感信息类型;和,根据所述数据处理请求方自定义的第一敏感信息类型确定模型,确定所述抽样数据所属的敏感信息类型;以及,根据预先配置的第二敏感信息类型确定模型,确定所述抽样数据所属的敏感信息类型;
根据所述抽样数据所属的敏感信息类型,确定所述抽样数据所属的敏感信息级别;
根据所述抽样数据所属的敏感信息类型和敏感信息级别,确定所述待分类分级数据所属的敏感信息类型和敏感信息级别。
4.根据权利要求2或3所述的方法,根据以下确定方式中的至少一种,确定所述抽样数据所属的敏感信息类型,包括:
从所述元数据中获取所述待分类分级数据的数据内容描述信息,以及,获取预先配置的基于数据内容描述信息确定分类方式的规则;
根据所述数据内容描述信息和所述基于数据内容描述信息确定分类方式的规则,在所述确定方式中选取至少一种作为目标确定方式,根据目标确定方式确定所述抽样数据所属的敏感信息类型。
5.根据权利要求2或3所述的方法,根据所述元数据,确定所述抽样数据所属的敏感信息类型,包括:
从所述元数据中获取所述待分类分级数据的数据来源描述信息,以及,获取预先配置的基于数据来源描述信息确定敏感信息类型的规则;
根据所述数据来源描述信息和所述基于数据来源描述信息确定敏感信息类型的规则,确定所述抽样数据所属的敏感信息类型。
6.根据权利要求2或3所述的方法,根据所述元数据,确定所述抽样数据所属的敏感信息类型,包括:
从所述元数据中获取所述待分类分级数据的备注信息,以及,获取预先配置的基于备注信息确定敏感信息类型的规则;
根据所述备注信息和所述基于备注信息确定敏感信息类型的规则,确定所述抽样数据所属的敏感信息类型。
7.根据权利要求2或3所述的方法,通过将所述抽样数据与预先配置的数据源进行比对的方式,确定所述抽样数据所属的敏感信息类型,包括:
对于预先配置的各个数据源,将所述抽样数据与该数据源中的数据进行比对,以在所述抽样数据中确定与该数据源中的数据相同的数据,及确定该相同的数据在所述抽样数据中的占比;
根据各个所述占比和各个所述数据源所对应的敏感信息类型,确定所述抽样数据所属的敏感信息类型。
8.根据权利要求2或3所述的方法,根据所述数据处理请求方自定义的第一敏感信息类型确定模型,确定所述抽样数据所属的敏感信息类型,包括:
将所述抽样数据依次输入各个所述第一敏感信息类型确定模型,获取各个所述第一敏感信息类型确定模型对所述抽样数据的第一处理结果;
根据各个所述第一处理结果,确定所述抽样数据所属的敏感信息类型;其中,所述第一敏感信息类型确定模型与敏感信息类型一一对应。
9.根据权利要求8所述的方法,所述第一敏感信息类型确定模型通过以下方式训练得到:
获取所述数据处理请求方通过区块链***上传的模型训练样本和所述模型训练样本所属的敏感信息类型标签;
根据所述模型训练样本和所述模型训练样本所属的敏感信息类型标签,训练所述第一敏感信息类型确定模型。
10.根据权利要求2或3所述的方法,根据预先配置的第二敏感信息类型确定模型,确定所述抽样数据所属的敏感信息类型,包括:
将所述抽样数据依次输入各个所述第二敏感信息类型确定模型,获取各个所述第二敏感信息类型确定模型对所述抽样数据的第二处理结果;
根据各个所述第二处理结果,确定所述抽样数据所属的敏感信息类型;其中,所述第二敏感信息类型确定模型与敏感信息类型一一对应。
11.根据权利要求3所述的方法,基于所述数据存储地址,获取所述待分类分级数据的抽样数据,包括:
根据所述数据存储地址,获取所述待分类分级数据,以及,从所述元数据中获取所述待分类分级数据的数据内容描述信息;
在根据所述数据内容描述信息,确定配置有与所述待分类分级数据相对应的数据筛选规则时,根据所述相对应的数据筛选规则,对所述待分类分级数据进行筛选,得到与所述数据内容描述信息相匹配的数据,在得到的所述数据中进行抽样,得到所述待分类分级数据的抽样数据;
在根据所述数据内容描述信息,确定未配置有与所述待分类分级数据相对应的数据筛选规则时,对所述待分类分级数据进行抽样,得到所述待分类分级数据的抽样数据。
12.根据权利要求11所述的方法,所述数据内容描述信息表示数据内容为身份证号;所述相对应的数据筛选规则包括正则表达式;根据所述相对应的数据筛选规则,对所述待分类分级数据进行筛选,得到与所述数据内容描述信息相匹配的数据,包括:
判断所述待分类分级数据是否符合所述正则表达式;
若符合,则将所述待分类分级数据作为与所述数据内容描述信息相匹配的数据筛选出来。
13.根据权利要求11所述的方法,所述数据内容描述信息表示数据内容为姓名;所述相对应的数据筛选规则包括正态分布函数;根据所述相对应的数据筛选规则,对所述待分类分级数据进行筛选,得到与所述数据内容描述信息相匹配的数据,包括:
将所述待分类分级数据的长度代入所述正态分布函数进行计算,得到函数结果;
若所述函数结果符合预设结果要求,则将所述待分类分级数据作为与所述数据内容描述信息相匹配的数据筛选出来。
14.根据权利要求1所述的方法,所述目标数据包括所述元数据;根据所述目标数据,确定所述待分类分级数据所属的敏感信息类型和敏感信息级别,包括:
根据以下确定方式中的至少一种,根据所述元数据,确定所述抽样数据所属的敏感信息类型:从所述元数据中获取所述待分类分级数据的数据来源描述信息,获取预先配置的基于数据来源描述信息确定敏感信息类型的规则,根据所述数据来源描述信息和所述基于数据来源描述信息确定敏感信息类型的规则,确定所述抽样数据所属的敏感信息类型;以及,从所述元数据中获取所述待分类分级数据的备注信息,获取预先配置的基于备注信息确定敏感信息类型的规则,根据所述备注信息和所述基于备注信息确定敏感信息类型的规则,确定所述抽样数据所属的敏感信息类型;
根据所述抽样数据所属的敏感信息类型,确定所述抽样数据所属的敏感信息级别;
根据所述抽样数据所属的敏感信息类型和敏感信息级别,确定所述待分类分级数据所属的敏感信息类型和敏感信息级别。
15.根据权利要求1所述的方法,所述目标数据包括所述抽样数据;根据所述目标数据,确定所述待分类分级数据所属的敏感信息类型和敏感信息级别,包括:
根据以下确定方式中的任意一种,根据所述抽样数据,确定所述抽样数据所属的敏感信息类型;通过将所述抽样数据与预先配置的数据源进行比对的方式,确定所述抽样数据所属的敏感信息类型;和,根据所述数据处理请求方自定义的第一敏感信息类型确定模型,确定所述抽样数据所属的敏感信息类型;以及,根据预先配置的第二敏感信息类型确定模型,确定所述抽样数据所属的敏感信息类型;
根据所述抽样数据所属的敏感信息类型,确定所述抽样数据所属的敏感信息级别;
根据所述抽样数据所属的敏感信息类型和敏感信息级别,确定所述待分类分级数据所属的敏感信息类型和敏感信息级别。
16.根据权利要求1所述的方法,所述区块链节点具有可信执行环境TEE;通过所述TEE执行对所述待处理数据进行解密得到所述目标数据,根据所述目标数据,确定所述待分类分级数据所属的敏感信息类型和敏感信息级别,以及,利用所述加密秘钥对所述敏感信息类型和所述敏感信息级别进行加密的步骤。
17.根据权利要求1所述的方法,在通过区块链***将加密后的所述敏感信息类型和加密后的所述敏感信息级别返回至所述数据处理请求方之后,还包括:
获取所述待处理数据的获取时间、获取加密后的所述敏感信息类型和加密后的所述敏感信息级别的生成时间;
根据所述待处理数据、所述获取时间、所述生成时间、加密后的所述敏感信息类型和加密后的所述敏感信息级别,生成数据处理记录并存储在区块链***中。
18.一种基于区块链的数据处理方法,包括:
获取待分类分级数据的元数据和/或抽样数据,以及,获取预先配置的加密秘钥;
将获取的数据作为目标数据,对所述目标数据进行打包加密,得到待处理数据;
通过区块链***将所述待处理数据发送至区块链节点;所述待处理数据用于所述区块链节点确定所述待分类分级数据所属的敏感信息类型和敏感信息级别;
接收区块链节点返回的所述待分类分级数据的加密后的敏感信息类型和加密后的敏感信息级别;所述加密后的敏感信息类型和加密后的敏感信息级别基于所述加密秘钥加密得到。
19.根据权利要求18所述的方法,获取待分类分级数据的抽样数据,包括:
从所述待分类分级数据的元数据中获取所述待分类分级数据的数据内容描述信息;
在根据所述数据内容描述信息,确定配置有与所述待分类分级数据相对应的数据筛选规则时,根据所述相对应的数据筛选规则,对所述待分类分级数据进行筛选,得到与所述数据内容描述信息相匹配的数据,在得到的所述数据中进行抽样,得到所述待分类分级数据的抽样数据;
在根据所述数据内容描述信息,确定未配置有与所述待分类分级数据相对应的数据筛选规则时,对所述待分类分级数据进行抽样,得到所述待分类分级数据的抽样数据。
20.一种基于区块链的数据处理***,包括数据处理请求方的交易设备和区块链节点;
所述数据处理请求方的交易设备,获取待分类分级数据的元数据和/或抽样数据,以及,获取预先配置的加密秘钥;将获取的数据作为目标数据,对所述目标数据进行打包加密,得到待处理数据;通过区块链***将所述待处理数据发送至区块链节点;
所述区块链节点,获取所述待处理数据,对所述待处理数据进行解密,得到所述目标数据,根据所述目标数据,确定所述待分类分级数据所属的敏感信息类型和敏感信息级别;利用所述加密秘钥对所述敏感信息类型和所述敏感信息级别进行加密,通过区块链***将加密后的所述敏感信息类型和加密后的所述敏感信息级别返回至所述数据处理请求方;
所述数据处理请求方的交易设备,接收区块链节点返回的加密后的所述敏感信息类型和加密后的所述敏感信息级别。
21.一种基于区块链的数据处理装置,包括:
第一获取单元,通过区块链***获取数据处理请求方的待处理数据;所述待处理数据为对目标数据进行加密所得到的密文数据;所述目标数据包括所述数据处理请求方配置的加密秘钥,以及,待分类分级数据的抽样数据和/或元数据;
第一处理单元,对所述待处理数据进行解密得到所述目标数据,根据所述目标数据,确定所述待分类分级数据所属的敏感信息类型和敏感信息级别;
第一发送单元,利用所述加密秘钥对所述敏感信息类型和所述敏感信息级别进行加密,通过区块链***将加密后的所述敏感信息类型和加密后的所述敏感信息级别返回至所述数据处理请求方。
22.一种基于区块链的数据处理装置,包括:
第二获取单元,获取待分类分级数据的元数据和/或抽样数据,以及,获取预先配置的加密秘钥;
第二处理单元,将获取的数据作为目标数据,对所述目标数据进行打包加密,得到待处理数据;
第二发送单元,通过区块链***将所述待处理数据发送至区块链节点;所述待处理数据用于所述区块链节点确定所述待分类分级数据所属的敏感信息类型和敏感信息级别;
数据接收单元,接收区块链节点返回的所述待分类分级数据的加密后的敏感信息类型和加密后的敏感信息级别;所述加密后的敏感信息类型和加密后的敏感信息级别基于所述加密秘钥加密得到。
23.一种数据处理设备,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述计算机可执行指令在被执行时使所述处理器实现上述权利要求1-17任一项或者18-19任一项中所述的数据处理方法的步骤。
24.一种存储介质,用于存储计算机可执行指令,所述计算机可执行指令在被处理器执行时实现上述权利要求1-17任一项或者18-19任一项中所述的数据处理方法的步骤。
CN202210301183.5A 2022-03-25 2022-03-25 基于区块链的数据处理方法、装置及***、存储介质 Pending CN114638005A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210301183.5A CN114638005A (zh) 2022-03-25 2022-03-25 基于区块链的数据处理方法、装置及***、存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210301183.5A CN114638005A (zh) 2022-03-25 2022-03-25 基于区块链的数据处理方法、装置及***、存储介质

Publications (1)

Publication Number Publication Date
CN114638005A true CN114638005A (zh) 2022-06-17

Family

ID=81949139

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210301183.5A Pending CN114638005A (zh) 2022-03-25 2022-03-25 基于区块链的数据处理方法、装置及***、存储介质

Country Status (1)

Country Link
CN (1) CN114638005A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115065561A (zh) * 2022-08-17 2022-09-16 深圳市乙辰科技股份有限公司 一种基于数据库数据存储的信息交互方法及***
CN117290889A (zh) * 2023-11-24 2023-12-26 广州墨斗信息科技有限公司 一种基于区块链实现电子劳务合同的安全存储方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115065561A (zh) * 2022-08-17 2022-09-16 深圳市乙辰科技股份有限公司 一种基于数据库数据存储的信息交互方法及***
CN115065561B (zh) * 2022-08-17 2022-11-18 深圳市乙辰科技股份有限公司 一种基于数据库数据存储的信息交互方法及***
CN117290889A (zh) * 2023-11-24 2023-12-26 广州墨斗信息科技有限公司 一种基于区块链实现电子劳务合同的安全存储方法
CN117290889B (zh) * 2023-11-24 2024-03-12 广州墨斗信息科技有限公司 一种基于区块链实现电子劳务合同的安全存储方法

Similar Documents

Publication Publication Date Title
CN109614823B (zh) 一种数据的处理方法、装置及设备
CN110990804B (zh) 资源访问方法、装置及设备
CN108932297B (zh) 一种数据查询、数据共享的方法、装置及设备
CN109309652B (zh) 一种训练模型的方法及装置
CN109426732B (zh) 一种数据处理方法及装置
CN112671769A (zh) 电子合同的签署方法、装置及设备
CN113079200A (zh) 一种数据处理的方法、装置及***
CN114638005A (zh) 基于区块链的数据处理方法、装置及***、存储介质
CN110503435B (zh) 基于区块链的交易预警方法、装置及设备
CN109583224B (zh) 一种用户隐私数据处理方法、装置、设备及***
CN106844288B (zh) 一种随机字符串生成方法及装置
CN112182506A (zh) 一种数据的合规检测方法、装置及设备
CN111737279A (zh) 基于区块链的业务处理方法、装置、设备及存储介质
CN114429222A (zh) 一种模型的训练方法、装置及设备
CN115134067A (zh) 检测隐私数据泄漏的方法
CN115098866A (zh) 检测隐私数据泄漏的方法
CN113076527A (zh) 一种基于区块链的数字资产处理方法及装置
CN113282628A (zh) 大数据平台访问方法、装置及大数据平台、电子设备
CN111737304B (zh) 一种区块链数据的处理方法、装置及设备
CN113095507A (zh) 机器学习模型进行训练、预测的方法、装置、设备及介质
CN112182509A (zh) 一种合规数据的异常检测方法、装置及设备
CN110674383B (zh) 舆情查询方法、装置及设备
CN113992429B (zh) 一种事件的处理方法、装置及设备
US11222156B2 (en) Methods and systems for facilitating designing a programmable logic device
CN114553516A (zh) 一种数据的处理方法、装置及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination