CN110968889A

CN110968889A - 一种数据保护方法、设备、装置和计算机存储介质

Info

Publication number: CN110968889A
Application number: CN201811162220.9A
Authority: CN
Inventors: 艾东梅
Original assignee: ZTE Corp
Current assignee: ZTE Corp
Priority date: 2018-09-30
Filing date: 2018-09-30
Publication date: 2020-04-07
Also published as: WO2020063349A1

Abstract

本发明实施例提供了一种数据保护方法、设备、装置和计算机存储介质，所述方法包括：获取n个隐私子模型；其中，每个隐私子模型为表示一种隐私属性的数据集，所述n个隐私子模型表示的隐私属性互不相同，n为大于1的整数；获取待处理数据，确定待处理数据对应的隐私子模型；所述待处理数据与对应的隐私子模型的相关性大于或等于预设相关性阈值时，生成预警信息，以提示所述待处理数据需要进行隐私保护。

Description

一种数据保护方法、设备、装置和计算机存储介质

技术领域

本发明实施例涉及但不限于隐私数据保护技术，尤其涉及一种数据保护方法、设备、装置和计算机存储介质。

背景技术

随着移动互联网的高速发展，移动终端上的各种应用成为用户了解世界的重要工具；由于互联网的开放性和互通性，使得用户对个人的网上隐私也越来越关注。尽管用户隐私是敏感信息，但仍然随时暴露无遗，示例性地，用户的各种行为轨迹如搜索、浏览、下载、支付、位置、运动量等被各种网站、app和终端等收集、存储、分析，然后被用于精准化营销或其他商业用途，甚至带来信息泄露、身份被盗、恶意攻击等危害。

相关技术中，对用户隐私数据的保护方法不够灵活，不能够根据实际需求确定是否需要对用户数据进行隐私保护。

发明内容

本发明实施例提供了一种数据保护方法、设备、装置和计算机存储介质，能够对隐私数据进行灵活保护和管理。

为达到上述目的，本发明实施例的技术方案是这样实现的：

本发明实施例提供了一种数据保护方法，所述方法包括：

获取n个隐私子模型；其中，每个隐私子模型为表示一种隐私属性的数据集，所述n个隐私子模型表示的隐私属性互不相同，n为大于1的整数；

获取待处理数据，确定待处理数据对应的隐私子模型；

所述待处理数据与对应的隐私子模型的相关性大于或等于预设相关性阈值时，生成预警信息，以提示所述待处理数据需要进行隐私保护。

本发明实施例还提供了一种数据保护设备，所述设备包括处理器和用于存储能够在处理器上运行的计算机程序的存储器；其中，

所述处理器用于运行所述计算机程序时，执行上述任意一种数据保护方法的步骤。

本发明实施例还提供了一种数据保护装置，所述装置包括：获取模块和决策模块，其中，

获取模块，用于获取n个隐私子模型；其中，每个隐私子模型为表示一种隐私属性的数据集，所述n个隐私子模型表示的隐私属性互不相同，n为大于1的整数；

决策模块，用于获取待处理数据，确定待处理数据对应的隐私子模型；在所述待处理数据与对应的隐私子模型的相关性大于或等于预设相关性阈值时，生成预警信息，以提示所述待处理数据需要进行隐私保护。

本发明实施例还提供了一种计算机存储介质，该计算机程序被处理器执行时实现上述任意一种数据保护方法的步骤。

本发明实施例提供的一种数据保护方法、设备、装置和计算机存储介质中，首先获取n个隐私子模型；其中，每个隐私子模型为表示一种隐私属性的数据集，所述n个隐私子模型表示的隐私属性互不相同，n为大于1的整数；然后，获取待处理数据，确定待处理数据对应的隐私子模型；最后，所述待处理数据与对应的隐私子模型的相关性大于或等于预设相关性阈值时，生成预警信息，以提示所述待处理数据需要进行隐私保护。

在采用上述记载的技术方案时，由于n个隐私子模型对应的n个隐私属性可以根据用户根据自身实际需求灵活设置，因而，可以得到符合实际需求的n个隐私子模型，进而，根据符合实际需求的n个隐私子模型确定生成预警信息时，说明预警信息的生成是符合实际需求的；也就是说，通过预先灵活和自主地设置n个隐私属性，可以实现对用户隐私数据的预警提醒，具有一定的灵活性和自主性，可以防止需要进行隐私保护的隐私数据泄露。

附图说明

图1为本发明实施例的一种数据保护方法的流程图；

图2为本发明实施例中针对训练数据的聚类结果示意图；

图3为本发明实施例的另一种数据保护方法的流程图；

图4为本发明实施例的一种数据保护装置的组成结构示意图；

图5为本发明实施例的一种数据保护设备的硬件结构示意图。

具体实施方式

以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

相关技术中，对用户隐私数据的保护方法主要有以下两种：(1)针对应用程序做保护，具体地说，制作程序伪装触发器，对应用程序的图标和名称进行伪装，使得终端锁屏状态解除时，仍然可以保证应用程序对于用户具有较强的隐私性，防止应用程序被除终端用户之外的第二人使用，从而保护了应用程序中用户数据的隐私安全。(2)针对用户数据保护，具体地说对用户隐私数据进行变化，生成保护了个人隐私的匿名化数据隐藏。

采用方法(1)对用户隐私数据进行保护时，由于仅仅针对应用程序的标识信息进行保护，导致保护的范围很小，对用户隐私数据的保护作用不大；采用方法(2)对用户隐私数据进行保护时，由于需要对用户数据做匿名处理，因而需要在匿名信息和真实数据间建立关联关系，该关联关系的映射程度直接影响到隐私数据的使用，即，通过用户隐私数据进行变化实现对隐私数据的保护方案，会影响到隐私数据的使用。

可以看出，相关技术中，对用户隐私数据的保护方法不够灵活，不能够根据实际需求确定是否需要对用户数据进行隐私保护。

本发明实施例可以应用于任意的需要进行隐私保护的场景，例如，对终端上应用运行时产生的用户数据进行隐私保护时，可以基于本发明实施例提供的技术方案实现；本发明实施例中并不对终端上运行的应用的种类进行限制。

本发明实施例可以应用于终端或其他设备中，上述记载的终端或其他设备可以包括处理器、存储器等器件。

基于上述记载的内容，提出以下各具体实施例。

第一实施例

本发明第一实施例记载了一种数据保护方法，图1为本发明实施例的一种数据保护方法的流程图，如图1所示，该流程可以包括：

步骤101：获取n个隐私子模型；其中，每个隐私子模型为表示一种隐私属性的数据集，所述n个隐私子模型表示的隐私属性互不相同，n为大于1的整数。

对于本步骤的实现方式，示例性地，可以首先获取训练数据，所述训练数据用于表示应用运行时产生的用户数据；然后，以预设的n个隐私属性作为中心对象，对所述训练数据进行聚类处理，得到n个隐私子模型。

在实际实施时，可以获取应用运行时产生的用户原始数据，对上述记载的用户原始数据进行预处理，得到训练数据；示例性地，可以对上述记载的用户原始数据执行以下至少一项得到训练数据：分词处理、过滤无用词处理，无用词可以包括标点、单字、符号、以及其它一些无意义的词；需要说明的是，上述记载的内容仅仅是举例的方式提供了预处理的实现方式，预处理还可以具有其他的实现方式，本发明实施例并不进行限制。

对于上述记载的用户原始数据的实现方式，示例性地，上述记载的用户原始数据可以是移动终端的应用(Application，App)运行时产生的用户数据，可以包含用户使用移动终端的各个应用时所产生的各种数据，比如登陆信息、阅读、消费、喜好细节等。

实际应用中，可以根据对隐私数据进行保护的实际需求，预先设置n个不同的隐私属性，n个隐私属性中的每个隐私属性表示用户确定需进行保护的隐私点(即用户最在意的隐私点)，例如，n个隐私属性可以包括“身份”、“兴趣”等；n可以认为是预先设置的保护度系数，n的值越大，说明用户确定需进行保护的隐私点越多；进一步地，在设置n个隐私属性后，用户可以根据实际需求对n个隐私属性进行改变，进而可以基于改版后的隐私属性对训练数据重新进行聚类处理，得到相应的隐私子模型。

可以看出，通过设定保护度系数n，可以用户灵活地确定个人数据的隐私保护策略，保护度系数n接影响隐私保护范畴的大小。用户根据对自身隐私保护程度的不同，设定相应的保护度系数。

具体实施时，用户可以通过终端的用户界面(User Interface，UI)输入保护度系数n以及n个隐私属性，如此，便于用户操作。

本发明实施例中，在获取n个隐私属性和用户原始数据后，可以将n个隐私属性和用户原始数据作为构建n个隐私子模型的输入数据，进而，可以对n个隐私子模型的输入数据进行处理，得到n个隐私子模型。

对于得到n个隐私子模型的实现方式，可以采用机器学习常用的基于聚类的自然语言处理方法，对n个隐私子模型的输入数据进行自动聚类处理，并通过迭代的方法，逐次更新每次聚类的中心对象，直至得到最后的聚类结果；这里，最后的聚类结果可以包括n个簇团，最后的聚类结果中的n个簇团的隐私属性互不相同，最后的聚类结果中的每个簇团表示一个隐私子模型。需要说明的是，本发明实施例并不对机器学习模型结构和学习方法进行限制。

也就是说，在得到训练数据和预设的n个隐私属性后，以预设的n个隐私属性作为中心对象，采用迭代的聚类方法，对所述训练数据进行多次聚类处理，得到n个隐私子模型；其中，在进行非首次聚类处理时，对聚类的中心对象进行更新，使本次聚类结果的预设评价指标高于上一次聚类结果的预设评价指标。

这里，聚类结果的预设评价指标可以用于表示：聚类结果中同一簇团中各个记录的邻近程度、以及聚类结果中不同簇团的记录之间的远离程度；聚类结果中同一簇团中各个记录的越邻近，聚类结果中不同簇团的记录之间的越远离，说明聚类结果的预设评价指标越高。

具体地说，对所述训练数据进行第1次聚类处理，得到第1次聚类结果；

令m表示所述迭代的聚类方法的迭代总次数，当i取2至m时，在第i-1次聚类结果的基础上，以第i次聚类的聚类结果的预设评价指标高于第i-1次聚类结果的预设评价指标为目标，对第i-1次聚类的中心对象进行更新，得到第i次聚类的中心对象；根据第i次聚类的中心对象，对训练数据进行第i次聚类处理，得到第i次聚类结果。

这里，m可以是预设的大于1的整数，或者，可以由预设的迭代终止条件确定；在一个示例中，预设的迭代终止条件可以是：无法以聚类结果的预设评价指标更高为目标，对前一次聚类的中心对象进行更新。

下面通过图2说明本发明实施例中对训练数据的聚类结果，为便于理解，参照图2，当i取1至m时，对训练数据进行第i次聚类时，将第i次聚类的n个中心对象抽象为n个点，以这n个点为核心，吸引和聚合数据集中语义上最靠近它们的对象，形成分别以这n个属性为中心的簇团，图2中，用K1、K2、K3和Kn标识的四个圆圈标识四个簇团，每个簇团代表了一个隐私属性相关的各种属性，如以“身份”为中心的簇团里聚集的就是各种跟“身份”相关的属性，例如“姓名”、“......”。如果用户想要隐私保护的范围更大，则可通过调节保护度系数来实现：保护度系数越大，则需要设置更多的隐私属性。

步骤102：获取待处理数据，确定待处理数据对应的隐私子模型；所述待处理数据与对应的隐私子模型的相关性大于或等于预设相关性阈值时，确定所述待处理数据需要进行隐私保护。

实际应用中，可以对应用运行时产生的用户数据进行监测，在监测到应用运行时产生的用户数据，将监测到的应用运行时产生的用户数据作为待处理数据。示例性地，待处理数据为终端待上传的数据或终端待保存的数据。

在获取待处理数据后，以上述记载的n个隐私子模型为中心对象，通过机器学习算法进行充分的计算，以确定待处理数据归属的隐私子模型(待处理数据对应的隐私子模型)。示例性地，可以分别确定待处理数据与n个隐私子模型的相关性，将与待处理数据的相关性最大的隐私子模型作为待处理数据对应的隐私子模型。

这里，对于确定待处理数据与每个隐私子模型的相关性的实现方式，在一个示例中，可以计算待处理数据与每个隐私子模型的语义距离，根据待处理数据与每个隐私子模型的语义距离，确定待处理数据与每个隐私子模型的相关性；待处理数据与隐私子模型的语义距离越小，说明待处理数据的隐私敏感程度越大，待处理数据与隐私子模型的相关性越大。

具体实施时，在确定待处理数据对应的隐私子模型后，可以判断待处理数据与对应的隐私子模型的相关性与预设相关性阈值的大小关系，当待处理数据与对应的隐私子模型的相关性大于或等于预设相关性阈值时，确定所述待处理数据需要进行隐私保护，此时，可以生成预警信息，以提示所述待处理数据需要进行隐私保护；当待处理数据与对应的隐私子模型的相关性小于预设相关性阈值时，确定所述待处理数据不需要进行隐私保护，可以直接结束流程。

本发明实施例中，对于判断待处理数据与对应的隐私子模型的相关性与预设相关性阈值的大小关系的实现方式，示例性地，可以计算所述待处理数据与对应的隐私子模型的语义距离，当待处理数据与对应的隐私子模型的语义距离小于或等于预设语义距离阈值时，确定待处理数据与对应的隐私子模型的相关性大于或等于预设相关性阈值；反之，当待处理数据与对应的隐私子模型的语义距离大于预设语义距离阈值时，确定待处理数据与对应的隐私子模型的相关性小于预设相关性阈值。

由于n个隐私子模型对应的n个隐私属性可以根据实际需求灵活设置，因而，可以得到符合实际需求的n个隐私子模型，进而，根据符合实际需求的n个隐私子模型确定生成预警信息时，说明预警信息的生成是符合实际需求的；也就是说，通过预先灵活和自主地设置n个隐私属性，可以实现对用户隐私数据的预警提醒，具有一定的灵活性和自主性，可以防止需要进行隐私保护的隐私数据泄露。另外，当待处理数据与对应的隐私子模型的相关性小于预设相关性阈值时，可以忽略待处理数据，如此，可以为不需要进行隐私保护的数据提供安全的通道和有力的保障。

实际应用中，本发明第一实施例的数据保护方法可以基于终端的处理器等实现。

相关技术中，在移动终端上，当用户安装App时，必须同意App所声明的全部授权，否则应用无法安装使用，相关领域的研究工作也主要集中在恶意软件检测、云端、服务器协助，基于信息流控制的隐私保护方法；在App生态圈没有协议或政策让用户自行决定让自己的哪些信息公开，哪些信息隐藏。

而在本发明实施例中，利用机器学习的方法，将终端上的用户原始数据，根据预设的n个隐私属性进行自动提炼和聚合处理，生成切合单个用户实际需要的隐私保护方案，并以此为基础，检测使用应用过程中生成的数据是否符合用户预期的隐私信息开放程度，再做出相应的举措；可以看出，通过设置n个隐私属性，可以对使用应用过程中生成的数据过滤和甄别处理，这样既能保护隐私数据防止滥用甚至被攻击，又能让数据得到有效利用；也就是说，本发明实施例中，可以从用户的角度出发，秉承“让用户为自己的数据做主”的宗旨，用机器学习的方法自动构建贴合用户需求的隐私数据保护方案，然后决策和管理那些可能是用户在意的隐私数据，可以在提供信息以享受服务的同时，保护自己的隐私。

第二实施例

在本发明前述实施例提出的数据保护方法的基础上，进行进一步的举例说明。

图3为本发明实施例的另一种数据保护方法的流程图，如图3所示，该流程可以包括：

步骤301：获取待处理数据和n个隐私子模型。

本步骤的实现方式已经在第一实施例中作出说明，这里不再赘述。

步骤302：确定待处理数据对应的隐私子模型。

本步骤的实现方式已经在步骤102中作出说明，这里不再赘述。

步骤303：判断待处理数据与对应的隐私子模型的相关性是否大于或等于预设相关性阈值，如果是，则执行步骤304，如果否，则结束流程。

步骤304：对待处理数据进行预警或其他处理。

具体地说，当待处理数据与对应的隐私子模型的相关性大于或等于预设相关性阈值时，可以认为待处理数据大概率属于用户很在意的隐私范畴，还可以生成预警信息，以提示存在隐私信息泄露风险，或者，可以直接对所述待处理数据进行隐私保护。对于预警信息的展示方式，示例性地，可以采用终端的UI或其他形式展示预警信息；对于对所述待处理数据进行隐私保护的实现方式，示例性地，可以在确定对待处理数据进行保存、上传或其他可能造成隐私泄露的操作时，阻止对待处理数据进行相应的操作，并对用户进行预警或提醒。

进一步地，在待处理数据与对应的隐私子模型的相关性大于或等于预设相关性阈值时，还可以将所述待处理数据添加到对应的隐私子模型中，使得隐私子模型更加完善。

第三实施例

在前述实施例提出的数据保护方法的基础上，本发明第四实施例提供了一种数据保护装置。

图4为本发明实施例的一种数据保护装置的组成结构示意图，如图4所示，所述装置包括获取模块401和决策模块402，其中，

获取模块401，用于获取n个隐私子模型；其中，每个隐私子模型为表示一种隐私属性的数据集，所述n个隐私子模型表示的隐私属性互不相同，n为大于1的整数；

决策模块402，用于获取待处理数据，确定待处理数据对应的隐私子模型；在所述待处理数据与对应的隐私子模型的相关性大于或等于预设相关性阈值时，生成预警信息，以提示所述待处理数据需要进行隐私保护。

在一实施方式中，所述获取模块401，具体用于获取训练数据，所述训练数据用于表示应用运行时产生的用户数据；以预设的n个隐私属性作为中心对象，对所述训练数据进行聚类处理，得到n个隐私子模型。

在一实施方式中，所述获取模块401，具体用于以预设的n个隐私属性作为中心对象，采用迭代的聚类方法，对所述训练数据进行多次聚类处理，得到n个隐私子模型；其中，在进行非首次聚类处理时，对聚类的中心对象进行更新，使本次聚类结果的预设评价指标高于上一次聚类结果的预设评价指标。

在一实施方式中，所述聚类结果的预设评价指标可以用于表示：聚类结果中同一簇团中各个记录的邻近程度、以及聚类结果中不同簇团的记录之间的远离程度。

在一实施方式中，所述待处理数据为终端待上传的数据或终端待保存的数据。

在一实施方式中，所述决策模块402，具体用于在所述n个隐私子模型中，将与待处理数据的相关性最大的隐私子模型作为待处理数据对应的隐私子模型。

在一实施方式中，所述决策模块402，还用于在所述待处理数据与对应的隐私子模型的相关性大于或等于预设相关性阈值时，对所述待处理数据进行隐私保护。

在一实施方式中，所述决策模块402，还用于在所述待处理数据与对应的隐私子模型的相关性大于或等于预设相关性阈值时，将所述待处理数据添加到对应的隐私子模型中，实现对应隐私子模型的补充扩容。

在一实施方式中，所述决策模块402，还用于在所述待处理数据与对应的隐私子模型的相关性小于预设相关性阈值时，确定所述待处理数据不需要进行隐私保护。

实际应用中，上述获取模块401和决策模块402均可由位于终端中的中央处理器(Central Processing Unit，CPU)、微处理器(Micro Processor Unit，MPU)、数字信号处理器(Digital Signal Processor，DSP)、或现场可编程门阵列(Field Programmable GateArray，FPGA)等实现。

另外，在本实施例中的各功能模块可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。

所述集成的单元如果以软件功能模块的形式实现并非作为独立的产品进行销售或使用时，可以存储在一个计算机可读取存储介质中，基于这样的理解，本实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)或processor(处理器)执行本实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

具体来讲，本实施例中的一种数据保护方法对应的计算机程序指令可以被存储在光盘，硬盘，U盘等存储介质上，当存储介质中的与一种数据保护方法对应的计算机程序指令被一电子设备读取或被执行时，实现前述实施例的任意一种数据保护方法的步骤。

基于前述实施例相同的技术构思，参见图5，其示出了本发明实施例提供的一种数据保护设备50，该设备可以包括：存储器51、处理器52和总线53；其中，

所述总线53用于连接所述存储器51、处理器52和这些器件之间的相互通信；

所述存储器51，用于存储计算机程序和数据；

所述处理器52，用于执行所述存储器中存储的计算机程序，以实现前述实施例的任意一种数据保护方法的步骤。

在实际应用中，上述存储器51可以是易失性存储器(volatile memory)，例如RAM；或者非易失性存储器(non-volatile memory)，例如ROM，快闪存储器(flash memory)，硬盘(Hard Disk Drive，HDD)或固态硬盘(Solid-State Drive，SSD)；或者上述种类的存储器的组合，并向处理器52提供指令和数据。

上述处理器52可以为特定用途集成电路(Application Specific IntegratedCircuit，ASIC)、DSP、数字信号处理装置(Digital Signal Processing Device，DSPD)、可编程逻辑装置(Programmable Logic Device，PLD)、FPGA、CPU、控制器、微控制器、微处理器中的至少一种。可以理解地，对于不同的设备，用于实现上述处理器功能的电子器件还可以为其它，本发明实施例不作具体限定。

本领域内的技术人员应明白，本发明的实施例可提供为方法、***、或计算机程序产品。因此，本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上所述，仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。

Claims

1.一种数据保护方法，其特征在于，所述方法包括：

获取待处理数据，确定待处理数据对应的隐私子模型；所述待处理数据与对应的隐私子模型的相关性大于或等于预设相关性阈值时，生成预警信息，以提示所述待处理数据需要进行隐私保护。

2.根据权利要求1所述的方法，其特征在于，所述获取n个隐私子模型，包括：

获取训练数据，所述训练数据用于表示应用运行时产生的用户数据；

以预设的n个隐私属性作为中心对象，对所述训练数据进行聚类处理，得到n个隐私子模型。

3.根据权利要求2所述的方法，其特征在于，所述以预设的n个隐私属性作为中心对象，对所述训练数据进行聚类处理，得到n个隐私子模型，包括：

以预设的n个隐私属性作为中心对象，采用迭代的聚类方法，对所述训练数据进行多次聚类处理，得到n个隐私子模型；其中，在进行非首次聚类处理时，对聚类的中心对象进行更新，使本次聚类结果的预设评价指标高于上一次聚类结果的预设评价指标。

4.根据权利要求3所述的方法，其特征在于，所述聚类结果的预设评价指标可以用于表示：聚类结果中同一簇团中各个记录的邻近程度、以及聚类结果中不同簇团的记录之间的远离程度。

5.根据权利要求1所述的方法，其特征在于，所述待处理数据为终端待上传的数据或终端待保存的数据。

6.根据权利要求1所述的方法，其特征在于，所述确定待处理数据对应的隐私子模型，包括：

在所述n个隐私子模型中，将与待处理数据的相关性最大的隐私子模型作为待处理数据对应的隐私子模型。

7.根据权利要求1所述的方法，其特征在于，所述方法还包括：所述待处理数据与对应的隐私子模型的相关性大于或等于预设相关性阈值时，对所述待处理数据进行隐私保护。

8.根据权利要求1所述的方法，其特征在于，所述方法还包括：所述待处理数据与对应的隐私子模型的相关性大于或等于预设相关性阈值时，将所述待处理数据添加到对应的隐私子模型中，实现对应隐私子模型的补充扩容。

9.根据权利要求1至8任一项所述的方法，其特征在于，所述方法还包括：

所述待处理数据与对应的隐私子模型的相关性小于预设相关性阈值时，确定所述待处理数据不需要进行隐私保护。

10.一种数据保护设备，其特征在于，所述设备包括处理器和用于存储能够在处理器上运行的计算机程序的存储器；其中，

所述处理器用于运行所述计算机程序时，执行权利要求1至9任一项所述方法的步骤。

11.一种数据保护装置，其特征在于，所述装置包括：获取模块和决策模块，其中，

12.一种计算机存储介质，其上存储有计算机程序，其特征在于，该计算机程序被处理器执行时实现权利要求1至9任一项所述方法的步骤。