CN115659197A - 数据安全监测模型训练方法及应用方法、装置和存储介质 - Google Patents
数据安全监测模型训练方法及应用方法、装置和存储介质 Download PDFInfo
- Publication number
- CN115659197A CN115659197A CN202211693424.1A CN202211693424A CN115659197A CN 115659197 A CN115659197 A CN 115659197A CN 202211693424 A CN202211693424 A CN 202211693424A CN 115659197 A CN115659197 A CN 115659197A
- Authority
- CN
- China
- Prior art keywords
- data
- security monitoring
- model
- data security
- clustering
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012544 monitoring process Methods 0.000 title claims abstract description 210
- 238000012549 training Methods 0.000 title claims abstract description 54
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000003860 storage Methods 0.000 title claims abstract description 10
- 238000011156 evaluation Methods 0.000 claims abstract description 114
- 239000013598 vector Substances 0.000 claims abstract description 80
- 238000003066 decision tree Methods 0.000 claims abstract description 47
- 238000012806 monitoring device Methods 0.000 claims abstract description 11
- 238000012545 processing Methods 0.000 claims description 23
- 238000013139 quantization Methods 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000004422 calculation algorithm Methods 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims description 4
- 238000012216 screening Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 4
- 230000006399 behavior Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000009849 deactivation Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Images
Landscapes
- Alarm Systems (AREA)
Abstract
本发明公开了一种数据安全监测模型训练方法、数据安全监测方法、装置和存储介质,所述方法包括:获取每个数据提供者提供的基础评估数据,其中,不同数据提供者提供的基础评估数据的数据维度互不相同,每种数据维度为对数据安全产生影响的一种影响因子;针对每一个维度的基础评估数据,对所述基础评估数据进行矢量化处理,得到所述基础评估数据对应的矢量信息;按照预设的聚类方式,对每个所述矢量信息进行聚类处理,得到聚类结果;基于所述聚类结果,对初始决策树模型进行训练,得到训练好的决策树模型,将所述训练好的决策树模型作为数据安全监测模型,采用本发明提高数据安全监测的准确率。
Description
技术领域
本发明涉及数据安全领域,尤其涉及一种数据安全监测模型训练方法、数据安全监测方法、装置和存储介质。
背景技术
随着人工智能的发展,机器学习相关技术被应用到诸多行业和领域。数据安全监测是各个领域在实践过程中必须要面对的一个问题,比如在城市交通领域、在气象预测领域等,根据当前各个维度的数据变化,对未来事件进行预测,在可能出现不利事件(例如可能出现交通拥堵、气象灾害)时,认为反映当前外部运行环境的数据安全存在隐患,进而进行提前预警和应对处理,保证生产作业的安全,现有的针对该类外部运行环境的数据安全监测,往往是通过以往的一些历史数据进行组合统计分析规则,进而生成对应的映射关系。
发明人在实现本发明的过程中发现,现有的这种方式面对一些未统计的情形时,往往难以进行数据安全监测或者安全监测结果不准确,存在监测准确率低和鲁棒性低的问题。
发明内容
本发明实施例提供一种数据安全监测模型训练方法、数据安全监测方法、装置和存储介质,以提高数据安全监测准确率。
为了解决上述技术问题,本申请实施例提供一种数据安全监测模型训练方法,包括:
获取每个数据提供者提供的基础评估数据,其中,不同数据提供者提供的基础评估数据的数据维度互不相同,每种数据维度为对数据安全产生影响的一种影响因子;
针对每一个维度的基础评估数据,对所述基础评估数据进行矢量化处理,得到所述基础评估数据对应的矢量信息;
按照预设的聚类方式,对每个所述矢量信息进行聚类处理,得到聚类结果;
基于所述聚类结果,对初始决策树模型进行训练,得到训练好的决策树模型,将所述训练好的决策树模型作为数据安全监测模型。
为了解决上述技术问题,本申请实施例提供一种数据安全监测方法,包括:
获取待数据安全监测数据;
将所述待数据安全监测数据输入数据安全监测模型中进行聚类数据安全监测,得到数据安全监测评估值,其中,所述数据安全监测模型为数据安全监测模型训练方法训练得到的模型;
将所述数据安全监测评估值与预设评估值对比,得到对比结果;
若所述对比结果为所述数据安全监测评估值小于预设评估值,则采用预设的数据处理方式,对所述待数据安全监测数据进行数据处理,并基于处理过的所述待数据安全监测数据,返回所述将所述待数据安全监测数据输入数据安全监测模型中,得到数据安全监测评估值的步骤继续执行;
若所述对比结果为所述数据安全监测评估值不小于所述预设评估值,则基于预定规则,根据所述数据安全监测评估值,确定数据安全监测结果。
为了解决上述技术问题,本申请实施例还提供一种数据安全监测模型训练装置,包括:
数据获取模块,用于获取每个数据提供者提供的基础评估数据,其中,不同数据提供者提供的基础评估数据的数据维度互不相同,每种数据维度为对数据安全产生影响的一种影响因子;
矢量信息确定模块,用于针对每一个维度的基础评估数据,对所述基础评估数据进行矢量化处理,得到所述基础评估数据对应的矢量信息;
聚类模块,用于按照预设的聚类方式,对每个所述矢量信息进行聚类处理,得到聚类结果;
数据安全监测模型确定模块,用于基于所述聚类结果,对初始决策树模型进行训练,得到训练好的决策树模型,将所述训练好的决策树模型作为数据安全监测模型。
为了解决上述技术问题,本申请实施例还提供一种数据安全监测装置,包括:
待数据安全监测数据获取模块,用于获取待数据安全监测数据;
聚类模块,用于将所述待数据安全监测数据输入数据安全监测模型中进行聚类数据安全监测,得到数据安全监测评估值,其中,所述数据安全监测模型为数据安全监测模型训练方法训练得到的模型;
对比模块,用于将所述数据安全监测评估值与预设评估值对比,得到对比结果;
处理模块,用于若所述对比结果为所述数据安全监测评估值小于预设评估值,则采用预设的数据处理方式,对所述待数据安全监测数据进行数据处理,并基于处理过的所述待数据安全监测数据,返回所述将所述待数据安全监测数据输入数据安全监测模型中,得到数据安全监测评估值的步骤继续执行;
数据安全监测结果获取模块,用于若所述对比结果为所述数据安全监测评估值不小于所述预设评估值,则基于预定规则,根据所述数据安全监测评估值,确定数据安全监测结果。
为了解决上述技术问题,本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述数据安全监测模型训练方法和上述数据安全监测方法的步骤。
本发明实施例提供的数据安全监测模型训练方法、数据安全监测方法、装置和存储介质,通过获取每个数据提供者提供的基础评估数据,其中,不同数据提供者提供的基础评估数据的数据维度互不相同,每种数据维度为对数据安全产生影响的一种影响因子;针对每一个维度的基础评估数据,对所述基础评估数据进行矢量化处理,得到所述基础评估数据对应的矢量信息;按照预设的聚类方式,对每个所述矢量信息进行聚类处理,得到聚类结果;基于所述聚类结果,对初始决策树模型进行训练,得到训练好的决策树模型,将所述训练好的决策树模型作为数据安全监测模型。通过对多个数据提供者的基础评估数据对应的矢量信息进行聚类,并根据聚类结果进行数据安全监测模型构建,基于该数据安全监测模型提高在多个数据提供者的情况下数据安全监测准确率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请可以应用于其中的示例性***架构图;
图2是本申请的数据安全监测模型训练方法的一个实施例的流程图;
图3是本申请的数据安全监测方法的一个实施例的流程图;
图4是根据本申请的数据安全监测模型训练装置的一个实施例的结构示意图;
图5是根据本申请的数据安全监测装置的一个实施例的结构示意图。
具体实施方式
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同;本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请;本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,如图1所示,***架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。
终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器( Moving Picture EpertsGroup Audio Layer III,动态影像专家压缩标准音频层面3 )、MP4( Moving PictureEperts Group Audio Layer IV,动态影像专家压缩标准音频层面4 )播放器、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上显示的页面提供支持的后台服务器。
需要说明的是,本申请实施例所提供的数据安全监测模型训练方法由服务器执行,相应地,数据安全监测模型训练装置设置于服务器中。
需要说明的是,本申请实施例所提供的数据安全监测方法由服务器执行,相应地,数据安全监测装置设置于服务器中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器,本申请实施例中的终端设备101、102、103具体可以对应的是实际生产中的应用***。
请参阅图2,图2示出本发明实施例提供的一种数据安全监测模型训练方法,以该方法应用在图1中的服务端为例进行说明,详述如下:
S201、获取每个数据提供者提供的基础评估数据,其中,不同数据提供者提供的基础评估数据的数据维度互不相同,每种数据维度为对数据安全产生影响的一种影响因子。
S202、针对每一个维度的基础评估数据,对基础评估数据进行矢量化处理,得到基础评估数据对应的矢量信息。
S203、按照预设的聚类方式,对每个矢量信息进行聚类处理,得到聚类结果。
S204、基于聚类结果,对初始决策树模型进行训练,得到训练好的决策树模型,将训练好的决策树模型作为数据安全监测模型。
在步骤S201中,上述数据提供者是指与数据安全监测相关的主体,可根据实际情况具体调整。例如,在境外投资中,上述数据提供者包括但不限于第三方合作机构、投资方、被投资方、国际组织。在交通场景下,上述数据提供者包括但不限于车主、车管所。
上述基础评估数据是指由在数据安全监测中影响该数据提供者的数据安全监测行为的因素构成的数据,上述基础评估数据由偏好属性构成。例如,在一个具有宗教信仰的数据提供者,该数据提供者的行为偏好数据包括的偏好属性可为单价、个性特征、宗教信仰。
在步骤S202中,上述矢量信息是由基础评估数据中的所有偏好属性对应的数据安全监测值构成的矢量。例如,当偏好属性为单价、个性特征、宗教信仰时,则对基础评估数据进行数据安全监测评估,根据单价、个性特征、宗教信仰的顺序,将评估得到的值(单价、个性特征、宗教信仰),作为偏好矢量。
在步骤S203中,上述聚类是指基于不同数据提供者对应的矢量信息,计算数据提供者两两之间的偏好相似度。将针对一个或多个偏好属性中具有相同或相似的数据安全监测风格的数据提供者归于同一个偏好簇中,不同数据安全监测风格的数据提供者归于不同的偏好簇中。应理解,数据提供者可根据偏好属性的变化同时处于不同偏好簇中或同个偏好簇中。
在步骤S204中,其具体是,采用决策树算法,构建初始决策树模型。
基于聚类结果,对初始决策树模型进行训练,得到训练好的决策树模型,将训练好的决策树模型作为数据安全监测模型。
应理解,此处的决策树算法可根据实际情况进行具体调整。本申请不做具体限制。
本申请实施例通过对多个数据提供者的基础评估数据对应的矢量信息进行聚类,并根据聚类结果进行数据安全监测模型构建,基于该数据安全监测模型提高在多个数据提供者的情况下数据安全监测准确率。
在本实施例的一些可选的实现方式中,当行为偏好数据包括至少两个偏好属性时,步骤S202包括S2021至步骤S2023:
S2021、获取每个数据提供者对应的量化因子。
S2022、基于预设的选取方式,从量化因子中筛选出数据安全监测因子。
S2023、基于数据安全监测因子,针对每一个维度的基础评估数据,对基础评估数据进行矢量化处理,得到基础评估数据对应的矢量信息。
在步骤S2021中,上述量化因子是指数据提供者可被量化的偏好属性。例如,当偏好属性为车速时,可对车速进行赋值量化,如将超过120公里车速用“0”进行量化,30至120公里用“1”进行量化,低于30公里用“2”进行量化等。
在步骤S2022中,上述预设的选取方式是指预设选取数据安全监测因子的方式。
上述预设的选取方式包括但不限于随机选取、固定选取、根据需求选取。
应理解,预设的选取方式可根据实际需求进行适应性调整。本申请不做具体限制。
在步骤S2023中,其具体是,针对每一个选取数据安全监测因子,对每一个数据提供者的基础评估数据进行与该数据安全监测因子有关的偏好属性进行数据安全监测预估,得到预估值,直到所有数据安全监测因子预估结束,基于所得到的的所有预估值,确定数据提供者对应的矢量信息。
在本申请实施例中,通过上述步骤,能快速确定数据提供者对应的矢量信息,以便于通过所得到的的矢量信息进行聚类,并根据聚类结果进行数据安全监测模型构建,基于该数据安全监测模型提高在多个数据提供者的情况下的数据安全监测准确率。
在本实施例的一些可选的实现方式中,步骤S203包括S2031至S2035:
S2031、任选两个矢量信息作为当前待聚类矢量组。
S2032、对当前待聚类矢量组中相同偏好属性的数据进行相似度计算,确定相似度。
S2033、当相似度不小于于预设相似度时,则将当前待聚类矢量组中的两个偏好矢量划分到同一个偏好簇中。
S2034、当相似度小于预设相似度时,则将当前待聚类矢量组中的两个偏好矢量划分到两个偏好簇中。
S2035、返回任选两个矢量信息作为当前待聚类矢量组的步骤继续执行,直到所有偏好矢量选取完毕,并将所有得到的偏好簇作为聚类结果。
在步骤S2032中,上述相似度计算是指计算两个数据提供者之间的矢量信息的相似度。
上述相似度计算的方法包括但不限于计算两者之间的余弦相似度,通过预训练好的模型计算相似度。此处需要说明的是,预训练好的模型是指训练得到的用来计算不同数据提供者之间矢量信息的相似度的模型。例如,可通过偏好相聚模型进行计算相似度计算。
在本申请实施例中,通过对不同数据提供者的矢量信息进行相似度计算,并根据得到的相似度结果识别出数据提供者的偏好属性是否属于同一个簇,从而将数据提供者归于不同偏好簇,并根据聚类结果进行数据安全监测模型构建,基于该数据安全监测模型提高在多个数据提供者的情况下的数据安全监测准确率。
在本实施例的一些可选的实现方式中,在步骤S203之后,步骤S204之前,数据安全监测模型训练方法还包括:
A、任选两个不同数据提供者,作为待测度主体。
B、获取待测度主体对应的矢量信息,并基于所选取的矢量信息,构建所选取的数据提供者之间的偏好相聚模型。
对于步骤B,按照如下公式(1)构建偏好相聚模型:
其中,i1是指第一数据提供者,i2是指第二数据提供者,Vi1i2是指第一数据提供者
和第二数据提供者对应的偏好相聚模型,,,N为矢量
信息中包括的偏好属性的个数,j=1,2,……N且j为正整数,1<p,q<+∞,且。
在本申请实施例中,通过构建不同数据提供者之间的偏好相聚模型,可基于该偏好相聚模型,识别出数据提供者的偏好属性是否属于同一个簇,从而将数据提供者归于不同偏好簇,并根据聚类结果进行数据安全监测模型构建,基于该数据安全监测模型提高在多个数据提供者的情况下数据安全监测准确率。
请参阅图3,图3示出本发明实施例提供的一种数据安全监测方法,以该方法应用在图2中数据安全监测模型训练方法得到的数据安全监测模型为例进行说明,详述如下:
S301、获取待数据安全监测数据。
S302、将待数据安全监测数据输入数据安全监测模型中进行聚类数据安全监测,得到数据安全监测评估值,其中,数据安全监测模型为数据安全监测模型训练方法训练得到的模型。
S303、将数据安全监测评估值与预设评估值对比,得到对比结果。
S304、若对比结果为数据安全监测评估值小于预设评估值,则采用预设的数据处理方式,对待数据安全监测数据进行数据处理,并基于处理过的待数据安全监测数据,返回将待数据安全监测数据输入数据安全监测模型中,得到数据安全监测评估值的步骤继续执行。
S305、若对比结果为数据安全监测评估值不小于预设评估值,则基于预定规则,根据数据安全监测评估值,确定数据安全监测结果。
在步骤S301中,其具体是,获取待数据安全监测数据,并对待数据安全监测数据进行预处理。
其中,上述预处理包括但不限于数据清洗、去停用词、量化数据。具体预处理的方式可根据实际需求进行适应性修改。
在步骤S304中,预设评估值是用来衡量数据安全监测模型中各个数据提供者利益冲突的一个值。也就是说,
其具体是,若对比结果为数据安全监测评估值小于预设评估值,则根据数据安全监测评估值,将数据安全监测评估值最小的的部分待数据安全监测数据进行删除,并返回将待数据安全监测数据输入数据安全监测模型中,得到数据安全监测评估值的步骤继续执行。
在步骤S305中,上述预设规则是指数据安全监测评估值对应的数据安全监测结果的规则。该预设规则可根据历史经验值获取,本申请不做具体限制。
在本申请实施例,通过数据安全监测模型对待数据安全监测数据进行评估,可提高在多个数据提供者的情况下数据安全监测准确率。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
图4示出与上述实施例数据安全监测模型训练方法一一对应的数据安全监测模型训练装置的原理框图。如图4所示,该数据安全监测模型训练装置包括数据获取模块41、矢量信息确定模块42、聚类模块43和数据安全监测模型确定模块44。各功能模块详细说明如下:
数据获取模块41,用于获取每个数据提供者提供的基础评估数据,其中,不同数据提供者提供的基础评估数据的数据维度互不相同,每种数据维度为对数据安全产生影响的一种影响因子。
矢量信息确定模块42,用于针对每一个维度的基础评估数据,对基础评估数据进行矢量化处理,得到基础评估数据对应的矢量信息。
聚类模块43,用于按照预设的聚类方式,对每个矢量信息进行聚类处理,得到聚类结果。
数据安全监测模型确定模块44,用于基于聚类结果,对初始决策树模型进行训练,得到训练好的决策树模型,将训练好的决策树模型作为数据安全监测模型。
在本实施例的一些可选的实现方式中,矢量信息确定模块42包括:
量化因子获取单元,用于获取每个数据提供者对应的量化因子。
筛选单元,用于基于预设的选取方式,从量化因子中筛选出数据安全监测因子。
矢量化单元,用于基于数据安全监测因子,针对每一个维度的基础评估数据,对基础评估数据进行矢量化处理,得到基础评估数据对应的矢量信息。
在本实施例的一些可选的实现方式中,聚类模块43包括:
当前待聚类矢量组确定单元,用于任选两个矢量信息作为当前待聚类矢量组。
相似度确定单元,用于对当前待聚类矢量组中相同偏好属性的数据进行相似度计算,确定相似度。
第一划分单元,用于当相似度不小于于预设相似度时,则将当前待聚类矢量组中的两个偏好矢量划分到同一个偏好簇中。
第二划分单元,用于当相似度小于预设相似度时,则将当前待聚类矢量组中的两个偏好矢量划分到两个偏好簇中。
循环单元,用于返回任选两个矢量信息作为当前待聚类矢量组的步骤继续执行,直到所有偏好矢量选取完毕,并将所有得到的偏好簇作为聚类结果。
在本实施例的一些可选的实现方式中,在数据安全监测模型确定模块44之前,该装置还包括:
待测度主体确定模块,用于任选两个不同数据提供者,作为待测度主体。
偏好相聚模型确定模块,用于获取待测度主体对应的矢量信息,并基于所选取的矢量信息,构建所选取的数据提供者之间的偏好相聚模型。
在本实施例的一些可选的实现方式中,偏好相聚模型确定模块包括:
按照如下公式构建偏好相聚模型:
其中,i1是指第一数据提供者,i2是指第二数据提供者,Vi1i2是指第一数据提供者
和第二数据提供者对应的偏好相聚模型,,,N为矢
量信息中包括的偏好属性的个数,j=1,2,……N且j为正整数,1<p,q<+∞,且。
在本实施例的一些可选的实现方式中,数据安全监测模型确定模块44包括:
初始决策树模型构建单元,用于采用决策树算法,构建初始决策树模型。
数据安全监测模型确定单元,用于基于聚类结果,对初始决策树模型进行训练,得到训练好的决策树模型,将训练好的决策树模型作为数据安全监测模型。
关于数据安全监测模型训练装置的具体限定可以参见上文中对于数据安全监测模型训练方法的限定,在此不再赘述。上述数据安全监测模型训练装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
图5示出与上述实施例数据安全监测方法一一对应的数据安全监测装置的原理框图。如图5所示,该数据安全监测装置包括待数据安全监测数据获取模块51、聚类模块52、对比模块53、处理模块54和数据安全监测结果获取模块55。各功能模块详细说明如下:
待数据安全监测数据获取模块51,用于获取待数据安全监测数据。
聚类模块52,用于将待数据安全监测数据输入数据安全监测模型中进行聚类数据安全监测,得到数据安全监测评估值,其中,数据安全监测模型为数据安全监测模型训练方法训练得到的模型。
对比模块53,用于将数据安全监测评估值与预设评估值对比,得到对比结果。
处理模块54,用于若对比结果为数据安全监测评估值小于预设评估值,则采用预设的数据处理方式,对待数据安全监测数据进行数据处理,并基于处理过的待数据安全监测数据,返回将待数据安全监测数据输入数据安全监测模型中,得到数据安全监测评估值的步骤继续执行。
数据安全监测结果获取模块55,用于若对比结果为数据安全监测评估值不小于预设评估值,则基于预定规则,根据数据安全监测评估值,确定数据安全监测结果。
关于数据安全监测装置的具体限定可以参见上文中对于数据安全监测方法的限定,在此不再赘述。上述数据安全监测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
本申请还提供了另一种实施方式,即提供一种计算机可读存储介质,所述计算机可读存储介质存储有界面显示程序,所述界面显示程序可被至少一个处理器执行,以使所述至少一个处理器执行如上述的数据安全监测模型训练方法和如上述的数据安全监测方法的步骤。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所述的方法。
显然,以上所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例,附图中给出了本申请的较佳实施例,但并不限制本申请的专利范围。本申请可以以许多不同的形式来实现,相反地,提供这些实施例的目的是使对本申请的公开内容的理解更加透彻全面。尽管参照前述实施例对本申请进行了详细的说明,对于本领域的技术人员来而言,其依然可以对前述各具体实施方式所记载的技术方案进行修改,或者对其中部分技术特征进行等效替换。凡是利用本申请说明书及附图内容所做的等效结构,直接或间接运用在其他相关的技术领域,均同理在本申请专利保护范围之内。
Claims (10)
1.一种数据安全监测模型训练方法,其特征在于,应用于外部运行环境的数据安全监测,所述数据安全监测模型训练方法包括:
获取每个数据提供者提供的基础评估数据,其中,不同数据提供者提供的基础评估数据的数据维度互不相同,每种数据维度为对数据安全产生影响的一种影响因子;
针对每一个维度的基础评估数据,对所述基础评估数据进行矢量化处理,得到所述基础评估数据对应的矢量信息;
按照预设的聚类方式,对每个所述矢量信息进行聚类处理,得到聚类结果;
基于所述聚类结果,对初始决策树模型进行训练,得到训练好的决策树模型,将所述训练好的决策树模型作为数据安全监测模型。
2.如权利要求1所述的数据安全监测模型训练方法,其特征在于,所述针对每一个维度的基础评估数据,对所述基础评估数据进行矢量化处理,得到所述基础评估数据对应的矢量信息的步骤包括:
获取每个数据提供者对应的量化因子;
基于预设的选取方式,从所述量化因子中筛选出数据安全监测因子;
基于所述数据安全监测因子,针对每一个维度的基础评估数据,对所述基础评估数据进行矢量化处理,得到所述基础评估数据对应的矢量信息。
3.如权利要求1所述的数据安全监测模型训练方法,其特征在于,所述按照预设的聚类方式,对每个所述矢量信息进行聚类处理,得到聚类结果的步骤包括:
任选两个矢量信息作为当前待聚类矢量组;
对所述当前待聚类矢量组中相同偏好属性的数据进行相似度计算,确定相似度;
当所述相似度不小于于预设相似度时,则将所述当前待聚类矢量组中的两个偏好矢量划分到同一个偏好簇中;
当所述相似度小于预设相似度时,则将所述当前待聚类矢量组中的两个偏好矢量划分到两个偏好簇中;
返回所述任选两个矢量信息作为当前待聚类矢量组的步骤继续执行,直到所有所述偏好矢量选取完毕,并将所有得到的偏好簇作为聚类结果。
4.如权利要求1所述的数据安全监测模型训练方法,其特征在于,在所述基于所述聚类结果,对初始决策树模型进行训练,得到训练好的决策树模型,将所述训练好的决策树模型作为数据安全监测模型之前,所述方法还包括:
任选两个不同数据提供者,作为待测度主体;
获取所述待测度主体对应的矢量信息,并基于所选取的矢量信息,构建所选取的数据提供者之间的偏好相聚模型。
6.如权利要求1所述的数据安全监测模型训练方法,其特征在于,所述基于所述聚类结果,对初始决策树模型进行训练,得到训练好的决策树模型,将所述训练好的决策树模型作为数据安全监测模型的步骤包括:
采用决策树算法,构建初始决策树模型;
基于所述聚类结果,对初始决策树模型进行训练,得到训练好的决策树模型,将所述训练好的决策树模型作为数据安全监测模型。
7.一种数据安全监测方法,其特征在于,所述数据安全监测方法包括:
获取待数据安全监测数据;
将所述待数据安全监测数据输入数据安全监测模型中进行聚类数据安全监测,得到数据安全监测评估值,其中,所述数据安全监测模型为如权利要求1至6任一项训练得到的模型;
将所述数据安全监测评估值与预设评估值对比,得到对比结果;
若所述对比结果为所述数据安全监测评估值小于预设评估值,则采用预设的数据处理方式,对所述待数据安全监测数据进行数据处理,并基于处理过的所述待数据安全监测数据,返回所述将所述待数据安全监测数据输入数据安全监测模型中,得到数据安全监测评估值的步骤继续执行;
若所述对比结果为所述数据安全监测评估值不小于所述预设评估值,则基于预定规则,根据所述数据安全监测评估值,确定数据安全监测结果。
8.一种数据安全监测模型训练装置,其特征在于,所述数据安全监测模型训练装置包括:
数据获取模块,用于获取每个数据提供者提供的基础评估数据,其中,不同数据提供者提供的基础评估数据的数据维度互不相同,每种数据维度为对数据安全产生影响的一种影响因子;
矢量信息确定模块,用于针对每一个维度的基础评估数据,对所述基础评估数据进行矢量化处理,得到所述基础评估数据对应的矢量信息;
聚类模块,用于按照预设的聚类方式,对每个所述矢量信息进行聚类处理,得到聚类结果;
数据安全监测模型确定模块,用于基于所述聚类结果,对初始决策树模型进行训练,得到训练好的决策树模型,将所述训练好的决策树模型作为数据安全监测模型。
9.一种数据安全监测装置,其特征在于,所述数据安全监测装置包括:
待数据安全监测数据获取模块,用于获取待数据安全监测数据;
聚类模块,用于将所述待数据安全监测数据输入数据安全监测模型中进行聚类数据安全监测,得到数据安全监测评估值,其中,所述数据安全监测模型为如权利要求1至6任一项训练得到的模型;
对比模块,用于将所述数据安全监测评估值与预设评估值对比,得到对比结果;
处理模块,用于若所述对比结果为所述数据安全监测评估值小于预设评估值,则采用预设的数据处理方式,对所述待数据安全监测数据进行数据处理,并基于处理过的所述待数据安全监测数据,返回所述将所述待数据安全监测数据输入数据安全监测模型中,得到数据安全监测评估值的步骤继续执行;
数据安全监测结果获取模块,用于若所述对比结果为所述数据安全监测评估值不小于所述预设评估值,则基于预定规则,根据所述数据安全监测评估值,确定数据安全监测结果。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的数据安全监测模型训练方法和如权利要求7所述的数据安全监测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211693424.1A CN115659197A (zh) | 2022-12-28 | 2022-12-28 | 数据安全监测模型训练方法及应用方法、装置和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211693424.1A CN115659197A (zh) | 2022-12-28 | 2022-12-28 | 数据安全监测模型训练方法及应用方法、装置和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115659197A true CN115659197A (zh) | 2023-01-31 |
Family
ID=85022642
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211693424.1A Pending CN115659197A (zh) | 2022-12-28 | 2022-12-28 | 数据安全监测模型训练方法及应用方法、装置和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115659197A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107798557A (zh) * | 2017-09-30 | 2018-03-13 | 平安科技(深圳)有限公司 | 电子装置、基于lbs数据的服务场所推荐方法及存储介质 |
CN111786950A (zh) * | 2020-05-28 | 2020-10-16 | 中国平安财产保险股份有限公司 | 基于态势感知的网络安全监控方法、装置、设备及介质 |
US20200380380A1 (en) * | 2019-06-03 | 2020-12-03 | Atlassian Pty Ltd | Using unsupervised machine learning to produce interpretable routing rules |
CN114363082A (zh) * | 2022-01-12 | 2022-04-15 | 平安普惠企业管理有限公司 | 网络攻击检测方法、装置、设备及计算机可读存储介质 |
CN114693052A (zh) * | 2020-12-31 | 2022-07-01 | 网神信息技术(北京)股份有限公司 | 风险预测模型的训练方法、装置、计算设备和介质 |
-
2022
- 2022-12-28 CN CN202211693424.1A patent/CN115659197A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107798557A (zh) * | 2017-09-30 | 2018-03-13 | 平安科技(深圳)有限公司 | 电子装置、基于lbs数据的服务场所推荐方法及存储介质 |
US20200380380A1 (en) * | 2019-06-03 | 2020-12-03 | Atlassian Pty Ltd | Using unsupervised machine learning to produce interpretable routing rules |
CN111786950A (zh) * | 2020-05-28 | 2020-10-16 | 中国平安财产保险股份有限公司 | 基于态势感知的网络安全监控方法、装置、设备及介质 |
CN114693052A (zh) * | 2020-12-31 | 2022-07-01 | 网神信息技术(北京)股份有限公司 | 风险预测模型的训练方法、装置、计算设备和介质 |
CN114363082A (zh) * | 2022-01-12 | 2022-04-15 | 平安普惠企业管理有限公司 | 网络攻击检测方法、装置、设备及计算机可读存储介质 |
Non-Patent Citations (1)
Title |
---|
徐选华: "网络环境下模型驱动的复杂大群体决策支持***研究", 中国博士学位论文全文数据, pages 54 - 55 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110647921B (zh) | 一种用户行为预测方法、装置、设备及存储介质 | |
CN110009486B (zh) | 一种欺诈检测的方法、***、设备及计算机可读存储介质 | |
CN109885834B (zh) | 一种用户年龄性别的预测方法及装置 | |
CN111275492A (zh) | 用户画像生成方法、装置、存储介质及设备 | |
CN113627566A (zh) | 一种网络诈骗的预警方法、装置和计算机设备 | |
CN109933610B (zh) | 数据处理方法、装置、计算机设备及存储介质 | |
CN112887371B (zh) | 边缘计算方法、装置、计算机设备及存储介质 | |
CN114693192A (zh) | 风控决策方法、装置、计算机设备和存储介质 | |
CN111931707A (zh) | 基于对抗补丁的人脸图像预测方法、装置、设备和介质 | |
CN110969261A (zh) | 基于加密算法的模型构建方法及相关设备 | |
CN113886721A (zh) | 个性化兴趣点推荐方法、装置、计算机设备及存储介质 | |
CN111340574B (zh) | 风险用户的识别方法、装置和电子设备 | |
CN112287111B (zh) | 一种文本处理方法和相关装置 | |
CN115700548A (zh) | 用户行为预测的方法、设备和计算机程序产品 | |
CN111241297B (zh) | 一种基于标签传播算法的图谱数据处理方法及装置 | |
CN115659197A (zh) | 数据安全监测模型训练方法及应用方法、装置和存储介质 | |
CN112818235B (zh) | 基于关联特征的违规用户识别方法、装置和计算机设备 | |
CN112905987B (zh) | 账号识别方法、装置、服务器及存储介质 | |
CN114186039A (zh) | 一种视觉问答方法、装置及电子设备 | |
CN116911304B (zh) | 一种文本推荐方法及装置 | |
CN114139031B (zh) | 数据分类方法、装置、电子设备及存储介质 | |
CN112214387B (zh) | 基于知识图谱的用户操作行为预测方法及装置 | |
CN113487316B (zh) | 分布式支付***安全处理方法及装置 | |
CN115860570A (zh) | 基于图的移动运营商潜在流失客户的评分方法 | |
CN112102013A (zh) | 一种基于特征融合的电销用户意图识别方法和*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20230131 |
|
RJ01 | Rejection of invention patent application after publication |