CN113434365B - 数据特征监控方法、装置、电子设备及存储介质 - Google Patents

数据特征监控方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN113434365B
CN113434365B CN202110718976.2A CN202110718976A CN113434365B CN 113434365 B CN113434365 B CN 113434365B CN 202110718976 A CN202110718976 A CN 202110718976A CN 113434365 B CN113434365 B CN 113434365B
Authority
CN
China
Prior art keywords
data
characteristic
feature
features
clustering
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110718976.2A
Other languages
English (en)
Other versions
CN113434365A (zh
Inventor
李芳�
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Bank Co Ltd
Original Assignee
Ping An Bank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Bank Co Ltd filed Critical Ping An Bank Co Ltd
Priority to CN202110718976.2A priority Critical patent/CN113434365B/zh
Publication of CN113434365A publication Critical patent/CN113434365A/zh
Application granted granted Critical
Publication of CN113434365B publication Critical patent/CN113434365B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/302Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a software system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/602Providing cryptographic facilities or services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Quality & Reliability (AREA)
  • Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及安全监控领域,揭露了一种数据特征监控方法,包括:获取原始数据,识别原始数据的数据特征,对数据特征进行特征聚类,生成多个聚类数据特征;对每个聚类数据特征进行结构化转换,得到结构化聚类数据特征;识别结构化聚类数据特征中的敏感数据特征和非敏感数据特征,对敏感数据特征进行特征加密,得到加密聚类数据特征;配置加密聚类数据特征和非敏感数据特征的特征库,根据预构建的数据特征监控规则,监控特征库的运行状态。另外,本发明还提供一种数据特征监控装置、电子设备及存储介质。此外,本发明还涉及区块链技术,所述敏感数据特征可存储于区块链中。本发明可以监控数据特征的运行状态,以保障应用数据特征的业务***的鲁棒性。

Description

数据特征监控方法、装置、电子设备及存储介质
技术领域
本发明涉及安全监控领域,尤其涉及一种数据特征监控方法、装置、电子设备及计算机可读存储介质。
背景技术
随着信息科技的不断发展,数据成井喷式的增长,数据特征显得尤为重要,所述数据特征可以理解为目标类数据的一般特征或特性的汇总,基于数据特征可以过滤掉部分业务数据,提高业务***的识别能力。
目前,数据特征通常是基于实际业务场景中产生的数据生成,在数据特征的应用过程中,数据特征的稳定决定了业务***是否能够正常运行,但是在实际业务场景中会产生大量的数据特征,而每个数据特征处于错综复杂多变的业务场景中,因此,很难识别每个数据特征的使用状态(如数据特征被使用了多少次,数据特征是否有用等),从而无法很好地监控每个数据特征的运行状态,进而很难保障数据特征对应业务***的运行稳定性。
发明内容
本发明提供一种数据特征监控方法、装置、电子设备及计算机可读存储介质,其主要目的在于监控数据特征的运行状态,以保障应用数据特征的业务***的鲁棒性。
为实现上述目的,本发明提供的一种数据特征监控方法,包括:
获取原始数据,识别所述原始数据的数据特征,对所述数据特征进行特征聚类,生成多个聚类数据特征;
对每个所述聚类数据特征进行结构化转换,得到结构化聚类数据特征;
识别所述结构化聚类数据特征中的敏感数据特征和非敏感数据特征,并对所述敏感数据特征进行特征加密,得到加密聚类数据特征;
配置所述加密聚类数据特征和所述非敏感数据特征的特征库,根据预构建的数据特征监控规则,监控所述特征库的运行状态。
可选地,所述识别原始数据的数据特征,包括:
对所述原始数据进行去重操作,识别去重后的所述原始数据的数据字段;
根据所述数据字段,对去重后的所述原始数据进行特征提取,得到特征数据;
根据所述特征数据,生成所述原始数据的数据特征。
可选地,所述对每个所述聚类数据特征进行结构化转换,得到结构化聚类数据特征,包括:
识别每个所述聚类数据特征中所有数据特征的特征结构和特征类;
根据所述特征结构和特征类,识别所述聚类数据特征中的非结构化数据特征;
将所述聚类数据特征中的非结构化数据特征转换为结构化数据特征,得到结构化聚类数据特征。
可选地,所述根据所述特征结构和特征类,识别所述聚类数据特征中的非结构化数据特征,包括:
识别所述特征结构是否具备表结构,及所述特征类是否具备类定义形式;
若所述数据结构具备表结构且所述数据类型具备类定义形式,则得到所述数据特征为结构化数据特征;
若所述数据结构不具备表结构和/或所述数据类型不具备类定义形式,则得到所述数据特征为非结构化数据特征。
可选地,所述识别所述结构化聚类数据特征中的敏感数据特征和非敏感数据特征,包括:
计算所述结构化聚类数据特征中的结构化数据特征与预设敏感数据特征库中敏感数据特征的匹配度;
将所述匹配度大于预设匹配度的结构化数据特征作为敏感数据特征,及将匹配度不大于预设匹配度的结构化数据特征作为非敏感数据特征。
可选地,所述对所述敏感数据特征进行特征加密,得到加密聚类数据特征,包括:
识别所述敏感数据特征的特征类型;
若所述特征类型为类别特征,则采用哈希算法对所述类别特征的敏感数据特征进行特征加密,得到第一加密聚类数据特征;
若所述特征类型为数值类别,则采用离散化算法对所述数值类别的敏感数据特征进行特征加密,得到第二加密聚类数据特征;
汇总所述第一加密聚类数据特征和第二加密聚类数据特征,得到加密聚类数据特征。
可选地,所述配置所述加密聚类数据特征和所述非敏感数据特征的特征库,包括:
定义所述加密聚类数据特征和所述非敏感数据特征之间的层级关系;
根据所述层级关系,创建所述加密聚类数据特征和所述非敏感数据特征之间的下拉图表和数据特征表;
根据所述下拉图表和数据特征表,生成所述加密聚类数据特征和所述非敏感数据特征的特征库。
为了解决上述问题,本发明还提供一种数据特征监控装置,所述装置包括:
特征聚类模块,用于获取原始数据,识别所述原始数据的数据特征,对所述数据特征进行特征聚类,生成多个聚类数据特征;
特征转换模块,用于对每个所述聚类数据特征进行结构化转换,得到结构化聚类数据特征;
特征加密模块,用于识别所述结构化聚类数据特征中的敏感数据特征和非敏感数据特征,并对所述敏感数据特征进行特征加密,得到加密聚类数据特征;
特征监控模块,用于配置所述加密聚类数据特征和所述非敏感数据特征的特征库,根据预构建的数据特征监控规则,监控所述特征库的运行状态。
为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以实现上述所述的数据特征监控方法。
为了解决上述问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个计算机程序,所述至少一个计算机程序被电子设备中的处理器执行以实现上述所述的数据特征监控方法。
本发明实施例首先通过识别原始数据的数据特征,对所述数据特征进行特征聚类,生成多个聚类数据特征,并对每个所述聚类数据特征进行结构化转换,得到结构化聚类数据特征,以保障后续数据特征可以正常加载;其次,本发明实施例通过对所述结构化聚类数据特征中的敏感数据特征进行特征加密,得到加密聚类数据特征,以保障数据特征在运行过程中的隐私性和安全性;进一步地,本发明实施例配置所述加密聚类数据特征的特征库,根据预构建的数据监控规则,监控所述特征库的运行状态,可以了解加密聚类数据特征中数据特征之间的逻辑关系,从而监控特征库中每个数据特征在运行过程中的使用状态,进而可以保障应用数据特征对应业务***的鲁棒性。因此,本发明提出的一种数据特征监控方法、装置、电子设备以及计算机可读存储介质可以监控数据特征的运行状态,以保障应用数据特征的业务***的鲁棒性。
附图说明
图1为本发明一实施例提供的数据特征监控方法的流程示意图;
图2为本发明一实施例中图1提供的数据特征监控方法中其中一个步骤的详细流程示意图;
图3为本发明一实施例提供的数据特征监控装置的模块示意图;
图4为本发明一实施例提供的实现数据特征监控方法的电子设备的内部结构示意图;
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本申请实施例提供一种数据特征监控方法。所述数据特征监控方法的执行主体包括但不限于服务端、终端等能够被配置为执行本申请实施例提供的该方法的电子设备中的至少一种。换言之,所述数据特征监控方法可以由安装在终端设备或服务端设备的软件或硬件来执行,所述软件可以是区块链平台。所述服务端包括但不限于:单台服务器、服务器集群、云端服务器或云端服务器集群等。
参照图1所示,为本发明一实施例提供的数据特征监控方法的流程示意图。在本发明实施例中,所述数据特征监控方法包括:
S1、获取原始数据,识别所述原始数据的数据特征,对所述数据特征进行特征聚类,生成多个聚类数据特征。
本发明实施例中,所述原始数据基于不同业务场景产生,如对于金融证券服务场景,所述原始数据包括:金融数据、理财数据、保险数据以及证券数据等,所述数据特征是指所述原始数据的一般特征或特性的汇总,在本发明中,所述数据特征可以理解为所述原始数据的数据标识,用于标记所述原始数据的身份信息,如所述原始数据为用户基本信息,则该原始数据的数据特征可以为用户身份号。
作为本发明的一个实施例,所述识别原始数据的数据特征,包括:对所述原始数据进行去重操作,识别去重后的所述原始数据的数据字段,根据所述数据字段,对去重后的所述原始数据进行特征提取,得到特征数据,根据所述特征数据,生成所述原始数据的数据特征。
本发明一可选实施例中,所述对所述原始数据进行去重操作,包括:计算所述原始数据中任意两个数据的相似度,若所述相似度不大于预设相似度,则同时保留所述两个原始数据,若所述相似度大于预设相似度,则删除所述两个数据中任意一个数据。
需要说明的是,本发明实施例在计算所述原始数据的相似度之前,还包括:利用hash算法将所述原始数据转换成对应hash值,以实现后续原始数据相似度的计算。
本发明一可选实施例中,所述数据字段通过预设的字段识别脚本实现,以自动化获取所述去重数据的数据字段,提高数据处理速度,所述字段识别脚本通过JavaScript脚本语言编译,示例性的,所述去重数据为贷款数据,如贷款时间、贷款金额以及贷款利率,通过所述字段识别脚本,可以识别出对应的数据字段为“时间”、“金额”以及“利率”。
本发明一可选实施例中,根据所述数据字段,对去重后的所述原始数据进行特征提取,得到特征数据,包括:根据所述数据字段,查询去重后的所述原始数据的数据字符串,采用线性方法提取所述数据字符串的字符串特征,根据所述字符串特征,生成特征数据。其中,所述数据字符串的查询可以通过SQL语句查询,所述线性方法包括:主成分分析法、线性判别分析法以及多维尺度法。
本发明一可选实施例中,所述根据所述特征数据,生成所述原始数据的数据特征,包括:获取所述特征数据的特征字段,根据所述特征字段,得到所述原始数据的数据特征,例如,所述特征数据为***贷款数据,其特征字段为***申请次数,则对应的数据特征可以为“***申请次数”。
进一步地,本发明实施例对所述数据特征进行特征聚类,以将具有相同类型的特征进行聚类,提高后续数据特征的查询速度。
作为本发明的一个实施例,所述对所述数据特征进行特征聚类,生成多个聚类数据特征,包括:获取所述数据特征的维度信息,将具有相同维度信息的数据特征进行聚类,得到多个聚类中心点,根据每个所述聚类中心点,生成多个聚类数据特征。
其中,所述维度信息可以了解为所述数据特征的数据特征类型,如数据特征为“***申请次数”的维度信息可以为贷款信息。所述数据特征的聚类可以通过聚类算法实现,如k-means算法。
S2、对每个所述聚类数据特征进行结构化转换,得到结构化聚类数据特征。
应该了解,在上述得到每个所述聚类数据特征中,会存在如文本数据特征和图形数据特征的非结构化数据特征,由于非结构化数据特征无法直接应用于模型训练,因此,本发明实施例通过对每个所述聚类数据特征进行结构化转换,以将所述聚类数据特征的非结构化数据特征转换为结构化数据特征,从而可以保障后续聚类数据特征中所有的数据特征可以正常加载。
作为本发明的一个实施例,参阅图2所示,所述对每个所述聚类数据特征进行结构化转换,得到结构化聚类数据特征,包括:
S201、识别每个所述聚类数据特征中所有数据特征的特征结构和特征类;
S202、根据所述特征结构和特征类,识别所述聚类数据特征中的非结构化数据特征;
S203、将所述聚类数据特征中的非结构化数据特征转换为结构化数据特征,得到结构化聚类数据特征。
其中,所述特征结构是指存储数据特征的方式,如数组、队列、图形以及堆等,所述特征类是指一种用户定义的引用数据特征类型,其用于编译数据特征的特征实例对象。
一个可选实施例中,所述根据所述特征结构和特征类,识别所述聚类数据特征中的非结构化数据特征,包括:识别所述特征结构是否具备表结构,及所述特征类是否具备类定义形式,若所述数据结构具备表结构且所述数据类型具备类定义形式,则得到对应数据特征为结构化数据特征;若所述数据结构不具备表结构和/或所述数据类型不具备类定义形式,则得到对应数据特征为非结构化数据特征。
其中,所述表结构包含表名、记录及字段等内容,所述类定义形式指的是描述数据特征实例属性的类形式。
一个可选实施例中,所述将所述聚类数据特征中的非结构化数据特征转换为结构化数据特征,得到结构化聚类数据特征,包括:将所述非结构化数据特征***至预先构建的表结构,并定义所述表结构的类,生成结构化聚类数据特征。其中,所述表结构可以通过Java语言中的create table{}函数实现,所述类定义可以通过Java语言中的class{}函数实现。
S3、识别所述结构化聚类数据特征中的敏感数据特征和非敏感数据特征,并对所述敏感数据特征进行特征加密,得到加密聚类数据特征。
应该了解,在所述结构化聚类数据特征会存在一定的敏感数据特征,即会存在一些隐私性数据,如资产数据特征、征信数据特征以及财务数据特征等,因此,本发明实施例通过识别所述结构化聚类数据特征中的敏感数据特征,并对敏感数据特征进行特征加密,以提高所述结构化聚类数据特征中的敏感数据特征的隐私性和安全性。
作为本发明的一个实施例,所述识别所述结构化聚类数据特征中的敏感数据特征和非敏感数据特征,包括:计算所述结构化聚类数据特征中的结构化数据特征与预设敏感数据特征库中敏感数据特征的匹配度,将所述匹配度大于预设匹配度的结构化数据特征作为敏感数据特征,及将匹配度不大于预设匹配度的结构化数据特征作为非敏感数据特征。
其中,所述预设敏感数据特征库中敏感数据特征根据历史业务场景中产生的敏感数据特征获取,比如在历史金融的贷款审核场景中,经审核发现,该贷款审核场景中资产数据特征、征信数据特征以及财务数据特征等数据特征为敏感数据特征,于是将这些数据特征存入所述预设敏感数据特征库中,可选的,所述预设敏感数据特征库可以通过数据库构建,用于实现数据的快速的存取。
本发明一可选实施例中,利用下述方法计算所述结构化聚类数据特征中的结构化数据特征与预设敏感数据特征库中敏感数据特征的匹配度:
Figure BDA0003135864870000071
其中,T(x,y)表示匹配度,xi表示结构化聚类数据特征中第i个结构化数据特征,yi表示预设敏感数据特征库中第i个敏感数据特征。
本发明一可选实施例中,所述预设匹配度设置为0.75,也可以根据实际业务场景设置。
作为本发明的一个实施例,所述对所述敏感数据特征进行特征加密,得到加密聚类数据特征,包括:识别所述敏感数据特征的特征类型,若所述特征类型为类别特征,则采用哈希(hash)算法对所述类别特征的敏感数据特征进行特征加密,得到第一加密聚类数据特征,若所述特征类型为数值类别,则采用离散化算法对所述数值类别的敏感数据特征进行特征加密,得到第二加密聚类数据特征,汇总所述第一加密聚类数据特征和第二加密聚类数据特征,得到加密聚类数据特征。
进一步地,为保障所述敏感数据特征的隐私性和安全性,所述敏感数据特征还可存储于区块链节点中。
S4、配置所述加密聚类数据特征和所述非敏感数据特征的特征库,根据预构建的数据特征监控规则,监控所述特征库的运行状态。
应该了解,在上述所述加密聚类数据特征中,是仅将具有相同维度信息的数据特征进行归类,并不了解每个所述聚类数据特征中数据特征之间的逻辑关系(如位置关系、存储关系以及查询关系等),因此,本发明实施例通过配置所述加密聚类数据特征的特征库,以定义所述聚类数据特征中所有的数据特征的逻辑关系,从而以准确的查找加密聚类数据特征中每个数据特征的使用状态。
作为本发明的一个实施例,所述配置所述加密聚类数据特征和所述非敏感数据特征的特征库包括:定义所述加密聚类数据特征和所述非敏感数据特征之间的层级关系,根据所述层级关系,创建所述加密聚类数据特征和所述非敏感数据特征之间的下拉图表和数据特征表,根据所述下拉图表和数据特征表,生成所述加密聚类数据特征和所述非敏感数据特征的特征库。
其中,所述层级关系是指所述加密聚类数据特征和所述非敏感数据特征之间的连接关系,如包含关系、并列关系,所述下拉图表用于存储具有包含关系的数据特征,所述数据特征表用于存储具有并列关系的数据特征,可选的,所述下拉图表和数据特征表可以通过SQL语句在数据库中以数据表的形式创建,则所述特征库可以理解为所述加密聚类数据特征和所述非敏感数据特征的数据特征库。
进一步地,本发明另一实施例,在根据预构建的数据监控规则,监控所述特征库的运行状态之前,还包括:检测所述特征库中是否存在数据特征缺失值,若存在数据特征缺失值,则对所述数据缺失值进行填充,以保障所述特征库中数据特征的完整性。
其中,所述数据特征缺失值的检测可以通过数据缺失值检测工具中的检测函数实现,如Amelia package工具中的missmap function检测函数。所述对所述数据特征缺失值进行填充包括:获取待填充数据特征的缺失位置,在所述缺失位置创建填充参数,并计算所述填充参数的缺失值概率,根据所述缺失位置、填充参数以及缺失值概率,得到对应填充的数据特征缺失值。
进一步地,本发明实施例根据预构建的数据监控规则,监控所述特征库的运行状态,以实时了解所述特征库中每个数据特征的使用状态,保障数据特征对应业务***的运行稳定性。其中,所述数据监控规则是指在维护所述特征库中的数据特征需要遵循的规则,其基于不同业务场景产生,包括数据监控策略和数据监控方式。其中,所述数据监控策略包括:特征更新策略、特征维护策略以及特征预警策略等,所述数据监控方式包括:移动均值监控、环比同比监控以及控制图监控等。
本发明实施例首先通过识别原始数据的数据特征,对所述数据特征进行特征聚类,生成多个聚类数据特征,并对每个所述聚类数据特征进行结构化转换,得到结构化聚类数据特征,以保障后续数据特征可以正常加载;其次,本发明实施例通过对所述结构化聚类数据特征中的敏感数据特征进行特征加密,得到加密聚类数据特征,以保障数据特征在运行过程中的隐私性和安全性;进一步地,本发明实施例配置所述加密聚类数据特征的特征库,根据预构建的数据监控规则,监控所述特征库的运行状态,可以了解加密聚类数据特征中数据特征之间的逻辑关系,从而监控特征库中每个数据特征在运行过程中的使用状态,进而可以保障应用数据特征对应业务***的鲁棒性。因此,本发明提出的一种数据特征监控方法可以监控数据特征的运行状态,以保障应用数据特征的业务***的鲁棒性。
如图3所示,是本发明数据特征监控装置的功能模块图。
本发明所述数据特征监控装置100可以安装于电子设备中。根据实现的功能,所述数据特征监控装置可以包括特征聚类模块101、特征转换模块102、特征加密模块103以及特征监控模块104。本发所述模块也可以称之为单元,是指一种能够被电子设备1处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备1的存储器中。
在本实施例中,关于各模块/单元的功能如下:
所述特征聚类模块101,用于获取原始数据,识别所述原始数据的数据特征,对所述数据特征进行特征聚类,生成多个聚类数据特征。
本发明实施例中,所述原始数据基于不同业务场景产生,如对于金融证券服务场景,所述原始数据包括:金融数据、理财数据、保险数据以及证券数据等,所述数据特征是指所述原始数据的一般特征或特性的汇总,在本发明中,所述数据特征可以理解为所述原始数据的数据标识,用于标记所述原始数据的身份信息,如所述原始数据为用户基本信息,则该原始数据的数据特征可以为用户身份号。
作为本发明的一个实施例,所述识别原始数据的数据特征,所述特征聚类模块101采用下述方式执行:对所述原始数据进行去重操作,识别去重后的所述原始数据的数据字段,根据所述数据字段,对去重后的所述原始数据进行特征提取,得到特征数据,根据所述特征数据,生成所述原始数据的数据特征。
本发明一可选实施例中,所述对所述原始数据进行去重操作,所述特征聚类模块101采用下述方式执行:计算所述原始数据中任意两个数据的相似度,若所述相似度不大于预设相似度,则同时保留所述两个原始数据,若所述相似度大于预设相似度,则删除所述两个数据中任意一个数据。
需要说明的是,本发明实施例在计算所述原始数据的相似度之前,还包括:利用hash算法将所述原始数据转换成对应hash值,以实现后续原始数据相似度的计算。
本发明一可选实施例中,所述数据字段通过预设的字段识别脚本实现,以自动化获取所述去重数据的数据字段,提高数据处理速度,所述字段识别脚本通过JavaScript脚本语言编译,示例性的,所述去重数据为贷款数据,如贷款时间、贷款金额以及贷款利率,通过所述字段识别脚本,可以识别出对应的数据字段为“时间”、“金额”以及“利率”。
本发明一可选实施例中,根据所述数据字段,对去重后的所述原始数据进行特征提取,得到特征数据,所述特征聚类模块101采用下述方式执行:根据所述数据字段,查询去重后的所述原始数据的数据字符串,采用线性方法提取所述数据字符串的字符串特征,根据所述字符串特征,生成特征数据。其中,所述数据字符串的查询可以通过SQL语句查询,所述线性方法包括:主成分分析法、线性判别分析法以及多维尺度法。
本发明一可选实施例中,所述根据所述特征数据,生成所述原始数据的数据特征,所述特征聚类模块101采用下述方式执行:获取所述特征数据的特征字段,根据所述特征字段,得到所述原始数据的数据特征,例如,所述特征数据为***贷款数据,其特征字段为***申请次数,则对应的数据特征可以为“***申请次数”。
进一步地,本发明实施例对所述数据特征进行特征聚类,以将具有相同类型的特征进行聚类,提高后续数据特征的查询速度。
作为本发明的一个实施例,所述对所述数据特征进行特征聚类,生成多个聚类数据特征,所述特征聚类模块101采用下述方式执行:获取所述数据特征的维度信息,将具有相同维度信息的数据特征进行聚类,得到多个聚类中心点,根据每个所述聚类中心点,生成多个聚类数据特征。
其中,所述维度信息可以了解为所述数据特征的数据特征类型,如数据特征为“***申请次数”的维度信息可以为贷款信息。所述数据特征的聚类可以通过聚类算法实现,如k-means算法。
所述特征转换模块102,用于对每个所述聚类数据特征进行结构化转换,得到结构化聚类数据特征。
应该了解,在上述得到每个所述聚类数据特征中,会存在如文本数据特征和图形数据特征的非结构化数据特征,由于非结构化数据特征无法直接应用于模型训练,因此,本发明实施例通过对每个所述聚类数据特征进行结构化转换,以将所述聚类数据特征的非结构化数据特征转换为结构化数据特征,从而可以保障后续聚类数据特征中所有的数据特征可以正常加载。
作为本发明的一个实施例,所述对每个所述聚类数据特征进行结构化转换,得到结构化聚类数据特征,所述特征转换模块102采用下述方式执行:识别每个所述聚类数据特征中所有数据特征的特征结构和特征类;根据所述特征结构和特征类,识别所述聚类数据特征中的非结构化数据特征;将所述聚类数据特征中的非结构化数据特征转换为结构化数据特征,得到结构化聚类数据特征。
其中,所述特征结构是指存储数据特征的方式,如数组、队列、图形以及堆等,所述特征类是指一种用户定义的引用数据特征类型,其用于编译数据特征的特征实例对象。
一个可选实施例中,所述根据所述特征结构和特征类,识别所述聚类数据特征中的非结构化数据特征,所述特征转换模块102采用下述方式执行:识别所述特征结构是否具备表结构,及所述特征类是否具备类定义形式,若所述数据结构具备表结构且所述数据类型具备类定义形式,则得到对应数据特征为结构化数据特征;若所述数据结构不具备表结构和/或所述数据类型不具备类定义形式,则得到对应数据特征为非结构化数据特征。
其中,所述表结构包含表名、记录及字段等内容,所述类定义形式指的是描述数据特征实例属性的类形式。
一个可选实施例中,所述将所述聚类数据特征中的非结构化数据特征转换为结构化数据特征,得到结构化聚类数据特征,所述特征转换模块102采用下述方式执行:将所述非结构化数据特征***至预先构建的表结构,并定义所述表结构的类,生成结构化聚类数据特征。其中,所述表结构可以通过Java语言中的create table{}函数实现,所述类定义可以通过Java语言中的class{}函数实现。
所述特征加密模块103,用于识别所述结构化聚类数据特征中的敏感数据特征和非敏感数据特征,并对所述敏感数据特征进行特征加密,得到加密聚类数据特征。
应该了解,在所述结构化聚类数据特征会存在一定的敏感数据特征,即会存在一些隐私性数据,如资产数据特征、征信数据特征以及财务数据特征等,因此,本发明实施例通过识别所述结构化聚类数据特征中的敏感数据特征,并对敏感数据特征进行特征加密,以提高所述结构化聚类数据特征中的敏感数据特征的隐私性和安全性。
作为本发明的一个实施例,所述识别所述结构化聚类数据特征中的敏感数据特征和非敏感数据特征,所述特征加密模块103采用下述方式执行:计算所述结构化聚类数据特征中的结构化数据特征与预设敏感数据特征库中敏感数据特征的匹配度,将所述匹配度大于预设匹配度的结构化数据特征作为敏感数据特征,及将匹配度不大于预设匹配度的结构化数据特征作为非敏感数据特征。
其中,所述预设敏感数据特征库中敏感数据特征根据历史业务场景中产生的敏感数据特征获取,比如在历史金融的贷款审核场景中,经审核发现,该贷款审核场景中资产数据特征、征信数据特征以及财务数据特征等数据特征为敏感数据特征,于是将这些数据特征存入所述预设敏感数据特征库中,可选的,所述预设敏感数据特征库可以通过数据库构建,用于实现数据的快速的存取。
本发明一可选实施例中,所述特征加密模块103采用下述方式计算所述结构化聚类数据特征中的结构化数据特征与预设敏感数据特征库中敏感数据特征的匹配度:
Figure BDA0003135864870000121
其中,T(x,y)表示匹配度,xi表示结构化聚类数据特征中第i个结构化数据特征,yi表示预设敏感数据特征库中第i个敏感数据特征。
本发明一可选实施例中,所述预设匹配度设置为0.75,也可以根据实际业务场景设置。
作为本发明的一个实施例,所述对所述敏感数据特征进行特征加密,得到加密聚类数据特征,所述特征加密模块103采用下述方式执行:识别所述敏感数据特征的特征类型,若所述特征类型为类别特征,则采用哈希(hash)算法对所述类别特征的敏感数据特征进行特征加密,得到第一加密聚类数据特征,若所述特征类型为数值类别,则采用离散化算法对所述数值类别的敏感数据特征进行特征加密,得到第二加密聚类数据特征,汇总所述第一加密聚类数据特征和第二加密聚类数据特征,得到加密聚类数据特征。
进一步地,为保障所述敏感数据特征的隐私性和安全性,所述敏感数据特征还可存储于区块链节点中。
所述特征监控模块104,用于配置所述加密聚类数据特征和所述非敏感数据特征的特征库,根据预构建的数据特征监控规则,监控所述特征库的运行状态。
应该了解,在上述所述加密聚类数据特征中,是仅将具有相同维度信息的数据特征进行归类,并不了解每个所述聚类数据特征中数据特征之间的逻辑关系(如位置关系、存储关系以及查询关系等),因此,本发明实施例通过配置所述加密聚类数据特征的特征库,以定义所述聚类数据特征中所有的数据特征的逻辑关系,从而以准确的查找加密聚类数据特征中每个数据特征的使用状态。
作为本发明的一个实施例,所述配置所述加密聚类数据特征和所述非敏感数据特征的特征库,所述特征监控模块104采用下述方式执行:定义所述加密聚类数据特征和所述非敏感数据特征之间的层级关系,根据所述层级关系,创建所述加密聚类数据特征和所述非敏感数据特征之间的下拉图表和数据特征表,根据所述下拉图表和数据特征表,生成所述加密聚类数据特征和所述非敏感数据特征的特征库。
其中,所述层级关系是指所述加密聚类数据特征和所述非敏感数据特征之间的连接关系,如包含关系、并列关系,所述下拉图表用于存储具有包含关系的数据特征,所述数据特征表用于存储具有并列关系的数据特征,可选的,所述下拉图表和数据特征表可以通过SQL语句在数据库中以数据表的形式创建,则所述特征库可以理解为所述加密聚类数据特征和所述非敏感数据特征的数据特征库。
进一步地,本发明另一实施例,在根据预构建的数据监控规则,监控所述特征库的运行状态之前,所述特征监控模块104还包括:检测所述特征库中是否存在数据特征缺失值,若存在数据特征缺失值,则对所述数据缺失值进行填充,以保障所述特征库中数据特征的完整性。
其中,所述数据特征缺失值的检测可以通过数据缺失值检测工具中的检测函数实现,如Amelia package工具中的missmap function检测函数。所述对所述数据特征缺失值进行填充包括:获取待填充数据特征的缺失位置,在所述缺失位置创建填充参数,并计算所述填充参数的缺失值概率,根据所述缺失位置、填充参数以及缺失值概率,得到对应填充的数据特征缺失值。
进一步地,本发明实施例根据预构建的数据监控规则,监控所述特征库的运行状态,以实时了解所述特征库中每个数据特征的使用状态,保障数据特征对应业务***的运行稳定性。其中,所述数据监控规则是指在维护所述特征库中的数据特征需要遵循的规则,其基于不同业务场景产生,包括数据监控策略和数据监控方式。其中,所述数据监控策略包括:特征更新策略、特征维护策略以及特征预警策略等,所述数据监控方式包括:移动均值监控、环比同比监控以及控制图监控等。
本发明实施例首先通过识别原始数据的数据特征,对所述数据特征进行特征聚类,生成多个聚类数据特征,并对每个所述聚类数据特征进行结构化转换,得到结构化聚类数据特征,以保障后续数据特征可以正常加载;其次,本发明实施例通过对所述结构化聚类数据特征中的敏感数据特征进行特征加密,得到加密聚类数据特征,以保障数据特征在运行过程中的隐私性和安全性;进一步地,本发明实施例配置所述加密聚类数据特征的特征库,根据预构建的数据监控规则,监控所述特征库的运行状态,可以了解加密聚类数据特征中数据特征之间的逻辑关系,从而监控特征库中每个数据特征在运行过程中的使用状态,进而可以保障应用数据特征对应业务***的鲁棒性。因此,本发明提出的一种数据特征监控装置可以监控数据特征的运行状态,以保障应用数据特征的业务***的鲁棒性。
如图4所示,是本发明实现数据特征监控方法的电子设备1的结构示意图。
所述电子设备1可以包括处理器10、存储器11、通信总线12以及通信接口13,还可以包括存储在所述存储器11中并可在所述处理器10上运行的计算机程序,如数据特征监控程序。
其中,所述处理器10在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述处理器10是所述电子设备1的控制核心(ControlUnit),利用各种接口和线路连接整个电子设备1的各个部件,通过运行或执行存储在所述存储器11内的程序或者模块(例如执行数据特征监控程序等),以及调用存储在所述存储器11内的数据,以执行电子设备1的各种功能和处理数据。
所述存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:SD或DX存储器等)、磁性存储器、磁盘、光盘等。所述存储器11在一些实施例中可以是电子设备1的内部存储单元,例如该电子设备1的移动硬盘。所述存储器11在另一些实施例中也可以是电子设备1的外部存储设备,例如电子设备1上配备的插接式移动硬盘、智能存储卡(Smart Media Card,SMC)、安全数字(SecureDigital,SD)卡、闪存卡(Flash Card)等。进一步地,所述存储器11还可以既包括电子设备1的内部存储单元也包括外部存储设备。所述存储器11不仅可以用于存储安装于电子设备1的应用软件及各类数据,例如数据特征监控程序的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
所述通信总线12可以是外设部件互连标准(peripheral componentinterconnect,简称PCI)总线或扩展工业标准结构(extended industry standardarchitecture,简称EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。所述总线被设置为实现所述存储器11以及至少一个处理器10等之间的连接通信。
所述通信接口13用于上述电子设备1与其他设备之间的通信,包括网络接口和用户接口。可选地,所述网络接口可以包括有线接口和/或无线接口(如WI-FI接口、蓝牙接口等),通常用于在该电子设备1与其他电子设备1之间建立通信连接。所述用户接口可以是显示器(Display)、输入单元(比如键盘(Keyboard)),可选地,用户接口还可以是标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备1中处理的信息以及用于显示可视化的用户界面。
图4仅示出了具有部件的电子设备1,本领域技术人员可以理解的是,图4示出的结构并不构成对所述电子设备1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
例如,尽管未示出,所述电子设备1还可以包括给各个部件供电的电源(比如电池),优选地,电源可以通过电源管理装置与所述至少一个处理器10逻辑相连,从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备1还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。
应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。
所述电子设备1中的所述存储器11存储的数据特征监控程序是多个计算机程序的组合,在所述处理器10中运行时,可以实现:
获取原始数据,识别所述原始数据的数据特征,对所述数据特征进行特征聚类,生成多个聚类数据特征;
对每个所述聚类数据特征进行结构化转换,得到结构化聚类数据特征;
识别所述结构化聚类数据特征中的敏感数据特征和非敏感数据特征,并对所述敏感数据特征进行特征加密,得到加密聚类数据特征;
配置所述加密聚类数据特征和所述非敏感数据特征的特征库,根据预构建的数据特征监控规则,监控所述特征库的运行状态。
具体地,所述处理器10对上述计算机程序的具体实现方法可参考图1对应实施例中相关步骤的描述,在此不赘述。
进一步地,所述电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个非易失性计算机可读取存储介质中。所述计算机可读存储介质可以是易失性的,也可以是非易失性的。例如,所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)。
本发明还提供一种计算机可读存储介质,所述可读存储介质存储有计算机程序,所述计算机程序在被电子设备1的处理器所执行时,可以实现:
获取原始数据,识别所述原始数据的数据特征,对所述数据特征进行特征聚类,生成多个聚类数据特征;
对每个所述聚类数据特征进行结构化转换,得到结构化聚类数据特征;
识别所述结构化聚类数据特征中的敏感数据特征和非敏感数据特征,并对所述敏感数据特征进行特征加密,得到加密聚类数据特征;
配置所述加密聚类数据特征和所述非敏感数据特征的特征库,根据预构建的数据特征监控规则,监控所述特征库的运行状态。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。***权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。

Claims (8)

1.一种数据特征监控方法,其特征在于,所述方法包括:
获取原始数据,识别所述原始数据的数据特征,对所述数据特征进行特征聚类,生成多个聚类数据特征;
对每个所述聚类数据特征进行结构化转换,得到结构化聚类数据特征;
识别所述结构化聚类数据特征中的敏感数据特征和非敏感数据特征,并识别所述敏感数据特征的特征类型,若所述特征类型为类别特征,则采用哈希算法对所述类别特征的敏感数据特征进行特征加密,得到第一加密聚类数据特征,若所述特征类型为数值类别,则采用离散化算法对所述数值类别的敏感数据特征进行特征加密,得到第二加密聚类数据特征,汇总所述第一加密聚类数据特征和第二加密聚类数据特征,得到加密聚类数据特征;
定义所述加密聚类数据特征和所述非敏感数据特征之间的层级关系,根据所述层级关系,创建所述加密聚类数据特征和所述非敏感数据特征之间的下拉图表和数据特征表,根据所述下拉图表和数据特征表,生成所述加密聚类数据特征和所述非敏感数据特征的特征库,根据预构建的数据特征监控规则,监控所述特征库的运行状态。
2.如权利要求1所述的数据特征监控方法,其特征在于,所述识别原始数据的数据特征,包括:
对所述原始数据进行去重操作,识别去重后的所述原始数据的数据字段;
根据所述数据字段,对去重后的所述原始数据进行特征提取,得到特征数据;
根据所述特征数据,生成所述原始数据的数据特征。
3.如权利要求1所述的数据特征监控方法,其特征在于,所述对每个所述聚类数据特征进行结构化转换,得到结构化聚类数据特征,包括:
识别每个所述聚类数据特征中所有数据特征的特征结构和特征类;
根据所述特征结构和特征类,识别所述聚类数据特征中的非结构化数据特征;
将所述聚类数据特征中的非结构化数据特征转换为结构化数据特征,得到结构化聚类数据特征。
4.如权利要求3所述的数据特征监控方法,其特征在于,所述根据所述特征结构和特征类,识别所述聚类数据特征中的非结构化数据特征,包括:
识别所述特征结构是否具备表结构,及所述特征类是否具备类定义形式;
若数据结构具备表结构且数据类型具备类定义形式,则得到所述数据特征为结构化数据特征;
若所述数据结构不具备表结构和/或所述数据类型不具备类定义形式,则得到所述数据特征为非结构化数据特征。
5.如权利要求1所述的数据特征监控方法,其特征在于,所述识别所述结构化聚类数据特征中的敏感数据特征和非敏感数据特征,包括:
计算所述结构化聚类数据特征中的结构化数据特征与预设敏感数据特征库中敏感数据特征的匹配度;
将所述匹配度大于预设匹配度的结构化数据特征作为敏感数据特征,及将匹配度不大于预设匹配度的结构化数据特征作为非敏感数据特征。
6.一种数据特征监控装置,其特征在于,所述装置包括:
特征聚类模块,用于获取原始数据,识别所述原始数据的数据特征,对所述数据特征进行特征聚类,生成多个聚类数据特征;
特征转换模块,用于对每个所述聚类数据特征进行结构化转换,得到结构化聚类数据特征;
特征加密模块,用于识别所述结构化聚类数据特征中的敏感数据特征和非敏感数据特征,并识别所述敏感数据特征的特征类型,若所述特征类型为类别特征,则采用哈希算法对所述类别特征的敏感数据特征进行特征加密,得到第一加密聚类数据特征,若所述特征类型为数值类别,则采用离散化算法对所述数值类别的敏感数据特征进行特征加密,得到第二加密聚类数据特征,汇总所述第一加密聚类数据特征和第二加密聚类数据特征,得到加密聚类数据特征;
特征监控模块,用于定义所述加密聚类数据特征和所述非敏感数据特征之间的层级关系,根据所述层级关系,创建所述加密聚类数据特征和所述非敏感数据特征之间的下拉图表和数据特征表,根据所述下拉图表和数据特征表,生成所述加密聚类数据特征和所述非敏感数据特征的特征库,根据预构建的数据特征监控规则,监控所述特征库的运行状态。
7.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至5中任意一项所述的数据特征监控方法。
8.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5中任意一项所述的数据特征监控方法。
CN202110718976.2A 2021-06-28 2021-06-28 数据特征监控方法、装置、电子设备及存储介质 Active CN113434365B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110718976.2A CN113434365B (zh) 2021-06-28 2021-06-28 数据特征监控方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110718976.2A CN113434365B (zh) 2021-06-28 2021-06-28 数据特征监控方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN113434365A CN113434365A (zh) 2021-09-24
CN113434365B true CN113434365B (zh) 2022-11-25

Family

ID=77755029

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110718976.2A Active CN113434365B (zh) 2021-06-28 2021-06-28 数据特征监控方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN113434365B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105825138A (zh) * 2015-01-04 2016-08-03 北京神州泰岳软件股份有限公司 一种敏感数据识别的方法和装置
CN107944283A (zh) * 2017-11-15 2018-04-20 中国农业银行股份有限公司 一种数据敏感性识别方法及装置
CN110928931A (zh) * 2020-02-17 2020-03-27 深圳市琦迹技术服务有限公司 敏感数据的处理方法及装置、电子设备、存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10671750B2 (en) * 2018-08-17 2020-06-02 Mentis Inc. System and method for data classification centric sensitive data discovery
CN110795751A (zh) * 2019-10-30 2020-02-14 浪潮云信息技术有限公司 一种通过自然语言分析对敏感数据进行安全保护的方法
CN111339052A (zh) * 2020-02-28 2020-06-26 ***股份有限公司 一种非结构化日志数据处理方法及装置
CN111581193A (zh) * 2020-04-27 2020-08-25 平安资产管理有限责任公司 数据处理方法、设备、计算机***及存储介质
CN111881480A (zh) * 2020-07-31 2020-11-03 平安付科技服务有限公司 隐私数据加密方法、装置、计算机设备及存储介质
CN112632195A (zh) * 2020-12-30 2021-04-09 平安证券股份有限公司 基于大数据的概念图展示方法、装置、设备及介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105825138A (zh) * 2015-01-04 2016-08-03 北京神州泰岳软件股份有限公司 一种敏感数据识别的方法和装置
CN107944283A (zh) * 2017-11-15 2018-04-20 中国农业银行股份有限公司 一种数据敏感性识别方法及装置
CN110928931A (zh) * 2020-02-17 2020-03-27 深圳市琦迹技术服务有限公司 敏感数据的处理方法及装置、电子设备、存储介质

Also Published As

Publication number Publication date
CN113434365A (zh) 2021-09-24

Similar Documents

Publication Publication Date Title
CN113239106B (zh) Excel文件导出方法、装置、电子设备及存储介质
CN112528616B (zh) 业务表单生成方法、装置、电子设备及计算机存储介质
CN112115145A (zh) 数据采集方法、装置、电子设备及存储介质
CN113961473A (zh) 数据测试方法、装置、电子设备及计算机可读存储介质
CN114550076A (zh) 区域异常行为监控方法、装置、设备及存储介质
CN112699142A (zh) 冷热数据处理方法、装置、电子设备及存储介质
CN114612194A (zh) 产品推荐方法、装置、电子设备及存储介质
CN114185895A (zh) 数据导入导出方法、装置、电子设备及存储介质
CN114138784A (zh) 基于存储库的信息溯源方法、装置、电子设备及介质
CN113268665A (zh) 基于随机森林的信息推荐方法、装置、设备及存储介质
CN114547696A (zh) 文件脱敏方法、装置、电子设备及存储介质
CN113434542B (zh) 数据关系识别方法、装置、电子设备及存储介质
CN114185776A (zh) 应用程序的大数据埋点方法、装置、设备及介质
CN113658002A (zh) 基于决策树的交易结果生成方法、装置、电子设备及介质
CN113434365B (zh) 数据特征监控方法、装置、电子设备及存储介质
CN114840631A (zh) 空间文本查询方法、装置、电子设备及存储介质
CN114911479A (zh) 基于配置化的界面生成方法、装置、设备及存储介质
CN114996386A (zh) 业务角色识别方法、装置、设备及存储介质
CN114518993A (zh) 基于业务特征的***性能监控方法、装置、设备及介质
CN114238233A (zh) 文件自动化清理方法、装置、设备及存储介质
CN113360505B (zh) 基于时序数据的数据处理方法、装置、电子设备及可读存储介质
CN113448933B (zh) 业务数据处理方法、装置、电子设备及介质
CN114386078B (zh) 一种基于bim的建设项目电子档案管理方法及装置
CN113672565B (zh) 一种文件标记方法、装置、电子设备及存储介质
CN113657076B (zh) 页面操作记录表的生成方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant