CN114511402A - 风险模型特征数据的管理方法及相关应用设备 - Google Patents

风险模型特征数据的管理方法及相关应用设备 Download PDF

Info

Publication number
CN114511402A
CN114511402A CN202210142996.4A CN202210142996A CN114511402A CN 114511402 A CN114511402 A CN 114511402A CN 202210142996 A CN202210142996 A CN 202210142996A CN 114511402 A CN114511402 A CN 114511402A
Authority
CN
China
Prior art keywords
data
database
variable
risk model
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210142996.4A
Other languages
English (en)
Inventor
李金兰
金颖媛
刘霞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Boc Financial Technology Co ltd
Original Assignee
Boc Financial Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Boc Financial Technology Co ltd filed Critical Boc Financial Technology Co ltd
Priority to CN202210142996.4A priority Critical patent/CN114511402A/zh
Publication of CN114511402A publication Critical patent/CN114511402A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供了一种风险模型特征数据的管理方法及相关应用设备,该方法在确定需要存储至数据库数据类型之后,按照数据所属数据类型所对应的存储方式,将数据存储至数据库;然后分别确定出数据库中各项数据的原始变量、衍生变量以及标签变量;原始变量是根据数据湖中与数据库中各项数据相关的数据生成的;最后根据原始变量、衍生变量及标签变量,生成数据管理目录,以供模型配置人员根据数据管理目录从数据湖或数据库中获取对应的入模数据,也即本发明提供的方法可以通过数据管理目录清晰展示数据层次,数据基本信息,数据适用模型以及成效,并且引入数据湖,能够充分利用现有数据。

Description

风险模型特征数据的管理方法及相关应用设备
技术领域
本发明涉及数据处理技术领域,具体涉及一种风险模型特征数据的管理方法及相关应用设备。
背景技术
《商业银行互联网贷款管理方法》于2020年7月17日正式出台并施行,该管理方法对商业银行互联网贷款模型及科技体系提出了要求。其中,在全风险治理架构方面,要求明确风险管理要求,建立全面风险管理体系,建立健全的风险治理架构,明确管理职责,建立考核问责机制;在全模型生命周期方面,要求建立风险模型评审机制,建立有效的风险模型日常检测体系,建立风险模型推出处置机制,全面记录风险模型开发至退出的全过程;在全面风险管理体系,要求信息科技风险管理,建立安全、合规、高效和可靠的互联网贷款信息***,以满足互联网贷款业务经营和风险管理要求。
传统的风险模型特征数据管理方式主要基于任务触发,数据接口按任务实施定义,无统一管理标准,不仅需要技术人员大量精力的投入,还不能清晰区分数据使用模型、场景及其他影响模型的因素,多任务之间工作冗余量大,不满足该管理办法的需求。
发明内容
对此,本申请提供一种风险模型特征数据的管理方法及相关应用设备,以解决现有相关管理方案主要基于任务触发,数据接口按任务实施定义,无统一管理标准,不仅需要技术人员大量精力的投入,还不能清晰区分数据使用模型、场景及其他影响模型的因素,多任务之间工作冗余量大,不满足该管理办法需求的问题。
为实现上述目的,本发明实施例提供如下技术方案:
本发明第一方面公开了一种风险模型特征数据的管理方法,包括:
确定需要存储至数据库数据所属的数据类型;
按照所述数据所属数据类型所对应的存储方式,将所述数据存储至所述数据库;
分别确定出所述数据库中各项数据的原始变量、衍生变量以及标签变量;所述原始变量是根据数据湖中与所述数据库中各项数据相关的数据生成的;
根据所述原始变量、所述衍生变量及所述标签变量,生成数据管理目录,以供模型配置人员根据所述数据管理目录从所述数据湖或所述数据库中获取对应的数据入模。
可选地,在上述的风险模型特征数据的管理方法中,确定需要存储至数据库数据所属的数据类型,包括:
若需要存储至所述数据库的数据为非标准化数据或标准化数据的行内数据,则所述数据所属的数据类型为第一类型;
若需要存储至所述数据库的数据为所述标准化数据的行外数据,则所述数据所属的数据类型为第二类型。
可选地,在上述的风险模型特征数据的管理方法中,所述数据所属类型所对应的存储方式包括:
若所述数据所属的数据类型为所述第一类型,则对应的存储方式为:直接存储;
若所述数据所属的数据类型为所述第二类型,则对应的存储方式为:进行预设格式处理后存储。
可选地,在上述的风险模型特征数据的管理方法中,确定出所述数据库中各项数据的衍生变量,包括:
分别获取所述数据库中各项数据对应的衍生变量公式;
针对每一项数据,利用其对应的衍生变量公式进行计算,得到所述数据的衍生变量。
可选地,在上述的风险模型特征数据的管理方法中,确定出所述数据库中各项数据的标签变量,包括:
分别确定出所述数据库中各项数据对应的标签生成规则;
根据所述标签生成规则,生成各项所述数据的标签变量。
可选地,在上述的风险模型特征数据的管理方法中,还包括:
实时判断所述数据库中各项数据的版本是否更新;
针对更新版本的数据,生成更新报告,并将更新信息发送至对应的风险模型,以使对应的所述风险模型根据更新信息同步更新入模数据。
可选地,在上述的风险模型特征数据的管理方法中,还包括:
根据预设校验规则,对所述数据库中的目标数据进行校验,生成所述目标数据的验核报告。
本发明第二方面公开了一种风险模型特征数据的管理***,包括:
第一确定单元,用于确定需要存储至数据库数据所属的数据类型;
第一存储单元,按照所述数据所属数据类型所对应的存储方式,将所述数据存储至所述数据库;
第二确定单元,用于分别确定出所述数据库中各项数据的原始变量、衍生变量以及标签变量;所述原始变量是根据数据湖中与所述数据库中各项数据相关的数据生成的;
第一生成单元,用于根据所述原始变量、所述衍生变量及所述标签变量,生成数据管理目录,以供模型配置人员根据所述数据管理目录从所述数据湖或所述数据库中获取对应的数据入模。
本发明第三方面公开了一种电子设备,包括处理器和存储器;其中:
所述存储器用于存储计算机指令;
所述处理器用于执行所述存储器存储的计算机指令,具体执行如第一方面公开的任意一项所述的风险模型特征数据的管理方法。
本发明第四方面公开了一种存储介质,用于存储程序,所述程序被执行时,用于实现如第一方面公开的任意一项所述的风险模型特征数据的管理方法。
本发明提供的风险模型特征数据的管理方法及相关应用设备,该方法在确定需要存储至数据库数据类型之后,按照数据所属数据类型所对应的存储方式,将数据存储至数据库;然后分别确定出数据库中各项数据的原始变量、衍生变量以及标签变量;原始变量是根据数据湖中与数据库中各项数据相关的数据生成的;最后根据原始变量、衍生变量及标签变量,生成数据管理目录,以供模型配置人员根据数据管理目录从数据湖或数据库中获取对应的入模数据,也即本发明提供的方法可以通过数据管理目录清晰展示数据层次,数据基本信息,数据适用模型以及成效,并且引入数据湖,能够充分利用现有数据。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例提供的一种风险模型特征数据的管理方法的流程图;
图2为本申请实施例提供的一种确定出数据库中各项数据的衍生变量的流程图;
图3为本申请实施例提供的一种确定出数据库中各项数据的标签变量的流程图;
图4为本申请实施例提供的另一种风险模型特征数据的管理方法的流程图;
图5为本申请实施例提供的一种风险模型特征数据的管理***的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
首先需要说明的是,经发明人研究发现,商业银行零售风险数据集市是针对商业银行对私风险数据主题进行统一的数据清晰整合,提供面向业务的风险数据,并梳理和理解数据之间逻辑,支撑对私各业务场景的风控需求,可有效提升商业银行的数据使用率,风险管理效率的***。
关系型数据库是指采用了关系型模型来组织数据的数据库,以行和列的形式存储数据便于用户理解,零售风险数据集市的数据是存储在关系型数据库中的。图数据库是一种非关系型数据库,应用图形理论存储实体之间的关系信息。
实际应用中,由于关系型数据库存储数据,图数据库存储数据间的关系,各项数据属性等,因此可以通过图数据库中对各项数据的展示即可快速掌握各项数据的基础信息及关系信息,从而快速从关系型数据库中获取数据。
此外,本申请实施例提供的风险特征模型一般为商业银行网贷风险模型。
基于上述,本申请实施例提供了一种风险模型特征数据的管理方法,以解决现有相关管理方案主要基于任务触发,数据接口按任务实施定义,无统一管理标准,不仅需要技术人员大量精力的投入,还不能清晰区分数据使用模型、场景及其他影响模型的因素,多任务之间工作冗余量大,不满足该管理办法需求的问题。
请参见图1,该风险模型特征数据的管理方法主要包括如下步骤:
S100、确定需要存储至数据库数据所属的数据类型。
实际应用中,若需要存储至数据库数据为非标准化数据或标准化数据的行内数据,则数据所属的数据类型为第一类型;若需要存储至数据库数据为标准化数据的行外数据,则数据所属的数据类型为第二类型。
需要说明的是,非标准化数据可以指尚未利用或暂时不用于入模的原数据。其主要来源于银行外部数据,包括非结构化数据以及结构化但目前还未支持标准化的数据,一般可以通过数据湖保存。例如,客户人脸识别图片,语音记录、文本格式等催收信息等等。
而标准化数据可以指数据格式稳定、规范,可用于风险模型的数据。主要包括行内数据和行外数据。具体的,行内数据可以包括:客户身份信息、客户资产信息、客户收入信息、决策引擎流水中用户构建的数据等。决策引擎流水中用户构建的数据可以包括:审批结果、提款状态、贷款过程中的数据等等。行外数据可以包括:征信数据、公积金数据、税务数据、养老金数据等等。
S102、按照数据所属数据类型所对应的存储方式,将数据存储至数据库。
实际应用中,若数据所属的数据类型为第一类型,也即数据为非标准化数据或者标准化数据的行内数据,则对应的存储方式为:直接存储;若数据所属的数据类型为第二类型,也即数据为标准化数据的行外数据,则对应的存储方式为:进行预设格式处理后存储。
换言之,若需要存储至数据库的数据为非标准化数据或标准化数据的行内数据,则可以直接将该数据存储至数据库中;若需要存储至数据库的数据为标准化数据的行外数据,则需要先对数据进行预设格式处理后,再存储至数据库中。
具体的,预设格式处理可以是根据数据结构标准及元数据管理规范进行格式化处理。
需要说明的是,实际应用中,对于标准化数据的行内数据,可以直接存储数据库;对于行外数据,可以根据外部数据结构标准以及元数据管理规范标准对行外数据进行格式化后,存入数据库。
还需要说明的是,数据湖一般为最底层的数据存储空间,实现未加工数据的直接存储和管理。在本申请方案中,所有现在已经应用的数据以及未来可能用的数据都存储在数据湖中。数据湖中存储的数据是未经过加工处理的,保留数据原始信息,未经过标准化处理,不可直接用于业务需求中。数据库也可以称为数据仓库,主要存储标准化数据。在本申请方案中,数据仓库可以按照数据字段管理原则组织数据,更新数据,以供模型设计人员基于此进行模型设计和监控。
S104、分别确定出数据库中各项数据的原始变量、衍生变量以及标签变量。
其中,原始变量是根据数据湖中与数据库中各项数据相关的数据生成的,具体的,可以对数据湖中与数据库中各项数据相关数据的提取关键字段,并将关键字段作为原始变量。具体的,每项数据的原始变量可以是该项数据的字段名称、字段来源、字段主题、字段类型、字段长度、字段加工逻辑、字段更新频率等等基础信息。
实际应用中,确定出数据库中各项数据的衍生变量的具体过程可如图2所示,具体可以包括如下步骤:
S200、分别获取数据库中各项数据对应的衍生变量公式。
实际应用中,可以根据基础数据项自定义公式,生成风险模型所需的复杂变量。例如,业务需要近3个月的贷款余额最大值,可以定义公式为max(当月贷款余额,上月贷款余额,上上月贷款余额),则***会根据定义公式加工并存储新的衍生变量数据。
需要说明的是,数据库中各项数据所对应的衍生变量公式可视具体应该环境和用户需求确定,并非数据库中各项数据都存在与之对应的衍生变量公式,或者所对应的衍生变量公式都有具体取值;当某项数据不存在与之对应的衍生变量公式,或者其所对应的衍生变量公式无固定取值时,可以将其对应的衍生变量公式视为空。
S202、针对每一项数据,利用其对应的衍生变量公式进行计算,得到数据的衍生变量。
实际应用中,可以针对每项数据利用其对应的衍生变量公式进行计算,得到数据的衍生变量。
然而,确定出数据库中各项数据的标签变量的具体过程可如图3所示,具体可以包括如下步骤:
S300、分别确定出数据库中各项数据对应的标签生成规则。
实际应用中,标签生成规则可以根据专业模型团队研发并向零售风险数据市集提出需求得到。
S302、根据标签生成规则,生成各项数据的标签变量。
实际应用中,可以根据标签生成规则,对数据库中的各项数据进行加工,得到各项数据的标签变量,并且标签变量存储至数据管理目录中,以便统一管理。
需要说明的是,实际应用中的标签变量可以是针对每项数据所属客户类型设置的,是经过加工得到的指标项数据,其主要来源可以如下:
1、风险数据市集根据业务规则自动加工。
2、管理***解析行外数据,如外部信用评分,收入水平等等。
3、图数据库数据结果。
4、业务手工打标。
还需要说明的是,实际中还可以通过图数据库,将数据库中需要增加标签的变量输入至图数据库,以得到该变量对应的标签。
S106、根据原始变量、衍生变量及标签变量,生成数据管理目录,以供模型配置人员根据数据管理目录从数据湖或数据库中获取对应的数据入模。
实际应用中,可以将数据库中每项数据的原始变量,根据衍生变量公式计算得到的衍生变量以及根据标签规则生成的标签变量,存入字段基础信息表,生成数据管理目录,以供模型配置人员根据数据管理目录从数据湖或数据库中获取对应的数据入模,供配置人员轻松掌握数据基础信息。
需要说明的是,该数据管理目录还支持业务自定义勾选,并根据勾选结果推送相关数据至模型数据环境中;并且,数据管理目录还支持自定义入模变量,无需技术人员底层支持。
还需要说明的是,该字段基础信息表中可以清晰看到各个数据层次,例如基础数据、衍生数据、标签数据,以及数据来源、类型、长度、加工逻辑、更新频率等等基本信息。另外,该字段基础信息表还可以作为外轨迹追踪基础,可清晰展示数据入模轨迹,换言之,可以通过字段基础信息表查询某项数据,即可得到该项数据的入模轨迹。并且,风险模型相关配置人员还可根据模型文档,从字段基础信息表的衍生变量中选择对应变量进行入模配置。
基于上述原理,本实施例提供的风险模型特征数据的管理方法在确定需要存储至数据库数据类型之后,按照数据所属数据类型所对应的存储方式,将数据存储至数据库;然后分别确定出数据库中各项数据的原始变量、衍生变量以及标签变量;原始变量是根据数据湖中与数据库中各项数据相关的数据生成的,最后根据原始变量、衍生变量及标签变量,生成数据管理目录,以供模型配置人员根据数据管理目录从数据湖或数据库中获取对应的入模数据,也即本发明提供的方法可以通过模块化管理方式生成数据管理目录清晰展示数据层次,数据基本信息,数据适用模型以及成效,并且引入数据湖,能够充分利用现有数据,解决了主要基于任务触发,数据接口按任务实施定义,无统一管理标准,不仅需要技术人员大量精力的投入,还不能清晰区分数据使用模型、场景及其他影响模型的因素,多任务之间工作冗余量大,不满足该管理办法的需求的问题。
再者,本发明提供的方法还能够满足《商业银行互联网贷款管理方法》要求,相较于现有的任务触发时的特征数据管理模式,不仅能够实现全风险治理架构、全模型生命周期、全面风险管理体系的客户信用综合评价体系,还可以通过上述方式建立出标准化管理方式,实现对风险模型的模块化配置,流程化管理,可视化监控以及参数化使用。
此外,本发明提供的方法还引入了数据湖,充分实现了现有技术的利用,视其存在更多应用可能性。
可选地,在本申请提供的另一实施例中,请参见图4,该风险模型特征数据的管理方法,还包括如下步骤:
S400、实时判断数据库中各项数据的版本是否更新。
实际应用中,数据库会对每次存入的数据赋予版本号,随着数据加工逻辑的变化,每次存入新的数据会替换原始数据,并且对应的版本号会自动累加,因此可以通过判断各项数据对应的版本号是否叠加,从而判断出各项数据的版本是否更新。
需要说明的是,当数据库中某项数据相关信息发生变化时,该项数据对应的字段基础信息表会同步更新。其中,更新频率可以由用户自定义,例如将更新频率由日更变为月更,那么更新后的变化会在表中体现,并将变化的各项数据的版本号+1。
S402、针对更新版本的数据,生成更新报告,并将更新信息发送至对应的风险模型,以使对应的风险模型根据更新信息同步更新入模数据。
实际应用中,针对更新版本的各项数据,可以生成更新报告以供用户查阅,同时还可以将更新信息发送至使用该项数据的风险模型,以使对应的风险模型及时根据更新的各项数据更新入模数据。
具体的,可以通过***消息的方式通知使用该项数据的相关模型,以使模型根据具体更新信息同步进行更新。
需要说明的是,实际中还可以通过比对数据库中各项数据的版本号以及风险模型中所使用的各项数据版本号,判断出风险模型中所使用的数据与数据库中的数据是否一致,若不一致,则可以生成异常指令,以提示风险模型中所使用的数据与数据库中的数据不一致,以提高风险模型结果的准确度。
可选地,在本申请提供的另一实施例中,该风险模型特征数据的管理方法,还包括:
根据预设校验规则,对数据库中的目标数据进行校验,生成目标数据的验核报告。
实际应用中,该目标数据可以是外部数据,例如百融等外部机构的数据。其中,可以根据业务自定义校验规则,对该外部数据进行核验,以检验该外部数据是否符合业务要求,生成验核报告。
假设业务定义的预设校验规则为:应还金额=应还本金+应还利息,那么根据该规则校验外部数据中每项数据应还金额是否等于应还本金+应还利息,将不符合该规则的数据写入报告,以供模型人员根据该报告分析坏数据比例等等,决定模型是否引入相关数据项。
还需要说明的是,该校验的数据可以是单个数据,例如判断该数据类型是否正确,取值范围是否越界等等;若单项数据异常,则可以以日报的形式上报数据管理员。此外,该校验还可以是多个交叉数据,例如公积金缴存基数与缴存比例是否等于月缴存额,以实现数据库中各项数据的质量控制。
实际应用中的预设校验规则可由相应数据管理员视具体应用环境和需求进行设置,以使数据库中的目标数据按照该预设校验规则,生成数据质量日报、月报等等,实现对数据异常情况的掌握,以便修复。
综合上述,本发明提供的风险模型特征数据的管理方法能够使技术人员从任务中抽离,所有特征选择、取消、衍生、入模等操作均可由无技术背景的模型配置人员独立完成,并形成模型配置报告。
基于上述实施例提供的风险模型特征数据的管理方法,本申请另一实施例还提供了一种风险模型特征数据的管理***,请参见图5,该管理***主要包括:
第一确定单元100,用于确定需要存储至数据库数据所属的数据类型。
第一存储单元102,按照数据所属数据类型所对应的存储方式,将数据存储至数据库。
第二确定单元104,用于分别确定出数据库中各项数据的原始变量、衍生变量以及标签变量,原始变量是根据数据湖中与数据库中各项数据相关的数据生成的。
第一生成单元106,用于根据原始变量、衍生变量及标签变量,生成数据管理目录,以供模型配置人员根据数据管理目录从数据湖或数据库中获取对应的数据入模。
可选地,第一确定单元100具体用于:若需要存储至数据库的数据为非标准化数据或标准化数据的行内数据,则数据所属的数据类型为第一类型。
若需要存储至数据库的数据为所述标准化数据的行外数据,则数据所属的数据类型为第二类型。
可选地,第一存储单元102具体用于:若数据所属的数据类型为第一类型,则对应的存储方式为:直接存储。
若数据所属的数据类型为第二类型,则对应的存储方式为:进行预设格式处理后存储。
可选地,第二确定单元104在确定出数据库中各项数据的衍生变量时,具体用于:
分别获取数据库中各项数据对应的衍生变量公式。
针对每一项数据,利用其对应的衍生变量公式进行计算,得到数据的衍生变量。
可选地,第二确定单元104在确定出数据库中各项数据的标签变量时,具体用于:
分别确定出数据库中各项数据对应的标签生成规则。
根据标签生成规则,生成各项数据的标签变量。
可选地,该管理***还包括:
实时判断单元,用于实时判断数据库中各项数据的版本是否更新;
报告生成单元,用于针对更新版本的数据,生成更新报告,并将更新信息发送至对应的风险模型,以使对应的风险模型根据更新信息同步更新入模数据。
可选地,该管理***还包括:
校验单元,用于根据预设校验规则,对数据库中的目标数据进行校验,生成目标数据的验核报告。
在本实施例提供的风险模型特征数据的管理***中,第一确定单元100,用于确定需要存储至数据库数据所属的数据类型;第一存储单元102,按照数据所属数据类型所对应的存储方式,将数据存储至数据库;第二确定单元104,用于分别确定出数据库中各项数据的原始变量、衍生变量以及标签变量;原始变量是根据数据湖中与数据库中各项数据相关的数据生成的;第一生成单元106,用于根据原始变量、衍生变量及标签变量以及数据湖中各项数据的相关信息,生成数据管理目录,以供模型配置人员根据数据管理目录从数据湖或数据库中获取对应的数据入模,可以通过数据管理目录清晰展示数据层次,数据基本信息,数据适用模型以及成效,并且引入数据湖,能够充分利用现有数据,解决了主要基于任务触发,数据接口按任务实施定义,无统一管理标准,不仅需要技术人员大量精力的投入,还不能清晰区分数据使用模型、场景及其他影响模型的因素,多任务之间工作冗余量大,不满足该管理办法的需求的问题。
可选地,本申请另一实施例还公开了一种存储介质,用于存储程序,所述程序被执行时,用于实现如如上述实施例示出的风险模型特征数据的管理方法。
本实施例中的风险模型特征数据的管理方法的具体实现过程与实现原理和上述实施例示出的风险模型特征数据的管理方法一致,可参见对应方法实施例的内容,此处不再赘述。
可选地,本申请实施例公开了一种电子设备,处理器和存储器;其中:
所述存储器用于存储计算机指令;
所述处理器用于执行所述存储器存储的计算机指令,具体执行如如上述实施例示出的风险模型特征数据的管理方法。
在具体实施中,所述电子设备可以包括但不限于手机、平板电脑、其他通用串行总线(Universal Serial Bus,USB)接口设备等。
本实施例中的风险模型特征数据的管理方法的具体实现过程与实现原理和上述实施例示出的风险模型特征数据的管理方法一致,可参见对应方法实施例的内容,此处不再赘述。
本说明书中的各个实施例中记载的特征可以相互替换或者组合,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于***或***实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的***及***实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

Claims (10)

1.一种风险模型特征数据的管理方法,其特征在于,包括:
确定需要存储至数据库数据所属的数据类型;
按照所述数据所属数据类型所对应的存储方式,将所述数据存储至所述数据库;
分别确定出所述数据库中各项数据的原始变量、衍生变量以及标签变量;所述原始变量是根据数据湖中与所述数据库中各项数据相关的数据生成的;
根据所述原始变量、所述衍生变量以及所述标签变量,生成数据管理目录,以供模型配置人员根据所述数据管理目录从所述数据湖或所述数据库中获取对应的数据入模。
2.根据权利要求1所述的风险模型特征数据的管理方法,其特征在于,确定需要存储至数据库数据所属的数据类型,包括:
若需要存储至所述数据库的数据为非标准化数据或标准化数据的行内数据,则所述数据所属的数据类型为第一类型;
若需要存储至所述数据库的数据为所述标准化数据的行外数据,则所述数据所属的数据类型为第二类型。
3.根据权利要求2所述的风险模型特征数据的管理方法,其特征在于,所述数据所属类型所对应的存储方式包括:
若所述数据所属的数据类型为所述第一类型,则对应的存储方式为:直接存储;
若所述数据所属的数据类型为所述第二类型,则对应的存储方式为:进行预设格式处理后存储。
4.根据权利要求1所述的风险模型特征数据的管理方法,其特征在于,确定出所述数据库中各项数据的衍生变量,包括:
分别获取所述数据库中各项数据对应的衍生变量公式;
针对每一项数据,利用其对应的衍生变量公式进行计算,得到所述数据的衍生变量。
5.根据权利要求1所述的风险模型特征数据的管理方法,其特征在于,确定出所述数据库中各项数据的标签变量,包括:
分别确定出所述数据库中各项数据对应的标签生成规则;
根据所述标签生成规则,生成各项所述数据的标签变量。
6.根据权利要求1所述的风险模型特征数据的管理方法,其特征在于,还包括:
实时判断所述数据库中各项数据的版本是否更新;
针对更新版本的数据,生成更新报告,并将更新信息发送至对应的风险模型,以使对应的所述风险模型根据更新信息同步更新入模数据。
7.根据权利要求1所述的风险模型特征数据的管理方法,其特征在于,还包括:
根据预设校验规则,对所述数据库中的目标数据进行校验,生成所述目标数据的验核报告。
8.一种风险模型特征数据的管理***,其特征在于,包括:
第一确定单元,用于确定需要存储至数据库数据所属的数据类型;
第一存储单元,按照所述数据所属数据类型所对应的存储方式,将所述数据存储至所述数据库;
第二确定单元,用于分别确定出所述数据库中各项数据的原始变量、衍生变量以及标签变量;所述原始变量是根据数据湖中与所述数据库中各项数据相关的数据生成的;
第一生成单元,用于根据所述原始变量、所述衍生变量及所述标签变量,生成数据管理目录,以供模型配置人员根据所述数据管理目录从所述数据湖或所述数据库中获取对应的数据入模。
9.一种电子设备,其特征在于,包括处理器和存储器;其中:
所述存储器用于存储计算机指令;
所述处理器用于执行所述存储器存储的计算机指令,具体执行如权利要求1至7中任意一项所述的风险模型特征数据的管理方法。
10.一种存储介质,其特征在于,用于存储程序,所述程序被执行时,用于实现如权利要求1至7中任意一项所述的风险模型特征数据的管理方法。
CN202210142996.4A 2022-02-16 2022-02-16 风险模型特征数据的管理方法及相关应用设备 Pending CN114511402A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210142996.4A CN114511402A (zh) 2022-02-16 2022-02-16 风险模型特征数据的管理方法及相关应用设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210142996.4A CN114511402A (zh) 2022-02-16 2022-02-16 风险模型特征数据的管理方法及相关应用设备

Publications (1)

Publication Number Publication Date
CN114511402A true CN114511402A (zh) 2022-05-17

Family

ID=81551225

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210142996.4A Pending CN114511402A (zh) 2022-02-16 2022-02-16 风险模型特征数据的管理方法及相关应用设备

Country Status (1)

Country Link
CN (1) CN114511402A (zh)

Similar Documents

Publication Publication Date Title
US5446885A (en) Event driven management information system with rule-based applications structure stored in a relational database
US10956911B2 (en) System and method of managing data injection into an executing data processing system
CN109034988A (zh) 一种会计分录生成方法和装置
CN102496126A (zh) 一种托管资产交易数据监控设备
US20070094118A1 (en) Exposure management system and method
US9639515B2 (en) Transfer of data between applications using intermediate user interface
US20140222655A1 (en) Method and System for Automatic Regulatory Compliance
JPWO2020054612A1 (ja) トランザクション監査システム
US7716092B2 (en) Use of separate rib ledgers in a computerized enterprise resource planning system
WO2024119789A1 (zh) 款项发放方法、装置、计算机设备及可读存储介质
CN112631889A (zh) 针对应用***的画像方法、装置、设备及可读存储介质
CN116228402A (zh) 一种金融征信特征仓库技术支持***
CN116245623A (zh) 一种银行业资损防控方法和装置
CN114511402A (zh) 风险模型特征数据的管理方法及相关应用设备
CN110544165A (zh) 一种信用风险评分卡创建方法、装置及电子设备
CN113011784A (zh) 监管报送数据的处理模型及方法
CN114239519A (zh) 征信数据处理方法、装置、电子设备及计算机可读介质
TW202230230A (zh) 績效管理分析系統及方法
US20140058925A1 (en) Apparatus, method and article to automate and manage formula or asset-based lending in a networked environment
US12039614B2 (en) Generic configuration platform for generating electronic reports
CN110597871B (zh) 数据处理方法、装置、计算机设备和计算机可读存储介质
JP2004157693A (ja) リスク管理方法、リスク管理システム、及びそのプログラム
CN117408826A (zh) 财务数据处理方法和装置、电子设备和可读存储介质
CN114331653A (zh) 一种往来台账数据的处理方法及装置
CN116342315A (zh) 一种往来款项清理方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination