CN111859922B - 实体关系抽取技术在银行风控中的应用方法 - Google Patents
实体关系抽取技术在银行风控中的应用方法 Download PDFInfo
- Publication number
- CN111859922B CN111859922B CN202010756980.3A CN202010756980A CN111859922B CN 111859922 B CN111859922 B CN 111859922B CN 202010756980 A CN202010756980 A CN 202010756980A CN 111859922 B CN111859922 B CN 111859922B
- Authority
- CN
- China
- Prior art keywords
- relation
- public
- private
- relationship
- entity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000605 extraction Methods 0.000 title claims abstract description 80
- 238000000034 method Methods 0.000 title claims abstract description 46
- 238000012549 training Methods 0.000 claims abstract description 92
- 230000004927 fusion Effects 0.000 claims abstract description 4
- 238000012795 verification Methods 0.000 claims description 26
- 238000012986 modification Methods 0.000 claims description 4
- 230000004048 modification Effects 0.000 claims description 4
- 238000005516 engineering process Methods 0.000 claims description 3
- 230000011218 segmentation Effects 0.000 claims description 3
- 238000013058 risk prediction model Methods 0.000 abstract description 3
- 238000001228 spectrum Methods 0.000 description 6
- 238000002372 labelling Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 3
- 238000010276 construction Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000012954 risk control Methods 0.000 description 2
- 239000002699 waste material Substances 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/232—Orthographic correction, e.g. spell checking or vowelisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Business, Economics & Management (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Animal Behavior & Ethology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种实体关系抽取技术在银行风控中的应用方法,所述实体关系包括实体的对公关系和对私关系,包括以下步骤:数据获取,分别获取对公关系和对私关系训练数据集;模型训练,分别深度训练对公关系和对私关系训练数据集形成对公关系和对私关系抽取模型;模型预测,分别采用对公关系和对私关系抽取模型抽取新闻文本中的实体及其关系,形成对公关系和对私关系预测集;关系融合,融合对公关系和对私关系预测集中各实体所对应的对公关系和对私关系;构建图谱并将图谱运用于银行的风控***中。本发明通过分开获取训练数据集并分开训练抽取模型,降低了训练噪音;另外将随时更新的图谱应用于风险预测等模型,能提高风险预测模型的精度。
Description
技术领域
本发明涉及风控技术领域,特别涉及一种实体关系抽取技术在银行风控中的应用方法。
背景技术
随着互联网金融和电子商务的发展,人们利用网络进行交易、支付和借贷,通常在借贷和支付的过程中,风险控制评估就显得非常关键。然而风险控制评估通常需要基于风控数据,例如实体关系数据等。对于获取实体关系数据,现有技术中通常采用购买第三方数据或人工查询等方式获取,导致风控成本的增加和人力的浪费。
因此有必要提供一种实体关系抽取技术在银行风控中的应用方法,同时采用算法抽取和人工核验的方法获取实体关系数据,减少人力浪费,并控制成本。
发明内容
本发明的目的在于提供一种实体关系抽取技术在银行风控中的应用方法,同时采用算法抽取和人工核验的方法获取实体关系数据,减少人力浪费,并控制成本。
为了解决现有技术中存在的问题,本发明提供了一种实体关系抽取技术在银行风控中的应用方法,所述实体关系包括实体的对公关系和对私关系,包括以下步骤:
数据获取,获取对公关系训练数据集和对私关系训练数据集;
模型训练,深度训练对公关系训练数据集形成对公关系抽取模型,深度训练对私关系训练数据集形成对私关系抽取模型;
模型预测,分别采用对公关系抽取模型和对私关系抽取模型抽取新闻文本中的实体及其关系,形成对公关系预测集和对私关系预测集;
关系融合,融合对公关系预测集和对私关系预测集中各实体所对应的对公关系和对私关系;
图谱构建,根据各实体所对应的对公关系和对私关系构建各实体的图谱关系,各实体的图谱关系与银行内部图谱融合形成综合图谱;
结果运用,将所述综合图谱运用于银行的风控***中。
可选的,在所述实体关系抽取技术在银行风控中的应用方法中,获取对公关系训练数据集包括以下步骤:
抽取新闻文本;
采用NLP技术对抽取的新闻文本进行解析操作,得到新闻文本每条语句中包含的实体,以及各实体之间的对公关系,形成对公训练三元组;
人工对得到的对公训练三元组和其对应的新闻文本语句进行核验;
若核验通过,则由所有对公训练三元组和其对应的新闻文本语句形成对公关系训练数据集,若核验不通过,则人工进行修改或删除。
可选的,在所述实体关系抽取技术在银行风控中的应用方法中,所述解析操作包括:对抽取的新闻文本进行分词、词性分析、句法分析和语义标注操作。
可选的,在所述实体关系抽取技术在银行风控中的应用方法中,获取对私关系训练数据集包括以下步骤:
获取公开数据集,抽取公开数据集中对私关系的数据作为对私关系训练数据集,对私关系训练数据集中包括对私训练三元组和其对应的文本语句。
可选的,在所述实体关系抽取技术在银行风控中的应用方法中,在模型预测过程中,还包括以下步骤:
分别采用对公关系抽取模型和对私关系抽取模型抽取新闻文本中的实体及其关系,得到由各实体及其相互之间的对公关系形成的对公预测三元组和由各实体及其相互之间的对私关系形成的对私预测三元组;
由各对公预测三元组及其对应的新闻文本语句形成对公关系预测集,由各对私预测三元组及其对应的新闻文本语句形成对私关系预测集。
可选的,在所述实体关系抽取技术在银行风控中的应用方法中,
在形成对公关系预测集后,随机抽取对公关系预测集中的部分样本数据,人工对抽取的对公预测三元组和其对应的新闻文本语句进行核验;
在形成对私关系预测集后,随机抽取对私关系预测集中的部分样本数据,人工对抽取的对私预测三元组和其对应的新闻文本语句进行核验。
可选的,在所述实体关系抽取技术在银行风控中的应用方法中,核验方式如下:
若核验成功,则将核验成功的样本数据加入对公关系训练数据集或对私关系训练数据集;
若核验失败,则人工修改再核验,将核验成功的样本数据加入对公关系训练数据集或对私关系训练数据集,对于人工修改也无法核验成功的样本数据直接舍弃;
不断重复深度训练更新后的对公关系训练数据集和/或对私关系训练数据集,并调整模型超参数,得到预测精度符合要求的对公关系抽取模型和/或对私关系抽取模型。
可选的,在所述实体关系抽取技术在银行风控中的应用方法中,所述对公关系抽取模型和所述对私关系抽取模型的建模方式包括:
采用BERT模型结构;
利用管道式命名识别实体+关系分类的方式进行建模。
可选的,在所述实体关系抽取技术在银行风控中的应用方法中,融合各实体所对应的对公关系和对私关系的方式为:
以各实体所对应的对公关系为主键,对各实体所对应的对私关系进行匹配。
可选的,在所述实体关系抽取技术在银行风控中的应用方法中,
对公关系包括:创始人、董事长、法人代表、总裁、股东、子公司以及总经理;
对私关系包括:母亲、父亲、丈夫、妻子、儿子、女儿、哥哥、弟弟、姐姐以及妹妹。
本发明相对于现有技术,具有以下优点:
(1)针对目前没有较好的对公关系语料且人工标注耗时费力的问题,本发明采用一种半自动化的抽取方法,利用算法抽取+人工核验的方式,减少了人工标注的工作量,同时可以积累对公关系的语料;
(2)针对对公关系和对私关系语料来源差异较大,且分布不均的问题,直接对整体数据集训练会有较大噪声,本发明提出将对公关系和对私关系进行分开训练,最后将结果进行融合,解决了噪音大的问题;
(3)抽取大量官方且免费的新闻文本和公开数据集文本中的数据,既能丰富实体及其对公关系和对私关系的数据等,又节约了成本;
(4)当某企业或企业关联人出现较大信用风险时,能及时对企业或其关联企业做出风险提示,便于银行做出反映;
(5)可以为银行以后模型的构建提供更为丰富的特征。
附图说明
图1为本发明实施例提供的实体关系抽取技术在银行风控中的应用方法的流程图;
图2为本发明实施例提供的实体关系抽取的流程图。
具体实施方式
下面将结合示意图对本发明的具体实施方式进行更详细的描述。根据下列描述,本发明的优点和特征将更清楚。需说明的是,附图均采用非常简化的形式且均使用非精准的比例,仅用以方便、明晰地辅助说明本发明实施例的目的。
在下文中,如果本文所述的方法包括一系列步骤,则本文所呈现的这些步骤的顺序并非必须是可执行这些步骤的唯一顺序,且一些所述的步骤可被省略和/或一些本文未描述的其他步骤可被添加到该方法中。
现有技术中通常采用购买第三方数据或人工查询等方式获取实体关系数据,具有以下不足:
(1)传统的机器学习需要特征工程,人为所能提取的特征有限,且传统的词法特征和语义特征已经趋近饱和,不能很好的学习文本潜在、高阶的特征。
(2)针对机器学习和深度学习都需要训练语料,目前在中文的关系抽取模型中语料较少,大多为人物关系,而目前针对于对公关系没有较好的语料。
(3)针对目前获取企业间关系的方式:购买第三方数据需要一定费用,且数据不一定全面、及时,如果人工查询则会浪费人力。
因此有必要提供一种实体关系抽取技术在银行风控中的应用方法,所述实体关系包括实体的对公关系和对私关系,如图1所示,图1为本发明实施例提供的实体关系抽取技术在银行风控中的应用方法的流程图,所述应用方法包括以下步骤:
数据获取,获取对公关系训练数据集和对私关系训练数据集;
模型训练,深度训练对公关系训练数据集形成对公关系抽取模型,深度训练对私关系训练数据集形成对私关系抽取模型;
模型预测,分别采用对公关系抽取模型和对私关系抽取模型抽取新闻文本中的实体及其关系,形成对公关系预测集和对私关系预测集;
关系融合,融合对公关系预测集和对私关系预测集中各实体所对应的对公关系和对私关系;
图谱构建,根据各实体所对应的对公关系和对私关系构建各实体的图谱关系,各实体的图谱关系与银行内部图谱融合形成综合图谱;
结果运用,将所述综合图谱运用于银行的风控***中。
本发明通过实体关系抽取技术,在权威新闻和公开数据集中抽取企业、企业关键人物以及企业间关系,形成图谱关系,并用于扩充银行综合图谱。当有企业申请银行贷款时,银行参考企业间关系,判断其是否存在欺诈客户的行为,以辅助给出授信额度的决定。若某企业发生经营危机时,通过图谱关系中的风险传导,可以判断是否会影响银行的客户,便于银行做出反映。另外基于综合图谱可以提取丰富的图特征,将其应用于风险预测等模型,能提高风险预测模型的精度。
进一步的,如图2所示,图2为本发明实施例提供的实体关系抽取的流程图,在所述实体关系抽取技术在银行风控中的应用方法中,获取对公关系训练数据集包括以下步骤:
从新闻文本库中抽取新闻文本,将剩余的新闻文本用于模型预测;
采用NLP技术对抽取的新闻文本进行解析操作,得到新闻文本每条语句中包含的实体,及各实体之间的对公关系,形成对公训练三元组,其中对公训练三元组的形式为第一实体-对公关系-第二实体;
人工对得到的对公训练三元组和其对应的新闻文本语句进行核验;
若核验通过,则由所有对公训练三元组和其对应的新闻文本语句形成对公关系训练数据集,若核验不通过,则人工进行修改,若修改后通过核验则加入对公关系训练数据集,若修改后还是不能通过核验则删除。
进一步的,所述解析操作包括:对抽取的新闻文本进行分词、词性分析、句法分析和语义标注操作。
继续参考图2,获取对私关系训练数据集包括以下步骤:
获取公开数据集,抽取公开数据集中对私关系的数据作为对私关系训练数据集,其中公开数据集文本为小说或其他杂志等的文本。对私关系训练数据集中包括对私训练三元组和其对应的文本语句,其中对私训练三元组的形式为第一实体-对私关系-第二实体。
具体的,在所述实体关系抽取技术在银行风控中的应用方法中,对公关系包括但不限于:创始人、董事长、法人代表、总裁、股东、子公司以及总经理;对私关系包括但不限于:母亲、父亲、丈夫、妻子、儿子、女儿、哥哥、弟弟、姐姐以及妹妹。
进一步的,深度训练对公关系训练数据集形成对公关系抽取模型,深度训练对私关系训练数据集形成对私关系抽取模型。
接着,进行模型预测,分别采用对公关系抽取模型和对私关系抽取模型抽取新闻文本中的实体及其关系,得到由各实体及其相互之间的对公关系形成的对公预测三元组和由各实体及其相互之间的对私关系形成的对私预测三元组;由各对公预测三元组及其对应的新闻文本语句形成对公关系预测集,由各对私预测三元组及其对应的新闻文本语句形成对私关系预测集。其中,对公预测三元组和对私预测三元组的形式均为第一实体-对公/或对私关系-第二实体。
优选的,在形成对公关系预测集后,随机抽取对公关系预测集中的部分样本数据,人工对抽取的对公预测三元组和其对应的新闻文本语句进行核验;在形成对私关系预测集后,随机抽取对私关系预测集中的部分样本数据,人工对抽取的对私预测三元组和其对应的新闻文本语句进行核验。
核验方式如下:
若核验成功,则将核验成功的样本数据加入对公关系训练数据集或对私关系训练数据集,以不断扩充对公关系训练数据集或对私关系训练数据集;
若核验失败,则人工修改再核验,将核验成功的样本数据加入对公关系训练数据集或对私关系训练数据集,对于人工修改也无法核验成功的样本数据直接舍弃;
不断重复深度训练更新后的对公关系训练数据集和/或对私关系训练数据集,增加各训练数据集中数据以提高抽取模型预测精度,结合模型超参数调整,直到得到预测精度符合要求的对公关系抽取模型和/或对私关系抽取模型。
进一步的,所述对公关系抽取模型和所述对私关系抽取模型的建模方式包括:采用BERT模型结构;利用管道式命名识别实体+关系分类的方式进行建模。
在一个实施例中,采用对公关系抽取模型抽取新闻文本中的实体及其对公关系的方式为:输入文本到所述对公关系抽取模型中,得到输入的文本所包含的对公关系;根据所述对公关系继续识别输入的文本所包含的具备该对公关系的实体,输出所述输入的文本中的各实体及其对公关系;采用对私关系抽取模型抽取新闻文本中的实体及其对私关系的方式为:输入文本到所述对私关系抽取模型中,得到输入的文本所包含的对私关系;根据所述对私关系继续识别输入的文本所包含的具备该对私关系的实体,输出所述输入的文本中的各实体及其对私关系。
优选的,融合各实体所对应的对公关系和对私关系的方式为:以各实体所对应的对公关系为主键,对各实体所对应的对私关系进行匹配。
在一个实施例中,将所述综合图谱运用于银行的风控***中的方式如下:
(1)当有企业申请银行贷款时,可以通过银行综合图谱平台进行图谱查询,展示出企业相关的关联图谱,包括企业名、企业的关键对公关系以及对私关系。通过这样的关联图谱,参考企业及人物的关联关系和用户信息,判断是否存在欺诈客户的行为,给出风险系数,以辅助给出授信额度的决定;
(2)另外基于综合图谱可以提取丰富的图特征,将其应用于风险预测等模型,能提高风险预测模型的精度。
综上,本发明相对于现有技术,具有以下优点:
(1)针对目前没有较好的对公关系语料且人工标注耗时费力的问题,本发明采用一种半自动化的抽取方法,利用算法抽取+人工核验的方式,减少了人工标注的工作量,同时可以积累对公关系的语料;
(2)针对对公关系和对私关系语料来源差异较大,且分布不均的问题,直接对整体数据集训练会有较大噪声,本发明提出将对公关系和对私关系进行分开训练,最后将结果进行融合,解决了噪音大的问题;
(3)抽取大量官方且免费的新闻文本和公开数据集文本中的数据,既能丰富实体及其对公关系和对私关系的数据等,又节约了成本;
(4)当某企业或企业关联人出现较大信用风险时,能及时对企业或其关联企业做出风险提示,便于银行做出反映;
(5)可以为银行以后模型的构建提供更为丰富的特征。
上述仅为本发明的优选实施例而已,并不对本发明起到任何限制作用。任何所属技术领域的技术人员,在不脱离本发明的技术方案的范围内,对本发明揭露的技术方案和技术内容做任何形式的等同替换或修改等变动,均属未脱离本发明的技术方案的内容,仍属于本发明的保护范围之内。
Claims (7)
1.一种实体关系抽取技术在银行风控中的应用方法,其特征在于,所述实体关系包括实体的对公关系和对私关系,包括以下步骤:
数据获取,获取对公关系训练数据集和对私关系训练数据集;获取对公关系训练数据集包括以下步骤:抽取新闻文本;采用NLP技术对抽取的新闻文本进行解析操作,得到新闻文本每条语句中包含的实体,以及各实体之间的对公关系,形成对公训练三元组;人工对得到的对公训练三元组和其对应的新闻文本语句进行核验;若核验通过,则由所有对公训练三元组和其对应的新闻文本语句形成对公关系训练数据集,若核验不通过,则人工进行修改或删除;获取对私关系训练数据集包括以下步骤:获取公开数据集,抽取公开数据集中对私关系的数据作为对私关系训练数据集,对私关系训练数据集中包括对私训练三元组和其对应的文本语句;
模型训练,深度训练对公关系训练数据集形成对公关系抽取模型,深度训练对私关系训练数据集形成对私关系抽取模型,所述对公关系抽取模型和所述对私关系抽取模型的建模方式包括:采用BERT模型结构;利用管道式命名识别实体+关系分类的方式进行建模;
模型预测,分别采用对公关系抽取模型和对私关系抽取模型抽取新闻文本中的实体及其关系,形成对公关系预测集和对私关系预测集;
关系融合,融合对公关系预测集和对私关系预测集中各实体所对应的对公关系和对私关系;
图谱构建,根据各实体所对应的对公关系和对私关系构建各实体的图谱关系,各实体的图谱关系与银行内部图谱融合形成综合图谱;
结果运用,将所述综合图谱运用于银行的风控***中。
2.如权利要求1所述的实体关系抽取技术在银行风控中的应用方法,其特征在于,所述解析操作包括:对抽取的新闻文本进行分词、词性分析、句法分析和语义标注操作。
3.如权利要求1所述的实体关系抽取技术在银行风控中的应用方法,其特征在于,在模型预测过程中,还包括以下步骤:
分别采用对公关系抽取模型和对私关系抽取模型抽取新闻文本中的实体及其关系,得到由各实体及其相互之间的对公关系形成的对公预测三元组和由各实体及其相互之间的对私关系形成的对私预测三元组;
由各对公预测三元组及其对应的新闻文本语句形成对公关系预测集,由各对私预测三元组及其对应的新闻文本语句形成对私关系预测集。
4.如权利要求3所述的实体关系抽取技术在银行风控中的应用方法,其特征在于,
在形成对公关系预测集后,随机抽取对公关系预测集中的部分样本数据,人工对抽取的对公预测三元组和其对应的新闻文本语句进行核验;
在形成对私关系预测集后,随机抽取对私关系预测集中的部分样本数据,人工对抽取的对私预测三元组和其对应的新闻文本语句进行核验。
5.如权利要求4所述的实体关系抽取技术在银行风控中的应用方法,其特征在于,核验方式如下:
若核验成功,则将核验成功的样本数据加入对公关系训练数据集或对私关系训练数据集;
若核验失败,则人工修改再核验,将核验成功的样本数据加入对公关系训练数据集或对私关系训练数据集,对于人工修改也无法核验成功的样本数据直接舍弃;
不断重复深度训练更新后的对公关系训练数据集和/或对私关系训练数据集,并调整模型超参数,得到预测精度符合要求的对公关系抽取模型和/或对私关系抽取模型。
6.如权利要求1所述的实体关系抽取技术在银行风控中的应用方法,其特征在于,融合各实体所对应的对公关系和对私关系的方式为:
以各实体所对应的对公关系为主键,对各实体所对应的对私关系进行匹配。
7.如权利要求1所述的实体关系抽取技术在银行风控中的应用方法,其特征在于,
对公关系包括:创始人、董事长、法人代表、总裁、股东、子公司以及总经理;
对私关系包括:母亲、父亲、丈夫、妻子、儿子、女儿、哥哥、弟弟、姐姐以及妹妹。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010756980.3A CN111859922B (zh) | 2020-07-31 | 2020-07-31 | 实体关系抽取技术在银行风控中的应用方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010756980.3A CN111859922B (zh) | 2020-07-31 | 2020-07-31 | 实体关系抽取技术在银行风控中的应用方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111859922A CN111859922A (zh) | 2020-10-30 |
CN111859922B true CN111859922B (zh) | 2023-12-01 |
Family
ID=72952622
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010756980.3A Active CN111859922B (zh) | 2020-07-31 | 2020-07-31 | 实体关系抽取技术在银行风控中的应用方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111859922B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112732897A (zh) * | 2020-12-28 | 2021-04-30 | 平安科技(深圳)有限公司 | 文档处理方法、装置、电子设备及存储介质 |
CN116702899B (zh) * | 2023-08-07 | 2023-11-28 | 上海银行股份有限公司 | 一种适用于公私联动场景的实体融合方法 |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005041057A1 (en) * | 2003-09-29 | 2005-05-06 | Infoglide Software Corporation | System and method for identification, detection and investigation of maleficent acts |
CN109064318A (zh) * | 2018-08-24 | 2018-12-21 | 苏宁消费金融有限公司 | 一种基于知识图谱的互联网金融风险监测*** |
CN110222201A (zh) * | 2019-06-26 | 2019-09-10 | 中国医学科学院医学信息研究所 | 一种专病知识图谱构建方法及装置 |
CN110276668A (zh) * | 2019-07-01 | 2019-09-24 | 中国工商银行股份有限公司 | 理财产品智能推送、匹配度确定的方法及*** |
CN110377690A (zh) * | 2019-06-27 | 2019-10-25 | 北京信息科技大学 | 一种基于远程关系抽取的信息获取方法和*** |
CN110502638A (zh) * | 2019-08-30 | 2019-11-26 | 重庆誉存大数据科技有限公司 | 一种基于目标实体的企业新闻风险分类方法 |
CN110598000A (zh) * | 2019-08-01 | 2019-12-20 | 达而观信息科技(上海)有限公司 | 一种基于深度学习模型的关系抽取及知识图谱构建方法 |
CN110717816A (zh) * | 2019-07-15 | 2020-01-21 | 上海氪信信息技术有限公司 | 一种基于人工智能技术的全域金融风险知识图谱构建方法 |
CN110781254A (zh) * | 2020-01-02 | 2020-02-11 | 四川大学 | 一种案情知识图谱自动构建方法及***及设备及介质 |
CN110889276A (zh) * | 2019-11-07 | 2020-03-17 | 广东工业大学 | 复数融合特征提取指针式抽取三元组信息的方法、***及计算机介质 |
CN111383097A (zh) * | 2020-03-24 | 2020-07-07 | 中国建设银行股份有限公司 | 挖掘个人疑似账户的方法和装置 |
CN111444713A (zh) * | 2019-01-16 | 2020-07-24 | 清华大学 | 新闻事件内实体关系抽取方法及装置 |
CN111444305A (zh) * | 2020-03-19 | 2020-07-24 | 浙江大学 | 一种基于知识图谱嵌入的多三元组联合抽取方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8214235B2 (en) * | 2006-06-20 | 2012-07-03 | Core Systems Group, Llc | Method and apparatus for enterprise risk management |
-
2020
- 2020-07-31 CN CN202010756980.3A patent/CN111859922B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005041057A1 (en) * | 2003-09-29 | 2005-05-06 | Infoglide Software Corporation | System and method for identification, detection and investigation of maleficent acts |
CN109064318A (zh) * | 2018-08-24 | 2018-12-21 | 苏宁消费金融有限公司 | 一种基于知识图谱的互联网金融风险监测*** |
CN111444713A (zh) * | 2019-01-16 | 2020-07-24 | 清华大学 | 新闻事件内实体关系抽取方法及装置 |
CN110222201A (zh) * | 2019-06-26 | 2019-09-10 | 中国医学科学院医学信息研究所 | 一种专病知识图谱构建方法及装置 |
CN110377690A (zh) * | 2019-06-27 | 2019-10-25 | 北京信息科技大学 | 一种基于远程关系抽取的信息获取方法和*** |
CN110276668A (zh) * | 2019-07-01 | 2019-09-24 | 中国工商银行股份有限公司 | 理财产品智能推送、匹配度确定的方法及*** |
CN110717816A (zh) * | 2019-07-15 | 2020-01-21 | 上海氪信信息技术有限公司 | 一种基于人工智能技术的全域金融风险知识图谱构建方法 |
CN110598000A (zh) * | 2019-08-01 | 2019-12-20 | 达而观信息科技(上海)有限公司 | 一种基于深度学习模型的关系抽取及知识图谱构建方法 |
CN110502638A (zh) * | 2019-08-30 | 2019-11-26 | 重庆誉存大数据科技有限公司 | 一种基于目标实体的企业新闻风险分类方法 |
CN110889276A (zh) * | 2019-11-07 | 2020-03-17 | 广东工业大学 | 复数融合特征提取指针式抽取三元组信息的方法、***及计算机介质 |
CN110781254A (zh) * | 2020-01-02 | 2020-02-11 | 四川大学 | 一种案情知识图谱自动构建方法及***及设备及介质 |
CN111444305A (zh) * | 2020-03-19 | 2020-07-24 | 浙江大学 | 一种基于知识图谱嵌入的多三元组联合抽取方法 |
CN111383097A (zh) * | 2020-03-24 | 2020-07-07 | 中国建设银行股份有限公司 | 挖掘个人疑似账户的方法和装置 |
Non-Patent Citations (4)
Title |
---|
A银行小微企业信贷风险控制研究;唐华;《中国优秀硕士学位论文全文数据库经济与管理科学辑》(第07期);J152-443 * |
PREFER: PREdiction Model for Financial Entity Relation;Lee Hoyeop 等;《Proceedings of the Fourth International Workshop on Data Science for Macro-Modeling with Financial and Economic Datasets》;1-2 * |
Type prediction combining linked open data and social media;Nechaev Yaroslav 等;《Proceedings of the 27th ACM International Conference on Information and Knowledge Management》;1033-1042 * |
商业银行面向中小企业贷款的精准营销研究;曲翔宇;《中国优秀硕士学位论文全文数据库经济与管理科学辑》(第12期);J162-42 * |
Also Published As
Publication number | Publication date |
---|---|
CN111859922A (zh) | 2020-10-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Chu et al. | Automatic image captioning based on ResNet50 and LSTM with soft attention | |
US9152622B2 (en) | Personalized machine translation via online adaptation | |
CN111859922B (zh) | 实体关系抽取技术在银行风控中的应用方法 | |
CN111414122B (zh) | 一种智能文本处理方法、装置、电子设备及存储介质 | |
CN111858940B (zh) | 一种基于多头注意力的法律案例相似度计算方法及*** | |
US10902191B1 (en) | Natural language processing techniques for generating a document summary | |
US20230121711A1 (en) | Content augmentation with machine generated content to meet content gaps during interaction with target entities | |
US10885122B2 (en) | Estimating article publication dates and authors based on social media context | |
CN111723870B (zh) | 基于人工智能的数据集获取方法、装置、设备和介质 | |
CN111414735B (zh) | 文本数据的生成方法和装置 | |
CN112395391A (zh) | 概念图谱构建方法、装置、计算机设备及存储介质 | |
CN115438149A (zh) | 一种端到端模型训练方法、装置、计算机设备及存储介质 | |
CN114330483A (zh) | 数据处理方法及模型训练方法、装置、设备、存储介质 | |
KR102583941B1 (ko) | 적대적 학습을 통한 질의응답 학습모델의 생성 방법 및 장치 | |
US20230206007A1 (en) | Method for mining conversation content and method for generating conversation content evaluation model | |
Dündar et al. | A Hybrid Approach to Question-answering for a Banking Chatbot on Turkish: Extending Keywords with Embedding Vectors. | |
CN116861898A (zh) | 样本数据处理方法、装置、设备及介质 | |
Gonzales | Sociolinguistic analysis with missing metadata? Leveraging linguistic and semiotic resources through deep learning to investigate English variation and change on Twitter | |
CN117916729A (zh) | 通用数据语言翻译器 | |
CN113946668A (zh) | 基于边缘节点的语义处理方法、***、装置及存储介质 | |
US11880664B2 (en) | Identifying and transforming text difficult to understand by user | |
CN114638221A (zh) | 基于业务需求的业务模型生成方法及装置 | |
Rinaldi et al. | End-to-end dialogue with sentiment analysis features | |
CN110147556B (zh) | 一种多向神经网络翻译***的构建方法 | |
Zhang | An Automatic Error Detection Method for Machine Translation Results via Deep Learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |