CN111859922A - 实体关系抽取技术在银行风控中的应用方法 - Google Patents

实体关系抽取技术在银行风控中的应用方法 Download PDF

Info

Publication number
CN111859922A
CN111859922A CN202010756980.3A CN202010756980A CN111859922A CN 111859922 A CN111859922 A CN 111859922A CN 202010756980 A CN202010756980 A CN 202010756980A CN 111859922 A CN111859922 A CN 111859922A
Authority
CN
China
Prior art keywords
public
private
relation
relationship
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010756980.3A
Other languages
English (en)
Other versions
CN111859922B (zh
Inventor
李梦霄
马方
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bank Of Shanghai Co ltd
Original Assignee
Bank Of Shanghai Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bank Of Shanghai Co ltd filed Critical Bank Of Shanghai Co ltd
Priority to CN202010756980.3A priority Critical patent/CN111859922B/zh
Publication of CN111859922A publication Critical patent/CN111859922A/zh
Application granted granted Critical
Publication of CN111859922B publication Critical patent/CN111859922B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/232Orthographic correction, e.g. spell checking or vowelisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Animal Behavior & Ethology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种实体关系抽取技术在银行风控中的应用方法,所述实体关系包括实体的对公关系和对私关系,包括以下步骤:数据获取,分别获取对公关系和对私关系训练数据集;模型训练,分别深度训练对公关系和对私关系训练数据集形成对公关系和对私关系抽取模型;模型预测,分别采用对公关系和对私关系抽取模型抽取新闻文本中的实体及其关系,形成对公关系和对私关系预测集;关系融合,融合对公关系和对私关系预测集中各实体所对应的对公关系和对私关系;构建图谱并将图谱运用于银行的风控***中。本发明通过分开获取训练数据集并分开训练抽取模型,降低了训练噪音;另外将随时更新的图谱应用于风险预测等模型,能提高风险预测模型的精度。

Description

实体关系抽取技术在银行风控中的应用方法
技术领域
本发明涉及风控技术领域,特别涉及一种实体关系抽取技术在银行风控中的应用方法。
背景技术
随着互联网金融和电子商务的发展,人们利用网络进行交易、支付和借贷,通常在借贷和支付的过程中,风险控制评估就显得非常关键。然而风险控制评估通常需要基于风控数据,例如实体关系数据等。对于获取实体关系数据,现有技术中通常采用购买第三方数据或人工查询等方式获取,导致风控成本的增加和人力的浪费。
因此有必要提供一种实体关系抽取技术在银行风控中的应用方法,同时采用算法抽取和人工核验的方法获取实体关系数据,减少人力浪费,并控制成本。
发明内容
本发明的目的在于提供一种实体关系抽取技术在银行风控中的应用方法,同时采用算法抽取和人工核验的方法获取实体关系数据,减少人力浪费,并控制成本。
为了解决现有技术中存在的问题,本发明提供了一种实体关系抽取技术在银行风控中的应用方法,所述实体关系包括实体的对公关系和对私关系,包括以下步骤:
数据获取,获取对公关系训练数据集和对私关系训练数据集;
模型训练,深度训练对公关系训练数据集形成对公关系抽取模型,深度训练对私关系训练数据集形成对私关系抽取模型;
模型预测,分别采用对公关系抽取模型和对私关系抽取模型抽取新闻文本中的实体及其关系,形成对公关系预测集和对私关系预测集;
关系融合,融合对公关系预测集和对私关系预测集中各实体所对应的对公关系和对私关系;
图谱构建,根据各实体所对应的对公关系和对私关系构建各实体的图谱关系,各实体的图谱关系与银行内部图谱融合形成综合图谱;
结果运用,将所述综合图谱运用于银行的风控***中。
可选的,在所述实体关系抽取技术在银行风控中的应用方法中,获取对公关系训练数据集包括以下步骤:
抽取新闻文本;
采用NLP技术对抽取的新闻文本进行解析操作,得到新闻文本每条语句中包含的实体,以及各实体之间的对公关系,形成对公训练三元组;
人工对得到的对公训练三元组和其对应的新闻文本语句进行核验;
若核验通过,则由所有对公训练三元组和其对应的新闻文本语句形成对公关系训练数据集,若核验不通过,则人工进行修改或删除。
可选的,在所述实体关系抽取技术在银行风控中的应用方法中,所述解析操作包括:对抽取的新闻文本进行分词、词性分析、句法分析和语义标注操作。
可选的,在所述实体关系抽取技术在银行风控中的应用方法中,获取对私关系训练数据集包括以下步骤:
获取公开数据集,抽取公开数据集中对私关系的数据作为对私关系训练数据集,对私关系训练数据集中包括对私训练三元组和其对应的文本语句。
可选的,在所述实体关系抽取技术在银行风控中的应用方法中,在模型预测过程中,还包括以下步骤:
分别采用对公关系抽取模型和对私关系抽取模型抽取新闻文本中的实体及其关系,得到由各实体及其相互之间的对公关系形成的对公预测三元组和由各实体及其相互之间的对私关系形成的对私预测三元组;
由各对公预测三元组及其对应的新闻文本语句形成对公关系预测集,由各对私预测三元组及其对应的新闻文本语句形成对私关系预测集。
可选的,在所述实体关系抽取技术在银行风控中的应用方法中,
在形成对公关系预测集后,随机抽取对公关系预测集中的部分样本数据,人工对抽取的对公预测三元组和其对应的新闻文本语句进行核验;
在形成对私关系预测集后,随机抽取对私关系预测集中的部分样本数据,人工对抽取的对私预测三元组和其对应的新闻文本语句进行核验。
可选的,在所述实体关系抽取技术在银行风控中的应用方法中,核验方式如下:
若核验成功,则将核验成功的样本数据加入对公关系训练数据集或对私关系训练数据集;
若核验失败,则人工修改再核验,将核验成功的样本数据加入对公关系训练数据集或对私关系训练数据集,对于人工修改也无法核验成功的样本数据直接舍弃;
不断重复深度训练更新后的对公关系训练数据集和/或对私关系训练数据集,并调整模型超参数,得到预测精度符合要求的对公关系抽取模型和/或对私关系抽取模型。
可选的,在所述实体关系抽取技术在银行风控中的应用方法中,所述对公关系抽取模型和所述对私关系抽取模型的建模方式包括:
采用BERT模型结构;
利用管道式命名识别实体+关系分类的方式进行建模。
可选的,在所述实体关系抽取技术在银行风控中的应用方法中,融合各实体所对应的对公关系和对私关系的方式为:
以各实体所对应的对公关系为主键,对各实体所对应的对私关系进行匹配。
可选的,在所述实体关系抽取技术在银行风控中的应用方法中,
对公关系包括:创始人、董事长、法人代表、总裁、股东、子公司以及总经理;
对私关系包括:母亲、父亲、丈夫、妻子、儿子、女儿、哥哥、弟弟、姐妹以及妹妹。
本发明相对于现有技术,具有以下优点:
(1)针对目前没有较好的对公关系语料且人工标注耗时费力的问题,本发明采用一种半自动化的抽取方法,利用算法抽取+人工核验的方式,减少了人工标注的工作量,同时可以积累对公关系的语料;
(2)针对对公关系和对私关系语料来源差异较大,且分布不均的问题,直接对整体数据集训练会有较大噪声,本发明提出将对公关系和对私关系进行分开训练,最后将结果进行融合,解决了噪音大的问题;
(3)抽取大量官方且免费的新闻文本和公开数据集文本中的数据,既能丰富实体及其对公关系和对私关系的数据等,又节约了成本;
(4)当某企业或企业关联人出现较大信用风险时,能及时对企业或其关联企业做出风险提示,便于银行做出反映;
(5)可以为银行以后模型的构建提供更为丰富的特征。
附图说明
图1为本发明实施例提供的实体关系抽取技术在银行风控中的应用方法的流程图;
图2为本发明实施例提供的实体关系抽取的流程图。
具体实施方式
下面将结合示意图对本发明的具体实施方式进行更详细的描述。根据下列描述,本发明的优点和特征将更清楚。需说明的是,附图均采用非常简化的形式且均使用非精准的比例,仅用以方便、明晰地辅助说明本发明实施例的目的。
在下文中,如果本文所述的方法包括一系列步骤,则本文所呈现的这些步骤的顺序并非必须是可执行这些步骤的唯一顺序,且一些所述的步骤可被省略和/或一些本文未描述的其他步骤可被添加到该方法中。
现有技术中通常采用购买第三方数据或人工查询等方式获取实体关系数据,具有以下不足:
(1)传统的机器学习需要特征工程,人为所能提取的特征有限,且传统的词法特征和语义特征已经趋近饱和,不能很好的学习文本潜在、高阶的特征。
(2)针对机器学习和深度学习都需要训练语料,目前在中文的关系抽取模型中语料较少,大多为人物关系,而目前针对于对公关系没有较好的语料。
(3)针对目前获取企业间关系的方式:购买第三方数据需要一定费用,且数据不一定全面、及时,如果人工查询则会浪费人力。
因此有必要提供一种实体关系抽取技术在银行风控中的应用方法,所述实体关系包括实体的对公关系和对私关系,如图1所示,图1为本发明实施例提供的实体关系抽取技术在银行风控中的应用方法的流程图,所述应用方法包括以下步骤:
数据获取,获取对公关系训练数据集和对私关系训练数据集;
模型训练,深度训练对公关系训练数据集形成对公关系抽取模型,深度训练对私关系训练数据集形成对私关系抽取模型;
模型预测,分别采用对公关系抽取模型和对私关系抽取模型抽取新闻文本中的实体及其关系,形成对公关系预测集和对私关系预测集;
关系融合,融合对公关系预测集和对私关系预测集中各实体所对应的对公关系和对私关系;
图谱构建,根据各实体所对应的对公关系和对私关系构建各实体的图谱关系,各实体的图谱关系与银行内部图谱融合形成综合图谱;
结果运用,将所述综合图谱运用于银行的风控***中。
本发明通过实体关系抽取技术,在权威新闻和公开数据集中抽取企业、企业关键人物以及企业间关系,形成图谱关系,并用于扩充银行综合图谱。当有企业申请银行贷款时,银行参考企业间关系,判断其是否存在欺诈客户的行为,以辅助给出授信额度的决定。若某企业发生经营危机时,通过图谱关系中的风险传导,可以判断是否会影响银行的客户,便于银行做出反映。另外基于综合图谱可以提取丰富的图特征,将其应用于风险预测等模型,能提高风险预测模型的精度。
进一步的,如图2所示,图2为本发明实施例提供的实体关系抽取的流程图,在所述实体关系抽取技术在银行风控中的应用方法中,获取对公关系训练数据集包括以下步骤:
从新闻文本库中抽取新闻文本,将剩余的新闻文本用于模型预测;
采用NLP技术对抽取的新闻文本进行解析操作,得到新闻文本每条语句中包含的实体,及各实体之间的对公关系,形成对公训练三元组,其中对公训练三元组的形式为第一实体-对公关系-第二实体;
人工对得到的对公训练三元组和其对应的新闻文本语句进行核验;
若核验通过,则由所有对公训练三元组和其对应的新闻文本语句形成对公关系训练数据集,若核验不通过,则人工进行修改,若修改后通过核验则加入对公关系训练数据集,若修改后还是不能通过核验则删除。
进一步的,所述解析操作包括:对抽取的新闻文本进行分词、词性分析、句法分析和语义标注操作。
继续参考图2,获取对私关系训练数据集包括以下步骤:
获取公开数据集,抽取公开数据集中对私关系的数据作为对私关系训练数据集,其中公开数据集文本为小说或其他杂志等的文本。对私关系训练数据集中包括对私训练三元组和其对应的文本语句,其中对私训练三元组的形式为第一实体-对私关系-第二实体。
具体的,在所述实体关系抽取技术在银行风控中的应用方法中,对公关系包括但不限于:创始人、董事长、法人代表、总裁、股东、子公司以及总经理;对私关系包括但不限于:母亲、父亲、丈夫、妻子、儿子、女儿、哥哥、弟弟、姐妹以及妹妹。例如,在一个实施例中,对公关系训练数据集样式可以为:{"spo_list":[{"subject":"阿里巴巴集团","relation":"创始人","object":"马云"}],"text":"马云,男,1964年9月10日生于浙江省杭州市,阿里巴巴集团主要创始人。"}。
进一步的,深度训练对公关系训练数据集形成对公关系抽取模型,深度训练对私关系训练数据集形成对私关系抽取模型。
接着,进行模型预测,分别采用对公关系抽取模型和对私关系抽取模型抽取新闻文本中的实体及其关系,得到由各实体及其相互之间的对公关系形成的对公预测三元组和由各实体及其相互之间的对私关系形成的对私预测三元组;由各对公预测三元组及其对应的新闻文本语句形成对公关系预测集,由各对私预测三元组及其对应的新闻文本语句形成对私关系预测集。其中,对公预测三元组和对私预测三元组的形式均为第一实体-对公/或对私关系-第二实体。
优选的,在形成对公关系预测集后,随机抽取对公关系预测集中的部分样本数据,人工对抽取的对公预测三元组和其对应的新闻文本语句进行核验;在形成对私关系预测集后,随机抽取对私关系预测集中的部分样本数据,人工对抽取的对私预测三元组和其对应的新闻文本语句进行核验。
核验方式如下:
若核验成功,则将核验成功的样本数据加入对公关系训练数据集或对私关系训练数据集,以不断扩充对公关系训练数据集或对私关系训练数据集;
若核验失败,则人工修改再核验,将核验成功的样本数据加入对公关系训练数据集或对私关系训练数据集,对于人工修改也无法核验成功的样本数据直接舍弃;
不断重复深度训练更新后的对公关系训练数据集和/或对私关系训练数据集,增加各训练数据集中数据以提高抽取模型预测精度,结合模型超参数调整,直到得到预测精度符合要求的对公关系抽取模型和/或对私关系抽取模型。
进一步的,所述对公关系抽取模型和所述对私关系抽取模型的建模方式包括:采用BERT模型结构;利用管道式命名识别实体+关系分类的方式进行建模。
在一个实施例中,采用对公关系抽取模型抽取新闻文本中的实体及其对公关系的方式为:输入文本到所述对公关系抽取模型中,得到输入的文本所包含的对公关系;根据所述对公关系继续识别输入的文本所包含的具备该对公关系的实体,输出所述输入的文本中的各实体及其对公关系;采用对私关系抽取模型抽取新闻文本中的实体及其对私关系的方式为:输入文本到所述对私关系抽取模型中,得到输入的文本所包含的对私关系;根据所述对私关系继续识别输入的文本所包含的具备该对私关系的实体,输出所述输入的文本中的各实体及其对私关系。
优选的,融合各实体所对应的对公关系和对私关系的方式为:以各实体所对应的对公关系为主键,对各实体所对应的对私关系进行匹配。
在一个实施例中,将所述综合图谱运用于银行的风控***中的方式如下:
(1)当有企业申请银行贷款时,可以通过银行综合图谱平台进行图谱查询,展示出企业相关的关联图谱,包括企业名、企业的关键对公关系以及对私关系。通过这样的关联图谱,参考企业及人物的关联关系和用户信息,判断是否存在欺诈客户的行为,给出风险系数,以辅助给出授信额度的决定;
(2)另外基于综合图谱可以提取丰富的图特征,将其应用于风险预测等模型,能提高风险预测模型的精度。
综上,本发明相对于现有技术,具有以下优点:
(1)针对目前没有较好的对公关系语料且人工标注耗时费力的问题,本发明采用一种半自动化的抽取方法,利用算法抽取+人工核验的方式,减少了人工标注的工作量,同时可以积累对公关系的语料;
(2)针对对公关系和对私关系语料来源差异较大,且分布不均的问题,直接对整体数据集训练会有较大噪声,本发明提出将对公关系和对私关系进行分开训练,最后将结果进行融合,解决了噪音大的问题;
(3)抽取大量官方且免费的新闻文本和公开数据集文本中的数据,既能丰富实体及其对公关系和对私关系的数据等,又节约了成本;
(4)当某企业或企业关联人出现较大信用风险时,能及时对企业或其关联企业做出风险提示,便于银行做出反映;
(5)可以为银行以后模型的构建提供更为丰富的特征。
上述仅为本发明的优选实施例而已,并不对本发明起到任何限制作用。任何所属技术领域的技术人员,在不脱离本发明的技术方案的范围内,对本发明揭露的技术方案和技术内容做任何形式的等同替换或修改等变动,均属未脱离本发明的技术方案的内容,仍属于本发明的保护范围之内。

Claims (10)

1.一种实体关系抽取技术在银行风控中的应用方法,其特征在于,所述实体关系包括实体的对公关系和对私关系,包括以下步骤:
数据获取,获取对公关系训练数据集和对私关系训练数据集;
模型训练,深度训练对公关系训练数据集形成对公关系抽取模型,深度训练对私关系训练数据集形成对私关系抽取模型;
模型预测,分别采用对公关系抽取模型和对私关系抽取模型抽取新闻文本中的实体及其关系,形成对公关系预测集和对私关系预测集;
关系融合,融合对公关系预测集和对私关系预测集中各实体所对应的对公关系和对私关系;
图谱构建,根据各实体所对应的对公关系和对私关系构建各实体的图谱关系,各实体的图谱关系与银行内部图谱融合形成综合图谱;
结果运用,将所述综合图谱运用于银行的风控***中。
2.如权利要求1所述的实体关系抽取技术在银行风控中的应用方法,其特征在于,获取对公关系训练数据集包括以下步骤:
抽取新闻文本;
采用NLP技术对抽取的新闻文本进行解析操作,得到新闻文本每条语句中包含的实体,以及各实体之间的对公关系,形成对公训练三元组;
人工对得到的对公训练三元组和其对应的新闻文本语句进行核验;
若核验通过,则由所有对公训练三元组和其对应的新闻文本语句形成对公关系训练数据集,若核验不通过,则人工进行修改或删除。
3.如权利要求2所述的实体关系抽取技术在银行风控中的应用方法,其特征在于,所述解析操作包括:对抽取的新闻文本进行分词、词性分析、句法分析和语义标注操作。
4.如权利要求1所述的实体关系抽取技术在银行风控中的应用方法,其特征在于,获取对私关系训练数据集包括以下步骤:
获取公开数据集,抽取公开数据集中对私关系的数据作为对私关系训练数据集,对私关系训练数据集中包括对私训练三元组和其对应的文本语句。
5.如权利要求1所述的实体关系抽取技术在银行风控中的应用方法,其特征在于,在模型预测过程中,还包括以下步骤:
分别采用对公关系抽取模型和对私关系抽取模型抽取新闻文本中的实体及其关系,得到由各实体及其相互之间的对公关系形成的对公预测三元组和由各实体及其相互之间的对私关系形成的对私预测三元组;
由各对公预测三元组及其对应的新闻文本语句形成对公关系预测集,由各对私预测三元组及其对应的新闻文本语句形成对私关系预测集。
6.如权利要求5所述的实体关系抽取技术在银行风控中的应用方法,其特征在于,
在形成对公关系预测集后,随机抽取对公关系预测集中的部分样本数据,人工对抽取的对公预测三元组和其对应的新闻文本语句进行核验;
在形成对私关系预测集后,随机抽取对私关系预测集中的部分样本数据,人工对抽取的对私预测三元组和其对应的新闻文本语句进行核验。
7.如权利要求6所述的实体关系抽取技术在银行风控中的应用方法,其特征在于,核验方式如下:
若核验成功,则将核验成功的样本数据加入对公关系训练数据集或对私关系训练数据集;
若核验失败,则人工修改再核验,将核验成功的样本数据加入对公关系训练数据集或对私关系训练数据集,对于人工修改也无法核验成功的样本数据直接舍弃;
不断重复深度训练更新后的对公关系训练数据集和/或对私关系训练数据集,并调整模型超参数,得到预测精度符合要求的对公关系抽取模型和/或对私关系抽取模型。
8.如权利要求1所述的实体关系抽取技术在银行风控中的应用方法,其特征在于,所述对公关系抽取模型和所述对私关系抽取模型的建模方式包括:
采用BERT模型结构;
利用管道式命名识别实体+关系分类的方式进行建模。
9.如权利要求1所述的实体关系抽取技术在银行风控中的应用方法,其特征在于,融合各实体所对应的对公关系和对私关系的方式为:
以各实体所对应的对公关系为主键,对各实体所对应的对私关系进行匹配。
10.如权利要求1所述的实体关系抽取技术在银行风控中的应用方法,其特征在于,
对公关系包括:创始人、董事长、法人代表、总裁、股东、子公司以及总经理;
对私关系包括:母亲、父亲、丈夫、妻子、儿子、女儿、哥哥、弟弟、姐妹以及妹妹。
CN202010756980.3A 2020-07-31 2020-07-31 实体关系抽取技术在银行风控中的应用方法 Active CN111859922B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010756980.3A CN111859922B (zh) 2020-07-31 2020-07-31 实体关系抽取技术在银行风控中的应用方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010756980.3A CN111859922B (zh) 2020-07-31 2020-07-31 实体关系抽取技术在银行风控中的应用方法

Publications (2)

Publication Number Publication Date
CN111859922A true CN111859922A (zh) 2020-10-30
CN111859922B CN111859922B (zh) 2023-12-01

Family

ID=72952622

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010756980.3A Active CN111859922B (zh) 2020-07-31 2020-07-31 实体关系抽取技术在银行风控中的应用方法

Country Status (1)

Country Link
CN (1) CN111859922B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112732897A (zh) * 2020-12-28 2021-04-30 平安科技(深圳)有限公司 文档处理方法、装置、电子设备及存储介质
CN116702899A (zh) * 2023-08-07 2023-09-05 上海银行股份有限公司 一种适用于公私联动场景的实体融合方法

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005041057A1 (en) * 2003-09-29 2005-05-06 Infoglide Software Corporation System and method for identification, detection and investigation of maleficent acts
US20070294118A1 (en) * 2006-06-20 2007-12-20 Tait Andrew M Method and Apparatus for Enterprise Risk Management
CN109064318A (zh) * 2018-08-24 2018-12-21 苏宁消费金融有限公司 一种基于知识图谱的互联网金融风险监测***
CN110222201A (zh) * 2019-06-26 2019-09-10 中国医学科学院医学信息研究所 一种专病知识图谱构建方法及装置
CN110276668A (zh) * 2019-07-01 2019-09-24 中国工商银行股份有限公司 理财产品智能推送、匹配度确定的方法及***
CN110377690A (zh) * 2019-06-27 2019-10-25 北京信息科技大学 一种基于远程关系抽取的信息获取方法和***
CN110502638A (zh) * 2019-08-30 2019-11-26 重庆誉存大数据科技有限公司 一种基于目标实体的企业新闻风险分类方法
CN110598000A (zh) * 2019-08-01 2019-12-20 达而观信息科技(上海)有限公司 一种基于深度学习模型的关系抽取及知识图谱构建方法
CN110717816A (zh) * 2019-07-15 2020-01-21 上海氪信信息技术有限公司 一种基于人工智能技术的全域金融风险知识图谱构建方法
CN110781254A (zh) * 2020-01-02 2020-02-11 四川大学 一种案情知识图谱自动构建方法及***及设备及介质
CN110889276A (zh) * 2019-11-07 2020-03-17 广东工业大学 复数融合特征提取指针式抽取三元组信息的方法、***及计算机介质
CN111383097A (zh) * 2020-03-24 2020-07-07 中国建设银行股份有限公司 挖掘个人疑似账户的方法和装置
CN111444713A (zh) * 2019-01-16 2020-07-24 清华大学 新闻事件内实体关系抽取方法及装置
CN111444305A (zh) * 2020-03-19 2020-07-24 浙江大学 一种基于知识图谱嵌入的多三元组联合抽取方法

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005041057A1 (en) * 2003-09-29 2005-05-06 Infoglide Software Corporation System and method for identification, detection and investigation of maleficent acts
US20070294118A1 (en) * 2006-06-20 2007-12-20 Tait Andrew M Method and Apparatus for Enterprise Risk Management
CN109064318A (zh) * 2018-08-24 2018-12-21 苏宁消费金融有限公司 一种基于知识图谱的互联网金融风险监测***
CN111444713A (zh) * 2019-01-16 2020-07-24 清华大学 新闻事件内实体关系抽取方法及装置
CN110222201A (zh) * 2019-06-26 2019-09-10 中国医学科学院医学信息研究所 一种专病知识图谱构建方法及装置
CN110377690A (zh) * 2019-06-27 2019-10-25 北京信息科技大学 一种基于远程关系抽取的信息获取方法和***
CN110276668A (zh) * 2019-07-01 2019-09-24 中国工商银行股份有限公司 理财产品智能推送、匹配度确定的方法及***
CN110717816A (zh) * 2019-07-15 2020-01-21 上海氪信信息技术有限公司 一种基于人工智能技术的全域金融风险知识图谱构建方法
CN110598000A (zh) * 2019-08-01 2019-12-20 达而观信息科技(上海)有限公司 一种基于深度学习模型的关系抽取及知识图谱构建方法
CN110502638A (zh) * 2019-08-30 2019-11-26 重庆誉存大数据科技有限公司 一种基于目标实体的企业新闻风险分类方法
CN110889276A (zh) * 2019-11-07 2020-03-17 广东工业大学 复数融合特征提取指针式抽取三元组信息的方法、***及计算机介质
CN110781254A (zh) * 2020-01-02 2020-02-11 四川大学 一种案情知识图谱自动构建方法及***及设备及介质
CN111444305A (zh) * 2020-03-19 2020-07-24 浙江大学 一种基于知识图谱嵌入的多三元组联合抽取方法
CN111383097A (zh) * 2020-03-24 2020-07-07 中国建设银行股份有限公司 挖掘个人疑似账户的方法和装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
LEE HOYEOP 等: "PREFER: PREdiction Model for Financial Entity Relation", 《PROCEEDINGS OF THE FOURTH INTERNATIONAL WORKSHOP ON DATA SCIENCE FOR MACRO-MODELING WITH FINANCIAL AND ECONOMIC DATASETS》, pages 1 - 2 *
NECHAEV YAROSLAV 等: "Type prediction combining linked open data and social media", 《PROCEEDINGS OF THE 27TH ACM INTERNATIONAL CONFERENCE ON INFORMATION AND KNOWLEDGE MANAGEMENT》, pages 1033 - 1042 *
唐华: "A银行小微企业信贷风险控制研究", 《中国优秀硕士学位论文全文数据库经济与管理科学辑》, no. 07, pages 152 - 443 *
曲翔宇: "商业银行面向中小企业贷款的精准营销研究", 《中国优秀硕士学位论文全文数据库经济与管理科学辑》, no. 12, pages 162 - 42 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112732897A (zh) * 2020-12-28 2021-04-30 平安科技(深圳)有限公司 文档处理方法、装置、电子设备及存储介质
WO2022142116A1 (zh) * 2020-12-28 2022-07-07 平安科技(深圳)有限公司 文档处理方法、装置、电子设备及存储介质
CN116702899A (zh) * 2023-08-07 2023-09-05 上海银行股份有限公司 一种适用于公私联动场景的实体融合方法
CN116702899B (zh) * 2023-08-07 2023-11-28 上海银行股份有限公司 一种适用于公私联动场景的实体融合方法

Also Published As

Publication number Publication date
CN111859922B (zh) 2023-12-01

Similar Documents

Publication Publication Date Title
CN110968700B (zh) 融合多类事理与实体知识的领域事件图谱构建方法和装置
US20190005029A1 (en) Systems and methods for natural language processing of structured documents
CN112967144B (zh) 一种金融信用风险事件抽取方法、可读存储介质及设备
US20210191936A1 (en) Automatic creation of schema annotation files for converting natural language queries to structured query language
CN109101551B (zh) 一种问答知识库的构建方法及装置
CN111723870B (zh) 基于人工智能的数据集获取方法、装置、设备和介质
CN115098634B (zh) 一种基于语义依存关系融合特征的舆情文本情感分析方法
CN112926337B (zh) 一种结合重构句法信息的端到端方面级情感分析方法
CN113609838B (zh) 文档信息抽取及图谱化方法和***
CN111859922A (zh) 实体关系抽取技术在银行风控中的应用方法
CN112765974A (zh) 一种业务辅助方法、电子设备及可读存储介质
CN112036842A (zh) 一种科技服务智能匹配平台
CN115618006A (zh) 一种知识图谱的自动构建***及其工作方法
CN113934909A (zh) 基于预训练语言结合深度学习模型的金融事件抽取方法
CN114282498B (zh) 一种应用于电力交易的数据知识处理***
CN114880307A (zh) 一种开放教育领域知识的结构化建模方法
CN114548072A (zh) 用于合同类文件的自动内容解析与信息评测方法及***
US20170154029A1 (en) System, method, and apparatus to normalize grammar of textual data
CN114330483A (zh) 数据处理方法及模型训练方法、装置、设备、存储介质
Wang et al. Factuality of large language models in the year 2024
CN117290508A (zh) 一种基于自然语言处理的贷后文本数据处理方法和***
CN111191413B (zh) 一种基于图排序模型的事件核心内容自动标记方法、装置及***
CN112288584A (zh) 保险报案处理方法、装置、计算机可读介质及电子设备
CN116383414A (zh) 一种基于碳核查知识图谱的智能文件评审***及方法
CN110851572A (zh) 会话标注方法、装置、存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant