CN114118817A - 一种银行阳光办贷贷款审查派单方法、装置和*** - Google Patents

一种银行阳光办贷贷款审查派单方法、装置和*** Download PDF

Info

Publication number
CN114118817A
CN114118817A CN202111439938.XA CN202111439938A CN114118817A CN 114118817 A CN114118817 A CN 114118817A CN 202111439938 A CN202111439938 A CN 202111439938A CN 114118817 A CN114118817 A CN 114118817A
Authority
CN
China
Prior art keywords
loan
representing
classification
pending
loan service
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111439938.XA
Other languages
English (en)
Other versions
CN114118817B (zh
Inventor
董兴磊
赵涛
班风宝
陆权
许延波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jinan Rural Commercial Bank Co ltd
Original Assignee
Jinan Rural Commercial Bank Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jinan Rural Commercial Bank Co ltd filed Critical Jinan Rural Commercial Bank Co ltd
Priority to CN202111439938.XA priority Critical patent/CN114118817B/zh
Publication of CN114118817A publication Critical patent/CN114118817A/zh
Application granted granted Critical
Publication of CN114118817B publication Critical patent/CN114118817B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06311Scheduling, planning or task assignment for a person or group
    • G06Q10/063112Skill-based matching of a person or a group to a task
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/103Workflow collaboration or project management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • General Business, Economics & Management (AREA)
  • Molecular Biology (AREA)
  • Marketing (AREA)
  • Biophysics (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Technology Law (AREA)
  • Databases & Information Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Game Theory and Decision Science (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明公开了一种银行阳光办贷贷款审查派单方法、装置和***,其中,该方法包括以下步骤:获取待办贷款业务的单据,并通过对所述待办贷款业务的单据进行图像识别处理和分词处理,获得待办贷款业务的单据的多个分词;通过第一分类模型对所述待办贷款业务进行初次分类;基于所述初次分类结果,确定是否需进行人工派单,如果是则进行人工派单,否则,通过第二分类模型对所述待办贷款业务进行二次分类;基于所述二次分类的分类结果,将所述待办贷款业务分派给与所述待办贷款业务符合程度最高的审查人员进行审查。本发明能够有效提高派单的精确度、合理性和安全性,具有较好的实际应用价值。

Description

一种银行阳光办贷贷款审查派单方法、装置和***
技术领域
本发明涉及互联网通信技术领域,特别涉及一种银行阳光办贷贷款审查派单方法、装置和***。
背景技术
商业银行在审查审批体制上基本比较完善,但在审查审批办贷环节操作上都普遍存在一些问题,主要体现在银行阳光办贷贷款审查的派单方面。
银行的贷款有很多种类,一般来说,按照贷款期限分类,包括短期贷款、中期贷款和长期贷款;按照偿还方式分类,包括活期贷款、定期贷款;按照贷款用途分类,包括消费贷款、有价证券贷款等;按照贷款担保分类,包括票据贴现贷款、票据抵押贷款、商品抵押贷款、信用贷款等;按照利率分类,包括固定利率贷款和浮动利率贷款。
然而,在实际的贷款审查中,除了上述一般贷款种类外,有部分贷款需要现场调查,即,现场对贷款人贷款的合法性、安全性以及盈利性进行调查(下称需进行现场调查的贷款业务,也称嵌入式贷款调查业务),也就是说,审查人员的工作主要分两部分:现场贷款调查和常规贷款审查。
在派单之前,首先需要对进入贷款审查流程的贷款单据进行分类,然后根据贷款类别分给审查人员进行审查。
目前,现有技术中主要有人工派单和***自动派单两种派单方式,现有的银行贷款派单技术为克服人工派单效率低的问题,一般采用自动派单方式,自动派单大大提高了派单的效率,然而,还存在以下几方面的问题:
(1)现有的银行自动派单技术利用机器学习模型对贷款进行分类,但是由于采用的简单的机器学习模型,并没有针对银行贷款业务对机器学习模型进行改进,所以存在分类不够准确的问题。
(2)现有的银行自动派单技术将所有的贷款业务都放入派单队列进行自动派单,未考虑加急、重要的贷款业务等情况,且在进行贷款分类时仅考虑了上述一般的银行贷款分类,未考虑现场调查贷款的分类,即,没有将人工派单和自动派单有机的结合,不能满足银行准确派单的需求。
(3)现有的银行自动派单技术在派单时未考虑审查人员与待审批的贷款业务的符合程度,或者仅根据审查人员的手头工作量和贷款业务的工作量进行简单的匹配,没有对审查人员的各项工作指标作出客观详细的评价,从而存在派单不合理、不准确的问题。
(4)现有的银行自动派单技术通过机器学习的方式进行分类,需要进行大量的数据运算,而银行的终端数据处理能力有限,且银行的数据处理需要备份,而只在终端进行数据处理和存储,存在数据丢失的风险。
如果贷款派单不够及时、准确,则会极大影响银行后续处理贷款业务的效率和准确性,使得银行方和贷款方的利益都受到损害。因此,有必要开发一种能够提高银行贷款审批的派单的精确度、合理性以及安全性,能够解决本发明提出的上述问题的派单方法、装置和***,以更好的满足银行阳光办贷贷款派单需求。
发明内容
针对上述问题,本发明提供了一种银行阳光办贷贷款审查派单方法、装置和***,可充分的消除由于现有技术的限制和缺陷而导致的上述派单精确度低、派单不够合理和存在的安全性等多个问题。为解决上述问题,本发明提出的技术方案如下:
一方面,本发明提供了一种银行阳光办贷贷款审查派单方法包括以下步骤:
S1.获取待办贷款业务的单据,并通过对所述待办贷款业务的单据进行图像识别处理和分词处理,获得所述待办贷款业务的单据的多个分词;
S2.将所述待办贷款业务的单据的多个分词输入到预先训练好的第一分类模型,以通过所述第一分类模型对所述待办贷款业务进行初次分类;
S3.基于所述初次分类结果,确定是否需进行人工派单,如果是,则转入步骤S6,否则转入步骤S4;
S4.将所述待办贷款业务的单据的多个分词输入到预先训练好的第二分类模型,以通过所述第二分类模型对所述待办贷款业务进行二次分类;
S5.基于所述二次分类的分类结果,将所述待办贷款业务分派给与所述待办贷款业务符合程度最高的审查人员进行审查;
S6.由具有人工派单权限的派单人员进行人工派单;
其中,所述第一分类模型和所述第二分类模型采用相同的神经网络模型,所述神经网络模型包括:
输入层,用于接收所述多个分词;
嵌入层,用于通过Word2vec模型将所述多个分词转换为词向量,并对所述词向量进行加权形成加权词向量;
双向LSTM层,用于从所述加权词向量中提取语义特征,形成第一特征向量,并将所述第一特征向量输入到TextCNN层;
TextCNN层,用于接收所述第一特征向量,并从所述第一特征向量中提取局部位置特征,形成第二特征向量;
输出层,用于将所述第一特征向量和所述第二特征向量组合为第三特征向量,以便分类器使用所述第三特征向量进行分类。
优选的,步骤S1具体包括以下子步骤:
S11.对所述待办贷款业务的单据进行图像识别,以提取所述待办贷款业务的单据中的文本信息;
S12.对所述文本信息进行预处理,以去除无关信息,得到预处理后的文本信息;
S13.利用分词工具将所述预处理后的文本信息进行分词处理,得到多个分词。
优选的,其特征在于,对Word2vec模型转换后的词向量进行加权,加权公式为:
Figure RE-GDA0003422559770000041
Figure RE-GDA0003422559770000042
其中,W(ti,d)表示单词ti在文本d中的权重,tf(ti,d)表示单词ti在文本d中出现的频率,N表示文本的总数,
Figure RE-GDA0003422559770000043
表示存在单词ti的文本总数。
优选的,所述双向LSTM层的计算公式如下:
Figure RE-GDA0003422559770000044
Figure RE-GDA0003422559770000045
Figure RE-GDA0003422559770000046
其中,
Figure RE-GDA0003422559770000047
表示t时刻前方向的输出状态向量,
Figure RE-GDA0003422559770000048
表示t时刻后方向的状态输出向量,
Figure RE-GDA0003422559770000049
表示输出状态向量,xt表示t时刻的输入,
Figure RE-GDA00034225597700000410
表示t-1时刻前方向的输出状态向量,
Figure RE-GDA00034225597700000411
表示t+1时刻后方向的状态输出向量,
Figure RE-GDA00034225597700000412
表示前方向输入- 隐藏权重矩阵,
Figure RE-GDA0003422559770000051
表示前方向隐藏-隐藏权重矩阵,
Figure RE-GDA0003422559770000052
表示前方向隐藏-输出权重矩阵,
Figure RE-GDA0003422559770000053
表示后方向输入-隐藏权重矩阵,
Figure RE-GDA0003422559770000054
表示后方向隐藏-隐藏权重矩阵,
Figure RE-GDA0003422559770000055
表示后方向隐藏-输出权重矩阵,
Figure RE-GDA0003422559770000056
by分别表示前方向、后方向和最终输出的偏置向量。
优选的,在TextCNN层,采用多个卷积层对所述第一特征向量进行卷积运算,其中,当前卷积层的输入为前一卷积核的卷积结果和所述第一特征向量,最后一个卷积层的卷积结果为所述第二特征向量。
优选的,步骤S5包括以下子步骤:
S51.获取每位审查人员的待审查贷款业务工作量,基于所述每位审查人员的待审查贷款业务工作量确定预分配审查人员,并计算每位所述预分配审查人员针对所述待处理贷款业务的分数;
S52.将每位所述预分配审查人员针对所述待处理贷款业务的分数进行排序,并将所述待处理贷款业务分派给分数最高的审查人员。
优选的,在步骤S51中,按照以下公式(1)计算每位预分配审查人员针对待审查贷款业务的分数:
Figure RE-GDA0003422559770000057
其中,Scorei,j表示第i位审查人员针对业务类别为j的待审查贷款业务的分数,ct表示该第i位审查人员审查第t种类型的贷款业务的权重,kt表示第i位审查人员处理第t种类型的贷款业务的次数,nj表示该第i位审查人员审查第j 种类型的贷款业务的总次数,n表示该第i位审查人员审查的所有类型的贷款业务的总次数。
优选的,所述方法还包括以下步骤:将贷款审查相关数据上传到云端服务器进行备份。
本发明还提供了一种银行阳光办贷贷款审查派单***,所述***包括:处理器,存储器及存储在所述存储器上并可在所述处理器上运行的程序,所述程序被所述处理器执行时实现如权利要求1-8中任意一项所述的银行阳光办贷贷款审查派单方法。
本发明还提供了一种计算机可读存储介质,计算机可读存储介质上存储有程序,所述程序被处理器执行时实现如权利要求1-8中任意一项所述的银行阳光办贷贷款审查派单方法。
本发明提供的银行阳光办贷贷款审查派单方法、装置和***,与现有技术相比,能够有效提高派单的精确度、合理性和安全性,具有较好的实际应用价值。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将首先对描述实施例所使用的附图作简要说明。可以理解的是,这些附图仅仅是示例性的说明,对于本领域普通技术人员来讲,在不付出创造性的劳动的前提下,可以对这些附图作出改变,这些改进都旨在包括在本发明的范围之内。
图1为根据本发明实施例的银行阳光办贷贷款审查派单方法的流程图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,便于本领域技术人员能够更好的理解对本发明的技术方案,下面将结合附图对本发明的实施例进行清楚、完整的描述。显而易见的是,所描述的实施例仅仅是本发明的一部分特定实施例,而不是全部的实施例。基于本发明说明书中的特定实施例,本领域普通技术人员在没有作出创造性的劳动的前提下所获得的所有其他实施例,都应当属于本发明的保护范围。
如图1所示,根据本发明的实施例的银行阳光办贷贷款审查派单方法包括以下步骤:
S1.获取待办贷款业务的单据,并通过对所述待办贷款业务的单据进行图像识别处理和分词处理,获得所述待办贷款业务的单据的多个分词。
S2.将所述待办贷款业务的单据的多个分词输入到预先训练好的第一分类模型,以通过所述第一分类模型对所述待办贷款业务进行初次分类。
S3.基于所述初次分类结果,确定是否需进行人工派单,如果是,则转入步骤S6,否则转入步骤S4。
S4.将所述待办贷款业务的单据的多个分词输入到预先训练好的第二分类模型,以通过所述第二分类模型对所述待办贷款业务进行二次分类。
S5.基于所述二次分类的分类结果,将所述待办贷款业务分派给与所述待办贷款业务符合程度最高的审查人员进行审查。
S6.由具有人工派单权限的派单人员进行人工派单。
其中,所述第一分类模型和所述第二分类模型采用相同的神经网络模型,所述神经网络模型包括输入层、嵌入层、双向LSTM层、TextCNN层和输出层,其中,所述嵌入层采用的是Wordevec模型,通过Wordevec模型将所述多个分词转换为词向量,并对所述词向量进行加权形成加权词向量。
下面对上述步骤S1-S6进行详细说明。
在步骤S1中主要实现待办贷款业务的单据的文本信息提取和分词,其中,步骤S1具体包括以下子步骤:
S11.对所述待办贷款业务的单据进行图像识别,以提取所述待办贷款业务的单据中的文本信息。
传统的银行派单***,需要人工手动输入贷款业务单据中的关键词信息,这需要耗费人力成本。本发明获取到待办贷款业务的单据后,通过图像识别技术,识别出单据图像中的文本信息,例如,贷款人、贷款金额、贷款用途、还款方式、还款期限等等。
S12.对所述文本信息进行预处理,以去除无关信息,得到预处理后的文本信息。
贷款业务的单据中除了包含上述关键信息外,还包括例如标点、特殊符号等无关信息。步骤S12通过对文本进行预处理,去除无关信息,以有助于后续的贷款业务的数据处理。
S13.利用分词工具将所述预处理后的文本信息进行分词处理,得到多个分词。
可选的,本发明采用的分词工具例如为盘古分词、庖丁分词等。为了更好的适应银行数据单的分词处理,本发明在分词工具自身携带的分词库的基础上,加入了辅助数据库,其中,所述辅助数据库包括金融数据库和自定义数据库。在实际工作中,将常用的银行术语补充到自定义数据库中,以不断完善分词所使用的数据库,提高分词效果。
本发明直接利用现有的分词工具,并且通过补充金融数据库和自定义数据的方式,有效提高了针对银行贷款业务的分词的效率和分词的精确度。
接下来执行步骤S2,利用第一分类模型对待办贷款业务单据进行初次分类。具体的,第一分类模型提取贷款人的信息(包括贷款人的信用、贷款记录、名下资产等)、贷款金额、贷款用途等特征信息,并根据以上信息对待审查的贷款业务进行分类,初次分类结果包括:常规贷款业务和重要贷款业务。
举例来说,所述的重要贷款业务包括需进行现场调查的贷款业务、需优先处理的贷款业务(例如,通过贷款人信息识别为贷款人为vip客户)、需加快处理的紧急贷款业务等等。
本发明通过执行步骤S2,将贷款业务进行初步分类,分为常规贷款业务和重要贷款业务,对于重要贷款业务通过人工分派,一般的常规贷款业务则通过***进行自动分派。由此可见,本发明将重要的贷款业务和一般的贷款业务分开处理,人工分派和自动分派相结合,这样既能保证派单的效率,同时通过人工分派能够确保将重要的贷款业务分配给最合适的审查人员。例如,分派人员可以指定经验丰富、工作认真的审查人员来审查重要紧急的贷款业务,做到优先办理且保证服务质量。对于需进行现场调查的贷款业务,分派人员可以按照规定,指定两位合适的审查人员陪同调查人员同时到现场参与调查。
由于执行人工派单的管理人员更加熟悉了解其手下的员工的工作情况,所以相对于机器的机械分配而言,对于少量的重要的贷款业务,本发明由人工分配,而对于大量的一般的贷款业务由机器自动分配,即,本发明在贷款业务派单时,机器自动分配和人工分配相结合,兼顾了效率和精确度。
在步骤S3中,基于步骤S2的所述初次分类结果,确定是否需进行人工派单,如果是,则转入步骤S6,由具有人工派单权限的派单人员进行人工派单。一般来说,将银行管理人员设为具有人工派单权限的派单人员。如果不需人工派单,则转入执行步骤S4,进行自动派单处理。
在步骤S4中,将所述待办贷款业务的单据的多个分词输入到预先训练好的第二分类模型,以通过所述第二分类模型对所述待办贷款业务进行二次分类。通过上文描述可知,通过步骤S2的初分类,分为常规贷款业务和重要贷款业务,如果判定待办的贷款业务属于常规贷款业务,则需通过第二分类模型继续进行二次分类,因此,步骤S4中,输入到第二分类模型中的分词与在步骤S2中输入到第一分类模型中的分词相同,即,经过步骤S2的分类后,在步骤S4中,继续将待办贷款业务的分词输入到第二分类模型中进行二次分类。
在步骤S4中执行的二次分类,其中的二次分类的类别是本发明背景技术部分提到的一般分类,即,包括活期贷款、定期贷款、消费贷款、有价证券贷款、票据贴现贷款、票据抵押贷款、商品抵押贷款、信用贷款、固定利率贷款、浮动利率贷款等等。需要说明的是,以上贷款类型仅是示例,本发明不对具体的贷款类型作出具体限定。
下面对第一分类模型和第二分类模型进行详细说明。
第一分类模型和第二分类模型是本发明的核心部分,其关系着分类的精确度。只有提高业务分类的精确度,才能提高派单的精确度,从而为高质量高效率的审查贷款业务提供保障。基于此,本发明重点对分类模型进行改进。
现有技术中,一般先利用词向量转换模型将分词转换为词向量,再利用分类模型对词向量进行特征提取,从而实现分类,这样词向量转换模型和分类模型是分开的,需分别构建、训练、利用词向量转换模型和分类模型,过程繁琐且没有形成统一的整体。另外,双向LSTM在提取较长的词序列的特征时,会由于模型容量问题而丢弃重要的词信息,而TextCNN则善于提取当前词的局部特征。
本发明在现有神经网络模型的基础上,提出了一种改进的分类模型。本发明的分类模型是一个混合的神经网络模型,其综合了Word2vec、双向LSTM和 TextCNN,充分利用了上述各个模型的优点,可有效提高分类精度。
需要说明的是,在使用本发明的分类模型之前,需利用历史数据进行训练,具体的训练过程不再赘述。
根据本发明的优选实施例,第一分类模型和第二分类模型采用相同的神经网络模型,所述神经网络模型包括:
输入层,用于接收所述多个分词;
嵌入层,用于通过Word2vec模型将所述多个分词转换为词向量,并对所述词向量进行加权形成加权词向量;
双向LSTM层,用于从所述加权词向量中提取语义特征,形成第一特征向量,并将所述第一特征向量输入到TextCNN层;
TextCNN层,用于接收所述第一特征向量,并从所述第一特征向量中提取局部位置特征,形成第二特征向量;其中,所述局部位置特征可以包括单词之间的关系以及包括单词在文本中的位置信息。
输出层,用于将所述第一特征向量和所述第二特征向量组合为第三特征向量,并使用所述第三特征向量进行分类,输出分类结果。
根据本发明的优选实施例,嵌入层采用的是经过训练的Word2vec模型,通过Wordevec模型将所述多个分词转换为词向量。需要说明的是,本发明使用的 Word2vec仅是举例说明,本领域技术人员可以选用任何其他合适的模型来将分词转换为词向量。
Wordevec模型包括CBOW模型和Skip-gram模型,本发明采用CBOW模型。
为了便于在后续的特征提取步骤提取出有助于分类的特征词,本发明对Wordevec模型转换后的词向量进行加权,加权公式为:
Figure RE-GDA0003422559770000111
Figure RE-GDA0003422559770000112
其中,W(ti,d)表示单词ti在文本d中的权重,tf(ti,d)表示单词ti在文本d中出现的频率,N表示文本的总数,
Figure RE-GDA0003422559770000113
表示存在单词ti的文本总数。
通过公式(1)、(2)获得文本中每个单词的权重,形成权重矩阵,将权重矩阵与词向量矩阵相乘,即可得到加权的词向量。
在通过嵌入层得到加权的词向量后,将所述加权的词向量输入到双向LSTM 层,双向LSTM层采用的是双向LSTM模型,为了简化网络结构,减少网络参数的数量,本发明的双向LSTM模型不包括注意度层。此外,本发明的双向LSTM模型保留了位置-顺序关系,从而可以连接语句中不同距离的单词。
具体的,本发明的双向LSTM模型的计算公式如下:
Figure RE-GDA0003422559770000121
Figure RE-GDA0003422559770000122
Figure RE-GDA0003422559770000123
其中,
Figure RE-GDA0003422559770000124
表示t时刻前方向的输出状态向量,
Figure RE-GDA0003422559770000125
表示t时刻后方向的状态输出向量,
Figure RE-GDA0003422559770000126
表示输出状态向量(即,前文所述的第一特征向量),xt表示t时刻的输入,
Figure RE-GDA0003422559770000127
表示t-1时刻前方向的输出状态向量,
Figure RE-GDA0003422559770000128
表示t+1时刻后方向的状态输出向量,
Figure RE-GDA0003422559770000129
表示前方向输入-隐藏权重矩阵,
Figure RE-GDA00034225597700001210
表示前方向隐藏-隐藏权重矩阵,
Figure RE-GDA00034225597700001211
表示前方向隐藏-输出权重矩阵,
Figure RE-GDA00034225597700001212
表示后方向输入-隐藏权重矩阵,
Figure RE-GDA00034225597700001213
表示后方向隐藏-隐藏权重矩阵,
Figure RE-GDA00034225597700001214
表示后方向隐藏-输出权重矩阵,
Figure RE-GDA00034225597700001215
by分别表示前方向、后方向和最终输出的偏置向量。
接下来,将双向LSTM层输出的向量输入到TextCNN层,以进一步提取局部位置特征。TextCNN层对输入的向量进行卷积计算,根据本发明的优选实施例,采用N个卷积层(优选的,N=5)对所述第一特征向量进行卷积运算,其中,当前卷积层的输入为前一卷积核的卷积结果和所述第一特征向量,最后一个卷积层的卷积结果为所述第二特征向量。需要说明的是,对于第一个卷积层,由于不存在前一卷积层的卷积结果,所以第一卷积层的输入仅为所述第一特征向量。
本发明通过对TextCNN层的卷积运算进行改进,采用连续卷积的方式,进一步提高了特征提取的精度。
根据本发明的优选实施例,输出层采用softmax函数计算分类概率,最后输出概率最大的类别作为分类结果。
根据本发明的优选实施例,本发明还利用第一分类模型和第二分类模型的分类结果数据更新所述第一分类模型和所述第二分类模型,以不断优化所述第一分类模型和所述第二分类模型,提高分类的精确度。
通过步骤S4得到二次分类结果后,执行步骤S5,基于所述二次分类的分类结果,将所述待办贷款业务分派给与所述待办贷款业务符合程度最高的审查人员进行审查。
具体的,步骤S5包括以下子步骤:
S51.获取每位审查人员的待审查贷款业务工作量,基于所述每位审查人员的待审查贷款业务工作量确定预分配审查人员,并计算每位所述预分配审查人员针对所述待处理贷款业务的分数;
S52.将每位所述预分配审查人员针对所述待处理贷款业务的分数进行排序,并将所述待处理贷款业务分派给分数最高的审查人员。
在步骤S5中,为了避免贷款业务审查工作的积压,提高审查效率,本发明首先获取每位审查人员的待审查贷款业务工作量,将待审查贷款业务工作量低于预设阈值的审查人员确定为预分配审查人员,这样可以避免将待审查的贷款业务分配给手头已有多个未完成的待办贷款业务的审查人员,其中,预设阈值可由管理人员设置,例如,设置为2件等。
在步骤S51的具体实现时,本发明预先设置审查人员工作量表,表格中有每位审查人员以及与其对应的待审查贷款业务工作量。即,步骤S51中的“获取每位审查人员的待审查贷款业务工作量,基于所述每位审查人员的待审查贷款业务工作量确定预分配审查人员”可具体包括:通过审查人员工作量表获取每位审查人员的待审查贷款业务工作量,将每位审查人员的待审查贷款业务工作量与预设阈值进行比较,将待审查贷款业务工作量低于预设阈值的审查人员确定为预分配审查人员。
在步骤S51中,为了将贷款业务分配给最适合处理该笔贷款业务的审查人员,本发明对每位预分配审查人员进行评分,具体的,根据发现利用策略,按照以下公式(6)计算每位预分配审查人员针对待审查贷款业务的分数:
Figure RE-GDA0003422559770000141
其中,Scorei,j表示第i位审查人员针对业务类别为j的待审查贷款业务的分数,ct表示该第i位审查人员审查第t种类型的贷款业务的权重,kt表示第i位审查人员处理第t种类型的贷款业务的次数,nj表示该第i位审查人员审查第j 种类型的贷款业务的总次数,n表示该第i位审查人员审查的所有类型的贷款业务的总次数。
可以理解的是,权重ct反映审查人员处理第t种类型的贷款业务的整体质量情况,其可以根据审查人员处理第t种类型的贷款业务的工作时长、客户的反馈评价以及该审查人员的工作年限、工作业绩等综合设定。
接下来,执行步骤S52,将每位所述预分配审查人员针对所述待处理贷款业务的分数进行排序,并将所述待处理贷款业务分派给分数最高的审查人员。
根据本发明的优选实施例,为减轻银行终端的压力,将所述第一分类模型和所述第二分类模型分别存储于第一云端子服务器和第二云端子服务器中。另外,为了确保审查数据的安全性,本发明还包括:将贷款审查相关数据上传到第三云端子服务器中进行备份。
另外,为了实现阳关办贷,即,使得贷款人及时了解贷款办理情况,本发明还包括:将贷款审查进度及时发送到贷款人的智能终端,例如,手机。
由以上描述可知,本发明充分考虑到银行终端处理数据能力有限的问题,利用云端服务器进行模型的训练和分类,并且将不同的模型分布在不同的云端子服务器上,这样可以进一步提高数据处理的效率和安全性。
本发明还提供了一种银行阳光办贷贷款审查派单***,所述***包括:处理器,存储器及存储在所述存储器上并可在所述处理器上运行的程序,所述程序被所述处理器执行时实现如上所述的银行阳光办贷贷款审查派单方法实施例的各个方法步骤。
本发明还提供了一种计算机可读存储介质,计算机可读存储介质上存储有程序,该程序被处理器执行时实现如上所述的银行阳光办贷贷款审查派单方法实施例的各个方法步骤。其中,该计算机可读存储介质,如只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等。
此外,需要指出的是,在本发明的装置和方法中,显然,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本发明的等效方案。并且,执行上述系列处理的步骤可以自然地按照说明的顺序或按时间顺序执行,但是并不需要一定按照时间顺序执行,某些步骤可以并行或彼此独立地执行。对本领域的普通技术人员而言,能够理解本发明的方法和装置的全部或者任何步骤或者部件,可以在任何计算装置(包括处理器、存储介质等)或者计算装置的网络中,以硬件、固件、软件或者它们的组合加以实现。
以上内容仅为本发明的较佳实施例,对于本领域的普通技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种银行阳光办贷贷款审查派单方法包括以下步骤:
S1.获取待办贷款业务的单据,并通过对所述待办贷款业务的单据进行图像识别处理和分词处理,获得所述待办贷款业务的单据的多个分词;
S2.将所述待办贷款业务的单据的多个分词输入到预先训练好的第一分类模型,以通过所述第一分类模型对所述待办贷款业务进行初次分类;
S3.基于所述初次分类结果,确定是否需进行人工派单,如果是,则转入步骤S6,否则转入步骤S4;
S4.将所述待办贷款业务的单据的多个分词输入到预先训练好的第二分类模型,以通过所述第二分类模型对所述待办贷款业务进行二次分类;
S5.基于所述二次分类的分类结果,将所述待办贷款业务分派给与所述待办贷款业务符合程度最高的审查人员进行审查;
S6.由具有人工派单权限的派单人员进行人工派单;
其中,所述第一分类模型和所述第二分类模型采用相同的神经网络模型,所述神经网络模型包括:
输入层,用于接收所述多个分词;
嵌入层,用于通过Word2vec模型将所述多个分词转换为词向量,并对所述词向量进行加权形成加权词向量;
双向LSTM层,用于从所述加权词向量中提取语义特征,形成第一特征向量,并将所述第一特征向量输入到TextCNN层;
TextCNN层,用于接收所述第一特征向量,并从所述第一特征向量中提取局部位置特征,形成第二特征向量;
输出层,用于将所述第一特征向量和所述第二特征向量组合为第三特征向量,以便分类器使用所述第三特征向量进行分类。
2.根据权利要求1所述的方法,其特征在于,步骤S1具体包括以下子步骤:
S11.对所述待办贷款业务的单据进行图像识别,以提取所述待办贷款业务的单据中的文本信息;
S12.对所述文本信息进行预处理,以去除无关信息,得到预处理后的文本信息;
S13.利用分词工具将所述预处理后的文本信息进行分词处理,得到多个分词。
3.根据权利要求1或2所述的方法,其特征在于,对Word2vec模型转换后的词向量进行加权,加权公式为:
Figure RE-FDA0003422559760000021
Figure RE-FDA0003422559760000022
其中,W(ti,d)表示单词ti在文本d中的权重,tf(ti,d)表示单词ti在文本d中出现的频率,N表示文本的总数,
Figure RE-FDA0003422559760000023
表示存在单词ti的文本总数。
4.根据权利要求1或2所述的方法,其特征在于,所述双向LSTM层的计算公式如下:
Figure RE-FDA0003422559760000024
Figure RE-FDA0003422559760000025
Figure RE-FDA0003422559760000026
其中,
Figure RE-FDA0003422559760000027
表示t时刻前方向的输出状态向量,
Figure RE-FDA0003422559760000028
表示t时刻后方向的状态输出向量,
Figure RE-FDA0003422559760000029
表示输出状态向量,xt表示t时刻的输入,
Figure RE-FDA00034225597600000210
表示t-1时刻前方向的输出状态向量,
Figure RE-FDA00034225597600000211
表示t+1时刻后方向的状态输出向量,
Figure RE-FDA00034225597600000212
表示前方向输入-隐藏权重矩阵,
Figure RE-FDA00034225597600000213
表示前方向隐藏-隐藏权重矩阵,
Figure RE-FDA00034225597600000214
表示前方向隐藏-输出权重矩阵,
Figure RE-FDA0003422559760000031
表示后方向输入-隐藏权重矩阵,
Figure RE-FDA0003422559760000032
表示后方向隐藏-隐藏权重矩阵,
Figure RE-FDA0003422559760000033
表示后方向隐藏-输出权重矩阵,
Figure RE-FDA0003422559760000034
by分别表示前方向、后方向和最终输出的偏置向量。
5.根据权利要求1或2所述的方法,其特征在于,在TextCNN层,采用多个卷积层对所述第一特征向量进行卷积运算,其中,当前卷积层的输入为前一卷积核的卷积结果和所述第一特征向量,最后一个卷积层的卷积结果为所述第二特征向量。
6.根据权利要求1所述的方法,其特征在于,步骤S5包括以下子步骤:
S51.获取每位审查人员的待审查贷款业务工作量,基于所述每位审查人员的待审查贷款业务工作量确定预分配审查人员,并计算每位所述预分配审查人员针对所述待处理贷款业务的分数;
S52.将每位所述预分配审查人员针对所述待处理贷款业务的分数进行排序,并将所述待处理贷款业务分派给分数最高的审查人员。
7.根据权利要求6所述的方法,其特征在于,在步骤S51中,按照以下公式(1)计算每位预分配审查人员针对待审查贷款业务的分数:
Figure RE-FDA0003422559760000035
其中,Scorei,j表示第i位审查人员针对业务类别为j的待审查贷款业务的分数,ct表示该第i位审查人员审查第t种类型的贷款业务的权重,kt表示第i位审查人员处理第t种类型的贷款业务的次数,nj表示该第i位审查人员审查第j种类型的贷款业务的总次数,n表示该第i位审查人员审查的所有类型的贷款业务的总次数。
8.根据权利要求1-7中任意一项所述的方法,其特征在于,所述方法还包括以下步骤:将贷款审查相关数据上传到云端服务器进行备份。
9.一种银行阳光办贷贷款审查派单***,所述***包括:处理器,存储器及存储在所述存储器上并可在所述处理器上运行的程序,所述程序被所述处理器执行时实现如权利要求1-8中任意一项所述的银行阳光办贷贷款审查派单方法。
10.一种计算机可读存储介质,计算机可读存储介质上存储有程序,所述程序被处理器执行时实现如权利要求1-8中任意一项所述的银行阳光办贷贷款审查派单方法。
CN202111439938.XA 2021-11-30 2021-11-30 一种银行贷款审查派单方法、装置和*** Active CN114118817B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111439938.XA CN114118817B (zh) 2021-11-30 2021-11-30 一种银行贷款审查派单方法、装置和***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111439938.XA CN114118817B (zh) 2021-11-30 2021-11-30 一种银行贷款审查派单方法、装置和***

Publications (2)

Publication Number Publication Date
CN114118817A true CN114118817A (zh) 2022-03-01
CN114118817B CN114118817B (zh) 2022-08-05

Family

ID=80368215

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111439938.XA Active CN114118817B (zh) 2021-11-30 2021-11-30 一种银行贷款审查派单方法、装置和***

Country Status (1)

Country Link
CN (1) CN114118817B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107832400A (zh) * 2017-11-01 2018-03-23 山东大学 一种基于位置的lstm和cnn联合模型进行关系分类的方法
CN109102157A (zh) * 2018-07-11 2018-12-28 交通银行股份有限公司 一种基于深度学习的银行工单派单方法及***
US20200184540A1 (en) * 2018-12-10 2020-06-11 Accenture Global Solutions Limited Artificial intelligence and machine learning based conversational agent
CN112800765A (zh) * 2021-01-22 2021-05-14 南京亚派软件技术有限公司 一种工单的自动生成方法
CN113535960A (zh) * 2021-08-02 2021-10-22 中国工商银行股份有限公司 一种文本分类方法、装置和设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107832400A (zh) * 2017-11-01 2018-03-23 山东大学 一种基于位置的lstm和cnn联合模型进行关系分类的方法
CN109102157A (zh) * 2018-07-11 2018-12-28 交通银行股份有限公司 一种基于深度学习的银行工单派单方法及***
US20200184540A1 (en) * 2018-12-10 2020-06-11 Accenture Global Solutions Limited Artificial intelligence and machine learning based conversational agent
CN112800765A (zh) * 2021-01-22 2021-05-14 南京亚派软件技术有限公司 一种工单的自动生成方法
CN113535960A (zh) * 2021-08-02 2021-10-22 中国工商银行股份有限公司 一种文本分类方法、装置和设备

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
PAN DONG-HONG ET.AL.: "A Chinese implicit sentiment classification model combining contextual features", 《COMPUTER ENGINEERING AND SCIENCE》 *
刘佳: "基于改进词嵌入表示和卷积神经网络的银行智能派单***的研究", 《工业控制计算机》 *
王立荣: "Word2vec-CNN-Bilstm短文本情感分类", 《福建电脑》 *

Also Published As

Publication number Publication date
CN114118817B (zh) 2022-08-05

Similar Documents

Publication Publication Date Title
Chen et al. Stock prediction using convolutional neural network
Raghupathi et al. A neural network application for bankruptcy prediction
Wang et al. A new random subspace method incorporating sentiment and textual information for financial distress prediction
Jiang et al. Mining semantic features in current reports for financial distress prediction: Empirical evidence from unlisted public firms in China
Lu et al. Credit rating change modeling using news and financial ratios
Shi et al. A novel imbalanced data classification approach based on logistic regression and Fisher discriminant
Chen et al. Bankruptcy prediction using machine learning models with the text-based communicative value of annual reports
WO2023071120A1 (zh) 数字资产中的绿色资产的占比的识别方法及相关产品
Dasari et al. Prediction of bank loan status using machine learning algorithms
CN111143533B (zh) 一种基于用户行为数据的客服方法及***
CN114118817B (zh) 一种银行贷款审查派单方法、装置和***
Holowczak et al. Testing market response to auditor change filings: A comparison of machine learning classifiers
CN116662546A (zh) 投诉文本标注方法、装置、设备和介质
Zeng et al. Semantic multi-grain mixture topic model for text analysis
CN109635289A (zh) 词条分类方法及审计信息抽取方法
Bag et al. Stock price trend prediction and recommendation using cognitive process
Yang et al. An evidential reasoning rule-based ensemble learning approach for evaluating credit risks with customer heterogeneity
Lee et al. Application of machine learning in credit risk scorecard
Islam et al. Stock market prediction of Bangladesh using multivariate long short-term memory with sentiment identification.
Hristova et al. RatingBot: A Text Mining Based Rating Approach.
Lee et al. An Integral Predictive Model of Financial Distress
Kotsiantis et al. Financial Application of Neural Networks: two case studies in Greece
Makatjane Deep learning for sentiment analysis to predict the probability of bank loan default
Li et al. Parametric and non-parametric combination model to enhance overall performance on default prediction
Melnyk et al. Improving the quality of credit activity by using scoring model

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant