CN112579773A - 风险事件分级方法及装置 - Google Patents
风险事件分级方法及装置 Download PDFInfo
- Publication number
- CN112579773A CN112579773A CN202011487708.6A CN202011487708A CN112579773A CN 112579773 A CN112579773 A CN 112579773A CN 202011487708 A CN202011487708 A CN 202011487708A CN 112579773 A CN112579773 A CN 112579773A
- Authority
- CN
- China
- Prior art keywords
- risk event
- event
- risk
- model
- preset
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 56
- 238000000605 extraction Methods 0.000 claims abstract description 68
- 238000012549 training Methods 0.000 claims description 18
- 238000004590 computer program Methods 0.000 claims description 13
- 238000003860 storage Methods 0.000 claims description 12
- 238000013517 stratification Methods 0.000 claims 2
- 238000010586 diagram Methods 0.000 description 15
- 230000006870 function Effects 0.000 description 15
- 238000004891 communication Methods 0.000 description 14
- 238000012545 processing Methods 0.000 description 11
- 239000000872 buffer Substances 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 230000004913 activation Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000013145 classification model Methods 0.000 description 2
- 230000006735 deficit Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000034994 death Effects 0.000 description 1
- 231100000517 death Toxicity 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Human Computer Interaction (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提供了一种风险事件分级方法及装置,其中,该方法包括:采集目标新闻文本;应用预设的风险事件类型抽取模型、风险事件属性抽取模型和所述目标新闻文本,确定对应的风险事件的事件属性;应用预设的风险事件主体抽取模型、实体链接模型和所述目标新闻文本,确定所述风险事件的主体信息;基于所述事件属性、主体信息和预设的风险事件分级模型,确定所述风险事件的风险等级。本申请能够有效实现风险事件的分级,进而能够提高后续金融交易决策的准确性。
Description
技术领域
本申请涉及数据处理技术领域,尤其涉及一种风险事件分级方法及装置。
背景技术
新闻舆情对经济市场及相关活动的重要性不言而喻,准确把握新闻报道中关于各企业的负面事件报道,对新闻文本中涉及的风险事件的严重程度进行评估分级,能够为银行、投资机构乃至个人做相关决策提供巨大助力。
当前新闻文本风险事件的严重程度分级尚不成熟,当前的新闻报道中负面舆情的产生速度极快,对后续决策过程产生较大的处理压力。风险抽取的召回率不高,不足以满足业务实际需求。
在现有技术中,一种风险事件分级方法为直接由人工阅读新闻文本,总结、记录得到风险事件严重程度,首先,新闻文本中风险事件报道密度较为稀疏,人工阅读量巨大;其次,人工识别对文本阅读人员有较高的业务知识要求,人力成本高;另一种风险事件分级方法为将风险事件分级问题直接转化为分类问题实现分级,该方法存在数据稀疏导致的训练样本需求量大和分类算法的可解释性低的问题。
发明内容
针对现有技术中的至少一个问题,本申请提出了一种风险事件分级方法及装置,能够有效实现风险事件的分级,进而能够提高后续金融交易决策的准确性。
为了解决上述技术问题,本申请提供以下技术方案:
第一方面,本申请提供一种风险事件分级方法,包括:
采集目标新闻文本;
应用预设的风险事件类型抽取模型、风险事件属性抽取模型和所述目标新闻文本,确定对应的风险事件的事件属性;
应用预设的风险事件主体抽取模型、实体链接模型和所述目标新闻文本,确定所述风险事件的主体信息;
基于所述事件属性、主体信息和预设的风险事件分级模型,确定所述风险事件的风险等级。
进一步地,所述应用预设的风险事件类型抽取模型、风险事件属性抽取模型和所述目标新闻文本,确定对应的风险事件的事件属性,包括:
应用所述预设的风险事件类型抽取模型和目标新闻文本,确定所述风险事件的事件类型;
应用所述预设的风险事件属性抽取模型和事件类型,确定所述风险事件的事件属性。
进一步地,所述应用预设的风险事件主体抽取模型、实体链接模型和所述目标新闻文本,确定所述风险事件的主体信息,包括:
应用所述预设的风险事件主体抽取模型和目标新闻文本,确定所述风险事件的事件主体;
应用所述预设的实体链接模型和事件主体,确定所述风险事件的主体信息。
进一步地,所述预设的风险事件类型抽取模型为预先训练Bert-Dense-softmax模型得到的。
进一步地,所述预设的风险事件主体抽取模型为预先训练Bert-BILSTM-CRF模型得到的。
进一步地,所述预设的风险事件属性抽取模型为预先训练Albert预训练模型得到的。
进一步地,所述预设的实体链接模型包括:无监督实体链接模型和已训练完成的有监督实体链接模型。
第二方面,本申请提供一种风险事件分级装置,包括:
采集模块,用于采集目标新闻文本;
确定事件属性模块,用于应用预设的风险事件类型抽取模型、风险事件属性抽取模型和所述目标新闻文本,确定对应的风险事件的事件属性;
确定主体信息模型,用于应用预设的风险事件主体抽取模型、实体链接模型和所述目标新闻文本,确定所述风险事件的主体信息;
确定风险等级模块,用于基于所述事件属性、主体信息和预设的风险事件分级模型,确定所述风险事件的风险等级。
第三方面,本申请提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现所述的风险事件分级方法。
第四方面,本申请提供一种计算机可读存储介质,其上存储有计算机指令,所述指令被执行时实现所述的风险事件分级方法。
由上述技术方案可知,本申请提供一种风险事件分级方法及装置。其中,该方法包括:采集目标新闻文本;应用预设的风险事件类型抽取模型、风险事件属性抽取模型和所述目标新闻文本,确定对应的风险事件的事件属性;应用预设的风险事件主体抽取模型、实体链接模型和所述目标新闻文本,确定所述风险事件的主体信息;基于所述事件属性、主体信息和预设的风险事件分级模型,确定所述风险事件的风险等级,能够有效实现风险事件的分级,进而能够提高后续金融交易决策的准确性;具体地,能够实现基于新闻文本的风险事件分级判定,能够解决传统人力阅读新闻文本判定风险事件级别的高成本和时间滞后性问题,相比常见方法,通过抽取属性和关联其他企业信息能够降低计算量,并且能够提高风险事件分级的可解释性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例中风险事件分级方法的流程示意图;
图2是本申请另一实施例中风险事件分级方法的流程示意图;
图3是本申请又一实施例中风险事件分级方法的流程示意图;
图4是本申请实施例中事件类型抽取过程的逻辑示意图;
图5是本申请实施例中事件主体抽取过程的逻辑示意图;
图6是本申请应用实例中风险事件分级方法的流程示意图;
图7是本申请实施例中风险事件分级装置的结构示意图;
图8为本申请实施例的电子设备9600的***构成示意框图。
具体实施方式
为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
基于此,为了有效实现风险事件的分级,进而提高后续金融交易决策的准确性,本申请实施例提供一种风险事件分级装置,该装置可以是一服务器或客户端设备,所述客户端设备可以包括智能手机、平板电子设备、网络机顶盒、便携式计算机、台式电脑、个人数字助理(PDA)、车载设备和智能穿戴设备等。其中,所述智能穿戴设备可以包括智能眼镜、智能手表和智能手环等。
在实际应用中,进行风险事件分级的部分可以在如上述内容所述的服务器侧执行,也可以所有的操作都在所述客户端设备中完成。具体可以根据所述客户端设备的处理能力,以及用户使用场景的限制等进行选择。本申请对此不作限定。若所有的操作都在所述客户端设备中完成,所述客户端设备还可以包括处理器。
上述的客户端设备可以具有通信模块(即通信单元),可以与远程的服务器进行通信连接,实现与所述服务器的数据传输。所述服务器可以包括任务调度中心一侧的服务器,其他的实施场景中也可以包括中间平台的服务器,例如与任务调度中心服务器有通信链接的第三方服务器平台的服务器。所述的服务器可以包括单台计算机设备,也可以包括多个服务器组成的服务器集群,或者分布式装置的服务器结构。
所述服务器与所述客户端设备之间可以使用任何合适的网络协议进行通信,包括在本申请提交日尚未开发出的网络协议。所述网络协议例如可以包括TCP/IP协议、UDP/IP协议、HTTP协议、HTTPS协议等。当然,所述网络协议例如还可以包括在上述协议之上使用的RPC协议(Remote Procedure Call Protocol,远程过程调用协议)、REST协议(Representational State Transfer,表述性状态转移协议)等。
具体通过下述各个实施例进行说明。
为了有效实现风险事件的分级,进而提高后续金融交易决策的准确性,本实施例提供一种执行主体是风险事件分级装置的风险事件分级方法,该风险事件分级装置包括但不限于服务器,如图1所示,该方法具体包含有如下内容:
步骤101:采集目标新闻文本。
具体地,可以从网络信息源采集新闻文本,网络信息源可以是网页、论坛和社交媒体等。
步骤102:应用预设的风险事件类型抽取模型、风险事件属性抽取模型和所述目标新闻文本,确定对应的风险事件的事件属性。
具体地,所述预设的风险事件类型抽取模型为预先训练Bert-Dense-softmax模型得到的;如图4所示,Bert预训练模型能够在同时考虑上文及下文的前提下给出文本字符的全文语义向量表示;Dense全连接网络结构和softmax激活函数层,用于通过Wordembedding词嵌入得到事件类型的概率分布进而实现确定目标新闻文本的Resultlabeling事件类型;所述预设的风险事件属性抽取模型为预先训练Albert预训练模型得到的。所述风险事件可以是指发生于公司实体的负面事件,依据事件具体分为不同风险事件类型。所述风险事件为所述目标新闻文本对应的风险事件。
举例来说,所述风险事件的事件属性可以包括:预亏金额、处罚金额、亏损金额、涉诉金额、造假金额、死亡人数、损失金额、问题属性、评级后和评级前中的至少一种。
步骤103:应用预设的风险事件主体抽取模型、实体链接模型和所述目标新闻文本,确定所述风险事件的主体信息。
具体地,所述预设的风险事件主体抽取模型为预先训练Bert-BILSTM-CRF模型得到的;Bert-BILSTM-CRF模型可以是指一种实体识别模型,如图5所示,Bert-BILSTM-CRF模型中的Bert层用于获取目标新闻文本的嵌入矩阵,BILSTM层同时从前往后和从后向前建模文本上下文特征,该层输入为目标新闻文本的嵌入矩阵,输出为文本特征矩阵;Dense全连接网络层使用全连接网络的非线性拟合能力对文本特征矩阵进行特征拟合及降维,Dropout层通过随机丢弃部分训练、样本能够有效防止模型的过拟合:最后CRF条件随机场(Condition Random Field,简称CRF)层,对输出结果进行概率修正,得到Start Position开始位置和End Position结束位置,即确定主体是从目标新闻文本的第几个字到第几个字。所述预设的实体链接模型包括:无监督实体链接模型和已训练完成的有监督实体链接模型;所述无监督实体链接模型可以是TFIDF模型,有监督实体链接模型可以是LambdaMART模型。所述风险事件的主体信息可以包括:主体的中文名称、统一社会信用代码、日期、资本金额、经营范围、公司、地址、公司类型、经营状态、金融产品(如:股票或债券)、人员和公司简称中的至少一个。
步骤104:基于所述事件属性、主体信息和预设的风险事件分级模型,确定所述风险事件的风险等级。
具体地,所述预设的风险事件分级模型为预先训练GBDT模型得到的;所述风险等级可以是指负面事件对于银行、投资机构相关业务的影响程度级别。例如,可以根据所述风险等级,确定企业是否存在违约风险,进而决定是否向企业投资。
由上述描述可知,本实施例提供的风险事件分级方法,能够有效实现风险事件的分级,进而能够提高后续金融交易决策的准确性;具体地,能够实现从新闻文本中挖掘各企业相关风险事件并判定负面事件对于银行、投资机构的影响程度分级,能够有效提取风险事件类型、风险事件主体、风险事件属性,进而能够有效判定风险事件分级,计算量较小并且事件分级可解释。
为了进一步提高获取风险事件的事件属性的准确性,参见图2,在本申请一个实施例中,步骤102包括:
步骤201:应用所述预设的风险事件类型抽取模型和目标新闻文本,确定所述风险事件的事件类型。
具体地,可以将目标新闻文本输入预设的风险事件类型抽取模型,将预设的风险事件类型抽取模型的输出结果作为目标新闻文本对应的风险事件的事件类型;所述事件类型可以包括:财务事件、经营事件、信用事件和股东事件类型等。进一步地,为了提高风险事件分级的效率,可以应用所述预设的风险事件类型抽取模型,判断所述目标新闻文本是否存在对应的风险事件的事件类型,若否,则确定目标新闻文本不存在对应的风险事件,可以结束当前处理过程。
步骤202:应用所述预设的风险事件属性抽取模型和事件类型,确定所述风险事件的事件属性。
具体地,可以将事件类型输入所述预设的风险事件属性抽取模型,将所述预设的风险事件属性抽取模型的输出结果作为所述风险事件的事件属性。
为了进一步提高获取风险事件的主体信息的准确性,参见图3,在本申请一个实施例中,步骤103包括:
步骤301:应用所述预设的风险事件主体抽取模型和目标新闻文本,确定所述风险事件的事件主体。
具体地,所述事件主体可以是企业名称;可以将所述目标新闻文本输入所述预设的风险事件主体抽取模型,将所述预设的风险事件主体抽取模型的输出结果作为所述目标新闻文本对应的风险事件的事件主体。
步骤302:应用所述预设的实体链接模型和事件主体,确定所述风险事件的主体信息。
具体地,可以将所述事件主体输入所述预设的实体链接模型,预设的实体链接模型从预存储的主体资料库中提取事件主体对应的主体信息并输出,该主体资料库可以是存储在银行或投资机构对应的金融交易***中的主体资料库,可以包含有:多个企业的主体信息;为了进一步提高确定风险事件的主体信息的准确性,还可以将所述目标新闻文本与所述事件主体同时输入预设的实体链接模型。
为了进一步说明本方案,本申请提供一种风险事件分级方法的应用实例,具体描述如下:
S100:风险事件类型和风险事件主体抽取。
具体地,可以根据公开数据库进行信息抽取,基于Bert预训练模型构建一个文章核心句提取模型,并根据文章核心句内容构建一个文本多分类任务,从多种风险事件类型中为文本选择一个合适类型标签。并定义一个命名实体识别(Named-entity recognition,简称NER)任务,应用Bert-BILSTM-CRF模型,从文本中挖掘得到风险事件主体。参见图6,步骤S100包括:S001:风险事件类型抽取,S002:风险事件主体抽取;在步骤S001之后可以执行步骤S200,步骤S002之后可以执行步骤S300,提取风险事件属性和风险事件主体其他信息。
S200:风险事件属性抽取。
具体地,针对抽取到的风险事件类型,构建一个序列标注任务,从根据每种不同的风险事件类型抽取不同的属性。应用Albert的模型进行训练和预测风险事件属性。
S300:风险事件主体实体链接。
具体地,定义一个实体链接任务,应用无监督的实体链接模型和有监督的实体链接模型lambdamart融合使用的策略,将抽取的风险事件主体对应到企业内已有的主体资料库中,获取风险事件主体相关的其他信息;主体资料库可以相当于知识库,可以预先构建该知识库。
S400:基于属性分级;即根据风险事件类型、属性及风险事件主体相关的其他信息进行严重程度分级。
由上述描述可知,本应用实例提供的风险事件分级方法,通过对海量新闻文本做筛选,获取风险事件类型和风险事件主体;根据风险事件类型,抽取风险事件属性;根据风险事件主体,关联企业内部产生的与该主体相关的其他信息;根据风险事件属性和以及该主体相关的其他信息,输入风险事件分级模型得到分级。能够实现新闻文本的分级判定,能够解决传统人力阅读新闻文本判定风险事件级别的高成本和时间滞后性问题,相比常见方法,通过抽取属性和关联其他企业信息能够降低计算量并且提高可解释性。
从软件层面来说,为了有效实现风险事件的分级,进而提高后续金融交易决策的准确性,本申请提供一种用于实现所述风险事件分级方法中全部或部分内容的风险事件分级装置的实施例,参见图7,所述风险事件分级装置具体包含有如下内容:
采集模块10,用于采集目标新闻文本。
确定事件属性模块20,用于应用预设的风险事件类型抽取模型、风险事件属性抽取模型和所述目标新闻文本,确定对应的风险事件的事件属性。
确定主体信息模型30,用于应用预设的风险事件主体抽取模型、实体链接模型和所述目标新闻文本,确定所述风险事件的主体信息。
确定风险等级模块40,用于基于所述事件属性、主体信息和预设的风险事件分级模型,确定所述风险事件的风险等级。
本说明书提供的风险事件分级装置的实施例具体可以用于执行上述风险事件分级方法的实施例的处理流程,其功能在此不再赘述,可以参照上述风险事件分级方法实施例的详细描述。
由上述描述可知,本申请提供的风险事件分级方法及装置,能够有效实现风险事件的分级,进而能够提高后续金融交易决策的准确性;具体地,能够实现基于新闻文本的风险事件分级判定,能够解决传统人力阅读新闻文本判定风险事件级别的高成本和时间滞后性问题,相比常见方法,通过抽取属性和关联其他企业信息能够降低计算量,并且能够提高风险事件分级的可解释性。
从硬件层面来说,为了有效实现风险事件的分级,进而提高后续金融交易决策的准确性,本申请提供一种用于实现所述风险事件分级方法中的全部或部分内容的电子设备的实施例所述电子设备具体包含有如下内容:
处理器(processor)、存储器(memory)、通信接口(Communications Interface)和总线;其中,所述处理器、存储器、通信接口通过所述总线完成相互间的通信;所述通信接口用于实现所述风险事件分级装置以及用户终端等相关设备之间的信息传输;该电子设备可以是台式计算机、平板电脑及移动终端等,本实施例不限于此。在本实施例中,该电子设备可以参照实施例用于实现所述风险事件分级方法的实施例及用于实现所述风险事件分级装置的实施例进行实施,其内容被合并于此,重复之处不再赘述。
图8为本申请实施例的电子设备9600的***构成的示意框图。如图8所示,该电子设备9600可以包括中央处理器9100和存储器9140;存储器9140耦合到中央处理器9100。值得注意的是,该图8是示例性的;还可以使用其他类型的结构,来补充或代替该结构,以实现电信功能或其他功能。
在本申请一个或多个实施例中,风险事件分级功能可以被集成到中央处理器9100中。其中,中央处理器9100可以被配置为进行如下控制:
步骤101:采集目标新闻文本。
步骤102:应用预设的风险事件类型抽取模型、风险事件属性抽取模型和所述目标新闻文本,确定对应的风险事件的事件属性。
步骤103:应用预设的风险事件主体抽取模型、实体链接模型和所述目标新闻文本,确定所述风险事件的主体信息。
步骤104:基于所述事件属性、主体信息和预设的风险事件分级模型,确定所述风险事件的风险等级。
从上述描述可知,本申请的实施例提供的电子设备,能够有效实现风险事件的分级,进而提高后续金融交易决策的准确性。
在另一个实施方式中,风险事件分级装置可以与中央处理器9100分开配置,例如可以将风险事件分级装置配置为与中央处理器9100连接的芯片,通过中央处理器的控制来实现风险事件分级功能。
如图8所示,该电子设备9600还可以包括:通信模块9110、输入单元9120、音频处理器9130、显示器9160、电源9170。值得注意的是,电子设备9600也并不是必须要包括图8中所示的所有部件;此外,电子设备9600还可以包括图8中没有示出的部件,可以参考现有技术。
如图8所示,中央处理器9100有时也称为控制器或操作控件,可以包括微处理器或其他处理器装置和/或逻辑装置,该中央处理器9100接收输入并控制电子设备9600的各个部件的操作。
其中,存储器9140,例如可以是缓存器、闪存、硬驱、可移动介质、易失性存储器、非易失性存储器或其它合适装置中的一种或更多种。可储存上述与失败有关的信息,此外还可存储执行有关信息的程序。并且中央处理器9100可执行该存储器9140存储的该程序,以实现信息存储或处理等。
输入单元9120向中央处理器9100提供输入。该输入单元9120例如为按键或触摸输入装置。电源9170用于向电子设备9600提供电力。显示器9160用于进行图像和文字等显示对象的显示。该显示器例如可为LCD显示器,但并不限于此。
该存储器9140可以是固态存储器,例如,只读存储器(ROM)、随机存取存储器(RAM)、SIM卡等。还可以是这样的存储器,其即使在断电时也保存信息,可被选择性地擦除且设有更多数据,该存储器的示例有时被称为EPROM等。存储器9140还可以是某种其它类型的装置。存储器9140包括缓冲存储器9141(有时被称为缓冲器)。存储器9140可以包括应用/功能存储部9142,该应用/功能存储部9142用于存储应用程序和功能程序或用于通过中央处理器9100执行电子设备9600的操作的流程。
存储器9140还可以包括数据存储部9143,该数据存储部9143用于存储数据,例如联系人、数字数据、图片、声音和/或任何其他由电子设备使用的数据。存储器9140的驱动程序存储部9144可以包括电子设备的用于通信功能和/或用于执行电子设备的其他功能(如消息传送应用、通讯录应用等)的各种驱动程序。
通信模块9110即为经由天线9111发送和接收信号的发送机/接收机9110。通信模块(发送机/接收机)9110耦合到中央处理器9100,以提供输入信号和接收输出信号,这可以和常规移动通信终端的情况相同。
基于不同的通信技术,在同一电子设备中,可以设置有多个通信模块9110,如蜂窝网络模块、蓝牙模块和/或无线局域网模块等。通信模块(发送机/接收机)9110还经由音频处理器9130耦合到扬声器9131和麦克风9132,以经由扬声器9131提供音频输出,并接收来自麦克风9132的音频输入,从而实现通常的电信功能。音频处理器9130可以包括任何合适的缓冲器、解码器、放大器等。另外,音频处理器9130还耦合到中央处理器9100,从而使得可以通过麦克风9132能够在本机上录音,且使得可以通过扬声器9131来播放本机上存储的声音。
上述描述可知,本申请的实施例提供的电子设备,能够有效实现风险事件的分级,进而提高后续金融交易决策的准确性。
本申请的实施例还提供能够实现上述实施例中的风险事件分级方法中全部步骤的一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述实施例中的风险事件分级方法的全部步骤,例如,所述处理器执行所述计算机程序时实现下述步骤:
步骤101:采集目标新闻文本。
步骤102:应用预设的风险事件类型抽取模型、风险事件属性抽取模型和所述目标新闻文本,确定对应的风险事件的事件属性。
步骤103:应用预设的风险事件主体抽取模型、实体链接模型和所述目标新闻文本,确定所述风险事件的主体信息。
步骤104:基于所述事件属性、主体信息和预设的风险事件分级模型,确定所述风险事件的风险等级。
从上述描述可知,本申请实施例提供的计算机可读存储介质,能够有效实现风险事件的分级,进而提高后续金融交易决策的准确性。
本申请中上述方法的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。相关之处参见方法实施例的部分说明即可。
本领域内的技术人员应明白,本申请的实施例可提供为方法、***、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
本申请中应用了具体实施例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (10)
1.一种风险事件分级方法,其特征在于,包括:
采集目标新闻文本;
应用预设的风险事件类型抽取模型、风险事件属性抽取模型和所述目标新闻文本,确定对应的风险事件的事件属性;
应用预设的风险事件主体抽取模型、实体链接模型和所述目标新闻文本,确定所述风险事件的主体信息;
基于所述事件属性、主体信息和预设的风险事件分级模型,确定所述风险事件的风险等级。
2.根据权利要求1所述的风险事件分级方法,其特征在于,所述应用预设的风险事件类型抽取模型、风险事件属性抽取模型和所述目标新闻文本,确定对应的风险事件的事件属性,包括:
应用所述预设的风险事件类型抽取模型和目标新闻文本,确定所述风险事件的事件类型;
应用所述预设的风险事件属性抽取模型和事件类型,确定所述风险事件的事件属性。
3.根据权利要求1所述的风险事件分级方法,其特征在于,所述应用预设的风险事件主体抽取模型、实体链接模型和所述目标新闻文本,确定所述风险事件的主体信息,包括:
应用所述预设的风险事件主体抽取模型和目标新闻文本,确定所述风险事件的事件主体;
应用所述预设的实体链接模型和事件主体,确定所述风险事件的主体信息。
4.根据权利要求1所述的风险事件分级方法,其特征在于,所述预设的风险事件类型抽取模型为预先训练Bert-Dense-softmax模型得到的。
5.根据权利要求1所述的风险事件分级方法,其特征在于,所述预设的风险事件主体抽取模型为预先训练Bert-BILSTM-CRF模型得到的。
6.根据权利要求1所述的风险事件分级方法,其特征在于,所述预设的风险事件属性抽取模型为预先训练Albert预训练模型得到的。
7.根据权利要求1所述的风险事件分级方法,其特征在于,所述预设的实体链接模型包括:无监督实体链接模型和已训练完成的有监督实体链接模型。
8.一种风险事件分级装置,其特征在于,包括:
采集模块,用于采集目标新闻文本;
确定事件属性模块,用于应用预设的风险事件类型抽取模型、风险事件属性抽取模型和所述目标新闻文本,确定对应的风险事件的事件属性;
确定主体信息模型,用于应用预设的风险事件主体抽取模型、实体链接模型和所述目标新闻文本,确定所述风险事件的主体信息;
确定风险等级模块,用于基于所述事件属性、主体信息和预设的风险事件分级模型,确定所述风险事件的风险等级。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至7任一项所述的风险事件分级方法。
10.一种计算机可读存储介质,其上存储有计算机指令,其特征在于,所述指令被执行时实现权利要求1至7任一项所述的风险事件分级方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011487708.6A CN112579773A (zh) | 2020-12-16 | 2020-12-16 | 风险事件分级方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011487708.6A CN112579773A (zh) | 2020-12-16 | 2020-12-16 | 风险事件分级方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112579773A true CN112579773A (zh) | 2021-03-30 |
Family
ID=75135489
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011487708.6A Pending CN112579773A (zh) | 2020-12-16 | 2020-12-16 | 风险事件分级方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112579773A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114676346A (zh) * | 2022-03-17 | 2022-06-28 | 平安科技(深圳)有限公司 | 新闻事件处理方法、装置、计算机设备和存储介质 |
CN114820162A (zh) * | 2022-04-08 | 2022-07-29 | 中国银行股份有限公司 | 一种风险评估方法、***、电子设备及存储介质 |
CN117196293A (zh) * | 2023-08-16 | 2023-12-08 | 平安科技(深圳)有限公司 | 基于人工智能的舆情风险确定方法、装置、服务器及介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108846547A (zh) * | 2018-05-06 | 2018-11-20 | 成都信息工程大学 | 一种动态调整的企业信用风险评估方法 |
WO2019095572A1 (zh) * | 2017-11-17 | 2019-05-23 | 平安科技(深圳)有限公司 | 企业投资风险评估方法、装置及存储介质 |
CN111177319A (zh) * | 2019-12-24 | 2020-05-19 | 中国建设银行股份有限公司 | 风险事件的确定方法、装置、电子设备和存储介质 |
CN111241300A (zh) * | 2020-01-09 | 2020-06-05 | 中信银行股份有限公司 | 舆情预警以及风险传播分析方法、***、设备及存储介质 |
CN111858903A (zh) * | 2020-06-11 | 2020-10-30 | 创新工场(北京)企业管理股份有限公司 | 一种用于负面新闻预警的方法和装置 |
-
2020
- 2020-12-16 CN CN202011487708.6A patent/CN112579773A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019095572A1 (zh) * | 2017-11-17 | 2019-05-23 | 平安科技(深圳)有限公司 | 企业投资风险评估方法、装置及存储介质 |
CN108846547A (zh) * | 2018-05-06 | 2018-11-20 | 成都信息工程大学 | 一种动态调整的企业信用风险评估方法 |
CN111177319A (zh) * | 2019-12-24 | 2020-05-19 | 中国建设银行股份有限公司 | 风险事件的确定方法、装置、电子设备和存储介质 |
CN111241300A (zh) * | 2020-01-09 | 2020-06-05 | 中信银行股份有限公司 | 舆情预警以及风险传播分析方法、***、设备及存储介质 |
CN111858903A (zh) * | 2020-06-11 | 2020-10-30 | 创新工场(北京)企业管理股份有限公司 | 一种用于负面新闻预警的方法和装置 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114676346A (zh) * | 2022-03-17 | 2022-06-28 | 平安科技(深圳)有限公司 | 新闻事件处理方法、装置、计算机设备和存储介质 |
CN114820162A (zh) * | 2022-04-08 | 2022-07-29 | 中国银行股份有限公司 | 一种风险评估方法、***、电子设备及存储介质 |
CN117196293A (zh) * | 2023-08-16 | 2023-12-08 | 平安科技(深圳)有限公司 | 基于人工智能的舆情风险确定方法、装置、服务器及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112579773A (zh) | 风险事件分级方法及装置 | |
CN111275546B (zh) | 金融客户欺诈风险识别方法及装置 | |
CN111932267A (zh) | 企业金融服务风险预测方法及装置 | |
CN111784502A (zh) | 异常交易账户群体识别方法及装置 | |
CN112766825A (zh) | 企业金融服务风险预测方法及装置 | |
CN110798567A (zh) | 短信分类显示方法及装置、存储介质、电子设备 | |
WO2024099457A1 (zh) | 一种信息推荐方法、装置、存储介质及电子设备 | |
CN111897890B (zh) | 金融业务处理方法及装置 | |
CN111429282B (zh) | 基于反洗钱模型迁移的交易反洗钱方法及装置 | |
CN112784112A (zh) | 报文校验方法及装置 | |
CN112995414A (zh) | 基于语音通话的行为质检方法、装置、设备及存储介质 | |
CN113159923A (zh) | 风险筛查方法及装置 | |
CN113077251A (zh) | 一种预付费交易场景下的异常行为监测方法及装置 | |
CN111666408A (zh) | 重要条款筛选与展示的方法及装置 | |
CN111738761A (zh) | 营销信息处理方法及装置 | |
CN116304043A (zh) | 一种低资源条件下的文本分类方法及装置 | |
CN113393320B (zh) | 企业金融服务风险预测方法及装置 | |
CN116664227A (zh) | 金融产品智能推荐方法及装置 | |
CN114781368A (zh) | 业务需求安全处理方法及装置 | |
CN114662452A (zh) | 去隐私化的文本标签分析方法及装置 | |
CN114186831A (zh) | 一种应用迁移学习进行个人信用风险预测方法及*** | |
CN114066603A (zh) | 贷后风险预警方法、装置、电子设备和计算机可读介质 | |
CN112950382A (zh) | 交易业务撮合匹配方法、装置、电子设备及介质 | |
CN112820298A (zh) | 声纹识别方法及装置 | |
CN117951547B (zh) | 基于人工智能的招投标数据处理方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |