CN110689225A - 基于外呼的企业金融风险画像创建方法及相关设备 - Google Patents
基于外呼的企业金融风险画像创建方法及相关设备 Download PDFInfo
- Publication number
- CN110689225A CN110689225A CN201910792033.7A CN201910792033A CN110689225A CN 110689225 A CN110689225 A CN 110689225A CN 201910792033 A CN201910792033 A CN 201910792033A CN 110689225 A CN110689225 A CN 110689225A
- Authority
- CN
- China
- Prior art keywords
- outbound
- risk
- voice
- preset
- keywords
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 75
- 230000011218 segmentation Effects 0.000 claims abstract description 51
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 43
- 230000004044 response Effects 0.000 claims description 18
- 238000007635 classification algorithm Methods 0.000 claims description 8
- 238000011835 investigation Methods 0.000 claims description 8
- 238000012216 screening Methods 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 6
- 238000004088 simulation Methods 0.000 abstract 1
- 230000008569 process Effects 0.000 description 20
- 238000005516 engineering process Methods 0.000 description 18
- 230000006870 function Effects 0.000 description 11
- 239000011295 pitch Substances 0.000 description 10
- 238000012545 processing Methods 0.000 description 7
- 238000007621 cluster analysis Methods 0.000 description 6
- 238000012502 risk assessment Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000003993 interaction Effects 0.000 description 5
- 239000003086 colorant Substances 0.000 description 4
- 238000003058 natural language processing Methods 0.000 description 4
- 230000007115 recruitment Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000009193 crawling Effects 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 241001672694 Citrus reticulata Species 0.000 description 2
- 235000019013 Viburnum opulus Nutrition 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000010224 classification analysis Methods 0.000 description 2
- 230000019771 cognition Effects 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000000750 progressive effect Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/06—Asset management; Financial planning or analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- General Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Mathematical Physics (AREA)
- Marketing (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Human Computer Interaction (AREA)
- General Business, Economics & Management (AREA)
- Artificial Intelligence (AREA)
- Operations Research (AREA)
- Computational Linguistics (AREA)
- Game Theory and Decision Science (AREA)
- Databases & Information Systems (AREA)
- Quality & Reliability (AREA)
- Technology Law (AREA)
- Acoustics & Sound (AREA)
- Tourism & Hospitality (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Multimedia (AREA)
- Educational Administration (AREA)
- Probability & Statistics with Applications (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明提供一种基于外呼的企业金融风险画像创建方法,包括:构建外呼问题库;根据所述外呼问题库和问答逻辑时间线模拟用户外呼目标企业,得到外呼语音;对所述外呼语音进行语音识别,得到语音文本;根据预设中文分词算法对所述语音文本进行中文分词,得到多个关键词;根据预设关键词与风险类别之间的对应关系,确定所述多个关键词对应的风险类别;根据所述风险类别创建所述目标企业的企业画像。本发明还提供一种基于外呼的企业金融风险画像创建装置、终端及存储介质。本发明通过模拟用户外呼目标企业,根据外呼语音确定目标企业存在的风险类别,对风险类别进行了量化处理,企业的金融风险更加直观。
Description
技术领域
本发明涉及信息安全技术领域,具体涉及一种基于外呼的企业金融风险画像创建方法、装置、终端及存储介质。
背景技术
近年来,类金融产品层出不穷,例如,P2P互联网金融平台,众筹金融平台,电商小贷互联网金融平台,供应链金融互联网金融平台,已经成了金融产业的重要组成部分。但是,由于互联网金融产品的超常规发展,形成了大量的互联网金融产品的风险项目、风险投资和风险资产。
现有技术中,虽然也有基于大数据分析技术构建企业的金融风险画像,通过金融风险画像来刻画企业360度全貌视图,以展示企业的经营状况。然而这些金融风险画像的构建方案,大都是通过网络爬虫技术来爬取网络上公开的财务数据,基于公开的财务数据来判定企业违规开展类金融业务的风险,公开的财务数据带有一定的隐蔽性,且仅能片面的展示企业的经营状况,因而构建出来的金融风险画像准确度较低。
因此,有必要提供一种基于外呼的类金融风险判断准确度较高的企业金融风险画像创建方案,对开展类金融业务的企业进行风险画像展示,辅助判定企业的金融风险程度。
发明内容
鉴于以上内容,有必要提出一种基于外呼的企业金融风险画像创建方法、装置、终端及存储介质,通过模拟用户外呼目标企业,根据外呼语音确定目标企业存在的风险类别,对风险类别进行了量化处理。
本发明的第一方面提供一种基于外呼的企业金融风险画像创建方法,所述方法包括:
构建外呼问题库;
根据所述外呼问题库和问答逻辑时间线模拟用户外呼目标企业,得到外呼语音;
对所述外呼语音进行语音识别,得到语音文本;
根据预设中文分词算法对所述语音文本进行中文分词,得到多个关键词;
根据预设关键词与风险类别之间的对应关系,确定所述多个关键词对应的风险类别;
根据所述风险类别创建所述目标企业的企业画像。
优选的,所述构建外呼问题库包括:
接收多个问题清单;
根据预设分类算法对所述多个问题清单中的问题进行聚类;
计算每一类别中的问题数量;
筛选出问题数量大于预设数量阈值的类别;
根据所筛选出的类别中的问题构建外呼问题库。
优选的,在所述构建外呼问题库之后,所述方法还包括:
当侦测到有新的地方法规文本文件之后,根据预设文本比对算法对新的地方法规文本文件与历史地方法规文本文件进行比对;
将比对结果发送至预设专家名单中的专家;
获取所述专家上传的新的问题清单;
基于所述新的问题清单重新构建所述外呼问题库。
优选的,所述根据所述外呼问题库和问答逻辑时间线模拟用户外呼目标企业,得到外呼语音包括:
根据所述预设中文分词算法对所述语音文本进行中文分词,得到多个初步关键词;
计算所述初步关键词与预设词库中的备选关键词的匹配度;
筛选出匹配度大于或者等于预设匹配度阈值的目标初步关键词和目标备选关键词;
将所述目标初步关键词替换为所述目标备选关键词,得到最终的多个关键词。
优选的,所述计算所述初步关键词与预设词库中的备选关键词的匹配度包括:
计算所述初步关键词的第一哈希值;
计算所述备选关键词的第二哈希值;
计算所述第一哈希值和所述第二哈希值之间的余弦距离;
将所述余弦距离确定为所述初步关键词与预设词库中的备选关键词的匹配度。
优选的,所述根据所述外呼问题库外呼目标企业,得到外呼语音包括:
从预设语音特征库中随机获取一种语音特征;
识别所述语音特征的音强、音高、音色和音频;
以所述音强、音高、音色和音频模拟用户外呼所述目标企业;
获取所述目标企业的第一外呼问题的第一外呼应答;
根据预设外呼应答与外呼问题的逻辑时间线,匹配出对应所述第一外呼应答的第二外呼语音;
根据所述第二外呼语音外呼所述目标企业,直至得到预设时长的外呼语音。
优选的,在所述确定所述多个关键词对应的风险类别之后,所述方法还包括:
当所述风险类别为第一等级的风险类别时,向监管部门发送风险排查邮件;及/或
当所述风险类别为第二等级的风险类别时,向所述目标企业发送风险告警邮件。
本发明的第二方面提供一种基于外呼的企业金融风险画像创建装置,所述装置包括:
构建模块,用于构建外呼问题库;
外呼模块,用于根据所述外呼问题库和问答逻辑时间线模拟用户外呼目标企业,得到外呼语音;
识别模块,用于对所述外呼语音进行语音识别,得到语音文本;
分词模块,用于根据预设中文分词算法对所述语音文本进行中文分词,得到多个关键词;
确定模块,用于根据预设关键词与风险类别之间的对应关系,确定所述多个关键词对应的风险类别;
创建模块,用于根据所述风险类别创建所述目标企业的企业画像。
本发明的第三方面提供一种终端,所述终端包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现所述基于外呼的企业金融风险画像创建方法。
本发明的第四方面提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现所述基于外呼的企业金融风险画像创建方法。
本发明所述的基于外呼的企业金融风险画像创建方法、装置、终端及存储介质,首先构建外呼问题库,基于外呼问题库和问答逻辑时间线模拟用户外呼目标企业,得到外呼语音,然后对所述外呼语音进行语音识别转文字,得到语音文本,再根据预设中文分词算法对所述语音文本进行中文分词,得到多个关键词,最后根据预设关键词与风险类别之间的对应关系,确定所述多个关键词对应的风险类别,根据所述风险类别创建所述目标企业的企业画像。相对于现有技术中通过网络爬取数据的方式创建金融风险画像,本发明通过智能外呼平台构建外呼问题库并模拟用户外呼目标企业,基于目标企业的外呼语音创建目标企业的金融风险画像的方式,准确度更高,模拟用户外呼的方式具有隐蔽性,获得的外呼语音数据更为真实,可靠度高,能够自然真实的刻画出企业的金融风险情况;此外,本发明能够对企业的金融风险类别进行量化处理,刻画出的金融风险画像,更加直观有效。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1是本发明实施例一提供的基于外呼的企业金融风险画像创建方法的流程图。
图2是本发明实施例提供的外呼过程中问答逻辑时间线的示意图。
图3是本发明实施例二提供的基于外呼的企业金融风险画像创建装置的结构图。
图4是本发明实施例三提供的终端的结构示意图。
如下具体实施方式将结合上述附图进一步说明本发明。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施例对本发明进行详细描述。需要说明的是,在不冲突的情况下,本发明的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。
实施例一
图1是本发明实施例一提供的一种基于外呼的企业金融风险画像创建方法的流程图。
如图1所示,所述基于外呼的企业金融风险画像创建方法具体包括以下步骤,根据不同的需求,该流程图中步骤的顺序可以改变,某些可以省略。
S11,构建外呼问题库。
本实施例中,智能外呼平台可以获取多个问题清单,每个问题清单中可以包括一个或多个问题。所述问题为文本的形式,可以是由金融行业的专家根据监管政策及地方法规提出来的,由于各个专家的认知和经验不同,对风险的认定也有所差异,因而面对同一监管政策及地方法规,提炼出来的问题也是各有侧重。例如,问题一:你们的项目都是有担保的吗,有没有风险准备金,侧重于担保;问题二:除了你介绍的产品,还有没有私募等其他类的产品,侧重于私募。
智能外呼平台接收到各个专家上传的问题清单之后,可以根据所有的问题清单构建外呼问题库,便于后续根据所构建的外呼问题库中的问题外呼目标企业。
优选地,所述构建外呼问题库包括:
接收多个问题清单;
根据预设分类算法对所述多个问题清单中的问题进行聚类;
计算每一类别中的问题数量;
筛选出问题数量大于预设数量阈值的类别;
根据所筛选出的类别中的问题构建外呼问题库。
本实施例中,所述预设分类算法可以包括:K-means聚类分析算法、基于特征投票的文本分类方法等。根据预设分类算法能够对以本文形式存在的问题进行聚类分析,从而将多个问题清单中的问题进行归类,使得具有相同或者相近意思的问题归为同一类,具有不同意思的问题归为不同的类。所述K-means聚类分析算法、基于特征投票的文本分类方法均为现有技术,本文在此不再详细阐述。
对多个问题清单中的问题进行分类之后,每一类别中均包括至少一个问题,有些类别中的问题数量较大,有些类别中的问题数量较小。问题数量越大代表风险程度越高,急需进行风险确认与排查;问题数量越小代表风险程度越低,因而,可以将问题数量大于预设数量阈值的类别中的问题筛选出来,基于筛选出来的问题构建一个外呼问题库。
进一步的,所述方法还包括:
当侦测到有新的地方法规文本文件之后,根据预设文本比对算法对新的地方法规文本文件与历史地方法规文本文件进行比对;
将比对结果发送至预设专家名单中的专家;
获取所述专家上传的新的问题清单;
基于所述新的问题清单重新构建所述外呼问题库。
不同的区域通常会制定带有区域特色的金融风险的法规文本文件,而随着社会的发展,现有的地方法规文本文件会出现滞后性,因而各地方政府会颁布新的地方法规文本文件,来针对变化的社会及时作出反应。
本实施例中,智能外呼平台侦测到有新的地方法规文本文件之后,即可采用预设文本比对算法将新的地方法规文本文件和历史地方法规文本文件进行比对,从而确定出新的地方法规文本文件中与历史地方法规文本文件不一致的内容。所述预设文本比对算法可以包括:Needleman-Wunsch算法和Smith-Waterman算法等,为现有技术。
智能外呼平台在确定出比对结果之后,将比对结果可以发送给预先设置的专家名单中的专家,使得各个专家根据比对结果提炼出新的问题清单,以应对新的金融风险。在各个专家将新提炼出的问题清单上传至智能外呼平台后,智能外呼平台可以根据新的问题清单与历史问题清单,重新进行分类分析,并构建新的外呼问题库。
通过侦测新的地方法规并构建新的问题库,可以针对社会的变化,及时的作出调整,构建能够实时反映金融风险的外呼问题库,实用性强。
S12,根据所述外呼问题库和问答逻辑时间线模拟用户外呼目标企业,得到外呼语音。
本实施例中,智能外呼平台可以随机的从所述外呼问题库中获取一个或多个问题,并外呼目标企业,根据所述一个或多个问题以问答的方式与所述目标企业进行沟通,智能外呼平台进行提问,目标企业根据问题进行作答,在这种交互的过程中,智能外呼平台获取外呼过程中与目标企业的外呼语音。
智能外呼平台可以根据接收到的风险评估请求,确定所述目标企业。其中,所述风险评估请求中携带有目标企业的名称或者域名等信息。任何单位或个人如果需要了解某个或者某些企业的金融风险程度,则可以通过所述智能外呼平台发送风险评估请求。
优选地,所述根据所述外呼问题库和问答逻辑时间线模拟用户外呼目标企业,得到外呼语音包括:
从预设语音特征库中随机获取一种语音特征;
识别所述语音特征的音强、音高、音色和音频;
以所述音强、音高、音色和音频模拟用户外呼所述目标企业;
获取所述目标企业的第一外呼问题的第一外呼应答;
根据预设外呼应答与外呼问题的逻辑时间线,匹配出对应所述第一外呼应答的第二外呼语音;
根据所述第二外呼语音外呼所述目标企业,直至得到预设时长的外呼语音。
智能外呼平台中预先存储有多个语音特征,不同语音特征的音强、音高、音色或者音频不同。智能外呼平台在不同的交互过程中,会以不同的音强、音高、音色或者音频进行外呼,来模拟不同人的声音,即在本次外呼目标企业时,模拟一种用户的声音进行外呼,下次外呼目标企业时,模拟另一种用户的声音进行外呼,从而做到更贴近现实。
需要说明的是,本实施例中所述的智能外呼平台中,还预先存储有与每一个问题关联的应答,及与每一个应答相关联的问题,即采用层层递进和逻辑闭环的方式,将问题与应答串联起来,具体可参见图2所示。
具体而言,智能外呼平台模拟某一个用户外呼目标企业,目标企业根据智能外呼平台模拟的第一外呼问题进行第一回答,智能外呼平台确认第一回答后,根据预先设置的问答跳转逻辑时间线,确定第一回答之后的第二外呼问题,获取到目标企业针对第二外呼问题的第二回答时,再次根据预先设置的问答跳转逻辑时间线,确定第二回答之后的第三外呼问题,以此类推,使得在外呼目标企业的过程中,无论目标企业采用何种应答,均能够针对目标企业的应答,继续给出与所述应答相关联的问题,从而使得外呼过程能够顺利进行一段时长。由于智能外呼平台模拟用户外呼目标企业,外呼过程贴近真实环境,得到的外呼语音更能自然的反映出目标企业的金融风险情况;且采用了问答跳转逻辑时间线使得外呼过程能够持续进行,避免采用某一个或者少数几个无关联的问题进行外呼,能够有效的避免外呼语音数据造假的可能,进一步提高了外呼语音数据的可靠度,使得后续基于外呼语音构建出的金融风险画像,准确度更高。
S13,对所述外呼语音进行语音识别,得到语音文本。
本实施例中,智能外呼平台在结束外呼过程后,将外呼过程中的外呼语音存储下来,采用预设的语音识别转文字算法对所述外呼语音进行语音识别,得到语音文本。
优选的,所述智能外呼平台对所述目标企业的外呼语音进行语音识别转文字。通过对目标企业的外呼语音进行语音识别转文字,而无需对智能外呼平台发出的外呼语音进行语音识别转文字,能够减少外呼语音的识别量,节省外呼语音的识别时间,提高语音识别转文字的效率。
S14,根据预设中文分词算法对所述语音文本进行中文分词,得到多个关键词。
本实施例中,在将目标企业的外呼语音转成语音文本之后,可以采用预设中文分词算法,例如自然语言处理(Natural Language Processing,NLP)算法,对所述语音文本进行中文分词。
经过中文分词之后,会得到多个关键字词。例如,所述预设语音文本为“你们的项目都是有担保的吗”,根据预先中文分词算法进行分词为“你们的/项目/都是/有/保证/的/吗”,多个关键词为“你们的”、“项目”、“都是”、“有”、“保证”、“的”、“吗”。
优选的,所述根据预设中文分词算法对所述语音文本进行中文分词,得到多个关键词包括:
根据所述预设中文分词算法对所述语音文本进行中文分词,得到多个初步关键词;
计算所述初步关键词与预设词库中的备选关键词的匹配度;
筛选出匹配度大于或者等于预设匹配度阈值的目标初步关键词和目标备选关键词;
将所述目标初步关键词替换为所述目标备选关键词,得到最终的多个关键词。
本实施例中,智能外呼平台可以使用搜索引擎技术、网络爬虫技术、正则表达式技术、评分卡技术从百度、腾讯等互联网站上爬取金融行业里的专有词汇。通过将这些专有词汇进行汇总得到一个词库,专有词汇作为词库中的备选关键词。所述搜索引擎技术、网络爬虫技术、正则表达式技术、评分卡技术均为现有技术,在此不再阐述。
由于目标企业的工作人员的普通话不标准,或者周围环境的噪声等,或者并非是标准的行业用于,导致语音转文字识别时,会出现识别错误或者识别得到的语音文本中的关键词并不是行业专用的词汇,因而,在对语音文本进行中文分词切分之后,再计算切分的关键词与词库中的备选关键词的匹配度,从而使用专业的备选关键词替代切分出的关键词,使得切分之后的关键词更贴近专业,有利于后续确定风险类别,从而建立更精确和形象的企业画像。
优选地,所述计算所述初步关键词与预设词库中的备选关键词的匹配度包括:
计算所述初步关键词的第一哈希值;
计算所述备选关键词的第二哈希值;
计算所述第一哈希值和所述第二哈希值之间的余弦距离;
将所述余弦距离确定为所述初步关键词与预设词库中的备选关键词的匹配度。
智能外呼平台采用哈希算法计算初步关键词和备选关键词的哈希值,然后根据哈希值的余弦距离确定初步关键词和备选关键词的相似度。余弦距离越小,表明相似度越大;余弦距离越大,表明相似度越小。
S15,根据预设关键词与风险类别之间的对应关系,确定所述多个关键词对应的风险类别。
本实施例中,智能外呼平台中预先设置了多个风险类别,例如,融资、担保、借贷、刚性兑付等。每个风险类别还预先与词库中的多个关键词进行了关联。
在得到多个关键词之后,即可确定出每个关键词对应的风险类别。
S16,根据所述风险类别创建所述目标企业的企业画像。
本实施例中,根据外呼语音可以得到多个关键词,根据多个关键词可以确定出多个风险类别,从而根据确定出的风险类别,创建出目标企业的企业画像。
优选地,在所述确定所述多个关键词对应的风险类别之后,所述方法还包括:
当所述风险类别为第一等级的风险类别时,向监管部门发送风险排查邮件;及/或
当所述风险类别为第二等级的风险类别时,向所述目标企业发送风险告警邮件。
本实施例中,可以预先设置风险类别的风险等级,例如,第一等级,第二等级。当然在其他实施例中,还可以设置更多的风险等级。
不同等级的风险类别代表企业对社会和消费者造成的影响程度不同,其中,第一等级的风险类别代表企业对社会和消费者造成的影响程度非常高,第二等级的风险类别代表企业对社会和消费者造成的影响程度较高。
当所述风险类别为第一等级的风险类别时,即当所述风险类别的风险等级为第一等级时,表明目标企业存在较严重的违规行为,需要将监管部门发送风险告警,以通知监管部门对所述目标企业进行人工排查,确保目标企业不会对社会和消费者造成更严重的金融风险。当所述风险类别为第二等级的风险类别时,即当所述风险类别的风险等级为第二等级时,向所述目标企业发送风险告警邮件,以通知目标企业进行自我排查与确认风险因素来自于何方,避免目标企业形成了“滚雪球”效应,风险越来越大,导致企业倒闭。
综上所述,本发明所述的基于外呼的企业金融风险画像创建方法,首先构建外呼问题库,基于外呼问题库和问答逻辑时间线模拟用户外呼目标企业,得到外呼语音,然后对所述外呼语音进行语音识别转文字,得到语音文本,再根据预设中文分词算法对所述语音文本进行中文分词,得到多个关键词,最后根据预设关键词与风险类别之间的对应关系,确定所述多个关键词对应的风险类别,根据所述风险类别创建所述目标企业的企业画像。相对于现有技术中通过网络爬取数据的方式创建金融风险画像,本发明通过智能外呼平台构建外呼问题库并模拟用户外呼目标企业,基于目标企业的外呼语音创建目标企业的金融风险画像的方式,准确度更高,模拟用户外呼的方式具有隐蔽性,获得的外呼语音数据更为真实,可靠度高,能够自然真实的刻画出企业的金融风险情况;此外,本发明能够对企业的金融风险类别进行量化处理,刻画出的金融风险画像,更加直观有效。
实施例二
图3是本发明实施例二提供的基于外呼的企业金融风险画像创建装置的结构图。
在一些实施例中,所述基于外呼的企业金融风险画像创建装置20可以包括多个由程序代码段所组成的功能模块。所述基于外呼的企业金融风险画像创建装置20中的各个程序段的程序代码可以存储于终端的存储器中,并由所述至少一个处理器所执行,以执行(详见图1描述)基于外呼的企业金融风险画像创建的功能。
本实施例中,所述基于外呼的企业金融风险画像创建装置20,运行于终端,根据其所执行的功能,可以被划分为多个功能模块。所述功能模块可以包括:构建模块201、外呼模块202、识别模块203、分词模块204、确定模块205、创建模块206、第一发送模块207及第二发送模块208。本发明所称的模块是指一种能够被至少一个处理器所执行并且能够完成固定功能的一系列计算机程序段,其存储在存储器中。在本实施例中,关于各模块的功能将在后续的实施例中详述。
构建模块201,用于构建外呼问题库。
本实施例中,智能外呼平台可以获取多个问题清单,每个问题清单中可以包括一个或多个问题。所述问题为文本的形式,可以是由金融行业的专家根据监管政策及地方法规提出来的,由于各个专家的认知和经验不同,对风险的认定也有所差异,因而面对同一监管政策及地方法规,提炼出来的问题也是各有侧重。例如,问题一:你们的项目都是有担保的吗,有没有风险准备金,侧重于担保;问题二:除了你介绍的产品,还有没有私募等其他类的产品,侧重于私募。
智能外呼平台接收到各个专家上传的问题清单之后,可以根据所有的问题清单构建外呼问题库,便于后续根据所构建的外呼问题库中的问题外呼目标企业。
优选地,所述构建模块201构建外呼问题库包括:
接收多个问题清单;根据预设分类算法对所述多个问题清单中的问题进行聚类;
计算每一类别中的问题数量;
筛选出问题数量大于预设数量阈值的类别;
根据所筛选出的类别中的问题构建外呼问题库。
本实施例中,所述预设分类算法可以包括:K-means聚类分析算法、基于特征投票的文本分类方法等。根据预设分类算法能够对以本文形式存在的问题进行聚类分析,从而将多个问题清单中的问题进行归类,使得具有相同或者相近意思的问题归为同一类,具有不同意思的问题归为不同的类。所述K-means聚类分析算法、基于特征投票的文本分类方法均为现有技术,本文在此不再详细阐述。
对多个问题清单中的问题进行分类之后,每一类别中均包括至少一个问题,有些类别中的问题数量较大,有些类别中的问题数量较小。问题数量越大代表风险程度越高,急需进行风险确认与排查;问题数量越小代表风险程度越低,因而,可以将问题数量大于预设数量阈值的类别中的问题筛选出来,基于筛选出来的问题构建一个外呼问题库。
进一步的,所述构建模块201还用于:
当侦测到有新的地方法规文本文件之后,根据预设文本比对算法对新的地方法规文本文件与历史地方法规文本文件进行比对;
将比对结果发送至预设专家名单中的专家;
获取所述专家上传的新的问题清单;
基于所述新的问题清单重新构建所述外呼问题库。
不同的区域通常会制定带有区域特色的金融风险的法规文本文件,而随着社会的发展,现有的地方法规文本文件会出现滞后性,因而各地方政府会颁布新的地方法规文本文件,来针对变化的社会及时作出反应。
本实施例中,智能外呼平台侦测到有新的地方法规文本文件之后,即可采用预设文本比对算法将新的地方法规文本文件和历史地方法规文本文件进行比对,从而确定出新的地方法规文本文件中与历史地方法规文本文件不一致的内容。所述预设文本比对算法可以包括:Needleman-Wunsch算法和Smith-Waterman算法等,为现有技术。
智能外呼平台在确定出比对结果之后,将比对结果可以发送给预先设置的专家名单中的专家,使得各个专家根据比对结果提炼出新的问题清单,以应对新的金融风险。在各个专家将新提炼出的问题清单上传至智能外呼平台后,智能外呼平台可以根据新的问题清单与历史问题清单,重新进行分类分析,并构建新的外呼问题库。
通过侦测新的地方法规并构建新的问题库,可以针对社会的变化,及时的作出调整,构建能够实时反映金融风险的外呼问题库,实用性强。
外呼模块202,用于根据所述外呼问题库和问答逻辑时间线模拟用户外呼目标企业,得到外呼语音。
本实施例中,智能外呼平台可以随机的从所述外呼问题库中获取一个或多个问题,并外呼目标企业,根据所述一个或多个问题以问答的方式与所述目标企业进行沟通,智能外呼平台进行提问,目标企业根据问题进行作答,在这种交互的过程中,智能外呼平台获取外呼过程中与目标企业的外呼语音。
智能外呼平台可以根据接收到的风险评估请求,确定所述目标企业。其中,所述风险评估请求中携带有目标企业的名称或者域名等信息。任何单位或个人如果需要了解某个或者某些企业的金融风险程度,则可以通过所述智能外呼平台发送风险评估请求。
优选地,所述外呼模块202根据所述外呼问题库和问答逻辑时间线模拟用户外呼目标企业,得到外呼语音包括:
从预设语音特征库中随机获取一种语音特征;
识别所述语音特征的音强、音高、音色和音频;
以所述音强、音高、音色和音频模拟用户外呼所述目标企业;
获取所述目标企业的第一外呼问题的第一外呼应答;
根据预设外呼应答与外呼问题的逻辑时间线,匹配出对应所述第一外呼应答的第二外呼语音;
根据所述第二外呼语音外呼所述目标企业,直至得到预设时长的外呼语音。
智能外呼平台中预先存储有多个语音特征,不同语音特征的音强、音高、音色或者音频不同。智能外呼平台在不同的交互过程中,会以不同的音强、音高、音色或者音频进行外呼,来模拟不同人的声音,即在本次外呼目标企业时,模拟一种用户的声音进行外呼,下次外呼目标企业时,模拟另一种用户的声音进行外呼,从而做到更贴近现实。
需要说明的是,本实施例中所述的智能外呼平台中,还预先存储有与每一个问题关联的应答,及与每一个应答相关联的问题,即采用层层递进和逻辑闭环的方式,将问题与应答串联起来,具体可参见图2所示。
具体而言,智能外呼平台模拟某一个用户外呼目标企业,目标企业根据智能外呼平台模拟的第一外呼问题进行第一回答,智能外呼平台确认第一回答后,根据预先设置的问答跳转逻辑时间线,确定第一回答之后的第二外呼问题,获取到目标企业针对第二外呼问题的第二回答时,再次根据预先设置的问答跳转逻辑时间线,确定第二回答之后的第三外呼问题,以此类推,使得在外呼目标企业的过程中,无论目标企业采用何种应答,均能够针对目标企业的应答,继续给出与所述应答相关联的问题,从而使得外呼过程能够顺利进行一段时长。由于智能外呼平台模拟用户外呼目标企业,外呼过程贴近真实环境,得到的外呼语音更能自然的反映出目标企业的金融风险情况;且采用了问答跳转逻辑时间线使得外呼过程能够持续进行,避免采用某一个或者少数几个无关联的问题进行外呼,能够有效的避免外呼语音数据造假的可能,进一步提高了外呼语音数据的可靠度,使得后续基于外呼语音构建出的金融风险画像,准确度更高。
识别模块203,用于对所述外呼语音进行语音识别,得到语音文本。
本实施例中,智能外呼平台在结束外呼过程后,将外呼过程中的外呼语音存储下来,采用预设的语音识别转文字算法对所述外呼语音进行语音识别,得到语音文本。
优选的,所述智能外呼平台对所述目标企业的外呼语音进行语音识别转文字。通过对目标企业的外呼语音进行语音识别转文字,而无需对智能外呼平台发出的外呼语音进行语音识别转文字,能够减少外呼语音的识别量,节省外呼语音的识别时间,提高语音识别转文字的效率。
分词模块204,用于根据预设中文分词算法对所述语音文本进行中文分词,得到多个关键词。
本实施例中,在将目标企业的外呼语音转成语音文本之后,可以采用预设中文分词算法,例如自然语言处理(Natural Language Processing,NLP)算法,对所述语音文本进行中文分词。
经过中文分词之后,会得到多个关键字词。例如,所述预设语音文本为“你们的项目都是有担保的吗”,根据预先中文分词算法进行分词为“你们的/项目/都是/有/保证/的/吗”,多个关键词为“你们的”、“项目”、“都是”、“有”、“保证”、“的”、“吗”。
优选的,所述分词模块204根据预设中文分词算法对所述语音文本进行中文分词,得到多个关键词包括:
根据所述预设中文分词算法对所述语音文本进行中文分词,得到多个初步关键词;
计算所述初步关键词与预设词库中的备选关键词的匹配度;
筛选出匹配度大于或者等于预设匹配度阈值的目标初步关键词和目标备选关键词;
将所述目标初步关键词替换为所述目标备选关键词,得到最终的多个关键词。
本实施例中,智能外呼平台可以使用搜索引擎技术、网络爬虫技术、正则表达式技术、评分卡技术从百度、腾讯等互联网站上爬取金融行业里的专有词汇。通过将这些专有词汇进行汇总得到一个词库,专有词汇作为词库中的备选关键词。所述搜索引擎技术、网络爬虫技术、正则表达式技术、评分卡技术均为现有技术,在此不再阐述。
由于目标企业的工作人员的普通话不标准,或者周围环境的噪声等,或者并非是标准的行业用于,导致语音转文字识别时,会出现识别错误或者识别得到的语音文本中的关键词并不是行业专用的词汇,因而,在对语音文本进行中文分词切分之后,再计算切分的关键词与词库中的备选关键词的匹配度,从而使用专业的备选关键词替代切分出的关键词,使得切分之后的关键词更贴近专业,有利于后续确定风险类别,从而建立更精确和形象的企业画像。
优选地,所述计算所述初步关键词与预设词库中的备选关键词的匹配度包括:
计算所述初步关键词的第一哈希值;
计算所述备选关键词的第二哈希值;
计算所述第一哈希值和所述第二哈希值之间的余弦距离;
将所述余弦距离确定为所述初步关键词与预设词库中的备选关键词的匹配度。
智能外呼平台采用哈希算法计算初步关键词和备选关键词的哈希值,然后根据哈希值的余弦距离确定初步关键词和备选关键词的相似度。余弦距离越小,表明相似度越大;余弦距离越大,表明相似度越小。
确定模块205,用于根据预设关键词与风险类别之间的对应关系,确定所述多个关键词对应的风险类别。
本实施例中,智能外呼平台中预先设置了多个风险类别,例如,融资、担保、借贷、刚性兑付等。每个风险类别还预先与词库中的多个关键词进行了关联。
在得到多个关键词之后,即可确定出每个关键词对应的风险类别。
创建模块206,用于根据所述风险类别创建所述目标企业的企业画像。
本实施例中,根据外呼语音可以得到多个关键词,根据多个关键词可以确定出多个风险类别,从而根据确定出的风险类别,创建出目标企业的企业画像。
优选地,在所述确定所述多个关键词对应的风险类别之后,所述装置还包括:
第一发送模块207,用于当所述风险类别为第一等级的风险类别时,向监管部门发送风险排查邮件;及/或
第二发送模块208,用于当所述风险类别为第二等级的风险类别时,向所述目标企业发送风险告警邮件。
本实施例中,可以预先设置风险类别的风险等级,例如,第一等级,第二等级。当然在其他实施例中,还可以设置更多的风险等级。
不同等级的风险类别代表企业对社会和消费者造成的影响程度不同,其中,第一等级的风险类别代表企业对社会和消费者造成的影响程度非常高,第二等级的风险类别代表企业对社会和消费者造成的影响程度较高。
当所述风险类别为第一等级的风险类别时,即当所述风险类别的风险等级为第一等级时,表明目标企业存在较严重的违规行为,需要将监管部门发送风险告警,以通知监管部门对所述目标企业进行人工排查,确保目标企业不会对社会和消费者造成更严重的金融风险。当所述风险类别为第二等级的风险类别时,即当所述风险类别的风险等级为第二等级时,向所述目标企业发送风险告警邮件,以通知目标企业进行自我排查与确认风险因素来自于何方,避免目标企业形成了“滚雪球”效应,风险越来越大,导致企业倒闭。
综上所述,本发明所述的基于外呼的企业金融风险画像创建装置,首先构建外呼问题库,基于外呼问题库和问答逻辑时间线模拟用户外呼目标企业,得到外呼语音,然后对所述外呼语音进行语音识别转文字,得到语音文本,再根据预设中文分词算法对所述语音文本进行中文分词,得到多个关键词,最后根据预设关键词与风险类别之间的对应关系,确定所述多个关键词对应的风险类别,根据所述风险类别创建所述目标企业的企业画像。相对于现有技术中通过网络爬取数据的方式创建金融风险画像,本发明通过智能外呼平台构建外呼问题库并模拟用户外呼目标企业,基于目标企业的外呼语音创建目标企业的金融风险画像的方式,准确度更高,模拟用户外呼的方式具有隐蔽性,获得的外呼语音数据更为真实,可靠度高,能够自然真实的刻画出企业的金融风险情况;此外,本发明能够对企业的金融风险类别进行量化处理,刻画出的金融风险画像,更加直观有效。
实施例三
参阅图4所示,为本发明实施例三提供的终端的结构示意图。在本发明较佳实施例中,所述终端3包括存储器31、至少一个处理器32、至少一条通信总线33及收发器34。
本领域技术人员应该了解,图4示出的终端的结构并不构成本发明实施例的限定,既可以是总线型结构,也可以是星形结构,所述终端3还可以包括比图示更多或更少的其他硬件或者软件,或者不同的部件布置。
在一些实施例中,所述终端3包括一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的终端,其硬件包括但不限于微处理器、专用集成电路、可编程门阵列、数字处理器及嵌入式设备等。所述终端3还可包括客户设备,所述客户设备包括但不限于任何一种可与客户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互的电子产品,例如,个人计算机、平板电脑、智能手机、数码相机等。
需要说明的是,所述终端3仅为举例,其他现有的或今后可能出现的电子产品如可适应于本发明,也应包含在本发明的保护范围以内,并以引用方式包含于此。
在一些实施例中,所述存储器31用于存储程序代码和各种数据,例如安装在所述终端3中的基于外呼的企业金融风险画像创建装置20,并在终端3的运行过程中实现高速、自动地完成程序或数据的存取。所述存储器31包括只读存储器(Read-Only Memory,ROM)、可编程只读存储器(Programmable Read-Only Memory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read-Only Memory,EPROM)、一次可编程只读存储器(One-timeProgrammable Read-Only Memory,OTPROM)、电子擦除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
在一些实施例中,所述至少一个处理器32可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述至少一个处理器32是所述终端3的控制核心(Control Unit),利用各种接口和线路连接整个终端3的各个部件,通过运行或执行存储在所述存储器31内的程序或者模块,以及调用存储在所述存储器31内的数据,以执行终端3的各种功能和处理数据,例如执行基于外呼的企业金融风险画像创建的功能。
在一些实施例中,所述至少一条通信总线33被设置为实现所述存储器31以及所述至少一个处理器32等之间的连接通信。
尽管未示出,所述终端3还可以包括给各个部件供电的电源(比如电池),优选的,电源可以通过电源管理装置与所述至少一个处理器32逻辑相连,从而通过电源管理装置实现管理充电、放电、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述终端3还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。
应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。
上述以软件功能模块的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,终端,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分。
在进一步的实施例中,结合图3,所述至少一个处理器32可执行所述终端3的操作装置以及安装的各类应用程序(如所述的基于外呼的企业金融风险画像创建装置20)、程序代码等,例如,上述的各个模块。
所述存储器31中存储有程序代码,且所述至少一个处理器32可调用所述存储器31中存储的程序代码以执行相关的功能。例如,图3中所述的各个模块是存储在所述存储器31中的程序代码,并由所述至少一个处理器32所执行,从而实现所述各个模块的功能以达到基于外呼的企业金融风险画像创建的目的。
在本发明的一个实施例中,所述存储器31存储多个指令,所述多个指令被所述至少一个处理器32所执行以实现基于外呼的企业金融风险画像创建的功能。
具体地,所述至少一个处理器32对上述指令的具体实现方法可参考图1对应实施例中相关步骤的描述,在此不赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。
Claims (10)
1.一种基于外呼的企业金融风险画像创建方法,其特征在于,所述方法包括:
构建外呼问题库;
根据所述外呼问题库和问答逻辑时间线模拟用户外呼目标企业,得到外呼语音;
对所述外呼语音进行语音识别,得到语音文本;
根据预设中文分词算法对所述语音文本进行中文分词,得到多个关键词;
根据预设关键词与风险类别之间的对应关系,确定所述多个关键词对应的风险类别;
根据所述风险类别创建所述目标企业的企业画像。
2.如权利要求1所述的方法,其特征在于,所述构建外呼问题库包括:
接收多个问题清单;
根据预设分类算法对所述多个问题清单中的问题进行聚类;
计算每一类别中的问题数量;
筛选出问题数量大于预设数量阈值的类别;
根据所筛选出的类别中的问题构建外呼问题库。
3.如权利要求2所述的方法,其特征在于,在所述构建外呼问题库之后,所述方法还包括:
当侦测到有新的地方法规文本文件之后,根据预设文本比对算法对新的地方法规文本文件与历史地方法规文本文件进行比对;
将比对结果发送至预设专家名单中的专家;
获取所述专家上传的新的问题清单;
基于所述新的问题清单重新构建所述外呼问题库。
4.如权利要求1所述的方法,其特征在于,所述根据预设中文分词算法对所述语音文本进行中文分词,得到多个关键词包括:
根据所述预设中文分词算法对所述语音文本进行中文分词,得到多个初步关键词;
计算所述初步关键词与预设词库中的备选关键词的匹配度;
筛选出匹配度大于或者等于预设匹配度阈值的目标初步关键词和目标备选关键词;
将所述目标初步关键词替换为所述目标备选关键词,得到最终的多个关键词。
5.如权利要求4所述的方法,其特征在于,所述计算所述初步关键词与预设词库中的备选关键词的匹配度包括:
计算所述初步关键词的第一哈希值;
计算所述备选关键词的第二哈希值;
计算所述第一哈希值和所述第二哈希值之间的余弦距离;
将所述余弦距离确定为所述初步关键词与预设词库中的备选关键词的匹配度。
6.如权利要求1所述的方法,其特征在于,所述根据所述外呼问题库和问答逻辑时间线模拟用户外呼目标企业,得到外呼语音包括:
从预设语音特征库中随机获取一种语音特征;
识别所述语音特征的音强、音高、音色和音频;
以所述音强、音高、音色和音频模拟用户外呼所述目标企业;
获取所述目标企业的第一外呼问题的第一外呼应答;
根据预设外呼应答与外呼问题的逻辑时间线,匹配出对应所述第一外呼应答的第二外呼语音;
根据所述第二外呼语音外呼所述目标企业,直至得到预设时长的外呼语音。
7.如权利要求1至6中任意一项所述的方法,其特征在于,在所述确定所述多个关键词对应的风险类别之后,所述方法还包括:
当所述风险类别为第一等级的风险类别时,向监管部门发送风险排查邮件;及/或
当所述风险类别为第二等级的风险类别时,向所述目标企业发送风险告警邮件。
8.一种基于外呼的企业金融风险画像创建装置,其特征在于,所述装置包括:
构建模块,用于构建外呼问题库;
外呼模块,用于根据所述外呼问题库和问答逻辑时间线模拟用户外呼目标企业,得到外呼语音;
识别模块,用于对所述外呼语音进行语音识别,得到语音文本;
分词模块,用于根据预设中文分词算法对所述语音文本进行中文分词,得到多个关键词;
确定模块,用于根据预设关键词与风险类别之间的对应关系,确定所述多个关键词对应的风险类别;
创建模块,用于根据所述风险类别创建所述目标企业的企业画像。
9.一种终端,其特征在于,所述终端包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1至7中任意一项所述基于外呼的企业金融风险画像创建方法。
10.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任意一项所述基于外呼的企业金融风险画像创建方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910792033.7A CN110689225A (zh) | 2019-08-26 | 2019-08-26 | 基于外呼的企业金融风险画像创建方法及相关设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910792033.7A CN110689225A (zh) | 2019-08-26 | 2019-08-26 | 基于外呼的企业金融风险画像创建方法及相关设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110689225A true CN110689225A (zh) | 2020-01-14 |
Family
ID=69108630
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910792033.7A Pending CN110689225A (zh) | 2019-08-26 | 2019-08-26 | 基于外呼的企业金融风险画像创建方法及相关设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110689225A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111784485A (zh) * | 2020-05-29 | 2020-10-16 | 浙江保融科技有限公司 | 一种以交互方式实现企业财资力数字化自画像动态刻画的方法 |
CN111898378A (zh) * | 2020-07-31 | 2020-11-06 | 中国联合网络通信集团有限公司 | 政企客户的行业分类方法和装置、电子设备、存储介质 |
CN113378055A (zh) * | 2021-06-24 | 2021-09-10 | 上海微问家信息技术有限公司 | 基于访客信息的企业推送方法、装置、设备及存储介质 |
CN116136839A (zh) * | 2023-04-17 | 2023-05-19 | 湖南正宇软件技术开发有限公司 | 法规文件花脸稿的生成方法、生成***及相关设备 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108536708A (zh) * | 2017-03-03 | 2018-09-14 | 腾讯科技(深圳)有限公司 | 一种自动问答处理方法及自动问答*** |
CN108763499A (zh) * | 2018-05-30 | 2018-11-06 | 平安科技(深圳)有限公司 | 基于智能语音的呼叫质检方法、装置、设备及存储介质 |
CN109462707A (zh) * | 2018-11-13 | 2019-03-12 | 平安科技(深圳)有限公司 | 基于自动外呼***的语音处理方法、装置和计算机设备 |
CN109543985A (zh) * | 2018-11-15 | 2019-03-29 | 李志东 | 企业风险评估方法、***及介质 |
CN109543516A (zh) * | 2018-10-16 | 2019-03-29 | 深圳壹账通智能科技有限公司 | 签约意向判断方法、装置、计算机设备和存储介质 |
CN109977300A (zh) * | 2019-02-22 | 2019-07-05 | 深圳壹账通智能科技有限公司 | 企业舆情获取方法、装置、终端及计算机存储介质 |
US20190259103A1 (en) * | 2018-02-21 | 2019-08-22 | Lane Garrison Coonrod | System to predict impact of existing risk relationship adjustments |
-
2019
- 2019-08-26 CN CN201910792033.7A patent/CN110689225A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108536708A (zh) * | 2017-03-03 | 2018-09-14 | 腾讯科技(深圳)有限公司 | 一种自动问答处理方法及自动问答*** |
US20190259103A1 (en) * | 2018-02-21 | 2019-08-22 | Lane Garrison Coonrod | System to predict impact of existing risk relationship adjustments |
CN108763499A (zh) * | 2018-05-30 | 2018-11-06 | 平安科技(深圳)有限公司 | 基于智能语音的呼叫质检方法、装置、设备及存储介质 |
CN109543516A (zh) * | 2018-10-16 | 2019-03-29 | 深圳壹账通智能科技有限公司 | 签约意向判断方法、装置、计算机设备和存储介质 |
CN109462707A (zh) * | 2018-11-13 | 2019-03-12 | 平安科技(深圳)有限公司 | 基于自动外呼***的语音处理方法、装置和计算机设备 |
CN109543985A (zh) * | 2018-11-15 | 2019-03-29 | 李志东 | 企业风险评估方法、***及介质 |
CN109977300A (zh) * | 2019-02-22 | 2019-07-05 | 深圳壹账通智能科技有限公司 | 企业舆情获取方法、装置、终端及计算机存储介质 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111784485A (zh) * | 2020-05-29 | 2020-10-16 | 浙江保融科技有限公司 | 一种以交互方式实现企业财资力数字化自画像动态刻画的方法 |
CN111898378A (zh) * | 2020-07-31 | 2020-11-06 | 中国联合网络通信集团有限公司 | 政企客户的行业分类方法和装置、电子设备、存储介质 |
CN111898378B (zh) * | 2020-07-31 | 2023-09-19 | 中国联合网络通信集团有限公司 | 政企客户的行业分类方法和装置、电子设备、存储介质 |
CN113378055A (zh) * | 2021-06-24 | 2021-09-10 | 上海微问家信息技术有限公司 | 基于访客信息的企业推送方法、装置、设备及存储介质 |
CN116136839A (zh) * | 2023-04-17 | 2023-05-19 | 湖南正宇软件技术开发有限公司 | 法规文件花脸稿的生成方法、生成***及相关设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Busuioc | Accountable artificial intelligence: Holding algorithms to account | |
CN110689225A (zh) | 基于外呼的企业金融风险画像创建方法及相关设备 | |
CN107025509B (zh) | 基于业务模型的决策***和方法 | |
CN110692050A (zh) | 语义图中元关系的自适应评估 | |
CN114007131B (zh) | 视频监控方法、装置及相关设备 | |
CN114648392A (zh) | 基于用户画像的产品推荐方法、装置、电子设备及介质 | |
US11769521B1 (en) | Providing a condition-specific data collection sequence | |
EP4198906A1 (en) | Image generation based on ethical viewpoints | |
CN114880449B (zh) | 智能问答的答复生成方法、装置、电子设备及存储介质 | |
WO2018230616A1 (ja) | 法的情報処理システム、方法及びプログラム | |
CN112950344A (zh) | 数据评估方法、装置、电子设备及存储介质 | |
CN117807482B (zh) | 海关报关单的分类方法、装置、设备及存储介质 | |
Huynh et al. | Addressing regulatory requirements on explanations for automated decisions with provenance—A case study | |
Zacharis et al. | AiCEF: an AI-assisted cyber exercise content generation framework using named entity recognition | |
CN112330432B (zh) | 风险等级识别模型训练方法、识别方法、终端及存储介质 | |
EP4138004A1 (en) | Method and apparatus for assisting machine learning model to go online | |
CN113821612A (zh) | 信息查找方法以及装置 | |
Lai et al. | BTextCAN: Consumer fraud detection via group perception | |
CN117312562A (zh) | 内容审核模型的训练方法、装置、设备及存储介质 | |
CN117034230A (zh) | 一种数据校验方法、装置、设备及其存储介质 | |
J. Domanski | The AI pandorica: linking ethically-challenged technical outputs to prospective policy approaches | |
US20220374401A1 (en) | Determining domain and matching algorithms for data systems | |
Denvir et al. | The Devil in the Detail: Mitigating the Constitutional & Rule of Law Risks Associated with the Use of Artificial Intelligence in the Legal Domain | |
Cao et al. | An English pronunciation error detection system based on improved random forest | |
US12014428B1 (en) | Apparatus and a method for the generation of provider data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |