CN114818649A - 基于智能语音交互技术的业务咨询处理方法及装置 - Google Patents
基于智能语音交互技术的业务咨询处理方法及装置 Download PDFInfo
- Publication number
- CN114818649A CN114818649A CN202210518383.6A CN202210518383A CN114818649A CN 114818649 A CN114818649 A CN 114818649A CN 202210518383 A CN202210518383 A CN 202210518383A CN 114818649 A CN114818649 A CN 114818649A
- Authority
- CN
- China
- Prior art keywords
- consultation
- service
- text
- service consultation
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000005516 engineering process Methods 0.000 title claims abstract description 45
- 230000003993 interaction Effects 0.000 title claims abstract description 42
- 238000003672 processing method Methods 0.000 title claims abstract description 27
- 230000004044 response Effects 0.000 claims abstract description 33
- 238000000034 method Methods 0.000 claims abstract description 28
- 238000012545 processing Methods 0.000 claims description 26
- 230000015654 memory Effects 0.000 claims description 22
- 238000004590 computer program Methods 0.000 claims description 20
- 230000003595 spectral effect Effects 0.000 claims description 12
- 238000005070 sampling Methods 0.000 claims description 10
- 239000003550 marker Substances 0.000 claims description 8
- 238000001228 spectrum Methods 0.000 claims description 8
- 238000000605 extraction Methods 0.000 claims description 7
- 238000003058 natural language processing Methods 0.000 claims description 7
- 238000013527 convolutional neural network Methods 0.000 claims description 6
- 238000007476 Maximum Likelihood Methods 0.000 claims description 5
- 238000004422 calculation algorithm Methods 0.000 claims description 5
- 238000003066 decision tree Methods 0.000 claims description 5
- 238000009432 framing Methods 0.000 claims description 5
- 230000006870 function Effects 0.000 description 9
- 230000015572 biosynthetic process Effects 0.000 description 8
- 238000003786 synthesis reaction Methods 0.000 description 8
- 238000011156 evaluation Methods 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 239000013598 vector Substances 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000009223 counseling Methods 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000007787 long-term memory Effects 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 210000001503 joint Anatomy 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000033764 rhythmic process Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/194—Calculation of difference between files
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0281—Customer communication at a business location, e.g. providing product or service information, consulting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
- G10L2015/025—Phonemes, fenemes or fenones being the recognition units
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Computing Systems (AREA)
- Finance (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Life Sciences & Earth Sciences (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明实施例公开了一种基于智能语音交互技术的业务咨询处理方法及装置,可用于金融领域或其他技术领域,该方法包括:获取客户的业务咨询语音;识别出所述业务咨询语音对应的业务咨询文本;将所述业务咨询文本与预设的业务咨询模板进行相似度匹配,确定与所述业务咨询文本相似度最高的业务咨询模板;若该与所述业务咨询文本相似度最高的业务咨询模板对应的相似度大于或等于预设的阈值,则将该与所述业务咨询文本相似度最高的业务咨询模板对应的业务咨询回答信息发送给所述客户。本发明实现了将简单重复的咨询业务由智能语音***自动来完成,一定程度上提高了服务质量和效率,降低了用户的等待时间,以及降低人工客服应答的工作强度。
Description
技术领域
本发明涉及人工智能技术领域,具体而言,涉及一种基于智能语音交互技术的业务咨询处理方法及装置。
背景技术
随着人工智能时代的到来,智能语音识别、图像识别、自然语言处理等相关技术的日趋成熟,将其应用于传统的金融服务行业有极大的潜力和价值。在信息技术不断发展的大前提下,银行等相关行业的客服人员需要接受更多的业务知识以匹配越发成熟的新技术;除此之外受人力、物力的影响增加客服人员并不是最优选择。在这种形势下,客服人员的工作类型单一且重复,呼入电话的接入率较低会导致用户的服务体验较差进而导致大量的投诉问题的出现。当前金融行业的客服***主要包括呼叫中心和人工座席(人工客服)。
呼叫中心也就是电话的呼入和呼出端,一般客户通过电话、手机等移动设备进行专线对接呼叫中心进行业务咨询及相关办理,电话客服***的智能呼叫平台经过中继以及交互式语音应答(IVR)平台进行任务转接,在客户需要人工应答时转人工客服进行操作。金融行业如银行一般采用人工客服对客户所进行的业务进行查询操作进行实时反馈,为客户提供业务咨询、辅助交易、疑难问题解答、外呼营销等服务,对于无法在线解决的客户咨询、建议、投诉,及时提交工作联系单转后台处理,并跟踪处理情况,及时回复客户。
传统的客服***由于业务单一导致日均来电重复率较高,人工客服接线的传统方式对于客服人员要求较高,在人工客服繁忙期间会导致客户等待时间较长,接听率较低,客户投诉逐渐增多,严重影响服务服务体验。
发明内容
本发明为了解决上述背景技术中的至少一个技术问题,提出了一种基于智能语音交互技术的业务咨询处理方法及装置。
为了实现上述目的,根据本发明的一个方面,提供了一种基于智能语音交互技术的业务咨询处理方法,该方法包括:
获取客户的业务咨询语音;
识别出所述业务咨询语音对应的业务咨询文本;
将所述业务咨询文本与预设的业务咨询模板进行相似度匹配,确定与所述业务咨询文本相似度最高的业务咨询模板;
若该与所述业务咨询文本相似度最高的业务咨询模板对应的相似度大于或等于预设的阈值,则将该与所述业务咨询文本相似度最高的业务咨询模板对应的业务咨询回答信息发送给所述客户。
可选的,所述识别出所述业务咨询语音对应的业务咨询文本,具体包括:
对所述业务咨询语音进行分帧处理,并将每一帧的波形转化为声音特征;
将所述声音特征输入到预设的声学模型中,得到所述声学模型输出的每个所述声音特征各自对应的音素信息;
根据因素信息与字词的对应关系,确定每个所述音素信息各自对应的字或词;
根据每个所述音素信息各自对应的字或词生成所述业务咨询文本。
可选的,所述将所述业务咨询文本与预设的业务咨询模板进行相似度匹配,确定与所述业务咨询文本相似度最高的业务咨询模板,具体包括:
确定所述业务咨询文本对应的业务类型;
将所述业务咨询文本分别与所述业务类型对应的所有的所述业务咨询模板进行相似度匹配,确定与所述业务咨询文本相似度最高的业务咨询模板。
可选的,所述确定所述业务咨询文本对应的业务类型,具体包括:
利用长短时记忆网络对所述业务咨询文本进行特征提取,得到文本特征;
根据所述文本特征利用卷积神经网络进行文本分类识别,得到所述业务咨询文本对应的业务类型。
可选的,所述业务咨询回答信息包括:业务咨询回答文本;
所述将该与所述业务咨询文本相似度最高的业务咨询模板对应的业务咨询回答信息发送给所述客户,具体包括:
将该与所述业务咨询文本相似度最高的业务咨询模板对应的业务咨询回答文本转化为回答语音,并将所述回答语音发送到呼叫中心***,以使所述呼叫中心***将所述回答语音播放给所述客户。
可选的,所述将该与所述业务咨询文本相似度最高的业务咨询模板对应的业务咨询回答文本转化为回答语音,具体包括:
利用自然语言处理方法对所述业务咨询回答文本进行文本语言特征提取;
将提取的文本语言特征使用决策树进行聚类,并根据聚类结果以及隐马尔可夫模型得到频谱系数和音频标志位;
根据得到频谱系数和音频标志位利用最大似然参数生成算法进行频谱系数采样;
将频谱系数采样结果输入到声码器中进行语音波形的生成,得到所述回答语音。
可选的,该基于智能语音交互技术的业务咨询处理方法,还包括:
若最高的相似度小于所述阈值,则向呼叫中心***发送无匹配回答指令,以使所述呼叫中心***根据所述无匹配回答指令将所述客户的呼叫接入人工客服终端。
为了实现上述目的,根据本发明的另一方面,提供了一种基于智能语音交互技术的业务咨询处理装置,该装置包括:
业务咨询语音获取单元,用于获取客户的业务咨询语音;
语音识别单元,用于识别出所述业务咨询语音对应的业务咨询文本;
相似度匹配单元,用于将所述业务咨询文本与预设的业务咨询模板进行相似度匹配,确定与所述业务咨询文本相似度最高的业务咨询模板;
业务咨询回答信息发送单元,用于若该与所述业务咨询文本相似度最高的业务咨询模板对应的相似度大于或等于预设的阈值,则将该与所述业务咨询文本相似度最高的业务咨询模板对应的业务咨询回答信息发送给所述客户。
为了实现上述目的,根据本发明的另一方面,还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述基于智能语音交互技术的业务咨询处理方法的步骤。
为了实现上述目的,根据本发明的另一方面,还提供了一种计算机可读存储介质,其上存储有计算机程序/指令,该计算机程序/指令被处理器执行时实现上述基于智能语音交互技术的业务咨询处理方法的步骤。
为了实现上述目的,根据本发明的另一方面,还提供了一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现上述基于智能语音交互技术的业务咨询处理方法的步骤。
本发明的有益效果为:
本发明实施例先识别出客户输入的业务咨询语音对应的业务咨询文本,然后将所述业务咨询文本与预设的业务咨询模板进行相似度匹配,确定与所述业务咨询文本相似度最高的业务咨询模板,最后若该与所述业务咨询文本相似度最高的业务咨询模板对应的相似度大于或等于预设的阈值,则将该与所述业务咨询文本相似度最高的业务咨询模板对应的业务咨询回答信息发送给所述客户,本发明通过智能语音识别技术进行智能业务分流,并通过建立业务咨询模板以及对应的业务咨询回答信息,实现了将简单重复的咨询业务由智能语音***自动来完成,一定程度上提高了服务质量和效率,降低了用户的等待时间,以及降低人工客服应答的工作强度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1是本发明实施例基于智能语音交互技术的业务咨询处理方法的流程图;
图2是本发明实施例识别出业务咨询语音对应的业务咨询文本的流程图;
图3是本发明实施例相似度匹配的流程图;
图4是本发明实施例确定业务咨询文本对应的业务类型的流程图;
图5是本发明实施例将业务咨询回答文本转化为回答语音的流程图;
图6是本发明实施例智能语音***逻辑架构图;
图7是本发明实施例基于智能语音交互技术的业务咨询处理方法的整体流程图;
图8是本发明实施例基于智能语音交互技术的业务咨询处理装置的结构框图;
图9是本发明实施例计算机设备示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
本领域内的技术人员应明白,本发明的实施例可提供为方法、***、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
需要说明的是,本申请技术方案中对数据的获取、存储、使用、处理等均符合国家法律法规的相关规定。
本发明的目的在于建立一种基于智能语音交互技术的业务咨询处理方法,本发明通过采用智能语音交互、深度学习、大数据分析等技术,在一些常用场景中加入智能语音***,实现功能智能分流,对于像卡片业务办理、余额查询、卡片挂失、修改手机号码等咨询量较高的业务咨询实现智能语音应答交互,统一对接各类客户的需求,并在一定程度上缓解客服的压力减少客户的等待率,提高业务处理效率以及服务满意度。
本发明以下实施例的基于智能语音交互技术的业务咨询处理方法的实施主体为图6中由智能语音识别模块、知识检索核心模块以及智能语音合成模块组成的智能语音***。
图1是本发明实施例基于智能语音交互技术的业务咨询处理方法的流程图,如图1所示,在本发明一个实施例中,本发明的基于智能语音交互技术的业务咨询处理方法包括步骤S101至步骤S104。
步骤S101,获取客户的业务咨询语音。
如图6所示,在本发明一个实施例中,客户具体在呼叫中心***(呼叫中心电话语音平台)输入业务咨询语音。在本发明一个实施例中,客户通过电话或网络语音的方式接入呼叫中心***(呼叫中心电话语音平台),并在与呼叫中心***自动客服机器人的对话中根据指示输入业务咨询语音。
步骤S102,识别出所述业务咨询语音对应的业务咨询文本。
如图6所示,本发明通过预设的智能语音识别模块将客户的业务咨询语音转化为文本信息。在本发明一个实施例中,客户通过移动通信设备进行业务咨询或者业务办理,直接进入呼叫中心***中的智能语音***,在智能语音自助***提示音的引导下“说”出自己的问题或需求。呼叫中心***中的IVR平台把用户语音发送给智能语音识别模块,通过智能语音识别将客户输入的业务咨询语音转写成文本。
步骤S103,将所述业务咨询文本与预设的业务咨询模板进行相似度匹配,确定与所述业务咨询文本相似度最高的业务咨询模板。
如图6所示,本发明通过预设的知识检索核心模块进行语义分析,在知识库中进行匹配,找到客户的业务咨询的相关问题回答。在本发明一个实施例中,在将客户输入的语音转写成文本后,本发明调用知识检索核心模块结合知识管理优化服务器上的信息和规则对转写的文本进行智能分析,得到分析结果后,将分析结果返回给IVR平台。完成智能客服“听”的功能和“思考”的功能。知识检索核心模块对用户语音转写的文本进行细致分析,了解用户需求。知识检索核心模块判断找到客户的业务咨询的相关问题回答,则可以利用智能客服语音合成服务器负责将问题回答发送给客户。若是复杂场景的业务,智能语音***无法处理,则可以转人工坐席处理。
步骤S104,若该与所述业务咨询文本相似度最高的业务咨询模板对应的相似度大于或等于预设的阈值,则将该与所述业务咨询文本相似度最高的业务咨询模板对应的业务咨询回答信息发送给所述客户。
如图6所示,本发明通过预设的智能语音合成模块将文本答案进行语音合成,转成问题的回答通过呼叫中心电话语音平台中的IVR播放给客户。在本发明一个实施例中,智能语音合成模块负责将知识库内容进行合成,IVR服务器调用智能语音合成模块,将知识库内容的文本合成成语音,然后IVR服务器把合成的语音播放给用户,通过语音交互的方式回答或解决用户的问题,完成智能客服“说”的功能。根据用户的需求,从知识库中获取用户需要的答案IVR返回给客户。
在本发明一个实施例中,本发明的基于智能语音交互技术的业务咨询处理方法还包括:
若最高的相似度小于所述阈值,则向呼叫中心***发送无匹配回答指令,以使所述呼叫中心***根据所述无匹配回答指令将所述客户的呼叫接入人工客服终端。
如图7所示,本发明实施例先识别出客户输入的业务咨询语音对应的业务咨询文本,然后将所述业务咨询文本与预设的业务咨询模板进行相似度匹配,确定与所述业务咨询文本相似度最高的业务咨询模板,最后若该与所述业务咨询文本相似度最高的业务咨询模板对应的相似度大于或等于预设的阈值,则将该与所述业务咨询文本相似度最高的业务咨询模板对应的业务咨询回答信息发送给所述客户,若该与所述业务咨询文本相似度最高的业务咨询模板对应的相似度小于预设的阈值则通知呼叫中心***将所述客户的呼叫接入人工客服来进行处理。
由此可见,本发明通过采用智能语音交互、深度学习、大数据分析等技术,在一些常用场景中加入智能语音***,实现功能智能分流,对于一些常见的业务咨询实现智能语音应答交互,有助于提高业务处理效率以及服务满意度。
在本发明一个实施例中,本发明还新增智能语音***的评价指标。在给客户进行问题解答完成之后,对客户进行服务评价以及对客户的应答意图进行分析综合评判客户的满意度。通过人工标注和用户反馈两个评价体系来对智能语音***进行优化并对客户进行标签分类。
如图2所示,在本发明一个实施例中,上述步骤S102的识别出所述业务咨询语音对应的业务咨询文本,具体包括步骤S201至步骤S204。
步骤S201,对所述业务咨询语音进行分帧处理,并将每一帧的波形转化为声音特征。
在本发明一个实施例中,在进行步骤S201之前,本发明还把客户输入的业务咨询语音的首尾端的静音切除,降低对后续步骤造成的干扰。
在本发明一个实施例中,本步骤具体使用移动窗函数对客户输入的业务咨询语音进行分帧处理,利用Mel倒谱系数(MFCC)把每一帧波形变成一个包含声音信息的多维向量得到声音特征。
步骤S202,将所述声音特征输入到预设的声学模型中,得到所述声学模型输出的每个所述声音特征各自对应的音素信息。
在本发明一个实施例中,声学模型的输入是特征向量,输出为音素信息,声学模型为通过对语音数据进行训练所得到的。
步骤S203,根据因素信息与字词的对应关系,确定每个所述音素信息各自对应的字或词。
在本发明中,本发明根据字或者词与音素的对应,中文就是拼音和汉字的对应,英文就是音标与单词的对应,得到因素对应的字母或中文。
步骤S204,根据每个所述音素信息各自对应的字或词生成所述业务咨询文本。
在本发明中,本发明通过对大量文本信息进行训练,得到单个字或者词相互关联的概率,进而通过字词相互关联的概率以及个所述音素信息各自对应的字或词对提取特征后的音频数据进行文字输出,将客户输入的语音转换成文字。
如图3所示,在本发明一个实施例中,上述步骤S103的将所述业务咨询文本与预设的业务咨询模板进行相似度匹配,确定与所述业务咨询文本相似度最高的业务咨询模板,具体包括步骤S301和步骤S302。
步骤S301,确定所述业务咨询文本对应的业务类型。
步骤S302,将所述业务咨询文本分别与所述业务类型对应的所有的所述业务咨询模板进行相似度匹配,确定与所述业务咨询文本相似度最高的业务咨询模板。
在本发明一个实施例中,在进行相似度匹配时,本发明可以利用BiMPM(双多边视角匹配模型)进行相似度匹配。首先对待匹配的两个文本对象进行特征提取得到加权特征向量,通过相似度度量函数cosine计算两个加权向量的相似度,输出两个对象的匹配度。在本发明一个实施例中,针对计算出的所有相似度,本发明可以利用softmax函数进行归一化操作,确定相似度最高的回答,返回客户的业务咨询对应的最准确的答案。
如图4所示,在本发明一个实施例中,上述步骤S301的确定所述业务咨询文本对应的业务类型,具体包括步骤S401和步骤S402。
步骤S401,利用长短时记忆网络对所述业务咨询文本进行特征提取,得到文本特征。
在本发明一个实施例中,本发明首先利用LSTM(长短时记忆网络)对文本信息进行特征提取,每个时间步的输出不仅包含当前文本的特征向量信同时也包含之前所有文本的特征信息。
步骤S402,根据所述文本特征利用卷积神经网络进行文本分类识别,得到所述业务咨询文本对应的业务类型。
在本发明一个实施例中,本发明利用CNN(卷积神经网络)对文本特征进行文本分类识别,初步判断该业务属于哪种业务类型,在知识库中进行匹配查找与其相关的问题回复。
在本发明一个实施例中,所述业务咨询回答信息包括:业务咨询回答文本。
在本发明一个实施例中,上述步骤S104的将该与所述业务咨询文本相似度最高的业务咨询模板对应的业务咨询回答信息发送给所述客户,具体包括:
将该与所述业务咨询文本相似度最高的业务咨询模板对应的业务咨询回答文本转化为回答语音,并将所述回答语音发送到呼叫中心***,以使所述呼叫中心***将所述回答语音播放给所述客户。
如图5所示,在本发明一个实施例中,上述步骤的将该与所述业务咨询文本相似度最高的业务咨询模板对应的业务咨询回答文本转化为回答语音,具体包括步骤S501至步骤S504。
步骤S501,利用自然语言处理方法对所述业务咨询回答文本进行文本语言特征提取。
在本发明一个实施例中,文字转化为语音由语音合成引擎完成,其过程可以分为前端、后端两个步骤。前端负责文本的语法分析,利用NLP(自然语言处理)进行文本语言特征提取,通过词典和语法的规范,得到语法层次的格式化信息,发送至后端。
步骤S502,将提取的文本语言特征使用决策树进行聚类,并根据聚类结果以及隐马尔可夫模型得到频谱系数和音频标志位。
步骤S503,根据得到频谱系数和音频标志位利用最大似然参数生成算法进行频谱系数采样。
在本发明一个实施例中,后端以前端分析的结果为基础,将提取的文本语言特征统计使用决策树进行聚类,并按照聚类结果进行统计参数模型HMM(隐马尔可夫模型)的训练。利用HMM得到频谱系数和音频标志位。再利用MLPG(最大似然参数生成算法)进行频谱系数采样。
步骤S504,将频谱系数采样结果输入到声码器中进行语音波形的生成,得到所述回答语音。
在本发明一个实施例中,本发明将频谱系数采样结果输入到MLSA声码器中进行语音波形的生成。分析处理韵律语气,得到语音的长度、语调等基本信息,以此信息检索出最贴切的语音片段,将语音片段进行拼接优化,形成最终播放的语音。在本发明一个实施例中,IVR平台把合成的语音播放给客户。
在本发明中,由于智能语音***的回答能力受限于知识库语料的丰富程度,智能语音***的最优状态时将能够处理回答的问题准确率达到最高。本发明还可以使用人工标注的评价方式来进行***评价,从每日的全量数据中抽样小数据集,尽量保证小数据集的数据分布与全量数据保持一致,利用准确率、召回率、拒识率等指标进行***性能的评测。
在本发明中,本发明还可以基于用户反馈进行评价。在电话结束后智能语音***通过对客户进行满意度询问,通过大数据统计分析对该单业务进行等待市场、客户满意度、回答准确率等进行综合评价,以及通过业务办理流程对客户的意向关键词进行客户大数据标签分类,以便更好的为客户服务。
由以上实施例可以看出,本发明在客服***中加入了智能语音***,通过智能语音识别和合成技术进行智能业务分流,极大程度上降低了用户的等待时间,降低人工客服应答的工作强调,对于简单重复的业务由智能语音***来完成,在一定程度上提高服务质量和效率。智能语音***对传统单一的人工语音呼叫进行了优化提升,客户无需进行传统按键进行对应业务办理,只需说出自己的业务需求即可通过智能语音***进行业务处理,便捷高效,节约人力成本,提升呼叫专线的整体业务水平提高客户满意度不断完善用户体验。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机***中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
基于同一发明构思,本发明实施例还提供了一种基于智能语音交互技术的业务咨询处理装置,可以用于实现上述实施例所描述的基于智能语音交互技术的业务咨询处理方法,如下面的实施例所述。由于基于智能语音交互技术的业务咨询处理装置解决问题的原理与基于智能语音交互技术的业务咨询处理方法相似,因此基于智能语音交互技术的业务咨询处理装置的实施例可以参见基于智能语音交互技术的业务咨询处理方法的实施例,重复之处不再赘述。以下所使用的,术语“单元”或者“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图8是本发明实施例基于智能语音交互技术的业务咨询处理装置的结构框图,如图8所示,在本发明一个实施例中,本发明的基于智能语音交互技术的业务咨询处理装置包括:
业务咨询语音获取单元1,用于获取客户的业务咨询语音;
语音识别单元2,用于识别出所述业务咨询语音对应的业务咨询文本;
相似度匹配单元3,用于将所述业务咨询文本与预设的业务咨询模板进行相似度匹配,确定与所述业务咨询文本相似度最高的业务咨询模板;
业务咨询回答信息发送单元4,用于若该与所述业务咨询文本相似度最高的业务咨询模板对应的相似度大于或等于预设的阈值,则将该与所述业务咨询文本相似度最高的业务咨询模板对应的业务咨询回答信息发送给所述客户。
在本发明一个实施例中,本发明的基于智能语音交互技术的业务咨询处理装置还包括:
无匹配回答指令发送单元,用于若最高的相似度小于所述阈值,则向呼叫中心***发送无匹配回答指令,以使所述呼叫中心***根据所述无匹配回答指令将所述客户的呼叫接入人工客服终端。
在本发明一个实施例中,语音识别单元2具体包括:
声音特征转化模块,用于对所述业务咨询语音进行分帧处理,并将每一帧的波形转化为声音特征;
输入模块,用于将所述声音特征输入到预设的声学模型中,得到所述声学模型输出的每个所述声音特征各自对应的音素信息;
对应关系查找模块,用于根据因素信息与字词的对应关系,确定每个所述音素信息各自对应的字或词;
文本生成模块,用于根据每个所述音素信息各自对应的字或词生成所述业务咨询文本。
在本发明一个实施例中,相似度匹配单元3具体包括:
业务类型确定模块,用于确定所述业务咨询文本对应的业务类型;
相似度计算模块,用于将所述业务咨询文本分别与所述业务类型对应的所有的所述业务咨询模板进行相似度匹配,确定与所述业务咨询文本相似度最高的业务咨询模板。
在本发明一个实施例中,业务类型确定模块具体包括:
文本特征提取子模块,用于利用长短时记忆网络对所述业务咨询文本进行特征提取,得到文本特征;
类型确定子模块,用于根据所述文本特征利用卷积神经网络进行文本分类识别,得到所述业务咨询文本对应的业务类型。
在本发明一个实施例中,所述业务咨询回答信息包括:业务咨询回答文本。
在本发明一个实施例中,业务咨询回答信息发送单元4,包括:
语音转化模块,用于将该与所述业务咨询文本相似度最高的业务咨询模板对应的业务咨询回答文本转化为回答语音,并将所述回答语音发送到呼叫中心***,以使所述呼叫中心***将所述回答语音播放给所述客户。
在本发明一个实施例中,所述语音转化模块,具体包括:
文本语言特征提取子模块,用于利用自然语言处理方法对所述业务咨询回答文本进行文本语言特征提取;
聚类子模块,用于将提取的文本语言特征使用决策树进行聚类,并根据聚类结果以及隐马尔可夫模型得到频谱系数和音频标志位;
频谱系数采样子模块,用于根据得到频谱系数和音频标志位利用最大似然参数生成算法进行频谱系数采样;
语音波形生成子模块,用于将频谱系数采样结果输入到声码器中进行语音波形的生成,得到所述回答语音。
为了实现上述目的,根据本申请的另一方面,还提供了一种计算机设备。如图9所示,该计算机设备包括存储器、处理器、通信接口以及通信总线,在存储器上存储有可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述实施例方法中的步骤。
处理器可以为中央处理器(Central Processing Unit,CPU)。处理器还可以为其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。
存储器作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及单元,如本发明上述方法实施例中对应的程序单元。处理器通过运行存储在存储器中的非暂态软件程序、指令以及模块,从而执行处理器的各种功能应用以及作品数据处理,即实现上述方法实施例中的方法。
存储器可以包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需要的应用程序;存储数据区可存储处理器所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至处理器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
所述一个或者多个单元存储在所述存储器中,当被所述处理器执行时,执行上述实施例中的方法。
上述计算机设备具体细节可以对应参阅上述实施例中对应的相关描述和效果进行理解,此处不再赘述。
为了实现上述目的,根据本申请的另一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序在计算机处理器中执行时实现上述基于智能语音交互技术的业务咨询处理方法中的步骤。本领域技术人员可以理解,实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(Read-OnlyMemory,ROM)、随机存储记忆体(RandomAccessMemory,RAM)、快闪存储器(Flash Memory)、硬盘(Hard Disk Drive,缩写:HDD)或固态硬盘(Solid-State Drive,SSD)等;所述存储介质还可以包括上述种类的存储器的组合。
为了实现上述目的,根据本申请的另一方面,还提供了一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现上述基于智能语音交互技术的业务咨询处理方法的步骤。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (11)
1.一种基于智能语音交互技术的业务咨询处理方法,其特征在于,包括:
获取客户的业务咨询语音;
识别出所述业务咨询语音对应的业务咨询文本;
将所述业务咨询文本与预设的业务咨询模板进行相似度匹配,确定与所述业务咨询文本相似度最高的业务咨询模板;
若该与所述业务咨询文本相似度最高的业务咨询模板对应的相似度大于或等于预设的阈值,则将该与所述业务咨询文本相似度最高的业务咨询模板对应的业务咨询回答信息发送给所述客户。
2.根据权利要求1所述的基于智能语音交互技术的业务咨询处理方法,其特征在于,所述识别出所述业务咨询语音对应的业务咨询文本,具体包括:
对所述业务咨询语音进行分帧处理,并将每一帧的波形转化为声音特征;
将所述声音特征输入到预设的声学模型中,得到所述声学模型输出的每个所述声音特征各自对应的音素信息;
根据因素信息与字词的对应关系,确定每个所述音素信息各自对应的字或词;
根据每个所述音素信息各自对应的字或词生成所述业务咨询文本。
3.根据权利要求1所述的基于智能语音交互技术的业务咨询处理方法,其特征在于,所述将所述业务咨询文本与预设的业务咨询模板进行相似度匹配,确定与所述业务咨询文本相似度最高的业务咨询模板,具体包括:
确定所述业务咨询文本对应的业务类型;
将所述业务咨询文本分别与所述业务类型对应的所有的所述业务咨询模板进行相似度匹配,确定与所述业务咨询文本相似度最高的业务咨询模板。
4.根据权利要求3所述的基于智能语音交互技术的业务咨询处理方法,其特征在于,所述确定所述业务咨询文本对应的业务类型,具体包括:
利用长短时记忆网络对所述业务咨询文本进行特征提取,得到文本特征;
根据所述文本特征利用卷积神经网络进行文本分类识别,得到所述业务咨询文本对应的业务类型。
5.根据权利要求1所述的基于智能语音交互技术的业务咨询处理方法,其特征在于,所述业务咨询回答信息包括:业务咨询回答文本;
所述将该与所述业务咨询文本相似度最高的业务咨询模板对应的业务咨询回答信息发送给所述客户,具体包括:
将该与所述业务咨询文本相似度最高的业务咨询模板对应的业务咨询回答文本转化为回答语音,并将所述回答语音发送到呼叫中心***,以使所述呼叫中心***将所述回答语音播放给所述客户。
6.根据权利要求5所述的基于智能语音交互技术的业务咨询处理方法,其特征在于,所述将该与所述业务咨询文本相似度最高的业务咨询模板对应的业务咨询回答文本转化为回答语音,具体包括:
利用自然语言处理方法对所述业务咨询回答文本进行文本语言特征提取;
将提取的文本语言特征使用决策树进行聚类,并根据聚类结果以及隐马尔可夫模型得到频谱系数和音频标志位;
根据得到频谱系数和音频标志位利用最大似然参数生成算法进行频谱系数采样;
将频谱系数采样结果输入到声码器中进行语音波形的生成,得到所述回答语音。
7.根据权利要求1所述的基于智能语音交互技术的业务咨询处理方法,其特征在于,还包括:
若最高的相似度小于所述阈值,则向呼叫中心***发送无匹配回答指令,以使所述呼叫中心***根据所述无匹配回答指令将所述客户的呼叫接入人工客服终端。
8.一种基于智能语音交互技术的业务咨询处理装置,其特征在于,包括:
业务咨询语音获取单元,用于获取客户的业务咨询语音;
语音识别单元,用于识别出所述业务咨询语音对应的业务咨询文本;
相似度匹配单元,用于将所述业务咨询文本与预设的业务咨询模板进行相似度匹配,确定与所述业务咨询文本相似度最高的业务咨询模板;
业务咨询回答信息发送单元,用于若该与所述业务咨询文本相似度最高的业务咨询模板对应的相似度大于或等于预设的阈值,则将该与所述业务咨询文本相似度最高的业务咨询模板对应的业务咨询回答信息发送给所述客户。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7任意一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序/指令,其特征在于,该计算机程序/指令被处理器执行时实现权利要求1至7任意一项所述方法的步骤。
11.一种计算机程序产品,包括计算机程序/指令,其特征在于,该计算机程序/指令被处理器执行时实现权利要求1至7任意一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210518383.6A CN114818649A (zh) | 2022-05-13 | 2022-05-13 | 基于智能语音交互技术的业务咨询处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210518383.6A CN114818649A (zh) | 2022-05-13 | 2022-05-13 | 基于智能语音交互技术的业务咨询处理方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114818649A true CN114818649A (zh) | 2022-07-29 |
Family
ID=82513330
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210518383.6A Pending CN114818649A (zh) | 2022-05-13 | 2022-05-13 | 基于智能语音交互技术的业务咨询处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114818649A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115408553A (zh) * | 2022-09-02 | 2022-11-29 | 深圳市容大数字技术有限公司 | 一种用于优化生成呼叫中心服务的*** |
CN116600053A (zh) * | 2023-07-17 | 2023-08-15 | 北京人众互联信息技术有限公司 | 一种基于ai大语言模型的客服*** |
CN116862530A (zh) * | 2023-06-25 | 2023-10-10 | 江苏华泽微福科技发展有限公司 | 一种智能售后服务方法和*** |
CN117668154A (zh) * | 2023-10-17 | 2024-03-08 | 银川宜善互联网医院有限公司 | 一种医疗健康咨询服务方法、***、设备及存储介质 |
-
2022
- 2022-05-13 CN CN202210518383.6A patent/CN114818649A/zh active Pending
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115408553A (zh) * | 2022-09-02 | 2022-11-29 | 深圳市容大数字技术有限公司 | 一种用于优化生成呼叫中心服务的*** |
CN116862530A (zh) * | 2023-06-25 | 2023-10-10 | 江苏华泽微福科技发展有限公司 | 一种智能售后服务方法和*** |
CN116862530B (zh) * | 2023-06-25 | 2024-04-05 | 江苏华泽微福科技发展有限公司 | 一种智能售后服务方法和*** |
CN116600053A (zh) * | 2023-07-17 | 2023-08-15 | 北京人众互联信息技术有限公司 | 一种基于ai大语言模型的客服*** |
CN116600053B (zh) * | 2023-07-17 | 2023-10-27 | 北京人众互联信息技术有限公司 | 一种基于ai大语言模型的客服*** |
CN117668154A (zh) * | 2023-10-17 | 2024-03-08 | 银川宜善互联网医院有限公司 | 一种医疗健康咨询服务方法、***、设备及存储介质 |
CN117668154B (zh) * | 2023-10-17 | 2024-06-18 | 银川宜善互联网医院有限公司 | 一种医疗健康咨询服务方法、***、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111246027B (zh) | 一种实现人机协同的语音通讯***及方法 | |
US9742912B2 (en) | Method and apparatus for predicting intent in IVR using natural language queries | |
CN111739516A (zh) | 一种针对智能客服通话的语音识别*** | |
CN114818649A (zh) | 基于智能语音交互技术的业务咨询处理方法及装置 | |
CN110717018A (zh) | 一种基于知识图谱的工业设备故障维修问答*** | |
CN110853649A (zh) | 基于智能语音技术的标签提取方法、***、设备及介质 | |
US20100217591A1 (en) | Vowel recognition system and method in speech to text applictions | |
CN110310663A (zh) | 违规话术检测方法、装置、设备及计算机可读存储介质 | |
CN111489765A (zh) | 一种基于智能语音技术的话务服务质检方法 | |
CN112581964B (zh) | 一种面向多领域的智能语音交互方法 | |
CN110198381B (zh) | 一种识别ai来电的方法、装置、语音助手、终端、计算机设备及计算机可读存储介质 | |
CN112131359A (zh) | 一种基于图形化编排智能策略的意图识别方法及电子设备 | |
CN112800743A (zh) | 一种基于特定领域的语音打分模型构建***及方法 | |
CN110852075A (zh) | 自动添加标点符号的语音转写方法、装置及可读存储介质 | |
CN116631412A (zh) | 一种通过声纹匹配判断语音机器人的方法 | |
CN113793599A (zh) | 语音识别模型的训练方法和语音识别方法及装置 | |
CN117524202A (zh) | 一种ip电话语音数据检索方法及*** | |
CN115691500A (zh) | 一种基于时延神经网络的电力客服语音识别方法及装置 | |
CN115022471B (zh) | 一种智能机器人语音交互***和方法 | |
CN115985320A (zh) | 智能设备控制方法、装置、电子设备及存储介质 | |
CN114707515A (zh) | 话术判别方法、装置、电子设备及存储介质 | |
CN117041430B (zh) | 一种提高智能协调外呼***的外呼质量及鲁棒方法和装置 | |
CN112820274B (zh) | 一种语音信息识别校正方法和*** | |
CN115019777B (zh) | 一种在线学习语音识别应答装置及方法 | |
CN111489743B (zh) | 一种基于智能语音技术的运营管理分析*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |