CN112101046B - 一种基于通话行为的会话分析方法、装置和*** - Google Patents
一种基于通话行为的会话分析方法、装置和*** Download PDFInfo
- Publication number
- CN112101046B CN112101046B CN202011200776.XA CN202011200776A CN112101046B CN 112101046 B CN112101046 B CN 112101046B CN 202011200776 A CN202011200776 A CN 202011200776A CN 112101046 B CN112101046 B CN 112101046B
- Authority
- CN
- China
- Prior art keywords
- user
- age group
- judgment
- gender
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 78
- 230000006399 behavior Effects 0.000 claims abstract description 28
- 238000000034 method Methods 0.000 claims abstract description 26
- 238000005070 sampling Methods 0.000 claims description 56
- 238000013135 deep learning Methods 0.000 claims description 23
- 238000013527 convolutional neural network Methods 0.000 claims description 20
- 238000012545 processing Methods 0.000 claims description 16
- 238000004891 communication Methods 0.000 claims description 13
- 238000004422 calculation algorithm Methods 0.000 description 18
- 238000012549 training Methods 0.000 description 16
- 238000006243 chemical reaction Methods 0.000 description 8
- 238000001514 detection method Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 7
- 238000012795 verification Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 4
- 230000007613 environmental effect Effects 0.000 description 4
- 238000004590 computer program Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明公开了一种基于通话行为的会话分析方法、装置和***,其中方法包括与用户进行通话,接收用户的输入,获取用户的通话概况特征值;获取用户的基本信息,生成用户的用户特征值;将所述用户的通话概况特征值和所述用户特征值输入会话分析模型,所述会话分析模型输出用户评分。采用该技术方案,在通话过程中基于通话行为对用户进行分析,快速发现***或优质用户,为不同的用户的提供差异化服务,更好的提升了用户的感受。
Description
技术领域
本发明涉及计算机信息处理领域,具体而言,涉及一种基于通话行为的会话分析方法、装置和***。
背景技术
客户服务中心是企业与用户沟通的主要桥梁,提升用户满意度的主要渠道。以前客户服务中心主要以人工客服为主,由专业的客服人员为用户进行服务。
随着计算机信息处理技术的发展,越来越多的客户服务中心开始采用智能语音机器人来为用户进行服务,缓解人工客服等待时间过长的问题。
虽然智能语音机器人在语音语调上已经非常接近真实的客服,但由于技术限制,目前智能语音机器人为用户进行服务时,效果与人工客服还是有不小差距。如果都是用智能语音机器人进行服务,一些***或优质用户可能会流失,但如果都使用人工客服则成本过高,浪费资源。
发明内容
本发明旨在解决现有智能语音机器人服务过程中无法快速发现***或优质用户,无法为不同用户提供差异化服务的问题。
为了解决上述技术问题,本发明第一方面提出一种基于通话行为的会话分析方法,包括:一种基于通话行为的会话分析方法,其特征在于,方法包括:
与用户进行通话,接收用户的输入,获取用户的通话概况特征值;
获取用户的基本信息,生成用户的用户特征值;
将所述用户的通话概况特征值和所述用户特征值输入会话分析模型,所述会话分析模型输出用户评分。
根据本发明的一种优选实施方式,所述通话概况特征值包括通话时长,通话次数。
根据本发明的一种优选实施方式,所述用户特征值包括用户年龄段、用户性别、归属地信息以及入网时间。
根据本发明的一种优选实施方式,获取用户的基本信息,生成用户的用户特征值具体为:
获取用户的语音,输入年龄段判断模型,获取用户年龄段;
获取用户的语音,输入性别判断模型,获取用户性别;
获取用户的电话号码,确定用户的归属地信息,以及所述用户的入网时间。
根据本发明的一种优选实施方式,所述获取用户的语音,输入年龄段判断模型,获取用户年龄段具体为:
将所述用户输入的语音转化为年龄段判断波形;
设置年龄段判断采样周期,按所述年龄段判断采样周期对所述年龄段判断波形进行采样,生成年龄段判断波形序列;
将所述年龄段判断波形序列输入所述年龄段判断模型,所述年龄段判断模型输出用户年龄段,所述年龄段判断模型为基于深度学习的卷积神经网络。
根据本发明的一种优选实施方式,获取用户的语音,输入性别判断模型,获取用户性别具体为:
将所述用户输入的语音转化为性别判断波形;
设置性别判断采样周期,按所述性别判断采样周期对所述性别判断波形进行采样,生成性别判断波形序列;
将所述性别判断序列输入性别判断模型,所述性别判断模型输出用户性别,所述性别判断模型为基于深度学习的卷积神经网络。
根据本发明的一种优选实施方式,所述会话分析模型为基于深度学习的TextCNN网络模型。
根据本发明的一种优选实施方式,所述会话分析模型由历史用户数据进行训练。
根据本发明的一种优选实施方式,方法还包括:
设置用户评分阈值,若用户评分超过所述用户评分阈值则由人工客服对用户进行服务,否则由智能语音机器人对用户进行服务。
本发明第二方面提出一种基于通话行为的会话分析装置,装置包括:
通话概况特征值获取模块,用于与用户进行通话,接收用户的输入,获取用户的通话概况特征值;
用户特征值模块,用于获取用户的基本信息,生成用户的用户特征值;
用户评分模块,用于将所述用户的通话概况特征值和所述用户特征值输入会话分析模型,所述会话分析模型输出用户评分。
根据本发明的一种优选实施方式,所述通话概况特征值包括通话时长,通话次数。
根据本发明的一种优选实施方式,所述用户特征值包括用户年龄段、用户性别、归属地信息以及入网时间。
根据本发明的一种优选实施方式,获取用户的基本信息,生成用户的用户特征值具体为:
获取用户的语音,输入年龄段判断模型,获取用户年龄段;
获取用户的语音,输入性别判断模型,获取用户性别;
获取用户的电话号码,确定用户的归属地信息,以及所述用户的入网时间。
根据本发明的一种优选实施方式,所述获取用户的语音,输入年龄段判断模型,获取用户年龄段具体为:
将所述用户输入的语音转化为年龄段判断波形;
设置年龄段判断采样周期,按所述年龄段判断采样周期对所述年龄段判断波形进行采样,生成年龄段判断波形序列;
将所述年龄段判断波形序列输入所述年龄段判断模型,所述年龄段判断模型输出用户年龄段,所述年龄段判断模型为基于深度学习的卷积神经网络。
根据本发明的一种优选实施方式,获取用户的语音,输入性别判断模型,获取用户性别具体为:
将所述用户输入的语音转化为性别判断波形;
设置性别判断采样周期,按所述性别判断采样周期对所述性别判断波形进行采样,生成性别判断波形序列;
将所述性别判断序列输入性别判断模型,所述性别判断模型输出用户性别,所述性别判断模型为基于深度学习的卷积神经网络。
根据本发明的一种优选实施方式,所述会话分析模型为基于深度学习的TextCNN网络模型。
根据本发明的一种优选实施方式,所述会话分析模型由历史用户数据进行训练。
根据本发明的一种优选实施方式,装置还包括:
服务切换模块,用于设置用户评分阈值,若用户评分超过所述用户评分阈值则由人工客服对用户进行服务,否则由智能语音机器人对用户进行服务。
本发明第三方面提出一种基于通话行为的会话分析***,包括:
存储单元,用于存储计算机可执行程序;
处理单元,用于读取所述存储单元中的计算机可执行程序,以执行所述的基于通话行为的会话分析方法。
本发明第四方面提出一种计算机可读介质,用于存储计算机可读程序,所述计算机可读程序用于执行所述的基于通话行为的会话分析方法。
采用该技术方案,在通话过程中基于通话行为对用户进行分析,快速发现***或优质用户,为不同的用户的提供差异化服务,更好的提升了用户的感受。
附图说明
为了使本发明所解决的技术问题、采用的技术手段及取得的技术效果更加清楚,下面将参照附图详细描述本发明的具体实施例。但需声明的是,下面描述的附图仅仅是本发明的示例性实施例的附图,对于本领域的技术人员来讲,在不付出创造性劳动的前提下,可以根据这些附图获得其他实施例的附图。
图1是本发明实施例中基于通话行为的会话分析方法的流程示意图;
图2是本发明实施例中基于通话行为的会话分析装置的结构示意图;
图3是本发明实施例中基于通话行为的会话分析***的结构框架示意图;
图4是本发明实施例中计算机可读存储介质的结构示意图。
具体实施方式
现在将参考附图来更加全面地描述本发明的示例性实施例,虽然各示例性实施例能够以多种具体的方式实施,但不应理解为本发明仅限于在此阐述的实施例。相反,提供这些示例性实施例是为了使本发明的内容更加完整,更加便于将发明构思全面地传达给本领域的技术人员。
在符合本发明的技术构思的前提下,在某个特定的实施例中描述的结构、性能、效果或者其他特征可以以任何合适的方式结合到一个或更多其他的实施例中。
在对于具体实施例的介绍过程中,对结构、性能、效果或者其他特征的细节描述是为了使本领域的技术人员对实施例能够充分理解。但是,并不排除本领域技术人员可以在特定情况下,以不含有上述结构、性能、效果或者其他特征的技术方案来实施本发明。
附图中的流程图仅是一种示例性的流程演示,不代表本发明的方案中必须包括流程图中的所有的内容、操作和步骤,也不代表必须按照图中所显示的的顺序执行。例如,流程图中有的操作/步骤可以分解,有的操作/步骤可以合并或部分合并,等等,在不脱离本发明的发明主旨的情况下,流程图中显示的执行顺序可以根据实际情况改变。
附图中的框图一般表示的是功能实体,并不一定必然与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理单元装置和/或微控制器装置中实现这些功能实体。
各附图中相同的附图标记表示相同或类似的元件、组件或部分,因而下文中可能省略了对相同或类似的元件、组件或部分的重复描述。还应理解,虽然本文中可能使用第一、第二、第三等表示编号的定语来描述各种器件、元件、组件或部分,但是这些器件、元件、组件或部分不应受这些定语的限制。也就是说,这些定语仅是用来将一者与另一者区分。例如,第一器件亦可称为第二器件,但不偏离本发明实质的技术方案。此外,术语“和/或”、“及/或”是指包括所列出项目中的任一个或多个的所有组合。
图1是本发明一种获取用户属性信息的方法的流程图,如图1所示,本发明方法具有如下步骤:
S101、与用户进行通话,接收用户的输入,获取用户的通话概况特征值。
在上述技术方案的基础上,进一步地,所述通话概况特征值包括通话时长,通话次数。
在本实施方式中,通话时长是与用户进行沟通的时间,相对来说,通话时间越长,说明用户愿意进行沟通,愿意了解相关信息,因此用户是***或优质用户的可能比较高。很多时候为用户提供服务需要多轮进行沟通。根据大量数据的显示,沟通次数越多,说明用户转化比较困难,是***或优质用户的可能比较低。
因此从用户的通话时长以及通话次数这个角度能够判断用户是否是***或者优质用户。
S102、获取用户的基本信息,生成用户的用户特征值。
在上述技术方案的基础上,进一步地,所述用户特征值包括用户年龄段、用户性别、归属地信息以及入网时间。
在本实施方式中,由于是在与用户进行通话的时候对用户进行快速分析和定位,因此获取的维度相对有限,用户年龄段以及用户性别通过判断模型确定,归属地信息以及入网时间可以通过用户的电话号码查询获得相关信息。
在上述技术方案的基础上,进一步地,获取用户的基本信息,生成用户的用户特征值具体为:
获取用户的语音,输入年龄段判断模型,获取用户年龄段;
获取用户的语音,输入性别判断模型,获取用户性别;
获取用户的电话号码,确定用户的归属地信息,以及所述用户的入网时间。
在上述技术方案的基础上,进一步地,所述获取用户的语音,输入年龄段判断模型,获取用户年龄段具体为:
将所述用户输入的语音转化为年龄段判断波形;
设置年龄段判断采样周期,按所述年龄段判断采样周期对所述年龄段判断波形进行采样,生成年龄段判断波形序列;
将所述年龄段判断波形序列输入所述年龄段判断模型,所述年龄段判断模型输出用户年龄段,所述年龄段判断模型为基于深度学习的卷积神经网络。
在与用户进行沟通的时候,客户服务中心使用智能机器人与用户进行语音交流,客户服务中心获取用户的语音并将用户的语音转化为年龄段判断波形,在本发明使用VAD算法对语音输入进行检测,获得年龄段判断波形。语音活动检测VAD算法,又称语音端点检测算法或语音边界检测算法。在本实施方式中,由于环境噪音、设备噪音等等噪音的影响,用户的语音输入往往不仅仅包括用户的声音,还会包括用户所处环境的噪音,如果不将这些噪音滤除,会对分析结果造成影响。因此采用VAD算法标注所述音频数据中的语音段和非语音段,并利用标注结果去除音频数据中的非语音段,对用户的语音输入进行检测,滤除环境噪声,仅仅保留用户的人声,并转化成声波波形。
VAD算法中的具体算法有很多种,本发明优选采用高斯混合GMM模型算法进行人声检测。在其他实施方式中,还可以采用VAD算法中的其他算法。
设置年龄段判断采样周期,按照年龄段判断采样周期对年龄段判断波形进行采样,获得连续的年龄段判断波形序列。例如设置年龄段判断采样周期为20ms,则年龄段判断波形被截取成连续的多个20ms声波波形的年龄段判断波形序列。为了便于年龄段判断模型进行识别,将年龄段判断波形序列中的声波波形都转化为图像。
在本发明的其他实施方式中,可以采用在时间上有重叠的波形采样。为了避免连续图片中遗漏相关的边沿图片信息,可以设置重叠时长,重叠时长小于年龄段判断采样周期,比如年龄段判断采样周期为50ms,重叠时长为10ms,则获得年龄段判断波形采样为0ms-50ms、40ms-90ms、80ms-130ms……
在本实施方式中,年龄段判断模型为基于深度学习的CNN卷积神经网络模型,是一种前馈型的神经网络模型。年龄段判断模型是由客户服务中心存储的大量历史语音数据训练而成。客户服务中心还存储有对应的历史用户的年龄数据,对历史语音数据进行年龄段标定。将标定好的历史语音数据分为训练数据集和校验数据集。使用训练数据集对年龄段判断模型进行训练,调整年龄段判断模型参数直至模型收敛。然后使用校验数据集进行校验,如果校验通过则年龄段判断模型训练完成,如果未通过则重新对模型进行训练。
年龄段判断模型训练好以后,将与用户实时对话过程中获取的年龄段判断波形序列输入年龄段判断模型,年龄段判断模型会输出计算获得的当前用户的年龄段。
在上述技术方案的基础上,进一步地,获取用户的语音,输入性别判断模型,获取用户性别具体为:
将所述用户输入的语音转化为性别判断波形;
设置性别判断采样周期,按所述性别判断采样周期对所述性别判断波形进行采样,生成性别判断波形序列;
将所述性别判断序列输入性别判断模型,所述性别判断模型输出用户性别,所述性别判断模型为基于深度学习的卷积神经网络。
在本实施方式中,判断用户的性别的过程与判断用户年龄段的过程相同,在这里不在赘述。
S103、将所述用户的通话概况特征值和所述用户特征值输入会话分析模型,所述会话分析模型输出用户评分。
在上述技术方案的基础上,进一步地,所述会话分析模型为基于深度学习的TextCNN网络模型。
在上述技术方案的基础上,进一步地,所述会话分析模型由历史用户数据进行训练。
在本实施方式中,将获取的通话概况特征值和用户特征值,即将通话时长、通话次数、用户年龄段、性别、归属地信息以及入网时间输入会话分析模型,会话分析模型输出用户评分,根据用户评分确定用户是否是***或优质用户。
在本实施方式中,会话分析模型为基于深度学习的TextCNN网络模型,通过历史用户数据训练完成。客户服务中心积累的大量用户数据中包括用户通话时长、通话次数、用户年龄段、性别、归属地信息、入网时间以及用户的转化情况或者用户的购买情况。使用用户的转化情况或者用户的购买情况对历史用户数据进行标引,比如经过沟通后用户购买了产品,将用户标引为1,否则标引为0。
将标引好的历史用户数据划分为训练样本和校验样本,使用训练样本训练会话分析模型,调整模型参数,直至会话分析模型收敛。然后使用校验样本对会话分析模型进行校验,如果校验通过说明会话分析模型训练完成,否则重新对会话分析模型进行训练。
使用训练好的会话分析模型来对通话中的用户进行分析计算,输出用户评分。
在上述技术方案的基础上,进一步地,方法还包括:
设置用户评分阈值,若用户评分超过所述用户评分阈值则由人工客服对用户进行服务,否则由智能语音机器人对用户进行服务。
在本实施方式中,设置用户评分阈值,如果经过会话分析模型的计算获得的用户评分超过了用户评分阈值,说明该用户是***或优质用户的可能性很高。在后续的沟通中使用人工客服为用户进行服务,应答和解决问题更加灵活,能够更加人性化,使用户的使用体验更好,能够提高用户的转化率或购买率。为不同的用户提供不同的服务,节省了***资源。
图2是本发明实施例中基于通话行为的会话分析装置的结构示意图,如图2所示,本发明提供一种基于通话行为的会话分析装置的结构示意图200,包括:
通话概况特征值获取模块201,用于与用户进行通话,接收用户的输入,获取用户的通话概况特征值。
在上述技术方案的基础上,进一步地,所述通话概况特征值包括通话时长,通话次数。
在本实施方式中,通话时长是与用户进行沟通的时间,相对来说,通话时间越长,说明用户愿意进行沟通,愿意了解相关信息,因此用户是***或优质用户的可能比较高。很多时候为用户提供服务需要多轮进行沟通。根据大量数据的显示,沟通次数越多,说明用户转化比较困难,是***或优质用户的可能比较低。
因此从用户的通话时长以及通话次数这个角度能够判断用户是否是***或者优质用户。
用户特征值模块202,用于获取用户的基本信息,生成用户的用户特征值。
在上述技术方案的基础上,进一步地,所述用户特征值包括用户年龄段、用户性别、归属地信息以及入网时间。
在本实施方式中,由于是在与用户进行通话的时候对用户进行快速分析和定位,因此获取的维度相对有限,用户年龄段以及用户性别通过判断模型确定,归属地信息以及入网时间可以通过用户的电话号码查询获得相关信息。
在上述技术方案的基础上,进一步地,获取用户的基本信息,生成用户的用户特征值具体为:
获取用户的语音,输入年龄段判断模型,获取用户年龄段;
获取用户的语音,输入性别判断模型,获取用户性别;
获取用户的电话号码,确定用户的归属地信息,以及所述用户的入网时间。
在上述技术方案的基础上,进一步地,所述获取用户的语音,输入年龄段判断模型,获取用户年龄段具体为:
将所述用户输入的语音转化为年龄段判断波形;
设置年龄段判断采样周期,按所述年龄段判断采样周期对所述年龄段判断波形进行采样,生成年龄段判断波形序列;
将所述年龄段判断波形序列输入所述年龄段判断模型,所述年龄段判断模型输出用户年龄段,所述年龄段判断模型为基于深度学习的卷积神经网络。
在与用户进行沟通的时候,客户服务中心使用智能机器人与用户进行语音交流,客户服务中心获取用户的语音并将用户的语音转化为年龄段判断波形,在本发明使用VAD算法对语音输入进行检测,获得年龄段判断波形。语音活动检测VAD算法,又称语音端点检测算法或语音边界检测算法。在本实施方式中,由于环境噪音、设备噪音等等噪音的影响,用户的语音输入往往不仅仅包括用户的声音,还会包括用户所处环境的噪音,如果不将这些噪音滤除,会对分析结果造成影响。因此采用VAD算法标注所述音频数据中的语音段和非语音段,并利用标注结果去除音频数据中的非语音段,对用户的语音输入进行检测,滤除环境噪声,仅仅保留用户的人声,并转化成声波波形。
VAD算法中的具体算法有很多种,本发明优选采用高斯混合GMM模型算法进行人声检测。在其他实施方式中,还可以采用VAD算法中的其他算法。
设置年龄段判断采样周期,按照年龄段判断采样周期对年龄段判断波形进行采样,获得连续的年龄段判断波形序列。例如设置年龄段判断采样周期为20ms,则年龄段判断波形被截取成连续的多个20ms声波波形的年龄段判断波形序列。为了便于年龄段判断模型进行识别,将年龄段判断波形序列中的声波波形都转化为图像。
在本发明的其他实施方式中,可以采用在时间上有重叠的波形采样。为了避免连续图片中遗漏相关的边沿图片信息,可以设置重叠时长,重叠时长小于年龄段判断采样周期,比如年龄段判断采样周期为50ms,重叠时长为10ms,则获得年龄段判断波形采样为0ms-50ms、40ms-90ms、80ms-130ms……
在本实施方式中,年龄段判断模型为基于深度学习的CNN卷积神经网络模型,是一种前馈型的神经网络模型。年龄段判断模型是由客户服务中心存储的大量历史语音数据训练而成。客户服务中心还存储有对应的历史用户的年龄数据,对历史语音数据进行年龄段标定。将标定好的历史语音数据分为训练数据集和校验数据集。使用训练数据集对年龄段判断模型进行训练,调整年龄段判断模型参数直至模型收敛。然后使用校验数据集进行校验,如果校验通过则年龄段判断模型训练完成,如果未通过则重新对模型进行训练。
年龄段判断模型训练好以后,将与用户实时对话过程中获取的年龄段判断波形序列输入年龄段判断模型,年龄段判断模型会输出计算获得的当前用户的年龄段。
在上述技术方案的基础上,进一步地,获取用户的语音,输入性别判断模型,获取用户性别具体为:
将所述用户输入的语音转化为性别判断波形;
设置性别判断采样周期,按所述性别判断采样周期对所述性别判断波形进行采样,生成性别判断波形序列;
将所述性别判断序列输入性别判断模型,所述性别判断模型输出用户性别,所述性别判断模型为基于深度学习的卷积神经网络。
在本实施方式中,判断用户的性别的过程与判断用户年龄段的过程相同,在这里不在赘述。
用户评分模块203,用于将所述用户的通话概况特征值和所述用户特征值输入会话分析模型,所述会话分析模型输出用户评分。
在上述技术方案的基础上,进一步地,所述会话分析模型为基于深度学习的TextCNN网络模型。
在上述技术方案的基础上,进一步地,所述会话分析模型由历史用户数据进行训练。
在本实施方式中,将获取的通话概况特征值和用户特征值,即将通话时长、通话次数、用户年龄段、性别、归属地信息以及入网时间输入会话分析模型,会话分析模型输出用户评分,根据用户评分确定用户是否是***或优质用户。
在本实施方式中,会话分析模型为基于深度学习的TextCNN网络模型,通过历史用户数据训练完成。客户服务中心积累的大量用户数据中包括用户通话时长、通话次数、用户年龄段、性别、归属地信息、入网时间以及用户的转化情况或者用户的购买情况。使用用户的转化情况或者用户的购买情况对历史用户数据进行标引,比如经过沟通后用户购买了产品,将用户标引为1,否则标引为0。
将标引好的历史用户数据划分为训练样本和校验样本,使用训练样本训练会话分析模型,调整模型参数,直至会话分析模型收敛。然后使用校验样本对会话分析模型进行校验,如果校验通过说明会话分析模型训练完成,否则重新对会话分析模型进行训练。
使用训练好的会话分析模型来对通话中的用户进行分析计算,输出用户评分。
在上述技术方案的基础上,进一步地,方法还包括:
设置用户评分阈值,若用户评分超过所述用户评分阈值则由人工客服对用户进行服务,否则由智能语音机器人对用户进行服务。
在本实施方式中,设置用户评分阈值,如果经过会话分析模型的计算获得的用户评分超过了用户评分阈值,说明该用户是***或优质用户的可能性很高。在后续的沟通中使用人工客服为用户进行服务,应答和解决问题更加灵活,能够更加人性化,使用户的使用体验更好,能够提高用户的转化率或购买率。为不同的用户提供不同的服务,节省了***资源。
如图3所示,本发明的一个实施例中还公开一种基于通话行为的会话分析***,图3显示的基于通话行为的会话分析***仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
基于通话行为的会话分析***300,包括存储单元320,用于存储计算机可执行程序;处理单元310,用于读取所述存储单元中的计算机可执行程序,以执行本发明各种实施方式的步骤。
在本实施方式中基于通话行为的会话分析***300还包括,连接不同***组件(包括存储单元320和处理单元310)的总线330、显示单元340等。
其中,所述存储单元320存储有计算机可读程序,其可以是源程序或都只读程序的代码。所述程序可以被处理单元310执行,使得所述处理单元310执行本发明各种实施方式的步骤。例如,所述处理单元310可以执行如图1所示的步骤。
所述存储单元320可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)3201和/或高速缓存存储单元3202,还可以进一步包括只读存储单元(ROM)3203。所述存储单元320还可以包括具有一组(至少一个)程序模块3205的程序/实用工具3204,这样的程序模块3205包括但不限于:操作***、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线330可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、***总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
基于通话行为的会话分析***300也可以与一个或多个外部设备370(例如键盘、显示器、网络设备、蓝牙设备等)通信,使得用户能经由这些外部设备370通过输入/输出(I/O)接口350进行与处理单元310进行交互,还可以通过网络适配器360与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)进行。网络适配器360可以通过总线330与基于通话行为的会话分析***300的其它模块通信。应当明白,尽管图中未示出,基于通话行为的会话分析***300中可使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID***、磁带驱动器以及数据备份存储***等。
图4是本发明的一个计算机可读介质实施例的示意图。如图4所示,所述计算机程序可以存储于一个或多个计算机可读介质上。计算机可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储单元(RAM)、只读存储单元(ROM)、可擦式可编程只读存储单元(EPROM或闪存)、光纤、便携式紧凑盘只读存储单元(CD-ROM)、光存储单元件、磁存储单元件、或者上述的任意合适的组合。当所述计算机程序被一个或多个数据处理设备执行时,使得该计算机可读介质能够实现本发明的上述方法,即:
S101、与用户进行通话,接收用户的输入,获取用户的通话概况特征值;
S102、获取用户的基本信息,生成用户的用户特征值;
S103、将所述用户的通话概况特征值和所述用户特征值输入会话分析模型,所述会话分析模型输出用户评分。
通过以上的实施方式的描述,本领域的技术人员易于理解,本发明描述的示例性实施例可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本发明实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个计算机可读的存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台数据处理设备(可以是个人计算机、服务器、或者网络设备等)执行根据本发明的上述方法。
所述计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
综上所述,本发明可以执行计算机程序的方法、装置、电子设备或计算机可读介质来实现。可以在实践中使用微处理单元或者数字信号处理单元(DSP)等通用数据处理设备来实现本发明的一些或者全部功能。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,应理解的是,本发明不与任何特定计算机、虚拟装置或者电子设备固有相关,各种通用装置也可以实现本发明。以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种基于通话行为的会话分析方法,其特征在于,方法包括:
与用户进行通话,接收用户的输入,获取用户的通话概况特征值;
获取用户的基本信息,生成用户的用户特征值,所述用户特征值包括用户年龄段、用户性别、归属地信息以及入网时间,其中,获取用户的语音,输入年龄段判断模型,获取用户年龄段;获取用户的语音,输入性别判断模型,获取用户性别;获取用户的电话号码,确定用户的归属地信息,以及所述用户的入网时间;其中获取用户的语音,输入年龄段判断模型,获取用户年龄段具体包括获取用户的语音并将用户的语音转化为年龄段判断波形,设置年龄段判断采样周期以及设置重叠时长,按照年龄段判断采样周期以及重叠时长对年龄段判断波形进行有重叠的波形采样,重叠时长小于年龄段判断采样周期,获得年龄段判断波形序列,将年龄段判断波形序列中的声波波形都转化为图像,输入年龄段判断模型,获取用户年龄段,所述年龄段判断模型为基于深度学习的CNN卷积神经网络模型;其中获取用户的语音,输入性别判断模型,获取用户性别具体包括将所述用户输入的语音转化为性别判断波形;设置性别判断采样周期,按所述性别判断采样周期对所述性别判断波形进行采样,生成性别判断波形序列;将所述性别判断序列输入性别判断模型,所述性别判断模型输出用户性别,所述性别判断模型为基于深度学习的卷积神经网络模型;
将所述用户的通话概况特征值和所述用户特征值输入会话分析模型,所述会话分析模型输出用户评分,设置用户评分阈值,若用户评分超过所述用户评分阈值则由人工客服对用户进行服务,否则由智能语音机器人对用户进行服务。
2.如权利要求1所述的会话分析方法,其特征在于,所述通话概况特征值包括通话时长,通话次数。
3.如权利要求1所述的会话分析方法,其特征在于,所述获取用户的语音,输入年龄段判断模型,获取用户年龄段具体为:
将所述用户输入的语音转化为年龄段判断波形;
设置年龄段判断采样周期,按所述年龄段判断采样周期对所述年龄段判断波形进行采样,生成年龄段判断波形序列;
将所述年龄段判断波形序列输入所述年龄段判断模型,所述年龄段判断模型输出用户年龄段,所述年龄段判断模型为基于深度学习的卷积神经网络。
4.如权利要求1所述的会话分析方法,其特征在于,获取用户的语音,输入性别判断模型,获取用户性别具体为:
将所述用户输入的语音转化为性别判断波形;
设置性别判断采样周期,按所述性别判断采样周期对所述性别判断波形进行采样,生成性别判断波形序列;
将所述性别判断序列输入性别判断模型,所述性别判断模型输出用户性别,所述性别判断模型为基于深度学习的卷积神经网络。
5.如权利要求1所述的会话分析方法,其特征在于,所述会话分析模型为基于深度学习的TextCNN网络模型。
6.一种基于通话行为的会话分析装置,其特征在于,装置包括:
通话概况特征值获取模块,用于与用户进行通话,接收用户的输入,获取用户的通话概况特征值;
用户特征值模块,用于获取用户的基本信息,生成用户的用户特征值,所述用户特征值包括用户年龄段、用户性别、归属地信息以及入网时间,其中,获取用户的语音,输入年龄段判断模型,获取用户年龄段;获取用户的语音,输入性别判断模型,获取用户性别;获取用户的电话号码,确定用户的归属地信息,以及所述用户的入网时间;其中获取用户的语音,输入年龄段判断模型,获取用户年龄段具体包括获取用户的语音并将用户的语音转化为年龄段判断波形,设置年龄段判断采样周期以及设置重叠时长,按照年龄段判断采样周期以及重叠时长对年龄段判断波形进行有重叠的波形采样,重叠时长小于年龄段判断采样周期,获得年龄段判断波形序列,将年龄段判断波形序列中的声波波形都转化为图像,输入年龄段判断模型,获取用户年龄段,所述年龄段判断模型为基于深度学习的CNN卷积神经网络模型;其中获取用户的语音,输入性别判断模型,获取用户性别具体包括将所述用户输入的语音转化为性别判断波形;设置性别判断采样周期,按所述性别判断采样周期对所述性别判断波形进行采样,生成性别判断波形序列;将所述性别判断序列输入性别判断模型,所述性别判断模型输出用户性别,所述性别判断模型为基于深度学习的卷积神经网络模型;
用户评分模块,用于将所述用户的通话概况特征值和所述用户特征值输入会话分析模型,所述会话分析模型输出用户评分,设置用户评分阈值,若用户评分超过所述用户评分阈值则由人工客服对用户进行服务,否则由智能语音机器人对用户进行服务。
7.一种基于通话行为的会话分析***,其特征在于,包括:
存储单元,用于存储计算机可执行程序;
处理单元,用于读取所述存储单元中的计算机可执行程序,以执行权利要求1至5中任一项所述的基于通话行为的会话分析方法。
8.一种计算机可读介质,用于存储计算机可读程序,其特征在于,所述计算机可读程序用于执行权利要求1至5中任一项所述的基于通话行为的会话分析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011200776.XA CN112101046B (zh) | 2020-11-02 | 2020-11-02 | 一种基于通话行为的会话分析方法、装置和*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011200776.XA CN112101046B (zh) | 2020-11-02 | 2020-11-02 | 一种基于通话行为的会话分析方法、装置和*** |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112101046A CN112101046A (zh) | 2020-12-18 |
CN112101046B true CN112101046B (zh) | 2022-04-29 |
Family
ID=73784585
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011200776.XA Active CN112101046B (zh) | 2020-11-02 | 2020-11-02 | 一种基于通话行为的会话分析方法、装置和*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112101046B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113112845B (zh) * | 2021-04-07 | 2022-10-14 | 苏州鱼得水电气科技有限公司 | 一种双工通信中的干扰抑制***及方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105007171A (zh) * | 2015-05-25 | 2015-10-28 | 上海欣方软件有限公司 | 基于通信领域大数据的用户数据分析***及方法 |
CN105701088A (zh) * | 2016-02-26 | 2016-06-22 | 北京京东尚科信息技术有限公司 | 从机器对话切换到人工对话的方法和装置 |
CN107799126A (zh) * | 2017-10-16 | 2018-03-13 | 深圳狗尾草智能科技有限公司 | 基于有监督机器学习的语音端点检测方法及装置 |
CN110688547A (zh) * | 2019-09-30 | 2020-01-14 | 浪潮软件集团有限公司 | 一种定制化图形展现的话单相互通话数据分析模型的方法 |
CN110782916A (zh) * | 2019-09-30 | 2020-02-11 | 北京淇瑀信息科技有限公司 | 一种多模态的投诉识别方法、装置和*** |
CN111405562A (zh) * | 2020-03-11 | 2020-07-10 | 中国科学院信息工程研究所 | 一种基于通信行为规律的移动恶意用户识别方法及*** |
CN111738774A (zh) * | 2020-06-30 | 2020-10-02 | 中国平安财产保险股份有限公司 | 识别潜在目标用户的方法、装置、计算机设备和存储介质 |
CN111739516A (zh) * | 2020-06-19 | 2020-10-02 | 中国—东盟信息港股份有限公司 | 一种针对智能客服通话的语音识别*** |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8725518B2 (en) * | 2006-04-25 | 2014-05-13 | Nice Systems Ltd. | Automatic speech analysis |
CN109740155A (zh) * | 2018-12-27 | 2019-05-10 | 广州云趣信息科技有限公司 | 一种客服***人工智能质检规则自我归纳模型的方法及*** |
CN110309967A (zh) * | 2019-06-27 | 2019-10-08 | 携程计算机技术(上海)有限公司 | 客服会话评分等级的预测方法、***、设备和存储介质 |
-
2020
- 2020-11-02 CN CN202011200776.XA patent/CN112101046B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105007171A (zh) * | 2015-05-25 | 2015-10-28 | 上海欣方软件有限公司 | 基于通信领域大数据的用户数据分析***及方法 |
CN105701088A (zh) * | 2016-02-26 | 2016-06-22 | 北京京东尚科信息技术有限公司 | 从机器对话切换到人工对话的方法和装置 |
CN107799126A (zh) * | 2017-10-16 | 2018-03-13 | 深圳狗尾草智能科技有限公司 | 基于有监督机器学习的语音端点检测方法及装置 |
CN110688547A (zh) * | 2019-09-30 | 2020-01-14 | 浪潮软件集团有限公司 | 一种定制化图形展现的话单相互通话数据分析模型的方法 |
CN110782916A (zh) * | 2019-09-30 | 2020-02-11 | 北京淇瑀信息科技有限公司 | 一种多模态的投诉识别方法、装置和*** |
CN111405562A (zh) * | 2020-03-11 | 2020-07-10 | 中国科学院信息工程研究所 | 一种基于通信行为规律的移动恶意用户识别方法及*** |
CN111739516A (zh) * | 2020-06-19 | 2020-10-02 | 中国—东盟信息港股份有限公司 | 一种针对智能客服通话的语音识别*** |
CN111738774A (zh) * | 2020-06-30 | 2020-10-02 | 中国平安财产保险股份有限公司 | 识别潜在目标用户的方法、装置、计算机设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112101046A (zh) | 2020-12-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107818798A (zh) | 客服服务质量评价方法、装置、设备及存储介质 | |
CN111212190B (zh) | 一种基于话术策略管理的对话管理方法、装置和*** | |
CN110648691B (zh) | 基于语音的能量值的情绪识别方法、装置和*** | |
CN111241357A (zh) | 对话训练方法、装置、***及存储介质 | |
CN111193834B (zh) | 基于用户声音特征分析的人机交互方法、装置和电子设备 | |
US9652999B2 (en) | Computer-implemented systems and methods for estimating word accuracy for automatic speech recognition | |
CN111179935B (zh) | 一种语音质检的方法和设备 | |
CN110704618B (zh) | 确定对话数据对应的标准问题的方法及装置 | |
CN111177186A (zh) | 基于问题检索的单句意图识别方法、装置和*** | |
CN110223134B (zh) | 基于语音识别的产品推荐方法及相关设备 | |
CN109376363A (zh) | 一种基于耳机的实时语音翻译方法及装置 | |
CN111370030A (zh) | 语音情感检测方法与装置、存储介质、电子设备 | |
CN111177351A (zh) | 基于规则的自然语言表达意图获取方法、装置和*** | |
CN113297365B (zh) | 一种用户意向判定方法、装置、设备及存储介质 | |
CN108091323A (zh) | 用于自语音中识别情感的方法与装置 | |
CN110265008A (zh) | 智能回访方法、装置、计算机设备及存储介质 | |
CN108053826B (zh) | 用于人机交互的方法、装置、电子设备及存储介质 | |
CN112101046B (zh) | 一种基于通话行为的会话分析方法、装置和*** | |
CN110782221A (zh) | 一种面试智能评测***及方法 | |
CN110782916B (zh) | 一种多模态的投诉识别方法、装置和*** | |
CN112017668B (zh) | 一种基于实时情感检测的智能语音对话方法、装置和*** | |
CN112599151B (zh) | 语速评估方法、***、设备及存储介质 | |
CN114067842B (zh) | 客户满意度鉴别方法及装置、存储介质及电子设备 | |
CN110910905A (zh) | 静音点检测方法及装置、存储介质、电子设备 | |
CN110619894B (zh) | 基于语音波形图的情绪识别方法、装置和*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |