CN105744090A - 语音信息处理方法及装置 - Google Patents

语音信息处理方法及装置 Download PDF

Info

Publication number
CN105744090A
CN105744090A CN201410748579.XA CN201410748579A CN105744090A CN 105744090 A CN105744090 A CN 105744090A CN 201410748579 A CN201410748579 A CN 201410748579A CN 105744090 A CN105744090 A CN 105744090A
Authority
CN
China
Prior art keywords
user
speech data
priority
described user
service
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410748579.XA
Other languages
English (en)
Inventor
凌青
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201410748579.XA priority Critical patent/CN105744090A/zh
Priority to US15/532,934 priority patent/US10708423B2/en
Priority to PCT/CN2015/096241 priority patent/WO2016091110A1/zh
Priority to KR1020177018385A priority patent/KR20170088997A/ko
Priority to EP15868151.0A priority patent/EP3232651A4/en
Priority to JP2017530753A priority patent/JP6538846B2/ja
Priority to KR1020197008942A priority patent/KR102284973B1/ko
Priority to SG11201704392QA priority patent/SG11201704392QA/en
Publication of CN105744090A publication Critical patent/CN105744090A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • H04M3/493Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
    • H04M3/4936Speech interaction details
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • H04M3/493Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
    • H04M3/51Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing
    • H04M3/5166Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing in combination with interactive voice response systems or voice portals, e.g. as front-ends
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/63Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for estimating an emotional state
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • H04M3/493Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
    • H04M3/4931Directory assistance systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
    • H04M3/51Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing
    • H04M3/523Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing with call distribution or queueing
    • H04M3/5232Call distribution algorithms
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
    • H04M3/527Centralised call answering arrangements not requiring operator intervention

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Psychiatry (AREA)
  • Hospice & Palliative Care (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Child & Adolescent Psychology (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Telephonic Communication Services (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本申请提供一种语音信息处理方法及装置。方法包括:获取用户的语音数据;对所述语音数据进行情感分析,以确定语音数据的优先级;根据语音数据的优先级,将所述用户接入对应的服务通道。本申请可以提高IVR的服务质量。

Description

语音信息处理方法及装置
【技术领域】
本申请涉及语音处理技术领域,尤其涉及一种语音信息处理方法及装置。
【背景技术】
随着互联网和通信技术的发展,用户可以通过网络或电话进行通信,在通信过程中咨询一些问题并获得相关答案。例如,越来越多的客服***采用互动式语音应答热线服务(InteractiveVoiceResponse,IVR)方式,与用户进行通信,以便用户咨询一些问题,并向用户提供相关答案。
使用IVR的过程包括:用户通过电话接入IVR的服务中心,根据服务中心的语音提示选择一种服务通道,并使用所选择的服务通道进行问题咨询,所选择的服务通道可以是人工服务通道或智能服务通道。目前,IVR的服务模式比较单一,服务方式不够灵活,导致IVR的服务质量较低。
【发明内容】
本申请的多个方面提供一种语音信息处理方法及装置,用以提高IVR的服务质量。
本申请的一方面,提供一种语音信息处理方法,包括:
获取用于描述用户所咨询的问题的语音数据;
对所述语音数据进行情感分析,以确定所述用户的优先级;
根据所述用户的优先级,将所述用户接入对应的服务通道。
本申请的另一方面,提供一种语音信息处理装置,包括:
获取模块,用于获取用于描述用户所咨询的问题的语音数据;
分析模块,用于对所述语音数据进行情感分析,以确定所述用户的优先级;
服务接入模块,用于根据所述用户的优先级,将所述用户接入对应的服务通道。
在本申请中,获取用户的语音数据,对该语音数据进行情感分析,以确定语音数据的优先级,根据语音数据的优先级,将用户接入对应的服务通道。与现有技术相比,本申请可以根据语音数据的优先级,将用户接入对应的服务通道,这样就可以灵活及时的将用户接入不同的服务通道,例如可以将语音数据的优先级较高的用户接入高优先级的服务通道,有利于提高用户体验和问题解决速率,同时扩展了IVR的服务模式,提高了服务的灵活性,有利于提高IVR的服务质量。
【附图说明】
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请一实施例提供的语音信息处理方法的流程示意图;
图2为本申请一实施例提供的步骤101的实施方式的流程示意图;
图3为本申请一实施例提供的步骤102的实施方式的流程示意图;
图4为本申请另一实施例提供的语音信息处理方法的流程示意图;
图5为本申请另一实施例提供的语音信息处理装置的结构示意图。
【具体实施方式】
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
图1为本申请一实施例提供的语音信息处理方法的流程示意图。如图1所示,该方法包括:
101、获取用户的语音数据。
102、对上述语音数据进行情感分析,以确定所述语音数据的优先级。
103、根据上述语音数据的优先级,将用户接入对应的服务通道。
本实施例提供一种语音信息处理方法,可由语音信息处理装置来执行。在具体实现上,语音信息处理装置可以是任何具有一定处理能力的装置或设备,并可应用于提供语音服务的客服***,如IVR中。
具体的,语音信息处理装置获取用户的语音数据,对语音数据进行情感分析,以确定语音数据的优先级,进而根据语音数据的优先级,将用户接入对应的服务通道。
值得说明的是,语音数据的优先级一定程度上可以表示或反映用户的优先级。
本实施例通过对语音数据进行情感分析,确定语音数据的优先级,可以根据语音数据的优先级灵活及时的将用户接入不同的服务通道,例如可以将语音数据的优先级较高的用户接入高优先级的服务通道,不再像现有技术那样根据语音提示由用户选择服务通道,扩展IVR的服务模式,提高了IVR的服务质量。
在一可选实施方式中,用户的语音数据可以是用于描述用户所咨询的问题的语音数据。
在实际应用中,各种应用一般都会提供客服***,用于向使用该应用的用户提供一种交流平台,以供用户进行问题咨询、相关信息的了解、以及意见反馈等。
在本实施例中,客服***提供至少一种服务通道(或服务方式),例如可以包括人工通道和智能通道,人工通道主要是指由客服人员以语音方式向用户提供服务的方式;智能通道是指非人工的服务方式,例如可包括在线聊天服务和在线自助服务等。
在本实施例中,对服务通道进行优先级划分。人工通道的优先级要高于智能通道的优先级。另外,人工通道进一步可以分为普通人工通道、专家人工通道等。专家人工通道的优先级高于普通人工通道的优先级。优先级越高的服务通道所提供的服务质量越好,例如专家人工通道所能提供的服务质量要高于普通人工通道。不同服务通道的服务质量可由所能解决问题的难以程度、服务态度、解决问题的速度以及解决问题的灵活性等多方面因素来确定。
一种在客服***中应用本实施例提供的方法的具体过程包括:当有用户需要咨询问题时,获取用于描述该用户所咨询的问题的语音数据,对该语音数据进行情感分析,获得用户在描述所咨询的问题时的情感,根据用户咨询问题时的情感确定语音数据的优先级,进而根据语音数据的优先级,将用户接入对应的服务通道。
由此可见,本实施例通过对用户咨询问题的语音数据进行情感分析,可通过语音数据的优先级体现用户的优先级,实现对用户的区分,进而将不同优先级的用户接入不同的服务渠道,有利于提高用户体验和问题解决速率,有利于提高客服***的服务质量。另外,与现有技术相比,本实施例提供的方法可以通过语音数据的优先级体现用户的优先级,相当于对用户进行了区分,例如可以将诉求比较迫切的用户优先接入人工通道,不再像现有技术那样统一对待所有用户,扩展了客服***的服务模式,提高了服务的灵活性。
在一可选实施方式中,步骤101的一种实现方式如图2所示,具体包括:
1011、接收用户的通话请求,以与用户进行语音通话。
1012、向用户播放语音提示音。
1013、接收用户在语音提示音的提示下发出的语音数据。
在一可选实施方式中,上述语音提示音可以是问题描述提示音,用于指示用户对所咨询的问题进行描述。相应的,用户可以在问题描述提示音的提示下发出用于描述所咨询的问题的语音数据。
详细来说,对于一些向用户提供语音服务的客服***,例如IVR,当用户向这些客服***咨询问题时,一般会通过手机、固话等通信终端拨打相应的客服热线,向客服***中的语音信息处理装置发送通话请求,语音信息处理装置接收通话请求,以与用户建立语音通话。之后,语音信息处理装置向用户播放问题描述提示音,以提示用户对所咨询的问题进行描述。例如,问题描述提示音可以是“请用一句话描述所咨询的问题”、“请问所要咨询的问题是什么”等类似语音。用户根据问题描述提示音,对所咨询的问题进行描述,形成描述所咨询的问题的语音数据。例如,语音数据可以是“我忘记密码了”、“输入账号和密码后无法正常登录”等类似语音。
值得说明的是,语音信息处理装置除了可以采用上述方式获得用于描述用户所咨询的问题的语音数据之外,还可以采用其他方式。例如,语音信息处理装置可以从其他设备(例如用户终端)上获取用于描述用户所咨询的问题的语音数据。
当语音信息处理装置获取到语音数据后,可以对语音数据进行情感分析,以确定语音数据的优先级。在一可选实施方式中,步骤102的一种实现方式如图3所示,具体包括:
1021、对语音数据进行情感分析,确定用户在发出语音数据时的音量和/或语速。
1022、根据上述音量和/或语速,获得用户的情感值。
1023、根据用户的情感值和预设的情感值与优先级映射关系,获得用户的优先级。
其中,情感分析属于语义分析中的一种,属于现有技术,各种可以分析出音量和语速的方法均适用于本实施例。举例说明,对语速的分析过程可以是:在获取到语音数据后,计算语音数据的短时平均振幅,然后根据短时平均振幅分析语音数据的起止点,计算出语音数据的语速。
声音是由若干(或无限多个)频率分量组成的。为了检测和描述声音的特性,一般使用频谱。因此对音量的分析过程可以是:把语音数据由时域信号转换为频域信号,划分倍频程,并把频域信号从绝对量值转换为相对量值,即分贝(DB),获得语音数据的音量。
语音信息处理装置通过对语音数据进行情感分析,获得用户描述所咨询的问题时的语速和/或音量。语速和音量可以反映用户的情感,例如着急、生气、平静等。
对于音量来说,当音量在0-20分贝之间时,很静、几乎感觉不到;当音量在20-40分贝之间时,安静、犹如轻声絮语,说明用户情绪比较平和;当音量在40-60分贝之间时,一般、普通室内谈话,说明用户情绪比较正常;当音量在60-70分贝之间时,吵闹、有损神经,说明用户情绪比较着急或生气。
对于语速来说,正常人在一般语境中每分钟的语速是70-90个字,若按照用一句话描述所咨询问题的时间是15秒钟计算,则应该在18个-23个字左右。若用户在咨询问题时的语速小于或在18-23个字左右,说明用户情感较为平和,可能所咨询问题不太着急;反之,若用户在咨询问题时的语速大于23个字,例如咨询问题时的语速在25个-32个字左右,说明用户情绪较为急躁,可能所咨询问题比较迫切。
基于此,语音信息处理装置在获得用户在描述所咨询的问题时的音量和/或语速之后,进一步根据音量和/或语速,获得用户的情感值。
可选的,可以对音量和/或语速进行数值处理,将数值处理的结果作为用户的情感值。数值处理的方式可以是加权平均或加权重等。
例如,一种实施方式包括:语音信息处理装置将音量与权重的乘积作为用户的情感值。当权重为1时,即可以直接将音量作为用户的情感值。
又例如,一种实施方式包括:语音信息处理装置将语速与权重的乘积作为用户的情感值。当权重为1时,即可以直接将语速作为用户的情感值。
又例如,一种实施方式包括:语音信息处理装置对音量和语速进行数值处理,将数值处理的结果作为用户的情感值。例如,语音信息处理装置将音量和语速相乘,将相乘的结果作为用户的情感值;或者,语音信息处理装置可以对音量和语速进行加权平均,将结果作为用户的情感值。数值处理方式并不限于相乘和加权平均。
得到用户的情感值之后,语音信息处理装置将用户的情感值在预设的情感值与优先级映射关系中进行匹配,将匹配中的优先级作为用户的优先级。
值得说明的是,情感值与优先级映射关系具体可以是:情感值范围与优先级的对应关系,例如情感值范围0-10对应优先级-1,情感值范围10-20对应优先级0,情感值范围20-30对应优先级1,情感值范围30以上对应优先级2。或者,情感值与优先级映射关系具体也可以是:情感值阈值与优先级的对应关系,例如情感值阈值10对应优先级-1,情感值阈值20对应优先级0,情感值阈值30对应优先级1,关于优先级2对应的情感值阈值不做限定。
在一可选实施方式中,语音信息处理装置预先设定了优先级与服务通道的映射关系,且服务通道包括人工通道和智能通道。进一步可选的,人工通道又可分为普通人工通道和专家人工通道。语音信息处理装置具体将用户的优先级在预设的优先级与服务通道的映射关系中进行匹配;当匹配到人工通道时,将用户接入人工通道,具体是将用户的呼叫请求转接到人工通道中某个客服人员的客户端上。当匹配到智能通道时,将用户接入智能通道,具体可由语音信息处理装置以语音播报的方式指导用户解决问题。
举例说明,优先级2对应专家人工通道;优先级1对应普通人工通道;优先级0和优先级-1对应智能通道。假设用户的优先级为2,则语音信息处理装置需要将用户接入专家人工通道。
进一步,语音信息处理装置还可以根据语音数据,生成解答用户所咨询的问题的参考信息,将该参考信息提供给人工通道对应的客服人员,以便于客服人员根据该参考信息向用户解答问题,提高解答问题的效率和质量。
上述生成参考信息的方式包括但不限于:语义信息处理装置对语音数据进行文本转换,对文本信息进行识别确定用户所咨询的问题所属的类别,并获取用户的账户信息,将用户所咨询问题所属的类别以及用户的账户信息进行动态组装生成参考信息。该参考信息可以语音形式的,也可以是文本形式的。
值得说明的是,虽然上述实施例重点说明了如何使用用户的优先级确定用户应该接入的服务通道,但本申请实施例并不限于单独使用用户的优先级确定用户应该接入的服务通道,用户的优先级还可以与其他信息相结合使用。举例说明,用户的优先级可以与现有IVR中已经实现的用于确定用户接入服务通道的方法(例如基于用户所咨询问题所属的类别确定用户应该接入的服务通道)相结合。具体结合方式可以包括:优先考虑用户的优先级,再考虑用户所咨询问题所属的类别;或者,可以优先考虑用户所咨询问题所属的类别,再考虑用户的优先级;或者,同时考虑用户所咨询问题所属的类别和用户的优先级。
下面图4所示实施例提供一种使用用户的优先级为用户确定服务通道的详细流程。图4所示实施例中的各模块具体可构成上述语音信息处理装置。
图4为本申请一实施例提供的语音信息处理方法的流程示意图。如图4所示,该方法包括:
21、互动式语音应答(InteractiveVoiceResponse,IVR)模块接收用户发送的通话请求,以与用户建立语音通话。
22、IVR模块向用户播放问题描述提示音,以提示用户对所咨询的问题进行描述。
23、IVR模块接收用户描述所咨询的问题产生的语音数据。
24、IVR模块将语音数据发送给支付宝算法平台(AlipayGeneralAlgorithmPlatform,AGAP)模块。
25、AGAP模块对语音数据进行情感分析,获得用户的音量和/或语速,并根据音量和/或语速获得用户的优先级,并将用户的优先级返回给IVR模块。
26、IVR模块将语音数据发送给自动语音识别技术(AutomaticSpeechRecognition,ASR)模块。
27、ASR模块对语音数据进行文本转换,获得文本信息,并将文本信息返回给IVR模块。
28、IVR模块将文本信息和用户的优先级提供给客服语音交互响应(CustomerServiceInteractiveVoiceResponse,CSIVR)模块。
29、CSIVR模块将文本信息发送给文本分析平台(AlipayTextAnalyze,ALITA)模块。
30、ALITA模块对文本信息进行语义分析,确定问题类别,并将所确定的问题类别返回给CSIVR模块。
31、CSIVR模块将用户的来电号码、身份证号等信息提供给用户信息文件(CustomerInformationFile,CIF)模块。
32、CIF模块根据用户的来电号码、身份证号码获取用户的账号信息,并将用户的账号信息返回给CSIVR模块。
33、CSIVR模块将用户的账户信息、问题类别和用户的优先级发送给精准服务平台(CustomerServiceAccurate,CSACCURATE)模块。
34、CSACCURATE模块根据用户的账户信息、问题类别和用户的优先级,确定用户对应的服务通道,并将所确定的服务通道的标识信息返回给CSIVR模块。
在该实施方式中,CSACCURATE模块同时考虑问题类别和用户的优先级,来决定用户应该接入的服务通道。
举例说明,假设根据用户所咨询问题所属的类别判定用户属于无效用户,且根据用户咨询问题时的音量和语速确定用户的优先级为-1,则可以将用户接入智能通道。假设根据用户所咨询问题所属的类别判定用户属于咨询类用户,且根据用户咨询问题时的音量和语速确定用户的优先级为0,则可以将用户接入智能通道。假设根据用户所咨询问题所属的类别判定用户属于业务诉求类用户,且根据用户咨询问题时的音量和语速确定用户的优先级为1,则可以将用户接入普通人工通道。假设根据用户所咨询问题所属的类别判定用户属于紧急诉求类用户,且根据用户咨询问题时的音量和语速确定用户的优先级为2,则可以将用户接入专家人工通道。
35、若服务通道是智能通道,则CSIVR模块根据用户的账户信息、问题类别和用户的优先级生成对应的语音播放资料,返回给IVR模块,以供IVR模块指导用户解决问题。
36、若服务通道是人工通道,则CSIVR模块根据用户的账户信息、问题类别和用户的优先级生成参考信息,将用户接入人工通道,同时将参考信息提供给人工通道中的客服人员。
在本实施例中,可以根据用户咨询问题时的情感,确定用户的优先级,基于优先级将用户接入对应的服务通道,这样就可以灵活及时的将不同优先级的用户接入不同的服务通道,例如可以将优先级较高的用户接入高优先级的服务通道,有利于提高用户体验和问题解决速率,同时扩展了IVR的服务模式,提高了服务的灵活性,有利于提高IVR的服务质量。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
图5为本申请一实施例提供的语音信息处理装置的结构示意图。如图5所示,该装置包括:获取模块51、分析模块52和服务接入模块53。
获取模块51,用于获取用户的语音数据。
分析模块52,与获取模块51连接,用于对获取模块51获取的语音数据进行情感分析,以确定语音数据的优先级。
服务接入模块53,与分析模块52连接,用于根据分析模块52确定的语音数据的优先级,将用户接入对应的服务通道。
值得说明的是,语音数据的优先级一定程度上可以表示或反映用户的优先级。
在一可选实施方式中,用户的语音数据可以是用于描述用户所咨询的问题的语音数据。
在一可选实施方式中,获取模块51具体用于:接收用户的通话请求,以与用户进行语音通话;向用户播放语音提示音;接收用户在语音提示音的提示下发出的语音数据。
在一可选实施方式中,上述语音提示音可以是问题描述提示音,用于指示用户对所咨询的问题进行描述。相应的,用户可以在问题描述提示音的提示下发出用于描述所咨询的问题的语音数据。
在一可选实施方式中,分析模块52具体用于:对语音数据进行情感分析,确定用户在发出语音数据时的音量和/或语速;根据音量和/或语速,获得用户的情感值;根据用户的情感值和预设的情感值与优先级映射关系,获得语音数据的优先级。
分析模块52具体用于:对语音数据进行情感分析,确定用户在发出语音数据时的音量和/或语速;对音量和/或语速进行数值处理,将数值处理的结果作为用户的情感值;根据用户的情感值和预设的情感值与优先级映射关系,获得语音数据的优先级。
在一可选实施方式中,服务接入模块具体用于:将语音数据的优先级在预设的优先级与服务通道的映射关系中进行匹配;当匹配到人工通道时,将用户接入人工通道。
在一可选实施方式中,该语音信息处理装置还包括:参考处理模块,用于根据语音数据,生成参考信息,并将参考信息提供给人工通道对应的客服人员。
值得说明的是,语音信息处理装置除了可以采用图5所示实现结构之外,还可以采用图2所示实施例中的实现结构,形成一个IVR***。
本实施例提供的语音信息处理装置,可以根据语音数据的优先级,将用户接入对应的服务通道,这样就可以灵活及时的将用户接入不同的服务通道,例如可以将语音数据的优先级较高的用户接入高优先级的服务通道,有利于提高用户体验和问题解决速率,同时扩展了IVR的服务模式,提高了服务的灵活性,有利于提高IVR的服务质量。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的***,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的***,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本申请各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(RandomAccessMemory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (12)

1.一种语音信息处理方法,其特征在于,包括:
获取用户的语音数据;
对所述语音数据进行情感分析,以确定所述语音数据的优先级;
根据所述语音数据的优先级,将所述用户接入对应的服务通道。
2.根据权利要求1所述的方法,其特征在于,所述获取用户的语音数据,包括:
接收所述用户的通话请求,以与所述用户进行语音通话;
向所述用户播放语音提示音;
接收所述用户在所述语音提示音的提示下发出的所述语音数据。
3.根据权利要求1所述的方法,其特征在于,所述对所述语音数据进行情感分析,以确定所述语音数据的优先级,包括:
对所述语音数据进行情感分析,确定所述用户在发出所述语音数据时的音量和/或语速;
根据所述音量和/或语速,获得所述用户的情感值;
根据所述用户的情感值和预设的情感值与优先级映射关系,获得所述语音数据的优先级。
4.根据权利要求3所述的方法,其特征在于,所述根据所述音量和/或语速,获得所述用户的情感值,包括:
对所述音量和/或语速进行数值处理,将数值处理的结果作为所述用户的情感值。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述根据所述语音数据的优先级,将所述用户接入对应的服务通道,包括:
将所述语音数据的优先级在预设的优先级与服务通道的映射关系中进行匹配;
当匹配到人工通道时,将所述用户接入所述人工通道。
6.根据权利要求5所述的方法,其特征在于,还包括:
根据所述语音数据,生成参考信息;
将所述参考信息提供给所述人工通道对应的客服人员。
7.一种语音信息处理装置,其特征在于,包括:
获取模块,用于获取用户的语音数据;
分析模块,用于对所述语音数据进行情感分析,以确定所述语音数据的优先级;
服务接入模块,用于根据所述语音数据的优先级,将所述用户接入对应的服务通道。
8.根据权利要求7所述的装置,其特征在于,所述获取模块具体用于:
接收所述用户的通话请求,以与所述用户进行语音通话;
向所述用户播放语音提示音;
接收所述用户在所述语音提示音的提示下发出的所述语音数据。
9.根据权利要求7所述的装置,其特征在于,所述分析模块具体用于:
对所述语音数据进行情感分析,确定所述用户在发出所述语音数据时的音量和/或语速;
根据所述音量和/或语速,获得所述用户的情感值;
根据所述用户的情感值和预设的情感值与优先级映射关系,获得所述语音数据的优先级。
10.根据权利要求9所述的装置,其特征在于,所述分析模块具体用于:
对所述语音数据进行情感分析,确定所述用户在发出所述语音数据时的音量和/或语速;
对所述音量和/或语速进行数值处理,将数值处理的结果作为所述用户的情感值;
根据所述用户的情感值和预设的情感值与优先级映射关系,获得所述语音数据的优先级。
11.根据权利要求7-10任一项所述的装置,其特征在于,所述服务接入模块具体用于:
将所述语音数据的优先级在预设的优先级与服务通道的映射关系中进行匹配;
当匹配到人工通道时,将所述用户接入所述人工通道。
12.根据权利要求11所述的装置,其特征在于,还包括:
参考处理模块,用于根据所述语音数据,生成参考信息,并将所述参考信息提供给所述人工通道对应的客服人员。
CN201410748579.XA 2014-12-09 2014-12-09 语音信息处理方法及装置 Pending CN105744090A (zh)

Priority Applications (8)

Application Number Priority Date Filing Date Title
CN201410748579.XA CN105744090A (zh) 2014-12-09 2014-12-09 语音信息处理方法及装置
US15/532,934 US10708423B2 (en) 2014-12-09 2015-12-03 Method and apparatus for processing voice information to determine emotion based on volume and pacing of the voice
PCT/CN2015/096241 WO2016091110A1 (zh) 2014-12-09 2015-12-03 语音信息处理方法及装置
KR1020177018385A KR20170088997A (ko) 2014-12-09 2015-12-03 음성 정보를 처리하기 위한 방법 및 장치
EP15868151.0A EP3232651A4 (en) 2014-12-09 2015-12-03 Method and apparatus for processing voice information
JP2017530753A JP6538846B2 (ja) 2014-12-09 2015-12-03 音声情報を処理するための方法及び装置
KR1020197008942A KR102284973B1 (ko) 2014-12-09 2015-12-03 음성 정보를 처리하기 위한 방법 및 장치
SG11201704392QA SG11201704392QA (en) 2014-12-09 2015-12-03 Method and apparatus for processing voice information

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410748579.XA CN105744090A (zh) 2014-12-09 2014-12-09 语音信息处理方法及装置

Publications (1)

Publication Number Publication Date
CN105744090A true CN105744090A (zh) 2016-07-06

Family

ID=56106695

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410748579.XA Pending CN105744090A (zh) 2014-12-09 2014-12-09 语音信息处理方法及装置

Country Status (7)

Country Link
US (1) US10708423B2 (zh)
EP (1) EP3232651A4 (zh)
JP (1) JP6538846B2 (zh)
KR (2) KR102284973B1 (zh)
CN (1) CN105744090A (zh)
SG (1) SG11201704392QA (zh)
WO (1) WO2016091110A1 (zh)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106534598A (zh) * 2016-10-28 2017-03-22 广东亿迅科技有限公司 一种基于情感识别的呼叫平台排队***及其实现方法
CN106791107A (zh) * 2016-12-22 2017-05-31 广东小天才科技有限公司 一种提醒方法及装置
CN107274893A (zh) * 2017-05-19 2017-10-20 四川新网银行股份有限公司 一种对客服***智能调整在线排队优先级的方法
CN107393541A (zh) * 2017-08-29 2017-11-24 百度在线网络技术(北京)有限公司 信息验证方法和装置
CN107767869A (zh) * 2017-09-26 2018-03-06 百度在线网络技术(北京)有限公司 用于提供语音服务的方法和装置
CN108632475A (zh) * 2018-03-22 2018-10-09 平安科技(深圳)有限公司 语音留言方法、装置、计算机设备和存储介质
CN108876177A (zh) * 2018-06-28 2018-11-23 北京博数嘉科技有限公司 一种旅游咨询管理平台及管理方法
CN109618068A (zh) * 2018-11-08 2019-04-12 上海航动科技有限公司 一种基于人工智能的语音业务推送方法、装置与***
CN109767240A (zh) * 2018-12-17 2019-05-17 中国平安财产保险股份有限公司 云客服分配方法、装置、计算机设备和存储介质
CN110289017A (zh) * 2019-06-06 2019-09-27 秒针信息技术有限公司 语音处理方法以及装置
CN110890096A (zh) * 2019-10-12 2020-03-17 深圳供电局有限公司 一种基于语音分析的智能语音***及方法
CN110970017A (zh) * 2018-09-27 2020-04-07 北京京东尚科信息技术有限公司 人机交互方法及***、计算机***
CN111161733A (zh) * 2019-12-31 2020-05-15 中国银行股份有限公司 一种智能语音服务的控制方法及装置
CN112309586A (zh) * 2019-07-26 2021-02-02 深圳百诺明医说科技有限公司 提高医疗机器人推送信息与用户病症适配度的方法及***
CN115910110A (zh) * 2022-11-30 2023-04-04 杭州网筌科技有限公司 一种基于自然语言识别的政务服务***
CN116580721A (zh) * 2023-07-13 2023-08-11 中国电信股份有限公司 表情动画的生成方法、装置和数字人平台

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107993674A (zh) * 2016-10-27 2018-05-04 中兴通讯股份有限公司 一种情绪控制方法及装置
CN107277246B (zh) * 2017-06-16 2018-12-28 珠海格力电器股份有限公司 一种信息提醒方法及其装置、电子设备
JP7103769B2 (ja) * 2017-09-05 2022-07-20 京セラ株式会社 電子機器、携帯端末、コミュニケーションシステム、見守り方法、およびプログラム
CN110149450A (zh) * 2019-05-22 2019-08-20 欧冶云商股份有限公司 智能客服应答方法及***
CN112040074B (zh) * 2020-08-24 2022-07-26 华院计算技术(上海)股份有限公司 基于语音声学信息的电话客服人员职业倦怠检测方法
WO2022054910A1 (ja) * 2020-09-14 2022-03-17 日本電気株式会社 接続装置、接続システム、接続方法等
CN112820323B (zh) * 2020-12-29 2023-06-16 平安银行股份有限公司 基于客户语音进行响应队列优先级调整方法及***

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1076329A3 (en) * 1999-08-10 2003-10-01 International Business Machines Corporation Personality data mining method using a speech based dialog
GB0322449D0 (en) * 2002-09-27 2003-10-29 Rockwell Electronic Commerce Method selecting actions or phases for an agent by analyzing conversation content and emotional inflection
CN101662549A (zh) * 2009-09-09 2010-03-03 中兴通讯股份有限公司 一种基于语音的客户评价***及客户评价方法
CN101741953A (zh) * 2009-12-21 2010-06-16 中兴通讯股份有限公司 一种通话时应用卡通动画显示语音信息的方法和装置
CN101997996A (zh) * 2009-08-13 2011-03-30 华为技术有限公司 一种排队路由的方法及装置
CN102082879A (zh) * 2009-11-27 2011-06-01 华为技术有限公司 呼叫中心语音检测的方法、装置及***
CN102142253A (zh) * 2010-01-29 2011-08-03 富士通株式会社 语音情感识别设备及方法
CN102623009A (zh) * 2012-03-02 2012-08-01 安徽科大讯飞信息技术股份有限公司 一种基于短时分析的异常情绪自动检测和提取方法和***
CN102802114A (zh) * 2012-06-20 2012-11-28 北京语言大学 利用语音进行座席筛选的方法及***
CN103811009A (zh) * 2014-03-13 2014-05-21 华东理工大学 一种基于语音分析的智能电话客服***

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5559927A (en) 1992-08-19 1996-09-24 Clynes; Manfred Computer system producing emotionally-expressive speech messages
US5860064A (en) * 1993-05-13 1999-01-12 Apple Computer, Inc. Method and apparatus for automatic generation of vocal emotion in a synthetic text-to-speech system
US6094635A (en) 1997-09-17 2000-07-25 Unisys Corporation System and method for speech enabled application
GB9723813D0 (en) * 1997-11-11 1998-01-07 Mitel Corp Call routing based on caller's mood
US6185534B1 (en) 1998-03-23 2001-02-06 Microsoft Corporation Modeling emotion and personality in a computer user interface
US6144938A (en) 1998-05-01 2000-11-07 Sun Microsystems, Inc. Voice user interface with personality
US7457397B1 (en) 1999-08-24 2008-11-25 Microstrategy, Inc. Voice page directory system in a voice page creation and delivery system
US7222075B2 (en) 1999-08-31 2007-05-22 Accenture Llp Detecting emotions using voice signal analysis
US6490564B1 (en) 1999-09-03 2002-12-03 Cisco Technology, Inc. Arrangement for defining and processing voice enabled web applications using extensible markup language documents
US6658388B1 (en) 1999-09-10 2003-12-02 International Business Machines Corporation Personality generator for conversational systems
US7140004B1 (en) 2000-06-13 2006-11-21 Tellme Networks, Inc. Method and apparatus for zero-footprint phone application development
US6757365B1 (en) 2000-10-16 2004-06-29 Tellme Networks, Inc. Instant messaging via telephone interfaces
US6795808B1 (en) 2000-10-30 2004-09-21 Koninklijke Philips Electronics N.V. User interface/entertainment device that simulates personal interaction and charges external database with relevant data
US20030007609A1 (en) 2001-07-03 2003-01-09 Yuen Michael S. Method and apparatus for development, deployment, and maintenance of a voice software application for distribution to one or more consumers
US7242752B2 (en) * 2001-07-03 2007-07-10 Apptera, Inc. Behavioral adaptation engine for discerning behavioral characteristics of callers interacting with an VXML-compliant voice application
WO2003073417A2 (en) 2002-02-26 2003-09-04 Sap Aktiengesellschaft Intelligent personal assistants
US7665024B1 (en) * 2002-07-22 2010-02-16 Verizon Services Corp. Methods and apparatus for controlling a user interface based on the emotional state of a user
US7676034B1 (en) 2003-03-07 2010-03-09 Wai Wu Method and system for matching entities in an auction
JP4197344B2 (ja) * 2006-02-20 2008-12-17 インターナショナル・ビジネス・マシーンズ・コーポレーション 音声対話システム
US20080086690A1 (en) 2006-09-21 2008-04-10 Ashish Verma Method and System for Hybrid Call Handling
JP2009182433A (ja) 2008-01-29 2009-08-13 Seiko Epson Corp コールセンターの情報提供システム、情報提供装置、情報提供方法及び情報提供プログラム
US20130051545A1 (en) * 2011-08-25 2013-02-28 Bank Of America Corporation Call center system for dynamic determination of appropriate representative
CN103413113A (zh) * 2013-01-15 2013-11-27 上海大学 一种服务机器人智能情感交互的方法
US10101974B2 (en) * 2014-07-31 2018-10-16 Angel.Com Incorporated Contact center application creating using reusable program modules

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1076329A3 (en) * 1999-08-10 2003-10-01 International Business Machines Corporation Personality data mining method using a speech based dialog
GB0322449D0 (en) * 2002-09-27 2003-10-29 Rockwell Electronic Commerce Method selecting actions or phases for an agent by analyzing conversation content and emotional inflection
CN101997996A (zh) * 2009-08-13 2011-03-30 华为技术有限公司 一种排队路由的方法及装置
CN101662549A (zh) * 2009-09-09 2010-03-03 中兴通讯股份有限公司 一种基于语音的客户评价***及客户评价方法
CN102082879A (zh) * 2009-11-27 2011-06-01 华为技术有限公司 呼叫中心语音检测的方法、装置及***
CN101741953A (zh) * 2009-12-21 2010-06-16 中兴通讯股份有限公司 一种通话时应用卡通动画显示语音信息的方法和装置
CN102142253A (zh) * 2010-01-29 2011-08-03 富士通株式会社 语音情感识别设备及方法
CN102623009A (zh) * 2012-03-02 2012-08-01 安徽科大讯飞信息技术股份有限公司 一种基于短时分析的异常情绪自动检测和提取方法和***
CN102802114A (zh) * 2012-06-20 2012-11-28 北京语言大学 利用语音进行座席筛选的方法及***
CN103811009A (zh) * 2014-03-13 2014-05-21 华东理工大学 一种基于语音分析的智能电话客服***

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106534598A (zh) * 2016-10-28 2017-03-22 广东亿迅科技有限公司 一种基于情感识别的呼叫平台排队***及其实现方法
CN106791107A (zh) * 2016-12-22 2017-05-31 广东小天才科技有限公司 一种提醒方法及装置
CN107274893A (zh) * 2017-05-19 2017-10-20 四川新网银行股份有限公司 一种对客服***智能调整在线排队优先级的方法
CN107393541A (zh) * 2017-08-29 2017-11-24 百度在线网络技术(北京)有限公司 信息验证方法和装置
CN107767869A (zh) * 2017-09-26 2018-03-06 百度在线网络技术(北京)有限公司 用于提供语音服务的方法和装置
WO2019179043A1 (zh) * 2018-03-22 2019-09-26 平安科技(深圳)有限公司 语音留言方法、装置、计算机设备和存储介质
CN108632475A (zh) * 2018-03-22 2018-10-09 平安科技(深圳)有限公司 语音留言方法、装置、计算机设备和存储介质
CN108876177A (zh) * 2018-06-28 2018-11-23 北京博数嘉科技有限公司 一种旅游咨询管理平台及管理方法
CN110970017A (zh) * 2018-09-27 2020-04-07 北京京东尚科信息技术有限公司 人机交互方法及***、计算机***
CN109618068A (zh) * 2018-11-08 2019-04-12 上海航动科技有限公司 一种基于人工智能的语音业务推送方法、装置与***
CN109618068B (zh) * 2018-11-08 2021-04-16 上海航动科技有限公司 一种基于人工智能的语音业务推送方法、装置与***
CN109767240A (zh) * 2018-12-17 2019-05-17 中国平安财产保险股份有限公司 云客服分配方法、装置、计算机设备和存储介质
CN110289017A (zh) * 2019-06-06 2019-09-27 秒针信息技术有限公司 语音处理方法以及装置
CN112309586A (zh) * 2019-07-26 2021-02-02 深圳百诺明医说科技有限公司 提高医疗机器人推送信息与用户病症适配度的方法及***
CN110890096A (zh) * 2019-10-12 2020-03-17 深圳供电局有限公司 一种基于语音分析的智能语音***及方法
CN111161733A (zh) * 2019-12-31 2020-05-15 中国银行股份有限公司 一种智能语音服务的控制方法及装置
CN115910110A (zh) * 2022-11-30 2023-04-04 杭州网筌科技有限公司 一种基于自然语言识别的政务服务***
CN116580721A (zh) * 2023-07-13 2023-08-11 中国电信股份有限公司 表情动画的生成方法、装置和数字人平台
CN116580721B (zh) * 2023-07-13 2023-09-22 中国电信股份有限公司 表情动画的生成方法、装置和数字人平台

Also Published As

Publication number Publication date
EP3232651A1 (en) 2017-10-18
KR20170088997A (ko) 2017-08-02
SG11201704392QA (en) 2017-06-29
JP6538846B2 (ja) 2019-07-03
WO2016091110A1 (zh) 2016-06-16
JP2018501721A (ja) 2018-01-18
US10708423B2 (en) 2020-07-07
US20170346947A1 (en) 2017-11-30
KR20190037363A (ko) 2019-04-05
EP3232651A4 (en) 2018-05-09
KR102284973B1 (ko) 2021-08-03

Similar Documents

Publication Publication Date Title
CN105744090A (zh) 语音信息处理方法及装置
US10057419B2 (en) Intelligent call screening
CN107818798A (zh) 客服服务质量评价方法、装置、设备及存储介质
CN108470034B (zh) 一种智能设备服务提供方法及***
US7398212B2 (en) System and method for quality of service management with a call handling system
US8417524B2 (en) Analysis of the temporal evolution of emotions in an audio interaction in a service delivery environment
US20050065790A1 (en) System and method using multiple automated speech recognition engines
CN108073600A (zh) 一种智能问答交互方法、装置以及电子设备
CN103714813A (zh) 短语辨认***和方法
US20180103152A1 (en) Systems and methods for producing build calls
CN111583931A (zh) 业务数据处理方法及装置
US11516341B2 (en) Telephone call screener based on call characteristics
CN115643341A (zh) 人工智能客服应答***
US20050096912A1 (en) System and method for interactive voice response enhanced out-calling
CN109545203A (zh) 语音识别方法、装置、设备和存储介质
CN116631412A (zh) 一种通过声纹匹配判断语音机器人的方法
CN101460994A (zh) 语音区分
CN114328867A (zh) 一种人机对话中智能打断的方法及装置
CN112087726B (zh) 彩铃识别的方法及***、电子设备及存储介质
JP7304627B2 (ja) 留守番電話判定装置、方法及びプログラム
US10057418B1 (en) Managing telephone interactions of a user and an agent
US20210127002A1 (en) Automatic nuisance call management
CN112185383A (zh) 一种用于客服回访的处理方法及***
CN114065742B (zh) 一种文本检测方法和装置
CN110125946B (zh) 自动通话方法、装置、电子设备及计算机可读介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20160706

RJ01 Rejection of invention patent application after publication