CN113158692B - 基于语义识别的多意图处理方法、***、设备及存储介质 - Google Patents

基于语义识别的多意图处理方法、***、设备及存储介质 Download PDF

Info

Publication number
CN113158692B
CN113158692B CN202110435537.0A CN202110435537A CN113158692B CN 113158692 B CN113158692 B CN 113158692B CN 202110435537 A CN202110435537 A CN 202110435537A CN 113158692 B CN113158692 B CN 113158692B
Authority
CN
China
Prior art keywords
intention
type
target
operation flow
intents
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110435537.0A
Other languages
English (en)
Other versions
CN113158692A (zh
Inventor
陈林
何浩峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Property and Casualty Insurance Company of China Ltd
Original Assignee
Ping An Property and Casualty Insurance Company of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Property and Casualty Insurance Company of China Ltd filed Critical Ping An Property and Casualty Insurance Company of China Ltd
Priority to CN202110435537.0A priority Critical patent/CN113158692B/zh
Publication of CN113158692A publication Critical patent/CN113158692A/zh
Application granted granted Critical
Publication of CN113158692B publication Critical patent/CN113158692B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Machine Translation (AREA)

Abstract

本发明涉及语音识别领域,提供了一种基于语义识别的多意图处理方法,所述方法包括:接收待识别语音,并对所述待识别语音进行转写操作以得到待识别文本;将所述待识别文本拆分为多个目标文本;通过预先训练好的语义识别模型,识别每个目标文本对应的目标意图,以得到多个目标意图;获取各个所述目标意图的意图类型,并根据各个所述目标意图的意图类型确定目标操作策略;及基于所述目标操作策略确定一个或多个操作流程,以基于所述一个或多个操作流程执行响应操作。本发明提高了意图识别的效率、准确率和语音交互效率,使得语音回复***更加拟人化,提高了用户体验。

Description

基于语义识别的多意图处理方法、***、设备及存储介质
技术领域
本发明实施例涉及语音识别领域,尤其涉及一种基于语义识别的多意图处理方法、***、设备及存储介质。
背景技术
目前意图识别有几大难点,第一,语音识别***很难精准识别用户意图;第二,用户的一句话中如果存在多种意思,语音识别***无法很好处理,或者处理的不是用户核心意思;第三,问题处理不完整,无法全面处理用户的多个意思。基于以上几点,现有语音识别***在语音交互中,往往会出现文不对题、避重就轻、无法处理用户核心意思等问题,或当出现多个意图时只回复其中一个意图,而无法全面处理的问题。因此,如何提高意图识别的准确率,从而提高语音交互效率,成为了当前亟需解决的技术问题。
发明内容
有鉴于此,有必要提供一种基于语义识别的多意图处理方法、***、设备及可读存储介质,以解决意图识别的准确率低、语音交互的效率低的问题。
为实现上述目的,本发明实施例提供了一种基于语义识别的多意图处理方法,所述方法步骤包括:
接收待识别语音,并对所述待识别语音进行转写操作,以得到待识别文本;
将所述待识别文本拆分为多个目标文本;
通过预先训练好的语义识别模型,识别每个目标文本对应的目标意图,以得到多个目标意图;
获取各个所述目标意图的意图类型,并根据各个所述目标意图的意图类型确定目标操作策略;及
基于所述目标操作策略确定一个或多个操作流程,以基于所述一个或多个操作流程执行响应操作。
示例性的,所述意图类型包括结束型意图、主干型意图和异议型意图中的至少一个,其中,所述异议型意图包括可解决型意图、无法解决型意图和不用解决型意图中的至少一个;
所述根据各个所述目标意图的意图类型确定目标操作策略的步骤,包括:
根据所述各个目标意图的意图类型和预先配置的操作优先级,确定所述目标操作策略;
其中,所述操作优先级为各个目标意图的操作流程所对应的执行顺序,各个操作流程的执行顺序为:结束型意图的操作流程、无法解决型意图的操作流程、主干型意图的操作流程、可解决型意图的操作流程、不用解决型意图的操作流程。
示例性的,所述根据各个所述目标意图的意图类型确定目标操作策略的步骤,包括:
当各个所述目标意图的意图类型中存在所述结束型意图时,将执行所述结束型意图的操作流程确定为所述目标操作策略。
示例性的,所述根据各个所述目标意图的意图类型确定目标操作策略的步骤,包括:
当各个所述目标意图的意图类型中不存在所述结束型意图时,判断是否存在所述异议型意图;
若存在所述异议型意图,则检测所述异议型意图是否包括所述可解决型意图;
若所述异议型意图包括所述可解决型意图,则将优先执行所述可解决型意图的操作流程,然后根据所述操作优先级执行所述无法解决型意图的操作流程、所述主干型意图的操作流程和所述不用解决型意图的操作流程中当前操作优先级最高的操作流程确定为所述目标操作策略;及
若所述异议型意图不包括所述可解决型意图,则将根据所述操作优先级执行所述无法解决型意图的操作流程、所述主干型意图的操作流程和所述不用解决型意图的操作流程中当前操作优先级最高的操作流程确定为所述目标操作策略。
示例性的,所述根据所述操作优先级执行所述无法解决型意图的操作流程、所述主干型意图的操作流程和所述不用解决型意图的操作流程中当前操作优先级最高的操作流程的步骤,包括:
当所述当前操作优先级最高的操作流程为所述无法解决型意图的操作流程,且所述多个目标意图中包括按照预设顺序排列的多个无法解决型意图时,则执行所述多个无法解决型意图中最后一个无法解决型意图的操作流程,所述预设顺序包括各个无法解决型意图所对应的目标文本在所述待识别文本中的位置顺序;
当所述当前操作优先级最高的操作流程为所述主干型意图的操作流程,且所述多个目标意图中包括按照所述预设顺序排列的多个主干型意图时,则执行所述多个主干型意图中最后一个主干型意图的操作流程,所述预设顺序还包括各个主干型意图所对应的目标文本在所述待识别文本中的位置顺序;及
当所述当前操作优先级最高的操作流程为所述不用解决型意图的操作流程,且所述多个目标意图中包括按照所述预设顺序排列的多个不用解决型意图时,则执行所述多个不用解决型意图中最后一个不用解决型意图的操作流程,所述预设顺序还包括各个不用解决型意图所对应的目标文本在所述待识别文本中的位置顺序。
示例性的,所述响应操作包括播放操作和后续操作,其中,每种意图类型的操作流程对应一种播放操作,每种播放操作对应一种后续操作;
所述基于所述目标操作策略确定一个或多个操作流程,以基于所述一个或操作流程执行响应操作的步骤,包括:
根据各个所述操作流程执行对应的播放操作;及
根据各个所述播放操作中的最后一个播放操作,确定并执行该最后一个播放操作对应的后续操作。
示例性的,还包括:将所述目标操作策略上传到区块链。
为实现上述目的,本发明实施例还提供了一种基于语义识别的多意图处理***,包括:
接收模块,用于接收待识别语音,并对所述待识别语音进行转写操作,以得到待识别文本;
拆分模块,用于将所述待识别文本拆分为多个目标文本;
识别模块,用于通过预先训练好的语义识别模型,识别每个目标文本对应的目标意图,以得到多个目标意图;
确定模块,用于获取各个所述目标意图的意图类型,并根据各个所述目标意图的意图类型确定目标操作策略;及
执行模块,用于基于所述目标操作策略确定一个或多个操作流程,以基于所述一个或多个操作流程执行响应操作。
为实现上述目的,本发明实施例还提供了一种计算机设备,所述计算机设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被处理器执行时实现如上述的基于语义识别的多意图处理方法的步骤。
为实现上述目的,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序可被至少一个处理器所执行,以使所述至少一个处理器执行如上述的基于语义识别的多意图处理方法的步骤。
本发明实施例提供的基于语义识别的多意图处理方法、***、计算机设备及计算机可读存储介质,本实施例通过对待识别文本进行断句,并对断句后的多个目标短句进行意图识别,解决了因待识别文本中文字较多,或待识别文本中有交叉、矛盾、反转等意图,导致意图识别困难的问题,提高了识别待识别文本意图的准确率、降低了识别待识别文本意图的难度、提高了意图识别的效率;根据各个目标意图的意图类型配置目标操作策略,并根据目标操作策略调整执行各个目标意图操作的操作流程,以便针对不同意图执行不同回复的操作流程,如,可以针对较为重要的意图类型执行重点回复的操作流程、针对次要的意图类型执行选择回复的操作流程、针对不重要的意图类型执行不回复的操作流程,以减少对一些语音意图的回复,提高了语音交互的效率,使得语音回复***更加拟人化,提高了用户体验。
附图说明
图1为本发明实施例基于语义识别的多意图处理方法的流程示意图;
图2为本发明基于语义识别的多意图处理***实施例二的程序模块示意图;
图3为本发明计算机设备实施例三的硬件结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在本发明中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
实施例一
参阅图1,示出了本发明实施例之基于语义识别的多意图处理方法的步骤流程图。可以理解,本方法实施例中的流程图不用于对执行步骤的顺序进行限定。本实施例中的基于语义识别的多意图处理***可以被执行在计算机设备2中,下面以计算机设备2为执行主体进行示例性描述。具体如下。
步骤S100,接收待识别语音,并对所述待识别语音进行转写操作以得到待识别文本。
计算机设备2可以接收待识别语音,并对所述待识别语音进行转写操作,以得到的所述待识别文本。其中,所述待识别语音也可以是计算机设备2实时获取得到的;如在智能客服的场景中,计算机设备2可以实时获取所述智能客服所服务的服务对象(目标客户)的通话语音。所述待识别语音可以是所述目标客户的第N句语音,所述待识别语音还可以一个语音片段。
示例性的,计算机设备2可以对所述待识别语音进行转写操作,以得到多个语音文本;然后计算每个语音文本与所述待识别语音之间匹配度;并将所述多个语音文本中与所述待识别语音匹配度最高的语音文本作为所述待识别文本。其中,计算机设备2计算每个语音文本w和所述待识别语音之间的匹配度,具体可以将与所述待识别语音匹配度最高的语音文本作为所述待识别文本
通过贝叶斯公式可以将p(w|x)转换为p(x|w)p(w)进行计算其中,p(x|w)表示声学模型;p(w)表示语言模型;p(x)表示声学特征概率,对于不同的w该量是常值,在计算/>时可以忽略。本实施例通过从所述多个语音文本中获取与所述待识别语音匹配度最高的待识别文本,提高了语音识别的转写正确率。
步骤S102,将所述待识别文本拆分为多个目标文本。
当得到所述待识别文本后,计算机设备2可以对所述待识别文本进行断句操作,以得到所述多个目标文本。
步骤S104,通过预先训练好的语义识别模型,识别每个目标文本对应的目标意图,以得到多个目标意图。
当得到所述多个目标文本后,计算机设备2可以将所述多个目标文本输入到所述语义识别模型中,以通过所述语义识别模型对所述各个目标文本进行语义识别,并输出所述多个目标文本对应的多个目标意图。其中,所述语义识别模型可以是训练好的NLP(意图识别:Natural Language Processing)识别模型。
步骤S106,获取各个所述目标意图的意图类型,并根据各个所述目标意图的意图类型确定目标操作策略。
所述多个目标意图的意图类型包括结束型意图、主干型意图和异议型意图中的至少一个,其中,所述异议型意图包括可解决型意图、无法解决型意图和不用解决型意图中的至少一个。其中:
所述结束型意图为:存在通话结束语的语音对应的意图;
所述主干型意图为:整个待识别文本对应的主干话题对应的意图;
所述可解决型意图为:类似询问类意图,该意图在大多数情况下,都可以用固定解决语音进行回复的意图;
所述无法解决型意图为:疑难问题对应的意图,当前无法解决的意图;
所述不用解决型意图为:类似附和型语音对应的意图,没有太多实际意义或者属于因果关系的结果类意图。
示例性的,计算机设备2可以根据各个目标意图携带标签确定每个目标意图的意图类型。在本实施例中,在识别目标文本对应的目标意图时,所述语义识别模型还可以确定该意图的意图类型,并根据各个目标意图的意图类型为每个目标意图配置对应的意图标签,其中,一种意图类型对应一种意图标签。
在示例性的实施例中,所述步骤S106还可以包括:根据所述各个目标意图的意图类型和预先配置的操作优先级,确定所述目标操作策略;其中,所述操作优先级为各个目标意图的操作流程所对应的执行顺序,各个操作流程的执行顺序为:结束型意图的操作流程、无法解决型意图的操作流程、主干型意图的操作流程、可解决型意图的操作流程、不用解决型意图的操作流程。本实施例通过对语音意图进行分类,并为不同的语音类型的配置不同的优先级,以便对多个目标意图中的优先级高的意图进行优先回复,提高了语音***的智能回复效率。
在示例性的实施例中,所述步骤S106还可以进一步的包括:当各个所述目标意图的意图类型中存在所述结束型意图时,将执行所述结束型意图的操作流程确定为所述目标操作策略。所述结束型意图的操作流程为结束通话流程,具体的,当所述待识别文本中的其中一个语音意图为所述结束型意图时,例如,在智能客服的场景中,所述结束型意图为目标用户的要结束通话的意图,如当所述待识别文本存在“我挂了”、“我先挂了”、“再见”等词语时,则该所述待识别文本存在所述结束型意图,即,该目标用户当前无法继续保持通话。此时,计算机设备2可以执行结束通话流程;其中,当目标用户没有立即挂断,则播放预先配置好的回复语音(话术)。
在示例性的实施例中,所述步骤S106还可以进一步的包括步骤S200~步骤S204,其中:步骤S200,当各个所述目标意图的意图类型中不存在所述结束型意图时,判断是否存在所述异议型意图;若存在所述异议型意图,则检测所述异议型意图是否包括所述可解决型意图;步骤S202,若所述异议型意图包括所述可解决型意图,则将优先执行所述可解决型意图的操作流程,然后根据所述操作优先级执行所述无法解决型意图的操作流程、所述主干型意图的操作流程和所述不用解决型意图的操作流程中当前操作优先级最高的操作流程确定为所述目标操作策略;及步骤S204,若所述异议型意图不包括所述可解决型意图,则将根据所述操作优先级执行所述无法解决型意图的操作流程、所述主干型意图的操作流程和所述不用解决型意图的操作流程中当前操作优先级最高的操作流程确定为所述目标操作策略。
示例性的,计算机设备2可以预先配置语音回复库,其中,所述语音回复库包括多个解答型语音和多个回复型语音。所述多个解答型语音用于回复所述可解决型意图,所述多个回复型语音用于回复各个解答型语音无法解答的语音意图。
当检测到所述异议型意图包括所述可解决型意图时,所述可解决型意图的操作流程为:计算机设备2先从所述多个解答型语音中匹配与所述可解决型意图对应的一个或多个解答型语音,然后根据操作优先级从所述多个回复型语音匹配与当前操作优先级的语音意图对应的回复型语音,并优先播放所述一个或多个解答型语音,然后播放当前操作优先级的语音意图对应的回复型语音。其中,所述当前操作优先级的语音意图可以是无法解决型意图、主干型意图、可解决型意图、不用解决型意图中的其中一个。其中,所述可解决型意图对应的语音文本一般以疑问句的形式出现,且这些疑问句为预先解决过的问题。如,你是谁(对应的意图为:询问身份),你打电话找我干什么(对应的意图为:询问来电目的)。
当检测到所述异议型意图不包括所述可解决型意图时,则当前操作流程为:计算机设备2根据操作优先级从所述多个回复型语音匹配与当前操作优先级的语音意图对应的回复型语音,并播放当前操作优先级的语音意图对应的回复型语音。
在示例性的实施例中,所述步骤S204还可以进一步的包括步骤S300~步骤S304,其中:步骤S300,当所述当前操作优先级最高的操作流程为所述无法解决型意图的操作流程,且所述多个目标意图中包括按照预设顺序排列的多个无法解决型意图时,则执行所述多个无法解决型意图中最后一个无法解决型意图的操作流程,所述预设顺序包括各个无法解决型意图所对应的目标文本在所述待识别文本中的位置顺序;步骤S302,当所述当前操作优先级最高的操作流程为所述主干型意图的操作流程,且所述多个目标意图中包括按照所述预设顺序排列的多个主干型意图时,则执行所述多个主干型意图中最后一个主干型意图的操作流程,所述预设顺序还包括各个主干型意图所对应的目标文本在所述待识别文本中的位置顺序;及步骤S304,当所述当前操作优先级最高的操作流程为所述不用解决型意图的操作流程,且所述多个目标意图中包括按照所述预设顺序排列的多个不用解决型意图时,则执行所述多个不用解决型意图中最后一个不用解决型意图的操作流程,所述预设顺序还包括各个不用解决型意图所对应的目标文本在所述待识别文本中的位置顺序。本实施例通过执行所述多个同种类型意图中最后一个意图的操作流程,提高了语音回复效率。
步骤S108,基于所述目标操作策略确定一个或多个操作流程,以基于所述一个或多个操作流程执行响应操作。
在示例性的实施例中,所述响应操作包括播放操作和后续操作,其中,每种意图类型的操作流程对应一种播放操作,每种播放操作对应一种后续操作;所述步骤S108还可以进一步的包括步骤S400~步骤S402,其中:步骤S400,根据各个所述操作流程执行对应的播放操作;及步骤S402,根据各个所述播放操作中的最后一个播放操作,确定并执行该最后一个播放操作对应的后续操作。本实施例通过执行所述多个同种类型意图中最后一个意图的操作流程,提高了语音回复效率。
本实施例通过对长句(待识别文本)进行断句,并对断句后的多个目标短句进行意图识别,其中,通过对断句后的短句进行意图识别,避免因长句文字多,意图难识别,或者长句中有交叉、矛盾、反转等意图,导致出现维护长句意图库困难的问题或意图识别容易错乱的问题;提高了意图识别效率和准确率。本实施例还可以通过为各个目标意图对应的操作优先级,以调整各个目标意图操作流程(如,通过解答型语音或回复型语音对各种类型意图实现针对性回复和/或多样性回复,同时通过操作优先级配置实现对操作流程的多样性控制),使得语音回复***更加拟人化,从而提高目标用户的用户体验。
为了使本实施例更加清晰,本实施例还提供了一个目标操作策略的具体实例表,如表1所示:
表1
在表1中,“结束”为所述待识别文本对应的多个目标意图中包括一个或多个结束型意图;“主干”为所述待识别文本对应的多个目标意图中包括一个或多个主干型意图;“异议”为所述待识别文本对应的多个目标意图中包括一个或多个异议型意图;“无”为所述待识别文本对应的多个目标意图中包括一个或多个无法解决型意图;“可”为所述待识别文本对应的多个目标意图中包括一个或多个可解决型意图;“不”为所述待识别文本对应的多个目标意图中包括一个或多个不用解决型意图。
在表1的播放操作中,播放一为:依次播放可解决型意图对应的解答型语音;播放二为:播最后一个无法解决型意图对应的回复型语音;播放三为:播最后一个不用解决型意图对应的回复型语音;播放四为:播最后一个主干型意图对应的回复型语音;播放五为:播结束型意图对应的回复型语音,并结束通话。
在表1的后续操作中,操作一为:播放一对应的后续操作;操作二为:播放二对应的后续操作;操作三为:播放三对应的后续操作;操作四为:播放四对应的后续操作。
为了方便理解,本实施例还提供了一个具体实例:
所述待识别文本:“你是谁你打电话找我干什么我现在在开会这会儿不方便说话”。
所述待识别文本对应的多个目标文本:你是谁/你打电话找我干什么/我现在在开会/这会儿不方便说话(以/进行断句)。
各个目标文本对应的意图:你是谁-询问身份/你打电话找我干什么-询问来电目的/我现在在开会-在开会/这会儿不方便说话-没有时间。
可解决型意图:询问身份/询问来电目的。
无法解决型意图:在开会。
不用解决型意图:没有时间。
解决语音:我是XX公司的,来电话是因为XXXX事情,如果您现在开会的话,那我晚点联系您可以么。
所述待识别文本对应的目标操作策略为:计算机设备2先从所述多个解答型语音匹配与“询问身份”和“询问来电目的”对应的两个解答语音,然后从多个回复型语音匹配与“在开会”对应的回复语音,并播放与“询问身份”和“询问来电目的”对应的两个解答语音和与“在开会”对应的回复语音。
播放操作对应播放的语音为:我是XX公司的,来电话是因为XXXX事情,如果您现在开会的话,那我晚点联系您可以么。
后续操作:等待目标用户再次回复。
示例性的,所述基于语义识别的多意图处理方法还包括:将所述目标操作策略上传到区块链。
示例性的,将所述目标操作策略上传至区块链可保证其安全性和公正透明性。本示例所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
实施例二
图2为本发明基于语义识别的多意图处理***实施例二的程序模块示意图。基于语义识别的多意图处理***20可以包括或被分割成一个或多个程序模块,一个或者多个程序模块被存储于存储介质中,并由一个或多个处理器所执行,以完成本发明,并可实现上述基于语义识别的多意图处理方法。本发明实施例所称的程序模块是指能够完成特定功能的一系列计算机程序指令段,比程序本身更适合于描述基于语义识别的多意图处理***20在存储介质中的执行过程。以下描述将具体介绍本实施例各程序模块的功能:
接收模块200,接收待识别语音,并对所述待识别语音进行转写操作,以得到待识别文本。
拆分模块202,用于将所述待识别文本拆分为多个目标文本。
识别模块204,用于通过预先训练好的语义识别模型,识别每个目标文本对应的目标意图,以得到多个目标意图。
确定模块206,用于获取各个所述目标意图的意图类型,并根据各个所述目标意图的意图类型确定目标操作策略。
示例性的,所述意图类型包括结束型意图、主干型意图和异议型意图中的至少一个,其中,所述异议型意图包括可解决型意图、无法解决型意图和不用解决型意图中的至少一个;所述确定模块204,还用于:根据所述各个目标意图的意图类型和预先配置的操作优先级,确定所述目标操作策略;其中,所述操作优先级为各个目标意图的操作流程的优先执行权,所述操作优先级对应的意图类型的顺序为:结束型意图、无法解决型意图、主干型意图、可解决型意图、不用解决型意图。
示例性的,所述确定模块206,还用于:当各个所述目标意图的意图类型中存在所述结束型意图时,所述目标操作策略为:执行所述结束型意图的操作流程。
示例性的,所述确定模块206,还用于:当各个所述目标意图的意图类型中不存在所述结束型意图时,判断是否存在所述异议型意图;若存在所述异议型意图,则检测所述异议型意图是否包括所述可解决型意图;若所述异议型意图包括所述可解决型意图,则所述目标操作策略为:优先执行所述可解决型意图的操作流程,然后根据所述操作优先级执行所述无法解决型意图的操作流程、所述主干型意图的操作流程和所述不用解决型意图的操作流程中的其中一个操作流程;及若所述异议型意图不包括所述可解决型意图,则所述目标操作策略为:根据所述操作优先级执行所述无法解决型意图的操作流程、所述主干型意图的操作流程和所述不用解决型意图的操作流程中的其中一个操作流程。
示例性的,所述确定模块206,还用于:当所述当前操作优先级最高的操作流程为所述无法解决型意图的操作流程,且所述多个目标意图中包括按照预设顺序排列的多个无法解决型意图时,则执行所述多个无法解决型意图中最后一个无法解决型意图的操作流程,所述预设顺序包括各个无法解决型意图所对应的目标文本在所述待识别文本中的位置顺序;当所述当前操作优先级最高的操作流程为所述主干型意图的操作流程,且所述多个目标意图中包括按照所述预设顺序排列的多个主干型意图时,则执行所述多个主干型意图中最后一个主干型意图的操作流程,所述预设顺序还包括各个主干型意图所对应的目标文本在所述待识别文本中的位置顺序;及当所述当前操作优先级最高的操作流程为所述不用解决型意图的操作流程,且所述多个目标意图中包括按照所述预设顺序排列的多个不用解决型意图时,则执行所述多个不用解决型意图中最后一个不用解决型意图的操作流程,所述预设顺序还包括各个不用解决型意图所对应的目标文本在所述待识别文本中的位置顺序。
执行模块208,用于基于所述目标操作策略确定一个或多个操作流程,以基于所述一个或多个操作流程执行响应操作。
示例性的,所述响应操作包括播放操作和后续操作,其中,每种意图类型的操作流程对应一种播放操作,每种播放操作对应一种后续操作;所述执行模块208,还用于:根据各个所述操作流程执行对应的播放操作;及根据各个所述播放操作中的最后一个播放操作,确定并执行该最后一个播放操作对应的后续操作。
示例性的,所述基于语义识别的多意图处理***20还包括,上传模块,所述上传模块,用于将所述目标操作策略上传到区块链中。
实施例三
参阅图3,是本发明实施例三之计算机设备的硬件架构示意图。本实施例中,计算机设备2是一种能够按照事先设定或者存储的指令,自动进行数值计算和/或信息处理的设备。该计算机设备2可以是机架式服务器、刀片式服务器、塔式服务器或机柜式服务器(包括独立的服务器,或者多个服务器所组成的服务器集群)等。如图所示,计算机设备2至少包括,但不限于,可通过***总线相互通信连接存储器21、处理器22、网络接口23、以及基于语义识别的多意图处理***20。
本实施例中,存储器21至少包括一种类型的计算机可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,存储器21可以是计算机设备2的内部存储单元,例如该计算机设备2的硬盘或内存。在另一些实施例中,存储器21也可以是计算机设备2的外部存储设备,例如该计算机设备2上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。当然,存储器21还可以既包括计算机设备2的内部存储单元也包括其外部存储设备。本实施例中,存储器21通常用于存储安装于计算机设备2的操作***和各类应用软件,例如实施例二的基于语义识别的多意图处理***20的程序代码等。此外,存储器21还可以用于暂时地存储已经输出或者将要输出的各类数据。
处理器22在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器22通常用于控制计算机设备2的总体操作。本实施例中,处理器22用于运行存储器21中存储的程序代码或者处理数据,例如运行基于语义识别的多意图处理***20,以实现实施例一的基于语义识别的多意图处理方法。
所述网络接口23可包括无线网络接口或有线网络接口,该网络接口23通常用于在计算机设备2与其他电子装置之间建立通信连接。例如,所述网络接口23用于通过网络将计算机设备2与外部终端相连,在计算机设备2与外部终端之间的建立数据传输通道和通信连接等。所述网络可以是企业内部网(Intranet)、互联网(Internet)、全球移动通讯***(Global System of Mobile communicatI/On,GSM)、宽带码分多址(Wideband CodeDivisI/On Multiple Access,WCDMA)、4G网络、5G网络、蓝牙(Bluetooth)、Wi-Fi等无线或有线网络。
需要指出的是,图3仅示出了具有部件20-23的计算机设备2,但是应理解的是,并不要求实施所有示出的部件,可以替代的实施更多或者更少的部件。
在本实施例中,存储于存储器21中的基于语义识别的多意图处理***20还可以被分割为一个或者多个程序模块,所述一个或者多个程序模块被存储于存储器21中,并由一个或多个处理器(本实施例为处理器22)所执行,以完成本发明。
例如,图2示出了本发明实施例二之所述实现基于语义识别的多意图处理***20的程序模块示意图,该实施例中,所述基于语义识别的多意图处理***20可以被划分为接收模块200、拆分模块202、识别模块204、确定模块206和执行到模块208。其中,本发明所称的程序模块是指能够完成特定功能的一系列计算机程序指令段,比程序更适合于描述所述基于语义识别的多意图处理***20在计算机设备2中的执行过程。所述程序模块200-208的具体功能在实施例二中已有详细描述,在此不再赘述。
实施例四
本实施例还提供一种计算机可读存储介质,如闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘、服务器、App应用商城等等,其上存储有计算机程序,程序被处理器执行时实现相应功能。本实施例的计算机可读存储介质用于基于语义识别的多意图处理***20,被处理器执行时实现实施例一的基于语义识别的多意图处理方法。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (7)

1.一种基于语义识别的多意图处理方法,其特征在于,所述方法包括:
接收待识别语音,并对所述待识别语音进行转写操作以得到待识别文本;
将所述待识别文本拆分为多个目标文本;
通过预先训练好的语义识别模型,识别每个目标文本对应的目标意图,以得到多个目标意图;
获取各个所述目标意图的意图类型,并根据各个所述目标意图的意图类型确定目标操作策略;及
基于所述目标操作策略确定一个或多个操作流程,以基于所述一个或多个操作流程执行响应操作;
其中,所述意图类型包括结束型意图、主干型意图和异议型意图中的至少一个,其中,所述异议型意图包括可解决型意图、无法解决型意图和不用解决型意图中的至少一个;
所述根据各个所述目标意图的意图类型确定目标操作策略的步骤,包括:
根据所述各个目标意图的意图类型和预先配置的操作优先级,确定所述目标操作策略;
其中,所述操作优先级为各个目标意图的操作流程所对应的执行顺序,各个操作流程的执行顺序为:结束型意图的操作流程、无法解决型意图的操作流程、主干型意图的操作流程、可解决型意图的操作流程、不用解决型意图的操作流程;
其中,所述根据各个所述目标意图的意图类型确定目标操作策略的步骤,包括:
当各个所述目标意图的意图类型中不存在所述结束型意图时,则判断是否存在所述异议型意图;
若存在所述异议型意图,则检测所述异议型意图是否包括所述可解决型意图;
若所述异议型意图包括所述可解决型意图,则将优先执行所述可解决型意图的操作流程,然后根据所述操作优先级执行所述无法解决型意图的操作流程、所述主干型意图的操作流程和所述不用解决型意图的操作流程中当前操作优先级最高的操作流程确定为所述目标操作策略;及
若所述异议型意图不包括所述可解决型意图,则将根据所述操作优先级执行所述无法解决型意图的操作流程、所述主干型意图的操作流程和所述不用解决型意图的操作流程中当前操作优先级最高的操作流程确定为所述目标操作策略;
其中,所述根据所述操作优先级执行所述无法解决型意图的操作流程、所述主干型意图的操作流程和所述不用解决型意图的操作流程中当前操作优先级最高的操作流程的步骤,包括:
当所述当前操作优先级最高的操作流程为所述无法解决型意图的操作流程,且所述多个目标意图中包括按照预设顺序排列的多个无法解决型意图时,则执行所述多个无法解决型意图中最后一个无法解决型意图的操作流程,所述预设顺序包括各个无法解决型意图所对应的目标文本在所述待识别文本中的位置顺序;
当所述当前操作优先级最高的操作流程为所述主干型意图的操作流程,且所述多个目标意图中包括按照所述预设顺序排列的多个主干型意图时,则执行所述多个主干型意图中最后一个主干型意图的操作流程,所述预设顺序还包括各个主干型意图所对应的目标文本在所述待识别文本中的位置顺序;及
当所述当前操作优先级最高的操作流程为所述不用解决型意图的操作流程,且所述多个目标意图中包括按照所述预设顺序排列的多个不用解决型意图时,则执行所述多个不用解决型意图中最后一个不用解决型意图的操作流程,所述预设顺序还包括各个不用解决型意图所对应的目标文本在所述待识别文本中的位置顺序。
2.如权利要求1所述的基于语义识别的多意图处理方法,其特征在于,所述根据各个所述目标意图的意图类型确定目标操作策略的步骤,包括:
当各个所述目标意图的意图类型中存在所述结束型意图时,则将执行所述结束型意图的操作流程确定为所述目标操作策略。
3.如权利要求1至2中任一项所述的基于语义识别的多意图处理方法,其特征在于,所述响应操作包括播放操作和后续操作,其中,每种意图类型的操作流程对应一种播放操作,每种播放操作对应一种后续操作;
所述基于所述目标操作策略确定一个或多个操作流程,以基于所述一个或操作流程执行响应操作的步骤,包括:
根据各个所述操作流程执行对应的播放操作;及
根据各个所述播放操作中的最后一个播放操作,确定并执行该最后一个播放操作对应的后续操作。
4.如权利要求1至2中任一项所述的基于语义识别的多意图处理方法,其特征在于,还包括:将所述目标操作策略上传到区块链。
5.一种基于语义识别的多意图处理***,其特征在于,包括:
接收模块,用于接收待识别语音,并对所述待识别语音进行转写操作,以得到待识别文本;
拆分模块,用于将待识别文本拆分为多个目标文本;
识别模块,用于通过预先训练好的语义识别模型,识别每个目标文本对应的目标意图,以得到多个目标意图;
确定模块,用于获取各个所述目标意图的意图类型,并根据各个所述目标意图的意图类型确定目标操作策略;及
执行模块,用于基于所述目标操作策略确定一个或多个操作流程,以基于所述一个或多个操作流程执行响应操作;
其中,所述意图类型包括结束型意图、主干型意图和异议型意图中的至少一个,其中,所述异议型意图包括可解决型意图、无法解决型意图和不用解决型意图中的至少一个;
所述根据各个所述目标意图的意图类型确定目标操作策略的步骤,包括:
根据所述各个目标意图的意图类型和预先配置的操作优先级,确定所述目标操作策略;
其中,所述操作优先级为各个目标意图的操作流程所对应的执行顺序,各个操作流程的执行顺序为:结束型意图的操作流程、无法解决型意图的操作流程、主干型意图的操作流程、可解决型意图的操作流程、不用解决型意图的操作流程;
其中,所述根据各个所述目标意图的意图类型确定目标操作策略的步骤,包括:
当各个所述目标意图的意图类型中不存在所述结束型意图时,则判断是否存在所述异议型意图;
若存在所述异议型意图,则检测所述异议型意图是否包括所述可解决型意图;
若所述异议型意图包括所述可解决型意图,则将优先执行所述可解决型意图的操作流程,然后根据所述操作优先级执行所述无法解决型意图的操作流程、所述主干型意图的操作流程和所述不用解决型意图的操作流程中当前操作优先级最高的操作流程确定为所述目标操作策略;及
若所述异议型意图不包括所述可解决型意图,则将根据所述操作优先级执行所述无法解决型意图的操作流程、所述主干型意图的操作流程和所述不用解决型意图的操作流程中当前操作优先级最高的操作流程确定为所述目标操作策略;
其中,所述根据所述操作优先级执行所述无法解决型意图的操作流程、所述主干型意图的操作流程和所述不用解决型意图的操作流程中当前操作优先级最高的操作流程的步骤,包括:
当所述当前操作优先级最高的操作流程为所述无法解决型意图的操作流程,且所述多个目标意图中包括按照预设顺序排列的多个无法解决型意图时,则执行所述多个无法解决型意图中最后一个无法解决型意图的操作流程,所述预设顺序包括各个无法解决型意图所对应的目标文本在所述待识别文本中的位置顺序;
当所述当前操作优先级最高的操作流程为所述主干型意图的操作流程,且所述多个目标意图中包括按照所述预设顺序排列的多个主干型意图时,则执行所述多个主干型意图中最后一个主干型意图的操作流程,所述预设顺序还包括各个主干型意图所对应的目标文本在所述待识别文本中的位置顺序;及
当所述当前操作优先级最高的操作流程为所述不用解决型意图的操作流程,且所述多个目标意图中包括按照所述预设顺序排列的多个不用解决型意图时,则执行所述多个不用解决型意图中最后一个不用解决型意图的操作流程,所述预设顺序还包括各个不用解决型意图所对应的目标文本在所述待识别文本中的位置顺序。
6.一种计算机设备,所述计算机设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至4中任一项所述的基于语义识别的多意图处理方法的步骤。
7.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序可被至少一个处理器所执行,以使所述至少一个处理器执行如权利要求1至4任一项所述的基于语义识别的多意图处理方法的步骤。
CN202110435537.0A 2021-04-22 2021-04-22 基于语义识别的多意图处理方法、***、设备及存储介质 Active CN113158692B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110435537.0A CN113158692B (zh) 2021-04-22 2021-04-22 基于语义识别的多意图处理方法、***、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110435537.0A CN113158692B (zh) 2021-04-22 2021-04-22 基于语义识别的多意图处理方法、***、设备及存储介质

Publications (2)

Publication Number Publication Date
CN113158692A CN113158692A (zh) 2021-07-23
CN113158692B true CN113158692B (zh) 2023-09-12

Family

ID=76869466

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110435537.0A Active CN113158692B (zh) 2021-04-22 2021-04-22 基于语义识别的多意图处理方法、***、设备及存储介质

Country Status (1)

Country Link
CN (1) CN113158692B (zh)

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017218275A1 (en) * 2016-06-13 2017-12-21 Microsoft Technology Licensing, Llc Intelligent virtual keyboards
CN110309170A (zh) * 2019-07-02 2019-10-08 北京大学 一种任务型多轮对话中的复杂意图识别方法
CN110334201A (zh) * 2019-07-18 2019-10-15 中国工商银行股份有限公司 一种意图识别方法、装置及***
CN110909137A (zh) * 2019-10-12 2020-03-24 平安科技(深圳)有限公司 基于人机交互的信息推送方法、装置和计算机设备
CN111259625A (zh) * 2020-01-16 2020-06-09 平安科技(深圳)有限公司 意图识别方法、装置、设备及计算机可读存储介质
CN111368085A (zh) * 2020-03-05 2020-07-03 北京明略软件***有限公司 一种对话意图的识别方法、装置、电子设备及存储介质
CN111400438A (zh) * 2020-02-21 2020-07-10 镁佳(北京)科技有限公司 用户多意图的识别方法及装置,存储介质及车辆
CN111738016A (zh) * 2020-06-28 2020-10-02 中国平安财产保险股份有限公司 多意图识别方法及相关设备
CN111783471A (zh) * 2020-06-29 2020-10-16 中国平安财产保险股份有限公司 自然语言的语义识别方法、装置、设备及存储介质
CN111930950A (zh) * 2020-09-18 2020-11-13 深圳追一科技有限公司 多意图响应方法、装置、计算机设备和存储介质
CN112163086A (zh) * 2020-10-30 2021-01-01 海信视像科技股份有限公司 多意图的识别方法、显示设备
CN112214588A (zh) * 2020-10-16 2021-01-12 平安国际智慧城市科技股份有限公司 多意图识别方法、装置、电子设备及存储介质
WO2021051521A1 (zh) * 2019-09-18 2021-03-25 平安科技(深圳)有限公司 获取应答信息的方法、装置、计算机设备及存储介质

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109313534A (zh) * 2016-06-13 2019-02-05 微软技术许可有限责任公司 智能虚拟键盘
WO2017218275A1 (en) * 2016-06-13 2017-12-21 Microsoft Technology Licensing, Llc Intelligent virtual keyboards
CN110309170A (zh) * 2019-07-02 2019-10-08 北京大学 一种任务型多轮对话中的复杂意图识别方法
CN110334201A (zh) * 2019-07-18 2019-10-15 中国工商银行股份有限公司 一种意图识别方法、装置及***
WO2021051521A1 (zh) * 2019-09-18 2021-03-25 平安科技(深圳)有限公司 获取应答信息的方法、装置、计算机设备及存储介质
CN110909137A (zh) * 2019-10-12 2020-03-24 平安科技(深圳)有限公司 基于人机交互的信息推送方法、装置和计算机设备
CN111259625A (zh) * 2020-01-16 2020-06-09 平安科技(深圳)有限公司 意图识别方法、装置、设备及计算机可读存储介质
CN111400438A (zh) * 2020-02-21 2020-07-10 镁佳(北京)科技有限公司 用户多意图的识别方法及装置,存储介质及车辆
CN111368085A (zh) * 2020-03-05 2020-07-03 北京明略软件***有限公司 一种对话意图的识别方法、装置、电子设备及存储介质
CN111738016A (zh) * 2020-06-28 2020-10-02 中国平安财产保险股份有限公司 多意图识别方法及相关设备
CN111783471A (zh) * 2020-06-29 2020-10-16 中国平安财产保险股份有限公司 自然语言的语义识别方法、装置、设备及存储介质
CN111930950A (zh) * 2020-09-18 2020-11-13 深圳追一科技有限公司 多意图响应方法、装置、计算机设备和存储介质
CN112214588A (zh) * 2020-10-16 2021-01-12 平安国际智慧城市科技股份有限公司 多意图识别方法、装置、电子设备及存储介质
CN112163086A (zh) * 2020-10-30 2021-01-01 海信视像科技股份有限公司 多意图的识别方法、显示设备

Also Published As

Publication number Publication date
CN113158692A (zh) 2021-07-23

Similar Documents

Publication Publication Date Title
EP3451328B1 (en) Method and apparatus for verifying information
US11217236B2 (en) Method and apparatus for extracting information
EP2869298A1 (en) Information identification method and apparatus
JP2020505643A (ja) 音声認識方法、電子機器、及びコンピュータ記憶媒体
CN111858892B (zh) 基于知识图谱的语音交互方法、装置、设备及介质
CN110266900B (zh) 客户意图的识别方法、装置及客服***
CN109462482B (zh) 声纹识别方法、装置、电子设备及计算机可读存储介质
CN112633003A (zh) 一种地址识别方法、装置、计算机设备及存储介质
CN111768789B (zh) 电子设备及其语音发出者身份确定方法、装置和介质
CN111708866A (zh) 会话切分方法、装置、电子设备和存储介质
CN113630309B (zh) 机器人会话***、方法、装置、计算机设备和存储介质
CN114724561A (zh) 一种语音打断方法、装置、计算机设备及存储介质
CN117112065B (zh) 大模型插件调用方法、装置、设备及介质
CN107622769B (zh) 号码修改方法及装置、存储介质、电子设备
CN113158692B (zh) 基于语义识别的多意图处理方法、***、设备及存储介质
CN112669850A (zh) 语音质量检测方法、装置、计算机设备及存储介质
WO2023050669A1 (zh) 基于神经网络的信息推送方法、***、设备及介质
CN115858776B (zh) 一种变体文本分类识别方法、***、存储介质和电子设备
CN116343755A (zh) 领域自适应语音识别方法、装置、计算机设备及存储介质
CN112992151B (zh) 语音识别方法、***、设备和可读存储介质
CN111970311B (zh) 会话切分方法、电子设备及计算机可读介质
CN113656566A (zh) 智能对话处理方法、装置、计算机设备及存储介质
CN115691503A (zh) 语音识别方法、装置、电子设备和存储介质
CN114157763A (zh) 交互过程中的信息处理方法、装置、终端及存储介质
CN114254088A (zh) 自动应答模型的构建方法和自动应答方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant