CN112650842A - 基于人机交互的客服机器人意图识别方法及相关设备 - Google Patents
基于人机交互的客服机器人意图识别方法及相关设备 Download PDFInfo
- Publication number
- CN112650842A CN112650842A CN202011527974.7A CN202011527974A CN112650842A CN 112650842 A CN112650842 A CN 112650842A CN 202011527974 A CN202011527974 A CN 202011527974A CN 112650842 A CN112650842 A CN 112650842A
- Authority
- CN
- China
- Prior art keywords
- semantic representation
- semantic
- intention
- missing
- judgment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3343—Query execution using phonetics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Machine Translation (AREA)
Abstract
本申请实施例属于人工智能领域,应用于智慧城市领域中,涉及一种基于人机交互的客服机器人意图识别方法,包括对目标用户的输入语音进行预处理,得到输入文本;结构化处理输入文本,得到输入文本的语义表示;对语义表示进行缺失判断,得到判断结果;若判断结果为语义表示缺失,则基于预设语义条件获取所述语义表示的缺失信息;基于预设补全策略和所述缺失信息更新所述语义表示,对更新后的语义表示重复缺失判断、获取缺失信息以及更新的操作,直到更新后的语义表示的判断结果为语义表示完整,若判断结果为所述语义表示完整,则根据所述语义表示获取所述输入回应,并以语音的形式发送给目标用户。采用本方法可以为用户精准提供对应的应答信息。
Description
技术领域
本申请涉及人工智能领域,特别是涉及一种基于人机交互的客服机器人意图识别方法、装置、计算机设备和存储介质。
背景技术
现在智能客服机器人是人工智能商业化落地场景中最为成熟的一个应用场景,可以实现用户意图是照片或者提问,覆盖金融、保险、汽车、电商以及政务等多个领域。
现实中,因为目标用户在与客服机器人进行沟通时无法准确表达出自己的意图,以及机器学习模型的局限性。传统技术中直接根据目标用户的回答进行意图提取,再根据机器学习模型对提取到的意图进行分析,得到分析结果。但是因为不同地区、年龄、职业的人同一意图在通过文字或者语言表达出后的表现不一致,意图表达程度也有所不同,而机器学习因训练语料的局限性,又无法适用于如此多的场景,就会导致分析得到的意图不准确,从而无法为用户精准提供对应的应答信息。
发明内容
基于此,针对上述技术问题,本申请提供一种基于人机交互的客服机器人意图识别方法、装置、计算机设备及存储介质,以解决现有技术中意图表达程度也有所不同,导致分析得到的意图不准确,从而无法为用户精准提供对应的应答信息的技术问题。
一种基于人机交互的客服机器人意图识别方法,所述方法包括:
对目标用户的输入语音进行预处理,得到输入文本;
结构化处理所述输入文本,得到所述输入文本的语义表示,其中,所述语义表示用于获取输入语音对应的输入回应;
对所述语义表示进行缺失判断,得到判断结果;
若所述判断结果为所述语义表示缺失,则基于预设语义条件获取所述语义表示的缺失信息;并
基于预设补全策略和所述缺失信息更新所述语义表示,并对更新后的语义表示重复缺失判断、获取缺失信息以及更新的操作,直到更新后的语义表示的判断结果为语义表示完整,或更新次数达到预设更新次数;
若所述判断结果为所述语义表示完整,则根据所述语义表示获取所述输入回应,并以语音的形式发送给目标用户。
一种基于人机交互的客服机器人意图识别装置,所述装置包括:
预处理模块,用于对目标用户的输入语音进行预处理,得到输入文本;
结构化模块,用于结构化处理所述输入文本,得到所述输入文本的语义表示,其中,所述语义表示用于获取输入语音对应的输入回应;
判断模块,用于对所述语义表示进行缺失判断,得到判断结果;
获取模块,用于若所述判断结果为所述语义表示缺失,则基于预设语义条件获取所述语义表示的缺失信息;并
更新模块,用于基于预设补全策略和所述缺失信息更新所述语义表示,并对更新后的语义表示重复缺失判断、获取缺失信息以及更新的操作,直到更新后的语义表示的判断结果为语义表示完整,或更新次数达到预设更新次数;
回应模块,用于若所述判断结果为所述语义表示完整,则根据所述语义表示获取所述输入回应,并以语音的形式发送给目标用户。
一种计算机设备,包括存储器和处理器,以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令,所述处理器执行所述计算机可读指令时实现上述基于人机交互的客服机器人意图识别方法的步骤。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可读指令,所述计算机可读指令被处理器执行时实现上述基于人机交互的客服机器人意图识别方法的步骤。
上述基于人机交互的客服机器人意图识别方法、装置、计算机设备和存储介质,通过对目标用户的输入文本进行结构化处理,得到语义表示,通过对语义表示进行缺失判断来决定是否进行下一步,若语义表示不符合要求则根据预设补全策略和缺失信息更新语义表示,直到语义表示符合要求后,再根据符合要求的语义表示获取输入回应发送给目标用户。通过这种在不同场景下完善语义表示的方式,解决了现有技术中客服机器人分析得到的意图不准确,从而无法为用户精准提供对应的应答信息的技术问题。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为基于人机交互的客服机器人意图识别方法的应用环境示意图;
图2为基于人机交互的客服机器人意图识别方法的流程示意图;
图3为基于人机交互的客服机器人意图识别装置的示意图;
图4为一个实施例中计算机设备的示意图。
具体实施方式
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同;本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请;本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
为了使本申请的目的、技术方案及优点更加清楚明白,下面结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供的基于人机交互的客服机器人意图识别方法,可以应用于如图1所示的应用环境中。其中,该应用环境可以包括终端102、网络以及服务端104,网络用于在终端102和服务端104之间提供通信链路介质,网络可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端102通过网络与服务端104交互,以接收或发送消息等。终端102上可以安装有各种通讯客户端应用,例如网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
终端102可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture Experts Group AudioLayer III,动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts GroupAudio Layer IV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。
服务端104可以是提供各种服务的服务器,例如对终端102上显示的页面提供支持的后台服务器。
需要说明的是,本申请实施例所提供的基于人机交互的客服机器人意图识别方法一般由服务端/终端执行,相应地,基于人机交互的客服机器人意图识别装置一般设置于服务端/终端设备中。
本申请可用于众多通用或专用的计算机***环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器***、基于微处理器的***、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何***或设备的分布式计算环境等等。本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本申请可应用于智慧城市领域中,例如智慧银行、智慧政务领域中,从而推动智慧城市的建设。
应该理解,图1中的终端、网络和服务端的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
其中,终端102通过网络与服务端104进行通信。目标用户通过终端102将输入语音发送到服务端104,服务端104通过对目标用户的输入语音进行转换,得到输入文本,再对输入文本进行结构化处理,得到语义表示;然后通过对语义表示进行缺失判断来决定是否进行下一步,若语义表示不符合要求则根据预设补全策略和缺失信息更新语义表示,直到语义表示符合要求后,再根据符合要求的语义表示获取输入回应通过终端102发送给目标用户。其中,终端102和服务端104之间通过网络进行连接,该网络可以是有线网络或者无线网络,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务端104可以用独立的服务器或者是多个组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种基于人机交互的客服机器人意图识别方法,以该方法应用于图1中的服务端为例进行说明,包括以下步骤:
步骤202,对目标用户的输入语音进行预处理,得到输入文本。
本申请的技术方案可以应用于人机交互场景中,例如,智能客服机器人,目标用户说完一段话后,语音识别技术会将目标用户说的话进行纠错、删除、***单词/字符等操作,将客户所说进行补充和改写,这一过程完成了将输入语音转为输入文本的过程。
步骤204,结构化处理输入文本,得到输入文本的语义表示,其中,语义表示用于获取输入语音对应的输入回应。
将识别到的输入文本经过自然语言理解框架,解析为结构化的,机器可以理解的语义表示,即抽取出“领域-意图-词槽对”信息,其中,领域是包含一系列的相关的意图和词槽组成的语义理解场景,意图是用户通过交互输入所要表达的目的,词槽对由一个tag-value对组成,即词槽标签-词槽值。比如客户查询为“胡歌有什么好看的电视剧”,抽取出:领域–>电视剧,意图–>看剧,词槽–>演员:胡歌。
在一些实施例中,语义表示包括领域(语义场景)、意图(用户想要做什么)以及词槽对(怎么做什么)。具体地,获取语义表示包括:使用从文本到语音(TTS,TextToSpeech)技术将***回应的文本转化为语音播放给客户,重点是TTS内核的三个部分:文本分析:对输入文本进行语言学分析,逐句进行词汇的、语法的和语义的分析,以确定句子的低层结构和每个字的音素的组成,包括文本的断句、字词切分、多音字的处理、数字的处理、缩略语的处理等。语音合成:把处理好的文本所对应的单字或短语从语音合成库中提取,把语言学描述转化成言语波形。韵律生成:是指语音合成***所输出的语音的质量,一般从清晰度(或可懂度)、自然度和连贯性等方面进行主观评价。清晰度是正确听辨有意义词语的百分率;自然度用来评价合成语音音质是否接近人说话的声音,合成词语的语调是否自然;连贯性用来评价合成语句是否流畅。
步骤206,对语义表示进行缺失判断,得到判断结果。
如果提取到的语义表示为:领域:出行;意图:买机票;词槽对(起始地点和时间):西安-上海:2021年1月21日;在进行语义表示与预设语义条件进行检测时,可以通过匹配领域与意图实现预设语义条件的选取,并根据匹配到的预设语义条件判断语义表示是否缺少领域、意图以及词槽对中的任何一种或多种,得到判断结果。具体地,缺失判断步骤为,语义表示包括领域、意图以及词槽对,领域、意图以及词槽对皆有对应语义值(value值):
即,分别对领域、意图以及词槽对的语义值进行遍历,得到遍历结果,其中,遍历结果包括领域、意图以及词槽对的语义值的缺参情况;基于预设权重策略和缺参情况确定判断结果。
语义值为与领域、意图以及词槽对对应的提取到的参数值,也可称之为value值;比如:比如客户查询为“胡歌有什么好看的电视剧”,抽取出:领域–>电视剧,意图–>看剧,词槽–>演员:胡歌。那么“电视剧、看剧以及演员:胡歌”就是value值。遍历是为了得出领域、意图和词槽中哪里缺少value值。
Value缺参情况也分为多种,当目标用户输入的仅仅是几个关键字而非完整地语句,那么提取到的语义表示也有所不同,比如:领域虽然不缺少value值,但是只有“电视”两字,与意图的value值“看”以及词槽对的value值“演员:胡歌”结合,机器所理解的是胡歌-看-电视,而无法得知目标用户的真正意图,如果按照胡歌-看-电视的结果对目标客户进行回应很可能导致回应不准确,给用户带来不好的体验。
此外,还有一类情况是,领域、意图以及词槽对中至少一个缺少value值,但是因为缺少的value值不同,也会得到不同的判断结果。因为不同的value值在准确回应目标用户中所起到的重要程度不同,比如:如果领域缺少value值,还可以通过意图(看剧)和词槽对(演员:胡歌)确定目标用户真正的意图是“看演员胡歌的剧”,然后据此为目标用户提供对应的回答,“演员胡歌”参演的影视剧;但是,如果缺少词槽对(演员:胡歌),那么就无法准确得到目标用户的意图,为目标用户提供对应的回应,因为依靠“电视剧-看剧”给目标用户的回应可能是视频平台推荐而非“演员:胡歌”的参演的电视剧。
为了解决以上技术问题,可以根据预设权重策略为领域、意图以及词槽对生成权重,计算得到权重值,最后根据权重值确定判断结果。
根据语义表示的领域确定预设权重策略;若领域为第一领域梯度,则确定预设权重策略为第一权重策略;并根据第一权重策略为领域、意图以及词槽对匹配权重值,得到判定权重值;若领域为第二领域梯度,则确定预设权重策略为第二权重策略;并根据第二权重策略为领域、意图以及词槽对匹配权重值,得到判定权重值;若判断权重值低于预设权重值,则判断结果为语义表示缺失;若判断权重值不低于预设权重值,则判断结果为语义表示完整。
具体地,根据领域确定预设权重策略,如果领域是“出行”,根据预设领域表可以得到“出行”属于第一领域梯度,其中,预设领域表为根据用户历史输入信息总结得到的领域数据表,该领域数据表中包括若干个领域梯度,不同领域梯度中包括至少一个领域信息,例如:第一领域梯度包括“出行”、“旅游”、“出差”等领域信息;第二领域梯度可以包括“看剧”、“追书”、“追星”等领域信息,不同领域梯度可以对应不同的权重策略。
则根据预设领域表匹配得到的第一权重策略是公式(1):
P=0.1a+0.4b+0.5c (1)
其中,P为判断权重值,a指领域、b指意图、c指词槽对,默认a、b以及c都为1;
若领域为“看剧”,属于第二领域梯度,得到第二权重策略公式(2):
P=0.2a+0.3b+0.5c (2)
根据现有的语料数据对预设权重策略进行训练,得到不同领域所对应的预设权重策略,当得到的判断权重低于预设权重值0.8时,则认为无法根据现有的语义表示为目标用户提供准确的回应,则判断结果为语义表示缺失;当不小于0.8时,则可以根据当前语义表示为目标用户提供相对比较准确的回应,则确定判断结果为语义表示完整。
本申请通过根据预设权重策略决定获取语义表示缺失情况的方式,可以对多种情况下的语义表示进行缺参判断,使得对用户语音的判断方式更加灵活多变。
步骤208,若判断结果为语义表示缺失,则基于预设语义条件获取语义表示的缺失信息。
预设语义条件为根据大数据训练得到的多场景语义表示数据表,其中包括许多场景下所需要的数据,例如,火车票搜索场景的预设语义条件为:领域:出行;意图:买机票;词槽对(起始地点和时间):XXX;三者缺一不可。
进一步地,预设权重策略、预设语义条件以及提取到的目标用户的意图是一一对应的。若根据预设权重策略得到语义表示的判断结果为语义表示缺失,则根据预设语义条件获取语义表示的缺失的value值,并根据缺失的value值的类型对语义表示进行更新。
步骤210,基于预设补全策略和缺失信息更新语义表示,并对更新后的语义表示重复缺失判断、获取缺失信息以及更新的操作,直到更新后的语义表示的判断结果为语义表示完整,或更新次数达到预设更新次数。
预设补全策略为根据缺失信息确定目标用户的意图范围,其中,意图范围为根据语义表示中的领域、意图以及词槽对的语义值所对应的范围;根据意图范围生成第一问询话术或者第二问询话术,并将第一问询话术或第二问询话术以语音的形式发送给目标用户;接收目标用户根据第一问询话术或第二问询话术返回的问询回应,并基于问询回应更新语义表示。其中,根据历史经验,更新次数可以是3次。
具体地,缺失信息包括语义表示中缺少的语义值所对应的领域、意图或者词槽对中的一种,根据缺失信息确定目标用户的意图范围,在本实施例中,可以通过确定语义表示中领域、意图或者词槽对中的一种所对应的语义值,作为范围语义值;从预设意图范围库确定与范围语义值对应的意图范围,来确定目标用户的意图范围。具体地,范围语义值是语义表示中不缺少语义值的领域、意图或者词槽对中的一种或多种。意图范围是目标用户在现有语义表示信息的基础上,具体的意图范围。例如,根据预设语义条件对照得知语义表示缺少与领域对应的value值,就可以根据意图和词槽对对应的value值,看剧、演员胡歌确定目标用户的范围语义值:电视剧、电影、话剧以及小品中的一种或多种。
预设意图范围库是根据现有的资料搜集的知识图谱型的意图范围数据表,里面通过属性关联性确定各个节点之间的联系,例如:演员节点下包括男、女演员节点,又可以按照演员地区再进行分类,每个演员下对应有影视剧节点、纪录片节点等,而影视剧节点下又包括电视剧、电影、话剧等节点。当确定目标用户的意图范围是影视剧、纪录片之后,则根据节点下子节点的数量来确定目标用户的范围语义值是电视剧、电影;然后又可以根据电视剧节点下子节点的数量更精准得确定用户的意图范围。通过这种方式可以大致锁定目标用户的查询意图,迅速做出反应,大大提高了语义表示的完善速度,提高了为用户返回查询信息的效率。
如果缺失信息是缺少词槽对中“演员:胡歌”,则可以根据语义表示的领域和意图大致得出目标用户的想问的范围,是电视剧的类型,还是参演电视剧的人员,或者电视剧出品年代,抑或是电视剧出品地区等等。然后在此意图范围内,基于预设补全策略决定是直接在以上范围内生成下一条能够补全该value值的询问,得到目标用户确切的回答;还是指引用户一步一步输入确切的意图。当接收到目标用户根据新的询问输入的语音回应,则根据语音回应对缺失信息的语义表示进行更新。
例如,根据预设补全策略直接向目标用户发起新的提问:您想看的是演员胡歌的电视剧吗?当得到用户的肯定回答,则可以确定是电视剧。若得到其他的回答,比如:不是,我想看电影。那么就可以根据具体地回应补全缺失信息,完善语义表示。
进一步地,在得到目标用户的问询回应后,还需要对问询回应进行有效判断,其中,有效判断是指判断目标用户的问询回应与语义表示的相关度。
在本实施例中可以基于NLP技术以及现有网络信息计算文本之间的关联度来进行有效判断,确定相关度,例如演员胡歌与电视剧、看剧之间具有相关性。通过这种方式可以进一步提高更新语义表示的准确度。
具体地,通过语义识别算法对问询回应进行关键词提取,得到至少一个关键词;并将与缺失信息具有属性关联度的关键词更新到缺失信息对应的语义值中,得到更新后的语义表示。
本实施例通过预设补全策略以及缺失信息确定缺失信息,并获取缺失信息对应的意图范围,然后再基于预设补全策略获取用户确切的意图,对语义表示进行更新,提高了本申请的适用性。
步骤212,若判断结果为语义表示完整,则根据语义表示获取输入回应,并以语音的形式发送给目标用户。
输入回应是指根据语义表示生成的回应,可以是根据语义表示在网络上搜索得到的信息,比如搜索到的演员胡歌所参演的电视剧,又或者是“2021年1月21日从西安到上海”的机票信息;也可以是基于AI模型根据语义表示生成的对话回应,比如,如果目标用户的输入是你吃过了吗?那回应可以是:吃过了,谢谢之类的信息。
需要强调的是,为进一步保证上述目标用户信息的私密和安全性,上述输入文本和输入语音信息还可以存储于一区块链的节点中。
上述基于人机交互的客服机器人意图识别方法中,通过对目标用户的输入文本进行结构化处理,得到语义表示,通过对语义表示进行缺失判断来决定是否进行下一步,若语义表示不符合要求则根据预设补全策略和缺失信息更新语义表示,直到语义表示符合要求后,再根据符合要求的语义表示获取输入回应发送给目标用户。通过这种在不同场景下完善语义表示的方式,解决了现有技术中客服机器人分析得到的意图不准确,从而无法为用户精准提供对应的应答信息的技术问题。
应该理解的是,虽然图2的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图3所示,提供了一种基于人机交互的客服机器人意图识别装置,该基于人机交互的客服机器人意图识别装置与上述实施例中基于人机交互的客服机器人意图识别方法一一对应。该基于人机交互的客服机器人意图识别装置包括:
预处理模块302,用于对目标用户的输入语音进行预处理,得到输入文本;
结构化模块304,用于结构化处理输入文本,得到输入文本的语义表示,其中,语义表示用于获取输入语音对应的输入回应;
判断模块306,用于对语义表示进行缺失判断,得到判断结果;
获取模块308,用于若判断结果为语义表示缺失,则基于预设语义条件获取语义表示的缺失信息;以及
更新模块310,用于基于预设补全策略和缺失信息更新语义表示,并对更新后的语义表示重复缺失判断、获取缺失信息以及更新的操作,直到更新后的语义表示的判断结果为语义表示完整,或更新次数达到预设更新次数;
回应模块312,用于若判断结果为语义表示完整,则根据语义表示获取输入回应,并以语音的形式发送给目标用户。
进一步地,判断模块306,包括:
遍历子模块,用于分别对领域、意图以及词槽对的语义值进行遍历,得到遍历结果,其中,遍历结果包括领域、意图以及词槽对的语义值的缺参情况;
判断子模块,用于基于预设权重策略和缺参情况确定判断结果。
进一步地,判断子模块,包括:
确定单元,用于根据语义表示的领域确定预设权重策略;
第一权重单元,用于若领域为第一领域梯度,则确定预设权重策略为第一权重策略;以及
第一判断单元,用于根据第一权重策略为领域、意图以及词槽对匹配权重值,得到判定权重值;
第二权重单元,用于若领域为第二领域梯度,则确定预设权重策略为第二权重策略;以及
第二判断单元,用于根据第二权重策略为领域、意图以及词槽对匹配权重值,得到判定权重值;
第一结果单元,用于若判断权重值低于预设权重值,则判断结果为语义表示缺失;
第二结果单元,用于若判断权重值不低于预设权重值,则判断结果为语义表示完整。
进一步地,更新模块310,包括:
范围子模块,用于根据缺失信息确定目标用户的意图范围,其中,意图范围为根据语义表示中的领域、意图以及词槽对的语义值所对应的范围;
问询子模块,用于根据意图范围生成第一问询话术或者第二问询话术,并将第一问询话术或第二问询话术以语音的形式发送给目标用户;
更新子模块,用于接收目标用户根据第一问询话术或第二问询话术返回的问询回应,并基于问询回应更新语义表示。
进一步地,范围子模块,包括:
语义单元,用于确定语义表示中领域、意图或者词槽对中的一种所对应的语义值,作为范围语义值;
范围单元,用于从预设意图范围库确定与范围语义值对应的意图范围,作为目标用户的意图范围。
进一步地,更新子模块,包括:
提取单元,用于通过语义识别算法对问询回应进行关键词提取,得到至少一个关键词;以及
更新单元,用于将与缺失信息具有属性关联度的关键词更新到缺失信息对应的语义值中,得到更新后的语义表示。
需要强调的是,为进一步保证上述目标用户信息的私密和安全性,上述输入文本和输入语音信息还可以存储于一区块链的节点中。
上述基于人机交互的客服机器人意图识别装置,通过对目标用户的输入文本进行结构化处理,得到语义表示,通过对语义表示进行缺失判断来决定是否进行下一步,若语义表示不符合要求则根据预设补全策略和缺失信息更新语义表示,直到语义表示符合要求后,再根据符合要求的语义表示获取输入回应发送给目标用户。通过这种在不同场景下完善语义表示的方式,解决了现有技术中客服机器人分析得到的意图不准确,从而无法为用户精准提供对应的应答信息的技术问题。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图4所示。该计算机设备包括通过***总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***、计算机可读指令和数据库。该内存储器为非易失性存储介质中的操作***和计算机可读指令的运行提供环境。该计算机设备的数据库用于存储输入语音和输入文本。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机可读指令被处理器执行时以实现一种基于人机交互的客服机器人意图识别方法。本实施例通过对目标用户的输入文本进行结构化处理,得到语义表示,通过对语义表示进行缺失判断来决定是否进行下一步,若语义表示不符合要求则根据预设补全策略和缺失信息更新语义表示,直到语义表示符合要求后,再根据符合要求的语义表示获取输入回应发送给目标用户。通过这种在不同场景下完善语义表示的方式,解决了现有技术中客服机器人分析得到的意图不准确,从而无法为用户精准提供对应的应答信息的技术问题。
其中,本技术领域技术人员可以理解,这里的计算机设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字处理器(Digital Signal Processor,DSP)、嵌入式设备等。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机可读指令,计算机可读指令被处理器执行时实现上述实施例中基于人机交互的客服机器人意图识别方法的步骤,例如图2所示的步骤202至步骤212,或者,处理器执行计算机可读指令时实现上述实施例中基于人机交互的客服机器人意图识别装置的各模块/单元的功能,例如图3所示模块302至模块312的功能。
通过对目标用户的输入文本进行结构化处理,得到语义表示,通过对语义表示进行缺失判断来决定是否进行下一步,若语义表示不符合要求则根据预设补全策略和缺失信息更新语义表示,直到语义表示符合要求后,再根据符合要求的语义表示获取输入回应发送给目标用户。通过这种在不同场景下完善语义表示的方式,解决了现有技术中客服机器人分析得到的意图不准确,从而无法为用户精准提供对应的应答信息的技术问题。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机可读指令来指令相关的硬件来完成,所述的计算机可读指令可存储于一非易失性计算机可读取存储介质中,该计算机可读指令在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
本申请所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形、改进或者对部分技术特征进行等同替换,而这些修改或者替换,并不使相同技术方案的本质脱离本发明个实施例技术方案地精神和范畴,都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种基于人机交互的客服机器人意图识别方法,其特征在于,所述方法包括:
对目标用户的输入语音进行预处理,得到输入文本;
结构化处理所述输入文本,得到所述输入文本的语义表示,其中,所述语义表示用于获取输入语音对应的输入回应;
对所述语义表示进行缺失判断,得到判断结果;
若所述判断结果为所述语义表示缺失,则基于预设语义条件获取所述语义表示的缺失信息;并
基于预设补全策略和所述缺失信息更新所述语义表示,并对更新后的语义表示重复缺失判断、获取缺失信息以及更新的操作,直到更新后的语义表示的判断结果为语义表示完整,或更新次数达到预设更新次数;
若所述判断结果为所述语义表示完整,则根据所述语义表示获取所述输入回应,并以语音的形式发送给目标用户。
2.根据权利要求1所述的方法,其特征在于,所述语义表示包括领域、意图以及词槽对,以及分别与所述领域、所述意图以及所述词槽对对应的语义值,所述对所述语义表示进行缺失判断,得到判断结果,包括:
分别对所述领域、所述意图以及所述词槽对的语义值进行遍历,得到遍历结果,其中,所述遍历结果包括所述领域、所述意图以及所述词槽对的语义值的缺参情况;
基于预设权重策略和所述缺参情况确定所述判断结果。
3.根据权利要求2所述的方法,其特征在于,所述基于预设权重策略和所述缺参情况确定所述判断结果,包括:
根据所述语义表示的领域确定预设权重策略;
若所述领域为第一领域梯度,则确定所述预设权重策略为第一权重策略;并
根据所述第一权重策略为所述领域、所述意图以及所述词槽对匹配权重值,得到判定权重值;
若所述领域为第二领域梯度,则确定所述预设权重策略为第二权重策略;并
根据所述第二权重策略为所述领域、所述意图以及所述词槽对匹配权重值,得到判定权重值;
若所述判断权重值低于预设权重值,则所述判断结果为所述语义表示缺失;
若所述判断权重值不低于预设权重值,则所述判断结果为所述语义表示完整。
4.根据权利要求1所述的方法,其特征在于,所述基于预设补全策略和所述缺失信息更新所述语义表示,并对更新后的语义表示重复缺失判断、获取缺失信息以及更新的操作,直到更新后的语义表示的判断结果为语义表示完整,或更新次数达到预设更新次数,包括:
根据所述缺失信息确定目标用户的意图范围,其中,所述意图范围为根据语义表示中的领域、意图以及词槽对的语义值所对应的范围;
根据所述意图范围生成第一问询话术或者第二问询话术,并将所述第一问询话术或第二问询话术以语音的形式发送给目标用户;
接收所述目标用户根据所述第一问询话术或第二问询话术返回的问询回应,并基于所述问询回应更新所述语义表示。
5.根据权利要求4所述的方法,其特征在于,所述缺失信息包括语义表示中缺少的语义值所对应的领域、意图或者词槽对中的一种,所述根据所述缺失信息确定目标用户的意图范围,包括:
确定所述语义表示中领域、意图或者词槽对中的一种所对应的语义值,作为范围语义值;
从预设意图范围库确定与所述范围语义值对应的意图范围,作为目标用户的意图范围。
6.根据权利要求4所述的方法,其特征在于,所述基于所述问询回应更新所述语义表示,包括:
通过语义识别算法对所述问询回应进行关键词提取,得到至少一个关键词;并
将与所述缺失信息具有属性关联度的关键词更新到所述缺失信息对应的语义值中,得到更新后的语义表示。
7.根据权利要求1所述的方法,其特征在于,所述输入文本数据存储于区块链中。
8.一种基于人机交互的客服机器人意图识别装置,其特征在于,包括:
预处理模块,用于对目标用户的输入语音进行预处理,得到输入文本;
结构化模块,用于结构化处理所述输入文本,得到所述输入文本的语义表示,其中,所述语义表示用于获取输入语音对应的输入回应;
判断模块,用于对所述语义表示进行缺失判断,得到判断结果;
获取模块,用于若所述判断结果为所述语义表示缺失,则基于预设语义条件获取所述语义表示的缺失信息;并
更新模块,用于基于预设补全策略和所述缺失信息更新所述语义表示,并对更新后的语义表示重复缺失判断、获取缺失信息以及更新的操作,直到更新后的语义表示的判断结果为语义表示完整,或更新次数达到预设更新次数;
回应模块,用于若所述判断结果为所述语义表示完整,则根据所述语义表示获取所述输入回应,并以语音的形式发送给目标用户。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机可读指令,其特征在于,所述处理器执行所述计算机可读指令时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机可读指令,其特征在于,所述计算机可读指令被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011527974.7A CN112650842A (zh) | 2020-12-22 | 2020-12-22 | 基于人机交互的客服机器人意图识别方法及相关设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011527974.7A CN112650842A (zh) | 2020-12-22 | 2020-12-22 | 基于人机交互的客服机器人意图识别方法及相关设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112650842A true CN112650842A (zh) | 2021-04-13 |
Family
ID=75359243
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011527974.7A Pending CN112650842A (zh) | 2020-12-22 | 2020-12-22 | 基于人机交互的客服机器人意图识别方法及相关设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112650842A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113064985A (zh) * | 2021-04-30 | 2021-07-02 | 思必驰科技股份有限公司 | 人机对话方法、电子设备及存储介质 |
CN113139816A (zh) * | 2021-04-26 | 2021-07-20 | 北京沃东天骏信息技术有限公司 | 信息处理方法、装置、电子设备和存储介质 |
CN113220839A (zh) * | 2021-05-13 | 2021-08-06 | 湖北亿咖通科技有限公司 | 一种意图识别方法、电子设备及计算机可读存储介质 |
CN115410576A (zh) * | 2022-08-26 | 2022-11-29 | 国网河南省电力公司信息通信公司 | 一种智能客服***及智能客服机器人 |
CN116610646A (zh) * | 2023-07-20 | 2023-08-18 | 深圳市其域创新科技有限公司 | 数据压缩方法、装置、设备及计算机可读存储介质 |
-
2020
- 2020-12-22 CN CN202011527974.7A patent/CN112650842A/zh active Pending
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113139816A (zh) * | 2021-04-26 | 2021-07-20 | 北京沃东天骏信息技术有限公司 | 信息处理方法、装置、电子设备和存储介质 |
CN113064985A (zh) * | 2021-04-30 | 2021-07-02 | 思必驰科技股份有限公司 | 人机对话方法、电子设备及存储介质 |
CN113220839A (zh) * | 2021-05-13 | 2021-08-06 | 湖北亿咖通科技有限公司 | 一种意图识别方法、电子设备及计算机可读存储介质 |
CN113220839B (zh) * | 2021-05-13 | 2022-05-24 | 亿咖通(湖北)技术有限公司 | 一种意图识别方法、电子设备及计算机可读存储介质 |
CN115410576A (zh) * | 2022-08-26 | 2022-11-29 | 国网河南省电力公司信息通信公司 | 一种智能客服***及智能客服机器人 |
CN116610646A (zh) * | 2023-07-20 | 2023-08-18 | 深圳市其域创新科技有限公司 | 数据压缩方法、装置、设备及计算机可读存储介质 |
CN116610646B (zh) * | 2023-07-20 | 2024-04-02 | 深圳市其域创新科技有限公司 | 数据压缩方法、装置、设备及计算机可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108829822B (zh) | 媒体内容的推荐方法和装置、存储介质、电子装置 | |
CN112650842A (zh) | 基于人机交互的客服机器人意图识别方法及相关设备 | |
CN106383875B (zh) | 基于人工智能的人机交互方法和装置 | |
CN111258995B (zh) | 数据处理方法、装置、存储介质及设备 | |
CN111694940A (zh) | 一种用户报告的生成方法及终端设备 | |
CN112215008A (zh) | 基于语义理解的实体识别方法、装置、计算机设备和介质 | |
CN104462064A (zh) | 一种移动终端信息通讯提示输入内容的方法和*** | |
CN112989212B (zh) | 媒体内容推荐方法、装置和设备及计算机存储介质 | |
CN113806588B (zh) | 搜索视频的方法和装置 | |
US11036996B2 (en) | Method and apparatus for determining (raw) video materials for news | |
CN112434533B (zh) | 实体消歧方法、装置、电子设备及计算机可读存储介质 | |
CN115080836A (zh) | 基于人工智能的信息推荐方法、装置、电子设备及存储介质 | |
CN113254613A (zh) | 对话问答方法、装置、设备及存储介质 | |
CN114996511A (zh) | 一种针对跨模态视频检索模型的训练方法及装置 | |
CN113919360A (zh) | 语义理解方法、语音交互方法、装置、设备及存储介质 | |
CN112364184A (zh) | 多媒体数据的排序方法、装置、服务器及存储介质 | |
CN115115984A (zh) | 视频数据处理方法、装置、程序产品、计算机设备和介质 | |
CN111078849A (zh) | 用于输出信息的方法和装置 | |
CN117932022A (zh) | 一种智能问答方法、装置、电子设备及存储介质 | |
CN116955591A (zh) | 用于内容推荐的推荐语生成方法、相关装置和介质 | |
CN116977701A (zh) | 视频分类模型训练的方法、视频分类的方法和装置 | |
CN114547257B (zh) | 类案匹配方法、装置、计算机设备及存储介质 | |
CN113961811B (zh) | 基于事件图谱的话术推荐方法、装置、设备及介质 | |
CN111222011B (zh) | 一种视频向量确定方法和装置 | |
CN115134660A (zh) | 视频剪辑方法、装置、计算机设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |