CN107644641B - 对话场景识别方法、终端以及计算机可读存储介质 - Google Patents

对话场景识别方法、终端以及计算机可读存储介质 Download PDF

Info

Publication number
CN107644641B
CN107644641B CN201710636464.5A CN201710636464A CN107644641B CN 107644641 B CN107644641 B CN 107644641B CN 201710636464 A CN201710636464 A CN 201710636464A CN 107644641 B CN107644641 B CN 107644641B
Authority
CN
China
Prior art keywords
scene
information
user
candidate
scenes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710636464.5A
Other languages
English (en)
Other versions
CN107644641A (zh
Inventor
卢道和
郑德荣
张超
杨海军
钟伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
WeBank Co Ltd
Original Assignee
WeBank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by WeBank Co Ltd filed Critical WeBank Co Ltd
Priority to CN201710636464.5A priority Critical patent/CN107644641B/zh
Publication of CN107644641A publication Critical patent/CN107644641A/zh
Application granted granted Critical
Publication of CN107644641B publication Critical patent/CN107644641B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种对话场景识别方法,包括以下步骤:接收输入的用户对话信息;基于用户对话信息,采用预置的场景识别规则对预置候选场景进行筛选,得到用户对话信息对应的第一类候选场景;以及基于用户对话信息,采用场景判别模型对预置候选场景进行筛选,得到用户对话信息对应的第二类候选场景;基于第一类候选场景与第二类候选场景,对用户对话信息进行增强学习处理,得到与用户对话信息对应的最优对话场景;判断最优对话场景与当前对话场景是否相同,若不相同,则将最优对话场景作为当前对话场景。本发明还公开了一种对话场景识别终端及计算机可读存储介质。本发明实现了在对话场景变化过程中对场景的准确识别。

Description

对话场景识别方法、终端以及计算机可读存储介质
技术领域
本发明涉及对话场景识别技术领域,尤其涉及一种对话场景识别方法、终端以及计算机可读存储介质。
背景技术
自动问答是指利用计算机自动回答用户所提出的问题以满足用户知识需求的任务,是信息服务的一种高级形式。近年来,随着人工智能的飞速发展,自动问答已经成为备受关注且发展前景广泛的研究方向,自动问答被认为是验证机器是否具有自然语言理解能力的主要任务之一,自动问答的研究有利于推动人工智能相关学科的发展。
但是目前的自动问答***还不够完美,仍面临许多具体问题和困难。目前的智能机器人大都是单轮对话***,不考虑对话上下文信息,用户历史对话信息等数据,给出的很多答案不连贯,比较突兀,严重影响了用户体验。针对这种情况,我们提出了一种多场景识别的方法,在对话过程中,能够根据用户当前的输入、历史对话信息等数据,主动适应用户对话的场景,使得对话更加流畅自然。
发明内容
本发明的主要目的在于提供一种对话场景识别方法、识别终端以及计算机可读存储介质,旨在解决在智能机器人与人进行语音交互过程中,难以准确识别场景变化的技术问题。
为实现上述目的,本发明提供一种对话场景识别方法,所述对话场景识别方法包括:
接收输入的用户对话信息;
基于所述用户对话信息,采用预置的场景识别规则对预置候选场景进行筛选,得到所述用户对话信息对应的第一类候选场景;以及基于所述用户对话信息,采用场景判别模型对所述预置候选场景进行筛选,得到所述用户对话信息对应的第二类候选场景;
基于所述第一类候选场景与所述第二类候选场景,对所述用户对话信息进行增强学习处理,得到与所述用户对话信息对应的最优对话场景;
判断所述最优对话场景与当前对话场景是否相同,若不相同,则将所述最优对话场景作为当前对话场景。
优选地,所述基于所述用户对话信息,采用预置的场景识别规则对候选场景进行筛选处理,得到所述用户对话信息对应的第一类候选场景的步骤包括:
抽取所述用户对话信息中的关键词;
基于所述关键词,筛选所述预置候选场景中与所述关键词相关的场景,并将所述相关的场景作为所述用户对话信息对应的所述第一类候选场景。
优选地,所述基于用户对话信息,采用场景判别模型对所述预置候选场景进行筛选处理,得到所述用户对话信息对应的第二类候选场景的步骤包括:
抽取所述用户对话信息中的特征信息;
基于所述特征信息,通过所述场景判别模型计算所述预置候选场景与所述特征信息的匹配程度,并将匹配程度较高的部分场景作为所述用户对话信息对应的第二类候选场景。
优选地,所述基于所述第一类候选场景与所述第二类候选场景,对所述用户对话信息进行增强学习处理,得到与所述用户对话信息对应的最优对话场景的步骤包括:
以所述用户对话信息为动作、所述第一类候选场景与所述第二类候选场景为状态,对所述用户对话信息进行增强学习处理,以供从所述第一类候选场景与所述第二类候选场景中筛选出最优对话场景。
为实现上述目的,本发明还提供一种识别终端,所述识别终端包括:
存储有对话场景识别程序的存储器;
处理器,配置为执行所述对话场景识别程序以执行下述操作:
接收输入的用户对话信息;
基于所述用户对话信息,采用预置的场景识别规则对预置候选场景进行筛选,得到所述用户对话信息对应的第一类候选场景;以及基于所述用户对话信息,采用场景判别模型对所述预置候选场景进行筛选,得到所述用户对话信息对应的第二类候选场景;
基于所述第一类候选场景与所述第二类候选场景,对所述用户对话信息进行增强学习处理,得到与所述用户对话信息对应的最优对话场景;
判断所述最优对话场景与当前对话场景是否相同,若不相同,则将所述最优对话场景作为当前对话场景。
可选地,执行所述基于所述用户对话信息,采用预置的场景识别规则对预置候选场景进行筛选,得到所述用户对话信息对应的第一类候选场景的操作包括:
抽取所述用户对话信息中的关键词;
基于所述关键词,筛选所述预置候选场景中与所述关键词相关的场景,并将所述相关的场景作为所述用户对话信息对应的所述第一类候选场景。
可选地,执行所述基于所述用户对话信息,采用场景判别模型对所述预置候选场景进行筛选,得到所述用户对话信息对应的第二类候选场景的操作包括:
抽取所述用户对话信息中的特征信息;
基于所述特征信息,通过所述场景判别模型计算所述预置候选场景与所述特征信息的匹配程度,并将匹配程度较高的部分场景作为所述用户对话信息对应的第二类候选场景。
优选地,执行所述基于所述第一类候选场景与所述第二类候选场景,对所述用户对话信息进行增强学习处理,得到与所述用户对话信息对应的最优对话场景的操作包括:
以所述用户对话信息为动作、所述第一类候选场景与所述第二类候选场景为状态,对所述用户对话信息进行增强学习处理,以供从所述第一类候选场景与所述第二类候选场景中筛选出最优对话场景。
为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有对话场景识别程序,所述对话场景识别程序被处理器执行时实现如上述任一项所述的对话场景识别方法的步骤。
本发明中,具体在场景变化过程中,当对话场景发生改变的时候,首先采用预置的场景识别规则和场景判别模型对预置候选场景进行第一次筛选,并得到相应的候选场景,然后利用增强学习策略对候选场景进行第二次筛选,进而得到最优的对话场景,最后根据最优的对话场景选择合适的对话结果回复用户,从而实现了对当前对话场景变化的准确识别,进而提升用户人机交互的使用体验。
附图说明
图1为本发明智能机器人对话场景识别方法一实施例的流程示意图;
图2为图1中步骤S20的细化流程示意图;
图3为图1中步骤S30的细化流程示意图;
图4为图1中步骤S40的细化流程示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
参照图1,图1为本发明智能机器人对话场景识别方法一实施例的流程示意图。本实施例中,对话场景识别方法包括以下步骤:
步骤S10,接收输入的用户对话信息;
本实施例中,当用户与智能机器人对话时,智能机器人通过语音交互***接收用户输入的对话信息。其中,智能机器人接收用户对话信息的方式包括:将声音进行信息转化、利用***中的声音识别***。
将声音进行信息转换就是将声音转化为电波,再将声音转化为智能机器人所能识别的信息,机器人通过接收信息,进行相应反馈。
利用声音识别***时通过识别用户的音调、音色等,通过音调及音色对应的信息做出相应的反馈。
步骤S20,基于所述用户对话信息,采用预置的场景识别规则对预置候选场景进行筛选,得到所述用户对话信息对应的第一类候选场景;
本实施例中,当接收到用户输入的对话信息时,通过使用场景识别规则,对预置场景信息进行筛选,得到相对应的候选场景。场景识别规则具体基于人的实践经验而设定的对话规则,且本实施例对于预置场景识别规则的设置不限。
比如,通过获取对话信息中的规则进行场景识别。例如,当用户输入对话信息为“你是谁,今年几岁了”时,获取的规则就是“身份”以及“年龄”,此时场景识别规则可设定为人的基本情况介绍,因此对应的回答可以是“你好,我叫小白,今年两岁”。再例如,当用户输入对话信息为“我要查询机票”时,获取的对话关键词就是“查询机票”,此时场景识别规则开设定为查询机票方式的提供,因此对应的回答可以是“出发时间是哪天”。
再比如,通过问题和答案的对应进行场景识别。例如,当用户输入对话信息为“你和我谁更帅”时,此时利用场景识别规则直接对应的答案可以是“当然是我了”或者“我更帅”。再例如,当用户输入对话信息为“晚安”,此时可以直接回答“晚安”。
步骤S30,基于所述用户对话信息,采用场景判别模型对所述预置候选场景进行筛选,得到所述用户对话信息对应的第二类候选场景;
本实施例中,场景判别模型是机器学习的一种算法,具体是通过把很多相关信息都提取出来,结合历史信息,找寻历史信息与所提取出来的信息是否存在相似,若相似则会将相似的场景归为一类。判别模型的算法有多种,且在本实施例中判别模型的算法所使用的类型是不限的。本实施例中,所使用的判别模型计算方式可以是:计算特征信息与候选场景信息的相关性的大小,进而确定候选场景。
例如,当用户对话信息为“我要健身”时,此时会获取用户信息外,还会根据此信息获取到用户想要锻炼,更会从历史对话中获取之前对话提及过关于锻炼或者健身的问题的相关信息,在获取相关的特征信息包括用户意图理解、历史对话信息、用户偏好信息时,便根据特征信息,通过判别模型对场景进行筛选,此时的回答可以是“去×××健身俱乐部去吧”或者“去护城河边区跑步吧”,而不会是“我不要健身”。
再例如,当用户对话信息为“晚餐吃什么呢”,在场景中可能存在的相关场景就有“晚餐去西餐厅吃牛排”、“晚餐去吃湘菜”、“晚餐自己做蛋炒饭”或者“我不吃晚餐”等等。以上的四种场景都有一个相似点就是吃晚餐,但是第四个和前三个明显就有一个吃晚餐的对象不一样的问题,前三个时用户而第四个却变成了机器人。所以当用户对话说“晚餐吃什么”的时候,很显然第四个是不符合此时的场景的。
需要指出的是,上述步骤S20与S30的执行先后顺序不限,比如先执行步骤S20,而后再执行步骤S30,或者先执行步骤S30,而后再至执行步骤S20,或者步骤S20与S30同时进行。
步骤S40,基于所述第一类候选场景与所述第二类候选场景,对所述用户对话信息进行增强学习处理,得到与所述用户对话信息对应的最优对话场景;
本实施例中,增强学习是一个自主学习的过程,通过不断的学习,选择一个能达到目标的最优的动作。增强学习可以通过多种方式来实现,由于在增强学习的过程中有个值函数(状态值函数)、Q函数(动作值函数)或者策略等,而且值函数、Q函数或者策略是根据不同的任务进行不同的定义,所以本实施例中对于其实现的方式是不限的。
本实施例中,将通过步骤S20得到的第一类候选场景和通过步骤S30得到第二类候选场景作为增强学习的候选场景集合。在获取用户对话信息动作时,以此候选场景为状态集合,通过增强学习实现对候选场景的筛选。
例如,当用户对话信息为“晚餐吃什么呢”,经过场景识别规则和场景判别模型的第一次筛选之后得到第一类候选场景和第二类候选场景。此时候选场景可以包括有:“晚餐去西餐厅吃牛排”、“晚餐去吃湘菜”、“晚餐自己做蛋炒饭”、“晚餐自己做菜吧”、“六点之后再吃晚餐吧”、“我不吃晚餐”等等。
在用户问出“晚餐吃什么”的问题时,智能机器人清楚了解用户的目标,通过值函数的计算,每一个场景都对应一个值,比如,“晚餐去西餐厅吃牛排”所对应的值为54、“晚餐去吃湘菜”所对应的值为63、“晚餐自己做菜吧”所对应的值为72、“六点之后再吃晚餐吧”所对应的值为81、“晚餐自己做蛋炒饭”所对应的值为90,此时不同的值代表着与目标的接近程度(满分100,即达到目标),所以此时最优的回答可以是“晚餐自己做蛋炒饭”。
本实施例中,通过增强学习中的值函数的计算,利用数值对场景进行一个打分排序,选取打分最高的一个场景作为最优的场景输出。
步骤S50,判断所述最优对话场景与当前对话场景是否相同,若不相同,则将所述最优对话场景作为当前对话场景;
本实施例中,当通过增强学习筛选出最优的对话场景时,将最优对话场景与当前对话场景进行对比,若最优对话场景与当前度化场景没有变化,则当前对话场景不变,若对比发现最优对话场景与当前对话场景不一样,则将最优对话场景作为最新的当前对话场景输出。例如,用户之前和机器人对话的场景是关于天气的话题场景,而当用户再次与机器人对话时,根据对话信息筛选出来的时关于吃饭的话题场景,此时会将对话场景从前面的关于天气的话题场景转变为关于吃饭的话题场景。
在本实施例中,将最优的对话场景和当前的对话场景中最为合适的对话场景输出,并根据最为合适的对话场景做出相应的操作。
实施例二:
参照图2,图2为图1中步骤S20的细化流程示意图。基于上述实施例一,在本实施例中,上述步骤S20进一步包括:
步骤S201,抽取所述用户对话信息中的关键词;
步骤S202,基于所述关键词,筛选所述预置候选场景中与所述关键词相关的场景,并将所述相关的场景作为所述用户对话信息对应的所述第一类候选场景。
本实施例中,当接收到用户输入的对话信息时,根据对话信息抽取其中的关键词,然后依据所抽取出来的关键词筛选预置候选场景中与该关键词相关的程度较高的场景,并将相关程度较高的部分场景作为第一类候选场景。
例如,用户输入的对话信息是“我想要吃川菜”,当接收到此输入信息时,抽取信息中的关键词“吃饭”和“川菜”,此时根据关键词去和预置候选场景进行匹配,获取相关程度较高的部分场景。当获取了关键词“吃”和“食物”时,此时会匹配到的场景可能就有关于附近川菜馆的场景信息,进而获取更多关于“吃饭”和“川菜”的场景作为第一类候选场景。
再例如,用户输入的对话信息是“我想要去健身”,在接收到此信息时,可以很清晰的获取其中的关键词“健身”,此时获取的场景信息可能就是:“健身的项目有什么”、“健身的地点在哪里”、“怎么健身”等一系列与“健身”相关的场景就会出现在候选场景中,比如智能机器人输出的对话为“你是想要跑步还是想要去健身房”,用户可以再次选择“我想去跑步”。此时便选取了对话的场景。
本实施例中,通过识别规则获取第一类候选场景信息,获取的对话信息的关键词,而匹配的对话场景也是提及关键词的对话场景,是设置好的对话场景信息,不会随着用户的变化而改变。
实施例三:
参照图3,图3为图1中步骤S30的细化流程示意图。基于上述实施例一,在本实施例中,上述步骤S30进一步包括:
步骤S301,抽取所述用户对话信息中的特征信息;
步骤S302,基于所述特征信息,通过所述场景判别模型计算所述预置候选场景与所述特征信息的匹配程度,并将匹配程度较高的部分场景作为所述用户对话信息对应的第二类候选场景。
本实施例中,当接收到用户输入的对话信息时,抽取对话信息中的特征信息,通过将预置候选场景与该特征信息进行匹配程度的计算,得到匹配程度较高的部分场景作为第二类候选场景,其中抽取出来的特征信息包括有用户意图、此对话信息与前一段对话信息的关联性以及在预置候选场景中用户关于此类问题的偏好性等。
例如,当用户输入的对话信息是“中午吃什么”时,在获取用户信息的同时,依据此信息和用户此前问过的类似的问题,此时的特征信息可能就有用户经常的消费行为,用户经常在哪里吃,用户的口味等,通过对比这些特征信息从而选择较为合适的吃饭地点,此时可能就会回复“去×××餐厅吃川菜吧”或者“自己在家做饭吧”等。
再例如,用户对话信息是“我要健身”,此时判别模型除会获取用户信息外,还根据此信息获取到用户需要锻炼了,而此时也不单单只是获取对话信息中的信息,更会根据对话的历史信息,从历史对话中获取之前对话提及过关于锻炼或者健身的问题集合,并从集合中提取用户的选择偏好、关注的健身方式以及常去的场所等等,当获取一定的相关特征时,便根据特征信息,通过判别模型对场景进行筛选,可能就会回复“去×××健身俱乐部去吧”或者“去护城河边区跑步吧”。
通过实施例二和实施例三,可以发现,由于预置的场景识别规则是一个设定好的不能改变的规则,所以在识别过程中缺乏一定的灵活性,面对一个问题时,所能回复的永远只有一个或者几个固定的答案;而通过预置的判别模型可以较为准确的识别用户意图,进而给出更为合适的答案,但是此方法需积累一定量对话信息数据。于是通过此两种方法对预置候选场景进行第一次筛选,选择出较为合适的部分场景,为第二次的准确筛选缩小筛选范围。
实施例四:
参照图4,图4为图1中步骤S40的细化流程示意图。基于上述实施例一,在本实施例中,上述步骤S40进一步包括:
步骤S401,接收第一类候选场景和第二类候选场景,并将接收到的候选场景作为增强学的状态集合;
步骤S402,将对话信息作为增强学习的动作,通过增强学习筛选出状态集合中的最佳状态,进而确定最优对话场景。
本实施例中,在接收到第一类候选场景和第二类候选场景之后,将候选场景中的各场景当作一个状态,把用户对话信息作为一个动作,通过增强学习中的值函数或者Q函数结合当前动作对各个状态进行计算,将计算得到的值进行排序,选取值最大的作为最优状态,所述最优状态对应的场景即为最优对话场景。
例如,当用户对话信息为“我要去健身”时,通过场景是被规则和场景判别模型得到的第一类候选场景和第二类候选场景的场景集合就可以有“去×××健身俱乐部去吧”、“去护城河边区跑步吧”、“去找一个健身教练吧”、“去办一张健身卡吧”、“我不要健身”等等。智能机器人清楚了解用户的目标,通过值函数的计算,每一个场景都对应一个值,比如,“我不要健身”所对应的值为54、“去护城河边区跑步吧”所对应的值为63、“去×××健身俱乐部去吧”所对应的值为72、“去办一张健身卡吧”所对应的值为81、“去找一个健身教练吧”所对应的值为90,所以此时最优的回答可以是“去找一个健身教练吧”。
本发明还保护一种对话场景识别终端。
在本发明中,在本发明终端一实施例中,对话场景识别终端包括:
存储有对话场景识别程序的存储器;处理器,配置为执行所述对话场景识别程序以执行下述操作:
接收输入的用户对话信息;
基于所述用户对话信息,采用预置的场景识别规则对预置候选场景进行筛选,得到所述用户对话信息对应的第一类候选场景;以及基于所述用户对话信息,采用场景判别模型对所述预置候选场景进行筛选,得到所述用户对话信息对应的第二类候选场景;
基于所述第一类候选场景与所述第二类候选场景,对所述用户对话信息进行增强学习处理,得到与所述用户对话信息对应的最优对话场景;
判断所述最优对话场景与当前对话场景是否相同,若不相同,则将所述最优对话场景作为当前对话场景。
本实施例中,当用户与智能机器人对话时,智能机器人通过语音交互***接收用户输入的对话信息。其中,智能机器人接收用户对话信息的方式包括:将声音进行信息转化、利用***中的声音识别***。
将声音进行信息转换就是将声音转化为电波,再将声音转化为智能机器人所能识别的信息,机器人通过接收信息,进行相应反馈。
利用声音识别***时通过识别用户的音调、音色等,通过音调及音色对应的信息做出相应的反馈。
本实施例中,当接收到用户输入的对话信息时,通过使用场景识别规则,对预置场景信息进行筛选,得到相对应的候选场景。场景识别规则具体基于人的实践经验而设定的对话规则,且本实施例对于预置场景识别规则的设置不限。
比如,通过获取对话信息中的关键词进行场景识别。例如,当用户输入对话信息为“你是谁,今年几岁了”时,获取的规则就是“身份”以及“年龄”,此时场景识别规则可设定为人的基本情况介绍,因此对应的回答可以是“你好,我叫小白,今年两岁”。再例如,当用户输入对话信息为“我要查询机票”时,获取的对话关键词就是“查询机票”,此时场景识别规则开设定为查询机票方式的提供,因此对应的回答可以是“出发时间时哪天”。
再比如,通过问题和答案的对应进行场景识别。例如,当用户输入对话信息为“你和我谁更帅”时,此时利用场景识别规则直接对应的答案可以是“当然是我了”或者“我更帅”。再例如,当用户输入对话信息为“晚安”,此时可以直接回答“晚安”。
本实施例中,场景判别模型是机器学习的一种算法,具体是通过把很多相关信息都提取出来,结合历史信息,找寻历史信息与所提取出来的信息是否存在相似,若相似则会将相似的场景归为一类。判别模型的算法有多种,且在本实施例中判别模型的算法所使用的类型是不限的。本实施例中,所使用的判别模型计算方式可以是:计算特征信息与候选场景信息的相关性的大小,进而确定候选场景。
例如,当用户对话信息为“我要健身”时,此时会获取用户信息外,还会根据此信息获取到用户想要锻炼,更会从历史对话中获取之前对话提及过关于锻炼或者健身的问题的相关信息,在获取相关的特征信息包括用户意图理解、历史对话信息、用户偏好信息时,便根据特征信息,通过判别模型对场景进行筛选,此时的回答可以是“去×××健身俱乐部去吧”或者“去护城河边区跑步吧”,而不会是“我不要健身”。
再例如,当用户对话信息为“晚餐吃什么呢”,在场景中可能存在的相关场景就有“晚餐去西餐厅吃牛排”、“晚餐去吃湘菜”、“晚餐自己做蛋炒饭”或者“我不吃晚餐”等等。以上的四种场景都有一个相似点就是吃晚餐,但是第四个和前三个明显就有一个吃晚餐的对象不一样的问题,前三个时用户而第四个却变成了机器人。所以当用户对话说“晚餐吃什么”的时候,很显然第四个是不符合此时的场景的。
本实施例中,增强学习是一个自主学习的过程,通过不断的学习,选择一个能达到目标的最优的动作。增强学习可以通过多种方式来实现,由于在增强学习的过程中有个值函数(状态值函数)、Q函数(动作值函数)或者策略等,而且值函数、Q函数或者策略是根据不同的任务进行不同的定义,所以本实施例中对于其实现的方式是不限的。
本实施例中,将通过步骤S20得到的第一类候选场景和通过步骤S30得到第二类候选场景作为增强学习的候选场景集合。在获取用户对话信息动作时,以此候选场景为状态集合,通过增强学习实现对候选场景的筛选。
例如,当用户对话信息为“晚餐吃什么呢”,经过场景识别规则和场景判别模型的第一次筛选之后得到第一类候选场景和第二类候选场景。此时候选场景可以包括有:“晚餐去西餐厅吃牛排”、“晚餐去吃湘菜”、“晚餐自己做蛋炒饭”、“晚餐自己做菜吧”、“六点之后再吃晚餐吧”、“我不吃晚餐”等等。
在用户问出“晚餐吃什么”的问题时,智能机器人清楚了解用户的目标,通过值函数的计算,每一个场景都对应一个值,比如,“晚餐去西餐厅吃牛排”所对应的值为54、“晚餐去吃湘菜”所对应的值为63、“晚餐自己做菜吧”所对应的值为72、“六点之后再吃晚餐吧”所对应的值为81、“晚餐自己做蛋炒饭”所对应的值为90,此时不同的值代表着与目标的接近程度(满分100,即达到目标),所以此时最优的回答可以是“晚餐自己做蛋炒饭”。
本实施例中,通过增强学习中的值函数的计算,利用数值对场景进行一个打分排序,选取打分最高的一个场景作为最优的场景输出。
本实施例中,当通过增强学习筛选出最优的对话场景时,将最优对话场景与当前对话场景进行对比,若最优对话场景与当前度化场景没有变化,则当前对话场景不变,若对比发现最优对话场景与当前对话场景不一样,则将最优对话场景作为最新的当前对话场景输出。例如,用户之前和机器人对话的场景是关于天气的话题场景,而当用户再次与机器人对话时,根据对话信息筛选出来的时关于吃饭的话题场景,此时会将对话场景从前面的关于天气的话题场景转变为关于吃饭的话题场景。
在本实施例中,将最优的对话场景和当前的对话场景中最为合适的对话场景输出,并根据最为合适的对话场景做出相应的操作。
进一步可选的,在本发明终端一实施例中,处理器执行基于所述用户对话信息,采用预置的场景识别规则对预置候选场景进行筛选,得到所述用户对话信息对应的第一类候选场景的操作包括:
抽取所述用户对话信息中的关键词;
基于所述关键词,筛选所述预置候选场景中与所述关键词相关的场景,并将所述相关的场景作为所述用户对话信息对应的所述第一类候选场景。
本实施例中,当接收到用户输入的对话信息时,根据对话信息抽取其中的关键词,然后依据所抽取出来的关键词筛选预置候选场景中与该关键词相关的程度较高的场景,并将相关程度较高的部分场景作为第一类候选场景。
例如,用户输入的对话信息是“我想要吃川菜”,当接收到此输入信息时,抽取信息中的关键词“吃饭”和“川菜”,此时根据关键词去和预置候选场景进行匹配,获取相关程度较高的部分场景。当获取了关键词“吃”和“食物”时,此时会匹配到的场景可能就有关于附近川菜馆的场景信息,进而获取更多关于“吃饭”和“川菜”的场景作为第一类候选场景。
再例如,用户输入的对话信息是“我想要去健身”,在接收到此信息时,可以很清晰的获取其中的关键词“健身”,此时获取的场景信息可能就是:“健身的项目有什么”、“健身的地点在哪里”、“怎么健身”等一系列与“健身”相关的场景就会出现在候选场景中,比如智能机器人输出的对话为“你是想要跑步还是想要去健身房”,用户可以再次选择“我想去跑步”。此时便选取了对话的场景。
本实施例中,通过识别规则获取第一类候选场景信息,获取的对话信息的关键词,而匹配的对话场景也是提及关键词的对话场景,是设置好的对话场景信息,不会随着用户的变化而改变。
进一步可选的,在本发明终端一实施例中,处理器执行基于所述用户对话信息,采用场景判别模型对所述预置候选场景进行筛选,得到所述用户对话信息对应的第二类候选场景的操作包括:
抽取所述用户对话信息中的特征信息;
基于所述特征信息,通过所述场景判别模型计算所述预置候选场景与所述特征信息的匹配程度,并将匹配程度较高的部分场景作为所述用户对话信息对应的第二类候选场景。
本实施例中,当接收到用户输入的对话信息时,抽取对话信息中的特征信息,通过将预置候选场景与该特征信息进行匹配程度的计算,得到匹配程度较高的部分场景作为第二类候选场景,其中抽取出来的特征信息包括有用户意图、此对话信息与前一段对话信息的关联性以及在预置候选场景中用户关于此类问题的偏好性等。
例如,当用户输入的对话信息是“中午吃什么”时,在获取用户信息的同时,依据此信息和用户此前问过的类似的问题,此时的特征信息可能就有用户经常的消费行为,用户经常在哪里吃,用户的口味等,通过对比这些特征信息从而选择较为合适的吃饭地点,此时可能就会回复“去×××餐厅吃川菜吧”或者“自己在家做饭吧”等。
再例如,用户对话信息是“我要健身”,此时判别模型除会获取用户信息外,还根据此信息获取到用户需要锻炼了,而此时也不单单只是获取对话信息中的信息,更会根据对话的历史信息,从历史对话中获取之前对话提及过关于锻炼或者健身的问题集合,并从集合中提取用户的选择偏好、关注的健身方式以及常去的场所等等,当获取一定的相关特征时,便根据特征信息,通过判别模型对场景进行筛选,可能就会回复“去×××健身俱乐部去吧”或者“去护城河边区跑步吧”。
进一步可选的,在本发明终端一实施例中,处理器执行基于所述第一类候选场景与所述第二类候选场景,对所述用户对话信息进行增强学习处理,得到与所述用户对话信息对应的最优对话场景的操作包括:
接收第一类候选场景和第二类候选场景,并将接收到的候选场景作为增强学的状态集合;
将对话信息作为增强学习的动作,通过增强学习筛选出状态集合中的最佳状态,进而确定最优对话场景。
本实施例中,在接收到第一类候选场景和第二类候选场景之后,将候选场景中的各场景当作一个状态,把用户对话信息作为一个动作,通过增强学习中的值函数或者Q函数结合当前动作对各个状态进行计算,将计算得到的值进行排序,选取值最大的作为最优状态,所述最优状态对应的场景即为最优对话场景。
例如,当用户对话信息为“我要去健身”时,通过场景是被规则和场景判别模型得到的第一类候选场景和第二类候选场景的场景集合就可以有“去×××健身俱乐部去吧”、“去护城河边区跑步吧”、“去找一个健身教练吧”、“去办一张健身卡吧”、“我不要健身”等等。智能机器人清楚了解用户的目标,通过值函数的计算,每一个场景都对应一个值,比如,“我不要健身”所对应的值为54、“去护城河边区跑步吧”所对应的值为63、“去×××健身俱乐部去吧”所对应的值为72、“去办一张健身卡吧”所对应的值为81、“去找一个健身教练吧”所对应的值为90,所以此时最优的回答可以是“去找一个健身教练吧”。
本发明实施例还提出一种计算机可读存储介质。
本发明计算机可读存储介质上存储有对话场景识别程序,所述对话场景识别程序被处理器执行时实现如上所述实施例中的对话场景识别方法的步骤。
本实施例提出的对话场景识别方法,在具体的场景变化过程中,当对话场景发生改变的时候,首先采用预置的场景识别规则和场景判别模型对预置候选场景进行第一次筛选,并得到相应的候选场景,然后利用增强学习策略对候选场景进行第二次筛选,进而得到最优的对话场景,最后根据最优的对话场景选择合适的对话结果回复用户,从而实现了对当前对话场景变化的准确识别,进而提升用户人机交互的使用体验。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者***不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者***所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者***中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (9)

1.一种对话场景识别方法,其特征在于,所述对话场景识别方法包括以下步骤:
接收输入的用户对话信息;
基于所述用户对话信息,采用预置的场景识别规则对预置候选场景进行筛选,得到所述用户对话信息对应的第一类候选场景;以及提取所述用户对话信息中的特征信息,基于所述特征信息,采用场景判别模型对所述预置候选场景进行筛选,得到所述用户对话信息对应的第二类候选场景,其中,所述特征信息包括用户意图、所述用户对话信息与前一段对话信息的关联性和在预置候选场景中用户关于此类问题的偏好性;
基于所述第一类候选场景与所述第二类候选场景,对所述用户对话信息进行增强学习处理,得到与所述用户对话信息对应的最优对话场景,具体包括,通过所述增强学习处理中的值函数计算确定所述第一类候选场景对应的值,和所述第二类候选场景对应的值,并基于所述第一类候选场景对应的值和所述第二类候选场景对应的值进行打分排序,根据所述打分排序确定打分最高的一个场景作为所述用户对话信息对应的最优对话场景;
判断所述最优对话场景与当前对话场景是否相同,若不相同,则将所述最优对话场景作为当前对话场景。
2.如权利要求1所述的对话场景识别方法,其特征在于,所述基于所述用户对话信息,采用预置的场景识别规则对候选场景进行筛选处理,得到所述用户对话信息对应的第一类候选场景的步骤包括:
抽取所述用户对话信息中的关键词;
基于所述关键词,筛选所述预置候选场景中与所述关键词相关的场景,并将所述相关的场景作为所述用户对话信息对应的所述第一类候选场景。
3.如权利要求1所述的对话场景识别方法,其特征在于,所述基于所述特征信息,采用场景判别模型对所述预置候选场景进行筛选处理,得到所述用户对话信息对应的第二类候选场景的步骤包括:
基于所述特征信息,通过所述场景判别模型计算所述预置候选场景与所述特征信息的匹配程度,并将匹配程度较高的部分场景作为所述用户对话信息对应的第二类候选场景。
4.如权利要求1所述的对话场景识别方法,其特征在于,所述基于所述第一类候选场景与所述第二类候选场景,对所述用户对话信息进行增强学习处理,得到与所述用户对话信息对应的最优对话场景的步骤包括:
以所述用户对话信息为动作、所述第一类候选场景与所述第二类候选场景为状态,对所述用户对话信息进行增强学习处理,以供从所述第一类候选场景与所述第二类候选场景中筛选出最优对话场景。
5.一种对话场景识别终端,其特征在于,所述对话场景识别终端包括:
存储有对话场景识别程序的存储器;
处理器,配置为执行所述对话场景识别程序以执行下述操作:
接收输入的用户对话信息;
基于所述用户对话信息,采用预置的场景识别规则对预置候选场景进行筛选,得到所述用户对话信息对应的第一类候选场景;以及提取所述用户对话信息中的特征信息,基于所述特征信息,采用场景判别模型对所述预置候选场景进行筛选,得到所述用户对话信息对应的第二类候选场景,其中,所述特征信息包括用户意图、所述用户对话信息与前一段对话信息的关联性和在预置候选场景中用户关于此类问题的偏好性;
基于所述第一类候选场景与所述第二类候选场景,对所述用户对话信息进行增强学习处理,得到与所述用户对话信息对应的最优对话场景,具体包括,通过所述增强学习处理中的值函数计算确定所述第一类候选场景对应的值,和所述第二类候选场景对应的值,并基于所述第一类候选场景对应的值和所述第二类候选场景对应的值进行打分排序,根据所述打分排序确定打分最高的一个场景作为所述用户对话信息对应的最优对话场景;
判断所述最优对话场景与当前对话场景是否相同,若不相同,则将所述最优对话场景作为当前对话场景。
6.如权利要求5所述的对话场景识别终端,其特征在于,执行所述基于所述用户对话信息,采用预置的场景识别规则对预置候选场景进行筛选,得到所述用户对话信息对应的第一类候选场景的操作包括:
抽取所述用户对话信息中的关键词;
基于所述关键词,筛选所述预置候选场景中与所述关键词相关的场景,并将所述相关的场景作为所述用户对话信息对应的所述第一类候选场景。
7.如权利要求5所述的对话场景识别终端,其特征在于,执行所述基于所述特征信息,采用场景判别模型对所述预置候选场景进行筛选,得到所述用户对话信息对应的第二类候选场景的操作包括:
基于所述特征信息,通过所述场景判别模型计算所述预置候选场景与所述特征信息的匹配程度,并将匹配程度较高的部分场景作为所述用户对话信息对应的第二类候选场景。
8.如权利要求5所述的对话场景识别终端,其特征在于,执行所述基于所述第一类候选场景与所述第二类候选场景,对所述用户对话信息进行增强学习处理,得到与所述用户对话信息对应的最优对话场景的操作包括:
以所述用户对话信息为动作、所述第一类候选场景与所述第二类候选场景为状态,对所述用户对话信息进行增强学习处理,以供从所述第一类候选场景与所述第二类候选场景中筛选出最优对话场景。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有对话场景识别程序,所述对话场景识别程序被处理器执行时实现如权利要求1至4中任一项所述的对话场景识别方法的步骤。
CN201710636464.5A 2017-07-28 2017-07-28 对话场景识别方法、终端以及计算机可读存储介质 Active CN107644641B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710636464.5A CN107644641B (zh) 2017-07-28 2017-07-28 对话场景识别方法、终端以及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710636464.5A CN107644641B (zh) 2017-07-28 2017-07-28 对话场景识别方法、终端以及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN107644641A CN107644641A (zh) 2018-01-30
CN107644641B true CN107644641B (zh) 2021-04-13

Family

ID=61110969

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710636464.5A Active CN107644641B (zh) 2017-07-28 2017-07-28 对话场景识别方法、终端以及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN107644641B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109086860B (zh) * 2018-05-28 2022-03-15 北京光年无限科技有限公司 一种基于虚拟人的交互方法及***
CN108804603B (zh) * 2018-05-29 2021-07-23 北京灵智优诺科技有限公司 人机书面对话方法及***、服务器、介质
CN110858226A (zh) * 2018-08-07 2020-03-03 北京京东尚科信息技术有限公司 对话管理方法和装置
CN111475206B (zh) * 2019-01-04 2023-04-11 优奈柯恩(北京)科技有限公司 用于唤醒可穿戴设备的方法及装置
CN111813900B (zh) * 2019-04-10 2023-12-08 北京猎户星空科技有限公司 多轮对话处理方法、装置、电子设备及存储介质
CN110880324A (zh) * 2019-10-31 2020-03-13 北京大米科技有限公司 语音数据的处理方法、装置、存储介质及电子设备
CN111161739B (zh) * 2019-12-28 2023-01-17 科大讯飞股份有限公司 语音识别方法及相关产品
CN111290953B (zh) * 2020-01-22 2021-09-14 华为技术有限公司 分析测试日志的方法与装置
CN113488036A (zh) * 2020-06-10 2021-10-08 海信集团有限公司 一种多轮语音交互方法、终端及服务器
CN111881254A (zh) * 2020-06-10 2020-11-03 百度在线网络技术(北京)有限公司 话术生成方法、装置、电子设备及存储介质
CN112487170B (zh) * 2020-12-14 2023-12-15 南京三眼精灵信息技术有限公司 面向场景配置的人机交互对话机器人***
CN113822058A (zh) * 2021-09-18 2021-12-21 上海明略人工智能(集团)有限公司 对话信息抽取方法、***和计算机可读存储介质

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1417679A (zh) * 2001-10-21 2003-05-14 微软公司 以对话为目的的应用抽象
CN1781140A (zh) * 2003-03-20 2006-05-31 索尼株式会社 语音对话设备、方法和机器人设备
CN1881206A (zh) * 2005-06-15 2006-12-20 富士通株式会社 对话***
CN101551998A (zh) * 2009-05-12 2009-10-07 上海锦芯电子科技有限公司 一组可以进行语音互动的装置以及其和人的语音互动方法
CN102395013A (zh) * 2011-11-07 2012-03-28 康佳集团股份有限公司 一种对智能电视机的语音控制方法和***
CN102708454A (zh) * 2012-05-14 2012-10-03 北京奇虎科技有限公司 终端故障解决方案提供方法及装置
CN103413549A (zh) * 2013-07-31 2013-11-27 深圳创维-Rgb电子有限公司 语音交互的方法、***以及交互终端
CN103974366A (zh) * 2014-04-28 2014-08-06 南京邮电大学 一种基于增强学习的无线体域网路由方法
CN104464733A (zh) * 2014-10-28 2015-03-25 百度在线网络技术(北京)有限公司 一种语音对话的多场景管理方法及装置
CN104506906A (zh) * 2014-11-12 2015-04-08 科大讯飞股份有限公司 基于电视场景元素及语音助手的语音交互辅助方法及***
CN105575386A (zh) * 2015-12-18 2016-05-11 百度在线网络技术(北京)有限公司 语音识别方法和装置
CN105975511A (zh) * 2016-04-27 2016-09-28 乐视控股(北京)有限公司 智能对话的方法及装置
CN106020488A (zh) * 2016-06-03 2016-10-12 北京光年无限科技有限公司 一种面向对话***的人机交互方法及装置
CN106528522A (zh) * 2016-08-26 2017-03-22 南京威卡尔软件有限公司 场景化的语义理解与对话生成方法及***
CN106847271A (zh) * 2016-12-12 2017-06-13 北京光年无限科技有限公司 一种用于对话交互***的数据处理方法及装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004233676A (ja) * 2003-01-30 2004-08-19 Honda Motor Co Ltd 対話制御装置
US20090265022A1 (en) * 2008-04-21 2009-10-22 Microsoft Corporation Playback of multimedia during multi-way communications
CN103456301B (zh) * 2012-05-28 2019-02-12 中兴通讯股份有限公司 一种基于环境声音的场景识别方法及装置及移动终端
JP6255274B2 (ja) * 2014-02-19 2017-12-27 シャープ株式会社 情報処理装置、音声対話装置、および制御プログラム
US10009475B2 (en) * 2014-02-28 2018-06-26 Dolby Laboratories Licensing Corporation Perceptually continuous mixing in a teleconference
US9668073B2 (en) * 2015-10-07 2017-05-30 Robert Bosch Gmbh System and method for audio scene understanding of physical object sound sources
CN106356070B (zh) * 2016-08-29 2019-10-29 广州市百果园网络科技有限公司 一种音频信号处理方法,及装置

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1417679A (zh) * 2001-10-21 2003-05-14 微软公司 以对话为目的的应用抽象
CN1781140A (zh) * 2003-03-20 2006-05-31 索尼株式会社 语音对话设备、方法和机器人设备
CN1881206A (zh) * 2005-06-15 2006-12-20 富士通株式会社 对话***
CN101551998A (zh) * 2009-05-12 2009-10-07 上海锦芯电子科技有限公司 一组可以进行语音互动的装置以及其和人的语音互动方法
CN102395013A (zh) * 2011-11-07 2012-03-28 康佳集团股份有限公司 一种对智能电视机的语音控制方法和***
CN102708454A (zh) * 2012-05-14 2012-10-03 北京奇虎科技有限公司 终端故障解决方案提供方法及装置
CN103413549A (zh) * 2013-07-31 2013-11-27 深圳创维-Rgb电子有限公司 语音交互的方法、***以及交互终端
CN103974366A (zh) * 2014-04-28 2014-08-06 南京邮电大学 一种基于增强学习的无线体域网路由方法
CN104464733A (zh) * 2014-10-28 2015-03-25 百度在线网络技术(北京)有限公司 一种语音对话的多场景管理方法及装置
CN104506906A (zh) * 2014-11-12 2015-04-08 科大讯飞股份有限公司 基于电视场景元素及语音助手的语音交互辅助方法及***
CN105575386A (zh) * 2015-12-18 2016-05-11 百度在线网络技术(北京)有限公司 语音识别方法和装置
CN105975511A (zh) * 2016-04-27 2016-09-28 乐视控股(北京)有限公司 智能对话的方法及装置
CN106020488A (zh) * 2016-06-03 2016-10-12 北京光年无限科技有限公司 一种面向对话***的人机交互方法及装置
CN106528522A (zh) * 2016-08-26 2017-03-22 南京威卡尔软件有限公司 场景化的语义理解与对话生成方法及***
CN106847271A (zh) * 2016-12-12 2017-06-13 北京光年无限科技有限公司 一种用于对话交互***的数据处理方法及装置

Also Published As

Publication number Publication date
CN107644641A (zh) 2018-01-30

Similar Documents

Publication Publication Date Title
CN107644641B (zh) 对话场景识别方法、终端以及计算机可读存储介质
CN105487663B (zh) 一种面向智能机器人的意图识别方法和***
CN110046221B (zh) 一种机器对话方法、装置、计算机设备及存储介质
CN106096576B (zh) 一种机器人的智能服务方法
CN113360622B (zh) 用户对话信息的处理方法、装置及计算机设备
CN110110049A (zh) 服务咨询方法、装置、***、服务机器人及存储介质
CN110569344B (zh) 确定对话文本对应的标准问句的方法和装置
CN111199149B (zh) 一种对话***的语句智能澄清方法及***
US20210097288A1 (en) Method and system for generating video
US20120226642A1 (en) Method and apparatus for considering multi-user preference based on multi-user-criteria group
CN111078856A (zh) 一种群聊对话处理方法、装置及电子设备
CN109787885A (zh) 一种问答服务方法
CN111540355B (zh) 基于语音助手的个性化设置方法和设备
CN111161726A (zh) 一种智能语音交互方法、设备、介质及***
CN110245826A (zh) 一种数据分析方法及装置
WO2023273776A1 (zh) 语音数据的处理方法及装置、存储介质、电子装置
CN106356056B (zh) 语音识别方法和装置
CN106503189A (zh) 基于人工智能的搜索***优化方法和装置
CN113205129B (zh) 一种作弊团伙识别方法、装置、电子设备及存储介质
CN112182189A (zh) 一种对话处理方法、装置、电子设备及存储介质
CN109726002B (zh) 一种处理流程调整方法及装置
CN115083412B (zh) 语音交互方法及相关装置、电子设备、存储介质
CN116052646A (zh) 语音识别方法、装置、存储介质和计算机设备
CN109255016A (zh) 基于深度学习的应答方法、装置及计算机可读存储介质
CN111627452B (zh) 一种语音解码方法、装置和终端设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant