CN112560508A - 对话处理方法、装置及设备 - Google Patents
对话处理方法、装置及设备 Download PDFInfo
- Publication number
- CN112560508A CN112560508A CN202011536074.9A CN202011536074A CN112560508A CN 112560508 A CN112560508 A CN 112560508A CN 202011536074 A CN202011536074 A CN 202011536074A CN 112560508 A CN112560508 A CN 112560508A
- Authority
- CN
- China
- Prior art keywords
- text
- user
- target
- entity
- reply
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 19
- 238000012545 processing Methods 0.000 claims abstract description 29
- 238000000034 method Methods 0.000 claims description 77
- 238000004590 computer program Methods 0.000 claims description 13
- 238000005516 engineering process Methods 0.000 claims description 5
- 230000008569 process Effects 0.000 description 28
- 230000003993 interaction Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 239000004575 stone Substances 0.000 description 2
- 241000206389 Helleborus Species 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007123 defense Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Human Computer Interaction (AREA)
- Machine Translation (AREA)
Abstract
本申请实施例提供一种对话处理方法、装置及设备,该方法包括:获取用户输入的第一文本;根据第一文本,确定用于回复第一文本的第二文本,以及获取第一文本的意图和槽位信息,根据第一文本的意图和槽位信息,从预先构建的知识图谱中获取与意图相匹配的实体;从知识图谱中获取与实体相关的第一目标关系和/或第一目标属性;根据实体、第一目标关系和/或第一目标属性,生成第三文本;输出第二文本和第三文本。通过本方案,由于输出用于回复第二文本的同时,还根据知识图谱以及用户输入的第一文本输出第三文本,从而利用第三文本主动引导对话,解决现有技术中由用户主导对话易导致对话终止的情况,从而推动人机对话的进行,提升用户体验。
Description
技术领域
本申请实施例涉及人机交互技术领域,尤其涉及一种对话处理方法、装置及设备
背景技术
人机交互是研究***与用户之间的交互关系的科学,可以通过人机交互实现各种人工智能***,例如,智能客服***、语音控制***等。其中,智能问答***一般以用户作为对话驱动者,当用户提出问题后,智能问答***识别用户所提出的问题,然后从知识库中找出与该问题相匹配的答案,再将答案输出给用户,以完成对话过程。
然而,上述过程中是以用户作为对话的主导者,若用户没有主动推导对话,很容易造成对话终止的情况。因此,亟需一种对话处理方法,根据对话内容主动引导对话过程。
发明内容
鉴于上述问题,本申请实施例提供一种对话处理方法、装置及设备。用以解决现有技术中,人机对话时由用户作为对话的主导者,容易造成对话终止的情况。
第一方面,本申请实施例提供一种对话处理方法,包括:
获取用户输入的第一文本;
根据第一文本,确定用于回复第一文本的第二文本,以及获取第一文本的意图和槽位信息,根据第一文本的意图和槽位信息,从预先构建的知识图谱中获取与意图相匹配的实体;
从知识图谱中获取与实体相关的第一目标关系和/或第一目标属性,其中,第一目标关系与第一文本中的关系不同,第一目标属性与第一文本中的属性不同;
根据实体、第一目标关系和/或第一目标属性,生成第三文本;
输出第二文本和第三文本。
可选的,根据实体、第一目标关系和/或第一目标属性,生成第三文本之后,还包括:
根据第三文本,生成第三文本的正确回复文本集;
输出第二文本和第三文本之后,还包括:
获取用户输入的用于回复第三文本的第四文本;
若第四文本与正确回复文本集相匹配,则输出用于称赞用户的回复文本。
可选的,方法还包括:
若第四文本与正确回复文本集不匹配,则输出用于安慰用户的回复文本和/或正确回复文本。
可选的,方法还包括:
若第四文本与正确回复文本集不匹配且与预设回复文本集相匹配,则输出用于安慰用户的回复文本和/或正确回复文本;
若第四文本与正确回复文本集和预设回复文本集均不匹配,则确定第四文本为第一文本。
可选的,方法还包括:
若输出用于称赞用户的回复文本,或者,输出用于安慰用户的回复文本和/或正确回复文本,则从知识图谱中获取与实体相关的第二目标关系和/或第二目标属性,其中,第二目标关系与第一文本中的关系不同,第二目标属性与第一文本中的属性不同;
根据实体、第二目标关系和/或第二目标属性,生成第五文本;
输出第五文本。
可选的,方法还包括:
采用网络爬虫技术,从互联网上获取多个样本文本;
提取每个样本文本中的实体、关系、属性的三元关系;
根据各个样本文本中三元关系,构建知识图谱。
第二方面,本申请实施例还提供一种话处理装置,包括:
获取模块,用于获取用户输入的第一文本;
确定模块,用于根据第一文本,确定用于回复第一文本的第二文本,以及获取第一文本的意图和槽位信息,根据第一文本的意图和槽位信息,从预先构建的知识图谱中获取与意图相匹配的实体;
获取模块,还用于从知识图谱中获取与实体相关的第一目标关系和/或第一目标属性,其中,第一目标关系与第一文本中的关系不同,第一目标属性与第一文本中的属性不同;
处理模块,用于根据实体、第一目标关系和/或第一目标属性,生成第三文本;
输出模块,用于输出第二文本和第三文本。
可选的,处理模块还用于,根据第三文本,生成第三文本的正确回复文本集;
获取模块还用于,获取用户输入的用于回复第三文本的第四文本;
若第四文本与正确回复文本集相匹配,则输出用于称赞用户的回复文本。
可选的,输出模块还用于,若第四文本与正确回复文本集不匹配且与预设回复文本集相匹配,则输出用于安慰用户的回复文本和/或正确回复文本;
若第四文本与正确回复文本集和预设回复文本集均不匹配,则确定第四文本为第一文本。
可选的,输出模块还用于,若输出用于称赞用户的回复文本,或者,输出用于安慰用户的回复文本和/或正确回复文本,则从知识图谱中获取与实体相关的第二目标关系和/或第二目标属性,其中,第二目标关系与第一文本中的关系不同,第二目标属性与第一文本中的属性不同;
根据实体、第二目标关系和/或第二目标属性,生成第五文本;
输出第五文本。
可选的,获取模块还用于,采用网络爬虫技术,从互联网上获取多个样本文本;
提取每个样本文本中的实体、关系、属性的三元关系;
根据各个样本文本中三元关系,构建知识图谱。
第三方面,本申请实施例还提供一种电子设备,包括:
存储器,用于存储程序指令;
处理器,用于调用并执行所述存储器中的程序指令,执行如第一方面所述的方法。
第四方面,本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序;所述计算机程序被处理器执行时,实现如第一方面所述的方法。
第五方面,本申请实施例还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时,实现如第一方面所述的方法。
本申请实施例提供一种对话处理方法、装置及设备,获取用户输入的第一文本;根据第一文本,确定用于回复第一文本的第二文本,以及获取第一文本的意图和槽位信息,根据第一文本的意图和槽位信息,从预先构建的知识图谱中获取与意图相匹配的实体;从知识图谱中获取与实体相关的第一目标关系和/或第一目标属性;根据实体、第一目标关系和/或第一目标属性,生成第三文本;输出第二文本和第三文本。通过本方案,由于输出用于回复第二文本的同时,还根据知识图谱以及用户输入的第一文本输出第三文本,从而利用第三文本主动引导对话,解决现有技术中由用户主导对话易导致对话终止的情况,从而推动人机对话的进行,提升用户体验。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请一实施例提供的对话处理方法的应用场景示意图;
图2为本申请一实施例提供的对话处理方法的流程示意图;
图3为本申请另一实施例提供的对话处理方法的流程示意图;
图4为本申请一实施例提供的对话处理装置的结构示意图;
图5为本申请一实施例提供的电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。
应当理解,在本申请的各种实施例中,各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
应当理解,在本申请中,“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
描述包括对形成详细描述的一部分的附图的参考。附图示出了根据示例性实施方式的图示。在本文中也可被称为“示例”的这些实施方式被足够详细地描述,以使本领域中的技术人员能够实践本文所描述的所要求保护的主题的实施方式。在不偏离所要求保护的主题的范围和精神的情况下,可组合实施方式,可使用其它实施方式,或可做出结构、逻辑和电气改变。应理解的是,本文中所描述的实施方式并不旨在限制主题的范围,而是使本领域中的技术人员能够实践、制作和/或使用该主题。
首先对本申请所涉及的名词进行说明:
实体(Entity):实体是对客观个体的抽象,一个人、一个地名、一部电影、一句话都可以看作是一个实体,例如,河北,石家庄。
关系(relation):关系是实体与实体之间关系的抽象。例如,河北(entity)→省会(relation)→石家庄(entity),“省会”这个关系则是描述河北和石家庄的关系。
属性(property):属性是对实体与实体之间关系的抽象。例如,例如河北是一个实体,石家庄是一个实体,两个实体之间存在着关系即为:河北→省会→石家庄,则河北与石家庄的关系可以用属性“省会”刻画。
人机交互是研究***与用户之间的交互关系的科学,可以通过人机交互实现各种人工智能***,例如,智能客服***、语音控制***等。其中,以智能问答***为例,智能问答***一般以用户作为对话驱动者,当用户提出问题后,智能问答***识别用户所提出的问题,然后从知识库中找出与该问题相匹配的答案,再将答案输出给用户,以完成对话过程。
然而,上述过程中是以用户作为对话的主导者,在交互过程中,一般是以人作为对话驱动提出问题,机器人作为回答方,对人输入的问题进行解答。这样的交流需要人来的找话题,切换感兴趣的点驱动对话,上述过程若用户没有主动推导对话,很容易造成对话终止的情况。因此,亟需一种对话处理方法,根据对话内容主动引导对话过程。
有鉴于此,本申请实施例提供一种对话处理方法,针对用户输入的文本信息,确定用户意图,在给出该文本信息的答案的同时,根据用户输入的文本信息以及预先建立的知识图谱,生成与用户输入文本相关的问题,以主动引导对话,解决现有技术中由用户主导对话易导致对话终止的情况,推动人机对话,从而提升用户体验。
图1为本申请一实施例提供的对话处理方法的应用场景示意图。如图1所示,该场景包括:用户、终端设备101、服务器102。
在本申请实施例中,服务器102可以为任意配置了处理器与存储器的电子设备,或者电子设备的集合,本申请实施例也不做具体限定。
终端设备101可以是任意能够与用户进行对话的设备,比如,可以是机器类通信的用户设备。该终端设备101也可称之为用户设备(user equipment,UE)、移动台(mobilestation,MS)、移动终端(mobile terminal)、终端(terminal)等,示例性的,终端设备101可以为:台式电脑、笔记本、个人数字助理(Personal Digital Assistant,简称:PDA)、智能手机、平板电脑、问答机器人、智能客服等设备,本场景以台式电脑为例示出。
需要说明的是,本申请的实施例适用于多种场景,在一种场景中,上述对话过程可以为语音对话过程。示例性的,用户通过语音与服务器102进行对话,服务器102在接收到用户输入的语音信号时,对接收到的语音信号进行解析,获得用户的意图,以根据用户意图生成用于答复用户的语音信息,再将语音信息输出给终端设备101,通过终端设备101展示给用户。
在其他场景中,上述对话过程还可以为文本对话过程。示例性的,用户与服务器102进行文本对话,服务器102接收到用户通过用户终端发送的文本信息时对接收到的文本信息进行语义解析,获得用户意图,以根据用户意图生成用于答复用户的文本信息,再将文本信息输出给终端设备101,再通过终端设备101将该文本信息展示给用户,从而实现人机交互。
可以理解的是,用户与服务器102的交互方式,本申请实施例不做具体限定,一方面,用户可以通过终端设备101的输入端输入文本信息或者语音信息,由终端设备101将文本信息或者语音信息转发至服务器102,以使得服务器102接收用户的文本信息或者语音信息。其中,输入端可以包括触摸屏、按键、麦克风等,相应的,终端设备101通过输出端将文本信息或者语音信息展示给用户,其中,输出端可以包括显示屏、扬声器等。
需要说明的是,本申请的实施例适用于上述各场景,为方便理解,下述实施例以文本信息为例进行说明。
下面以具体地实施例对本申请的实施例的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行详细描述。
图2为本申请一实施例提供的对话处理方法的流程示意图。本申请实施例的执行主体可以为上述服务器。如图2所示,本申请实施例的方法包括如下步骤:
S201、获取用户输入的第一文本。
需要说明的是,本申请实施例对于获取第一文本的方法不做具体限定,一方面,可以接收用户输入的语音信号,再将接收到的语音信号转换为文本信息,从而获得第一文本。
另一方面,通过接收用户输入的文本信息,从而确定接收到的文本信息为第一文本。
本步骤中,用户可以通过多种方式输入文本信息,使得本方案可以适用于多种对话场景,从而解决各种场景中人机对话过程中,由用户主导对话易导致对话终止的情况,以推动人机对话的进行,提升用户体验。
作为一种可选方案,在获得用户输入的第一文本之后,还需要对第一文本进行预处理,其中,预处理过程可以包括以下至少一种:取特殊字符、去停用词、去分词、抽取关键词等。通过对用户输入的第一文本进行预处理,可以提取关键信息,去除干扰信息,降低干扰信息对后续的文本处理过程造成的干扰,从而在解耦数据处理压力的同时,提升机器对话内容的准确度。
S202、根据第一文本,确定用于回复第一文本的第二文本,以及获取第一文本的意图和槽位信息,根据第一文本的意图和槽位信息,从预先构建的知识图谱中获取与意图相匹配的实体。
在实际应用中,在接收到第一文本之后,获取第一文本中的意图信息和槽位信息,可以理解的是,对于意图信息和槽位信息的获取方案,本申请实施例不做具体限定。示例性的,可以使用预先训练好的槽位识别模型来识别槽位信息。
本申请实施例对于确定用于回复第一文本的第二文本的过程,也不做具体限定,一方面,在获取到用户的意图信息之后,根据意图信息,确定与意图信息相关的领域服务器,根据领域服务器确定第二文本,示例性的,用户输入的第一文本为:“××地区的天气怎么样?”,则获取的意图信息为:获取××地区的天气,此时,将该意图发送至天气服务器,由天气服务器获取与第一文本相关的查询结果,将天气服务器的查询结果作为第二文本。通过本方案,利用领域服务器获得第二文本,可以对用户输入的第一文本进行实时查询,从而获得与第一文本的匹配度较高得第二文本。
另一方面,还可以将第一文本与问答库中的问答对进行相似度匹配,根据匹配结果得到相似度最高的问答对中的答案作为第二文本。通过本方案,直接从问答中得问答对与第一文本进行匹配,可以提升第二文本的获取效率,最终提升对话处理的效率,从而降低用户等待答复内容的时间,进一步提升用户体验。
作为一种可选方案,在接收到用户输入的第一文本之后,可以在将意图信息发送至领域服务器的同时,与问答库中的问答对进行相似度匹配,再将两种方式获得的结果进行比较,获取与第一文本最相近的结果作为第二文本。通过本方案,通过两种手段获得的文本进行对比,从而获得与第一文本最相近的结果,可以进一步提升答复文本的准确性,从而避免答非所问的情况,进一步提升用户体验。
进一步的,在确定第二文本之后,根据第一文本的意图和槽位信息,从预先构建的知识图谱中获取与意图相匹配的实体。需要说明的是,知识图谱为根据大量文本中的实体、关系、属性之间的联系进行训练的到的,本申请实施例对于知识图谱的类型不做具体限定,示例性的,知识图谱可以为实体联系图(Entity Relationship Diagram,E-R图)即,也称实体关系图,其提供了表示实体型、属性和联系的方法,用来描述现实世界的概念模型。对于知识图谱的生成过程可以参考现有技术中的方案,本申请实施例不做具体限定。
示例性的,用户输入的第一文本为:“××地区的天气怎么样?”则确定第一文本中的实体为“××地区”,则从预先构建的知识图谱中获取与意图相匹配的实体为:“××地区”。
S203、从知识图谱中获取与实体相关的第一目标关系和/或第一目标属性。
本步骤中,根据知识图谱中获取与实体相关的第一目标关系和/或第一目标属性,仍以上为例,在知识图谱中获取实体为:知识图谱中实体为“××地区”的所有关系和属性,从获取的关系中确定任意关系为第一目标关系,例如:面积大小、人口数量、天气情况等。从获取的属性中确定任意属性为第一目标属性。
其中,第一目标关系与第一文本中的关系不同,第一目标属性与第一文本中的属性不同。示例性的,第一文本为“××地区的天气怎么样?”,则实体为:××地区,属性为:天气,则确定的第一目标属性需要避开:“天气”这个属性,随机从所有关系中确定除此之外的其他属性为第一目标属性,例如:第一目标属性可以为:面积大小。需要说明的是,第一目标关系的确定方式与第一目标属性的确定方式类似,具体可参考上述,本申请实施例不做具体限定。
本方案中,从知识图谱中获取与实体相关的第一目标关系和/或第一目标属性,可以围绕用户感兴趣的话题获取关系和/或属性,从而根据获取的关系和/或属性,在后续生成与用户感兴趣的话题相关的内容,以推动人机对话进行。另外,在获取关系和/或属性时,排除了与第一文本中相同的关系和属性,使得后续生成的用于推动人机对话的内容不会与用户输入的第一文本重复,从而提升用户体验。
S204、根据实体、第一目标关系和/或第一目标属性,生成第三文本。
在上述步骤的基础上,根据第一文本中的实体,以及第一目标关系和/或第一目标属性,生成第三文本。对于第三文本的生成方式,本申请实施例不做具体限定,例如,可以将确定的实体、第一目标关系和/或第一目标属性进行组合以生成第三文本。示例性的,仍以上为例,实体为:××地区,第一目标属性可以为:面积大小,则生成的第三文本可以为:“你知道××地区的面积大小是多少吗?”
S205、输出第二文本和第三文本。
具体的,可以通过将第二文本和第三文本输出给终端设备,再通过终端设备将第二文本和第三文本展示给用户。
需要说明的是,对于第二文本和第三文本的输出顺序,本申请实施例比作具体限定。一方面,可以先输出第二文本,再输出第三文本,仍以上述为例,输出的第二文本和第三文本可以为:“××地区今天的天气不错→你知道××地区的面积是多大吗?”另一方面,也可以先输出第三文本,再输出第二文本,具体方案与上述类似,此处不再赘述。
本申请实施例提供一种对话处理方法,获取用户输入的第一文本;根据第一文本,确定用于回复第一文本的第二文本,以及获取第一文本的意图和槽位信息,根据第一文本的意图和槽位信息,从预先构建的知识图谱中获取与意图相匹配的实体;从知识图谱中获取与实体相关的第一目标关系和/或第一目标属性;根据实体、第一目标关系和/或第一目标属性,生成第三文本;输出第二文本和第三文本。通过本方案,由于输出用于回复第二文本的同时,还根据知识图谱以及用户输入的第一文本输出第三文本,从而利用第三文本主动引导对话,解决现有技术中由用户主导对话易导致对话终止的情况,从而推动人机对话进行,提升用户体验。
图3为本申请另一实施例提供的话处理方法的流程示意图。在上述实施例的基础上,本实施例对本申请技术方案进行更详细的描述,如图3所示,本申请的实施例提供的报文攻击防御方法可以包括以下步骤:
S301、采用网络爬虫技术,从互联网上获取多个样本文本。
在实际应用中,对于样本文本的类型,本申请实施例不做具体限定,一方面,可以从互联网上获取任意类型的样本文本。本方案中,通过获取任意类型的样本文本,可以使得终端设备获取多样化的样本数据,从而具备多种类型的文本处理功能。
另一方面,可以根据终端设备的类型确定样本文本的类型,示例性的,若终端设备是天气查询终端,则获取的样本文本为天气相关的样本文本数据,若终端设备为百科查询终端,则获取的样本文本为百科相关的样本文本数据。本方案中,通过针对性的获取样本文本,可以减少无关数据带来的干扰,降低终端设备的数据处理压力,提升对话处理过程的效率。
S302、提取每个样本文本中的实体、关系、属性的三元关系。
S303、根据各个样本文本中三元关系,构建知识图谱。
需要说明的是,根据样本文本中三元关系构建知识图谱的方案可以参考现有技术的方案,本申请实施例对此不做具体限定。
S304、获取用户输入的第一文本。
S305、根据第一文本,确定用于回复第一文本的第二文本,以及获取第一文本的意图和槽位信息,根据第一文本的意图和槽位信息,从预先构建的知识图谱中获取与意图相匹配的实体;
S306、从知识图谱中获取与实体相关的第一目标关系和/或第一目标属性。
S307、根据实体、第一目标关系和/或第一目标属性,生成第三文本。
需要说明的是,步骤S304~步骤S307与图2所示实施例中的步骤S201~S204的方法与原理类似,具体可参考图2所示的实施例,此处不再赘述。
S308、根据第三文本,生成第三文本的正确回复文本集。
需要说明的是,在生成第三文本的同时,还可以生成第三文本的正确回复文本集。以第三文本为“你知道××地区的面积大小是多少吗”为例,则生成的第三文本的正确回复文本集可以包括:××万平方千米、××万平方公里等。
S309、输出第二文本和第三文本。
需要说明的是,步骤S309与图2所示实施例中的步骤S205的方法与原理类似,具体可参考图2所示的实施例,此处不再赘述。
S310、获取用户输入的用于回复第三文本的第四文本。
需要说明的是,步骤S310与图2所示实施例中的步骤S201的方法与原理类似,具体可参考图2所示的实施例,此处不再赘述。
在实际应用中,用户输入的第四文本又多种情况,下面对各种情况的处理方案进行详细说明。
一种可能的方案中,若第四文本与正确回复文本集相匹配,则输出用于称赞用户的回复文本。
需要说明的是,用于称赞用户的回复文本是预先设定好的回复文本集,当用户输入的第四文本与正确回复文本集相匹配时,随机输出用于称赞用户的回复文本。对于称赞用户的回复文本,本申请实施例不做具体限定,例如,可以为“你好棒呀、你真是知识渊博、你真聪明”等话术。仍以第三文本是“你知道××地区的面积大小是多少吗”为例,若用户输入的第四文本为“××万平方千米、××万平方公里”中的一个,则确定第四文本与正确回复文本集相匹配,此时,随机输出用于称赞用户的回复文本,例如,可以输出:你真是知识渊博。
另一种可能的方案中,若第四文本与正确回复文本集不匹配,则输出用于安慰用户的回复文本和/或正确回复文本。
一方面,可以直接输出用于安慰用户的回复文本。
需要说明的是,用于安慰用户的回复文本是预先设定好的回复文本集,当用户输入的第四文本与正确回复文本集不匹配时,随机输出用于安慰用户的回复文本。示例性的,用于安慰用户的回复文本可以为:“没关系的”。
另一方面,也可以直接输出正确回复,从而告知用于正确答案。
在其他实施例中,在输出用于安慰用户的回复文本的同时,可以同时输出正确回复,在安慰用户的同时告知用户正确答案,进一步提升用户体验。示例性的,输出的文本可以为:“没关系的,××地区的面积大小是××万平方公里”。
又一种可能的方案中,若第四文本与正确回复文本集不匹配且与预设回复文本集相匹配,则输出用于安慰用户的回复文本和/或正确回复文本。
在实际应用中,考虑到用户可能会回复“不知道、不清楚”等答复类型,在实际应用中,预先设定与该类型的答复相关的预设回复文本集,当出现第四文本与正确回复文本集不匹配且与预设回复文本集相匹配的情况时,也能够准确识别用户的回复,从而针对性的输出相应文本。
对于预设回复文本集的内容,本申请实施例不做具体限定,示例性的,预设回复文本集可以包括:“不知道、不清楚、不感兴趣、不想回答”等文本。
其他可能的方案中,若第四文本与正确回复文本集和预设回复文本集均不匹配,则确定第四文本为第一文本。
在实际应用中,还会出现用户输入的第四文本与正确回复文本集和预设回复文本集均不匹配的情况,例如,用户输入的第四文本为用户提出的新的问题。仍以第三文本为“你知道××地区的面积大小是多少吗”为例,用户输入的第四文本为:“××电影的导演是谁”,该第四文本并没有针对第三文本的内容进行答复,此时,将第四文本确定为第一文本,执行步骤S305。
通过本步骤,在用户提出的新的问题时,也能够针对新的问题进行处理,以避免无法识别新的问题而导致对话终止的情况,提升用户体验。
S311、若输出用于称赞用户的回复文本,或者,输出用于安慰用户的回复文本和/或正确回复文本,则从知识图谱中获取与实体相关的第二目标关系和/或第二目标属性。
S312、根据实体、第二目标关系和/或第二目标属性,生成第五文本。
S313、输出第五文本。
在一些实施例中,在输出用于称赞用户的回复文本,或者,输出用于安慰用户的回复文本和/或正确回复文本之后,若此时用户没有再输入新的文本信息,也会导致对话终止,此时,重新获取与实体相关的第二目标关系与第二目标属性,其中,第二目标关系与第一文本中的关系不同,第二目标属性与第一文本中的属性不同。
需要说明的是,步骤S311~S313的方案与图2所示实施例中的步骤S203~S205类似,具体可参考图2所示的实施例,此处不再赘述
上述步骤中,在用户没有再输入新的文本信息时,重新获取与实体相关的第二目标关系与第二目标属性,根据第二目标关系与第二目标属性生成第五文本,可以避免由于用户没有输入新的文本信息时,导致对话终止的情况。另外,由于第二目标关系与第一文本中的关系不同,第二目标属性与第一文本中的属性不同,使得生成的第五文本预计第一文本不同,避免重复提问,可以进一步提升用户体验。
图4为本申请一实施例提供的对话处理装置的结构示意图。如图4所示,本申请实施例提供的对话处理装置400,包括:
获取模块401,用于获取用户输入的第一文本;
确定模块402,用于根据第一文本,确定用于回复第一文本的第二文本,以及获取第一文本的意图和槽位信息,根据第一文本的意图和槽位信息,从预先构建的知识图谱中获取与意图相匹配的实体;
获取模块401,还用于从知识图谱中获取与实体相关的第一目标关系和/或第一目标属性,其中,第一目标关系与第一文本中的关系不同,第一目标属性与第一文本中的属性不同;
处理模块403,用于根据实体、第一目标关系和/或第一目标属性,生成第三文本;
输出模块404,用于输出第二文本和第三文本。
可选的,处理模块403还用于,根据第三文本,生成第三文本的正确回复文本集;
获取模块402还用于,获取用户输入的用于回复第三文本的第四文本;
若第四文本与正确回复文本集相匹配,则输出用于称赞用户的回复文本。
可选的,输出模块404还用于,若第四文本与正确回复文本集不匹配且与预设回复文本集相匹配,则输出用于安慰用户的回复文本和/或正确回复文本;
若第四文本与正确回复文本集和预设回复文本集均不匹配,则确定第四文本为第一文本。
可选的,输出模块404还用于,若输出用于称赞用户的回复文本,或者,输出用于安慰用户的回复文本和/或正确回复文本,则从知识图谱中获取与实体相关的第二目标关系和/或第二目标属性,其中,第二目标关系与第一文本中的关系不同,第二目标属性与第一文本中的属性不同;
根据实体、第二目标关系和/或第二目标属性,生成第五文本;
输出第五文本。
可选的,获取模块402还用于,采用网络爬虫技术,从互联网上获取多个样本文本;
提取每个样本文本中的实体、关系、属性的三元关系;
根据各个样本文本中三元关系,构建知识图谱。
可以理解的是,本实施例所提供的对话处理装置,可用于执行如上述任一方法实施例的技术方案,其实现原理和技术效果类似,具体可参考上述方法实施例,此处不再赘述。
图5为本申请一实施例提供的电子设备的结构示意图。图5所示,本申请实施例的电子设备500可用于实现上述方法实施例中描述的方法,具体参见上述方法实施例中的说明。
电子设备500包括处理组件501,其进一步包括一个或多个处理器,以及由存储器502所代表的存储器资源,用于存储可由处理组件1001的执行的指令,例如应用程序。存储器502中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件501被配置为执行指令,以执行如图2、图3所示的方法实施例,具体参见上述方法实施例中的说明,此处不再赘述。
电子设备500还可以包括一个有线或无线网络接口503被配置为将电子设备500连接到网络,和一个输入输出(I/O)接口504。电子设备500可以操作基于存储在存储器502的操作***,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM或类似。
本领域技术人员可以理解的是,图5中示出的电子设备的结构并不构成对本电子设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
在此需要说明的是,本申请提供的上述电子设备,用于实现上述方法实施例中描述的对话处理方法,且能够达到相同的技术效果,在此不再对本实施例中与方法实施例相同的部分及有益效果进行具体赘述。
本申请的实施例还提供一种计算机可读存储介质,当该存储介质中的指令由终端设备的处理器执行时,使得处理器能够执行上述方法实施例中的对话处理方法。
本申请的实施例还提供一种计算机程序产品,包括计算机程序,计算机程序被处理器执行时,实现上述方法实施例中的对话处理方法。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。例如,以上所描述的设备实施例仅仅是示意性的,例如,模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。
上述以软件功能模块的形式实现的集成的模块,可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器执行本申请各个方法实施例的部分步骤。
应理解,上述处理器可以是中央处理单元(Central Processing Unit,简称CPU),还可以是其它通用处理器、数字信号处理器(Digital Signal Processor,简称DSP)、专用集成电路(Application Specific Integrated Circuit,简称ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合发明所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
存储器可能包含高速RAM存储器,也可能还包括非易失性存储NVM,例如至少一个磁盘存储器,还可以为U盘、移动硬盘、只读存储器、磁盘或光盘等。
上述存储介质可以是由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。存储介质可以是通用或专用计算机能够存取的任何可用介质。
一种示例性的存储介质耦合至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于专用集成电路(Application Specific Integrated Circuits,简称ASIC)中。当然,处理器和存储介质也可以作为分立组件存在于电子设备或主控设备中。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例的方法。
以上仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。
Claims (10)
1.一种对话处理方法,其特征在于,包括:
获取用户输入的第一文本;
根据所述第一文本,确定用于回复所述第一文本的第二文本,以及获取所述第一文本的意图和槽位信息,根据所述第一文本的意图和槽位信息,从预先构建的知识图谱中获取与所述意图相匹配的实体;
从所述知识图谱中获取与所述实体相关的第一目标关系和/或第一目标属性,其中,所述第一目标关系与所述第一文本中的关系不同,所述第一目标属性与所述第一文本中的属性不同;
根据所述实体、所述第一目标关系和/或所述第一目标属性,生成第三文本;
输出所述第二文本和所述第三文本。
2.根据权利要求1所述的方法,其特征在于,所述根据所述实体、所述第一目标关系和/或所述第一目标属性,生成第三文本之后,还包括:
根据所述第三文本,生成所述第三文本的正确回复文本集;
所述输出所述第二文本和所述第三文本之后,还包括:
获取所述用户输入的用于回复所述第三文本的第四文本;
若所述第四文本与所述正确回复文本集相匹配,则输出用于称赞用户的回复文本。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
若所述第四文本与所述正确回复文本集不匹配,则输出用于安慰用户的回复文本和/或正确回复文本。
4.根据权利要求2所述的方法,其特征在于,所述方法还包括:
若所述第四文本与所述正确回复文本集不匹配且与预设回复文本集相匹配,则输出用于安慰用户的回复文本和/或正确回复文本;
若所述第四文本与所述正确回复文本集和所述预设回复文本集均不匹配,则确定所述第四文本为所述第一文本。
5.根据权利要求3或4所述的方法,其特征在于,所述方法还包括:
若输出用于称赞用户的回复文本,或者,输出用于安慰用户的回复文本和/或正确回复文本,则从所述知识图谱中获取与所述实体相关的第二目标关系和/或第二目标属性,其中,所述第二目标关系与所述第一文本中的关系不同,所述第二目标属性与所述第一文本中的属性不同;
根据所述实体、所述第二目标关系和/或所述第二目标属性,生成第五文本;
输出所述第五文本。
6.根据权利要求1-4任一项所述的方法,其特征在于,所述方法还包括:
采用网络爬虫技术,从互联网上获取多个样本文本;
提取每个样本文本中的实体、关系、属性的三元关系;
根据各个样本文本中三元关系,构建所述知识图谱。
7.一种对话处理装置,其特征在于,包括:
获取模块,用于获取用户输入的第一文本;
确定模块,用于根据所述第一文本,确定用于回复所述第一文本的第二文本,以及获取所述第一文本的意图和槽位信息,根据所述第一文本的意图和槽位信息,从预先构建的知识图谱中获取与所述意图相匹配的实体;
所述获取模块,还用于从所述知识图谱中获取与所述实体相关的第一目标关系和/或第一目标属性,其中,所述第一目标关系与所述第一文本中的关系不同,所述第一目标属性与所述第一文本中的属性不同;
处理模块,用于根据所述实体、所述第一目标关系和/或所述第一目标属性,生成第三文本;
输出模块,用于输出所述第二文本和所述第三文本。
8.一种电子设备,其特征在于,包括:
存储器,用于存储程序指令;
处理器,用于调用并执行所述存储器中的程序指令,执行如权利要求1至6中任一项所述的方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序;所述计算机程序被处理器执行时,实现如权利要求1至6中任一项所述的方法。
10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时,实现如权利要求1至6任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011536074.9A CN112560508A (zh) | 2020-12-22 | 2020-12-22 | 对话处理方法、装置及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011536074.9A CN112560508A (zh) | 2020-12-22 | 2020-12-22 | 对话处理方法、装置及设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112560508A true CN112560508A (zh) | 2021-03-26 |
Family
ID=75031541
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011536074.9A Pending CN112560508A (zh) | 2020-12-22 | 2020-12-22 | 对话处理方法、装置及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112560508A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105869468A (zh) * | 2016-06-24 | 2016-08-17 | 苏州美丽澄电子技术有限公司 | 智能家教机器人 |
CN108153901A (zh) * | 2018-01-16 | 2018-06-12 | 北京百度网讯科技有限公司 | 基于知识图谱的信息推送方法和装置 |
CN109522399A (zh) * | 2018-11-20 | 2019-03-26 | 北京京东尚科信息技术有限公司 | 用于生成信息的方法和装置 |
CN109657238A (zh) * | 2018-12-10 | 2019-04-19 | 宁波深擎信息科技有限公司 | 基于知识图谱的上下文识别补全方法、***、终端及介质 |
CN110990526A (zh) * | 2019-11-21 | 2020-04-10 | 腾讯科技(深圳)有限公司 | 一种查询语句展示方法及相关设备 |
-
2020
- 2020-12-22 CN CN202011536074.9A patent/CN112560508A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105869468A (zh) * | 2016-06-24 | 2016-08-17 | 苏州美丽澄电子技术有限公司 | 智能家教机器人 |
CN108153901A (zh) * | 2018-01-16 | 2018-06-12 | 北京百度网讯科技有限公司 | 基于知识图谱的信息推送方法和装置 |
CN109522399A (zh) * | 2018-11-20 | 2019-03-26 | 北京京东尚科信息技术有限公司 | 用于生成信息的方法和装置 |
CN109657238A (zh) * | 2018-12-10 | 2019-04-19 | 宁波深擎信息科技有限公司 | 基于知识图谱的上下文识别补全方法、***、终端及介质 |
CN110990526A (zh) * | 2019-11-21 | 2020-04-10 | 腾讯科技(深圳)有限公司 | 一种查询语句展示方法及相关设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109460463B (zh) | 基于数据处理的模型训练方法、装置、终端及存储介质 | |
CN109514586B (zh) | 实现智能客服机器人的方法及*** | |
CN112671886B (zh) | 基于边缘计算和人工智能的信息推送方法及大数据服务器 | |
CN110442697B (zh) | 一种人机交互方法、***、计算机设备和存储介质 | |
CN109460503B (zh) | 答案输入方法、装置、存储介质及电子设备 | |
CN107832720B (zh) | 基于人工智能的信息处理方法和装置 | |
CN111741104B (zh) | 应答消息的确定方法、配置方法、装置、设备及存储介质 | |
CN111078856A (zh) | 一种群聊对话处理方法、装置及电子设备 | |
CN112686051A (zh) | 语义识别模型训练方法、识别方法、电子设备、存储介质 | |
JP2023506087A (ja) | スキルの音声ウェイクアップ方法および装置 | |
CN110209768B (zh) | 自动问答的问题处理方法和装置 | |
CN111444321B (zh) | 问答方法、装置、电子设备和存储介质 | |
CN109753561B (zh) | 一种自动回复的生成方法及装置 | |
CN113901837A (zh) | 一种意图理解方法、装置、设备及存储介质 | |
CN111767386B (zh) | 对话处理方法、装置、电子设备及计算机可读存储介质 | |
CN110750633B (zh) | 用于确定问题的答案的方法及装置 | |
CN111506717A (zh) | 问题答复方法、装置、设备及存储介质 | |
CN116186771A (zh) | 应用于人工智能生成内容的文本处理方法、装置及介质 | |
CN112560508A (zh) | 对话处理方法、装置及设备 | |
CN114492310B (zh) | 文本标注方法、文本标注装置、电子设备和存储介质 | |
CN113138702B (zh) | 信息处理方法、装置、电子设备及存储介质 | |
CN115114404A (zh) | 智能客服的问答方法、装置、电子设备及计算机存储介质 | |
CN112328871B (zh) | 一种基于rpa模块的回复生成方法、装置、设备及存储介质 | |
CN111008373B (zh) | 智能问答的处理方法、装置、计算机可读介质及电子设备 | |
CN114297380A (zh) | 一种数据处理方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210326 |
|
RJ01 | Rejection of invention patent application after publication |