CN109753568A - 一种处理方法及电子设备 - Google Patents
一种处理方法及电子设备 Download PDFInfo
- Publication number
- CN109753568A CN109753568A CN201811612380.9A CN201811612380A CN109753568A CN 109753568 A CN109753568 A CN 109753568A CN 201811612380 A CN201811612380 A CN 201811612380A CN 109753568 A CN109753568 A CN 109753568A
- Authority
- CN
- China
- Prior art keywords
- dialog information
- dialog
- information
- informations
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Machine Translation (AREA)
Abstract
本申请公开了一种处理方法及电子设备,确定多轮对话信息,多轮对话信息至少包括第一对话信息及第二对话信息,第一对话信息产生时间早于第二对话信息,根据多轮对话信息确认多轮对话信息中的对话信息的关系,如果关系满足第一条件,执行控制指令以显示第一对话信息和第二对话信息,第一对话信息显示在第二对话信息之后。本方案中通过对第一对话信息和第二对话信息之间的关系的确定,根据其关系调整第一对话信息和第二对话信息的先后显示顺序,避免了对多轮对话信息进行分析时对应关系不能确定,从而导致的多轮对话信息中重要信息不明确的问题。
Description
技术领域
本申请涉及处理领域,尤其涉及一种处理方法及电子设备。
背景技术
针对聊天或客服***中的多轮对话,通常多轮对话的记录是沿着某些线索进行下去的,每条发言记录是有一定的承接逻辑关系的。承接逻辑关系一般可以分为开启话题、承接对方发言及承接己方发言,将这种承接逻辑关系确定为对应关系。
然而,目前,通常仅对多轮对话中的多条文本的语料进行处理,而忽略了每条记录之间的对应关系。
发明内容
有鉴于此,本申请提供一种处理方法及电子设备,其具体方案如下:
一种处理方法,包括:
确定多轮对话信息,所述多轮对话信息至少包括第一对话信息及第二对话信息,所述第一对话信息产生时间早于所述第二对话信息;
根据所述多轮对话信息,确认所述多轮对话信息中的对话信息的关系;
如果所述关系满足第一条件,执行控制指令以显示所述第一对话信息和所述第二对话信息,所述第一对话信息显示在所述第二对话信息之后。
进一步的,其中,所述如果所述关系满足第一条件,执行控制指令以显示所述第一对话信息和所述第二对话信息,所述第一对话信息显示在所述第二对话信息之后,包括:
按照产生时间顺序显示所述第一对话信息和所述第二对话信息,所述第一对话信息显示在所述第二对话信息之前;
如果所述关系满足第一条件,执行控制指令调整所述第一对话信息与所述第二对话信息的显示顺序,所述第一对话信息显示在所述第二对话信息之后。
进一步的,其中,还包括:
如果所述关系满足第一条件,所述第一对话信息显示在所述第二对话信息之后,接收用户指令,按照产生时间顺序显示所述第一对话信息和所述第二对话信息,所述第一对话信息显示在所述第二对话信息之前。
进一步的,其中,所述根据多轮对话信息,确认所述多轮对话信息中的对话信息的关系,包括:
对所述多轮对话信息中的每一句对话信息进行特征提取,并对提取的所述特征的特征值进行计算,其中,所述多轮对话信息包括n句对话信息;
根据提取的所述特征以及提取的所述特征的特征值确定第i句之前的i-1句对话信息中的每一句对话信息相对于第i句对话信息的注意力值,其中,1<i≤n;
确定所述第i句之前的i-1句对话信息中的每一句对话信息相对于第i句对话信息的注意力值中的最大注意力值,将所述最大注意力值对应的第k句对话信息确定为所述第i句对话信息的对应关系,其中,0<k<i,第一对话信息为第k句对话信息,第二对话信息为第i句对话信息。
进一步的,其中,所述对所述多轮对话信息中的每一句对话信息进行特征提取,并对提取的所述特征的特征值进行计算,包括:
对所述多轮对话中的每一句对话信息及所述每一句对话信息中每一个词语信息进行特征提取,并对提取的所述特征的特征值进行计算。
进一步的,其中,所述根据提取的所述特征以及提取的所述特征的特征值确定第i句之前的i-1句对话信息中的每一句对话信息相对于第i句对话信息的注意力值,其中,1<i≤n,包括:
根据提取的所述特征确定所述特征的重要度等级系数;
根据提取的所述特征、所述特征的特征值及所述特征的重要度等级系数确定第i句之前的i-1句对话信息中的每一句对话信息相对于第i句对话信息的注意力值。
进一步的,其中,所述根据提取的所述特征以及提取的所述特征的特征值确定第i句之前的i-1句对话信息中的每一句对话信息相对于第i句对话信息的注意力值,其中,1<i≤n,包括:
根据所述多轮对话信息确定第i句对话信息的角色信息,其中,1<i≤n;
根据提取的所述特征、提取的所述特征的特征值及第i句对话信息的角色信息确定第i句之前的i-1句对话信息中的每一句对话信息相对于第i句对话信息的注意力值。
进一步的,其中,所述根据提取的所述特征以及提取的所述特征的特征值确定第i句之前的i-1句对话信息中的每一句对话信息相对于第i句对话信息的注意力值,其中,1<i≤n,包括:
根据所述多轮对话信息确定第i句对话信息的角色信息,其中,1<i≤n;
根据提取的所述特征、提取的所述特征的特征值及所述多轮对话信息中的每一句对话信息的角色信息进行模型训练,确定第一数据模型;
根据所述第一数据模型、提取的所述特征、提取的所述特征的特征值及所述多轮对话信息中的每一句对话信息的角色信息确定第i句之前的i-1句对话信息中的每一句对话信息相对于第i句对话信息的注意力值。
一种电子设备,包括:显示器及处理器,其中:
所述显示器用于显示对话信息;
所述处理器用于确定多轮对话信息,所述多轮对话信息至少包括第一对话信息及第二对话信息,所述第一对话信息产生时间早于所述第二对话信息,根据所述多轮对话信息,确认所述多轮对话信息中的对话信息的关系,如果所述关系满足第一条件,执行控制指令以使所述显示器显示所述第一对话信息和所述第二对话信息,所述第一对话信息显示在所述第二对话信息之后。
进一步的,其中,
所述显示器按照产生时间顺序显示所述第一对话信息和所述第二对话信息,所述第一对话信息显示在所述第二对话信息之前;
若所述处理器确定所述关系满足第一条件,执行控制指令,以使所述显示器调整所述第一对话信息和所述第二对话信息的显示顺序,所述第一对话信息显示在所述第二对话信息之后。
从上述技术方案可以看出,本申请公开的处理方法及电子设备,确定多轮对话信息,多轮对话信息至少包括第一对话信息及第二对话信息,第一对话信息产生时间早于第二对话信息,根据多轮对话信息确认多轮对话信息中的对话信息的关系,如果关系满足第一条件,执行控制指令以显示第一对话信息和第二对话信息,第一对话信息显示在第二对话信息之后。本方案中通过对第一对话信息和第二对话信息之间的关系的确定,根据其关系调整第一对话信息和第二对话信息的先后显示顺序,避免了对多轮对话信息进行分析时对应关系不能确定,从而导致的多轮对话信息中重要信息不明确的问题。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例公开的一种处理方法的流程图;
图2为本申请实施例公开的一种处理方法的流程图;
图3为本申请实施例公开的一种处理方法的流程图;
图4为本申请实施例公开的一种处理方法的流程图;
图5为本申请实施例公开的一种电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请公开了一种处理方法,其流程图如图1所示,包括:
步骤S11、确定多轮对话信息,多轮对话信息至少包括第一对话信息及第二对话信息,第一对话信息产生时间早于第二对话信息;
多轮对话信息可以具体为:两个用户之间的对话信息,用户与客服之间的对话信息,警察与嫌疑人之间的对话信息等,即只要涉及到至少两个不同客体之间的对话均可以确定为对话信息。
多轮对话信息,即两个不同客体之间进行的多次语言或文字交互。
其中,第一对话信息及第二对话信息为两个不同客体之间任意一个或两个客体分别输出的对话信息,即第一对话信息及第二对话信息可以为同一个客体在多轮对话中输出的对话信息,也可以为不同客体在多轮对话中的输出。如:第一对话信息为第一客体输出,第二对话信息为第二客体输出;或者,第一对话信息为第一客体输出,第二对话信息为第一客体输出;或者,第一对话信息为第二客体输出,第二对话信息为第二客体输出等。
例如:A:今天天气怎么样?
B:天气晴朗,没有雾霾。
B:温度在-7到0度之间。
在这一例子中,第一客体为A,第二客体为B,当第一对话信息为A说的“今天天气怎么样”时,第二对话信息可以为B说的“天气晴朗,没有雾霾”,也可以为B说的“温度在-7到0度之间”;当第一对话信息为B说的“天气晴朗,没有雾霾”,那么,第二对话信息为“温度在-7到0度之间”。
由于第一对话信息的产生时间是早于第二对话信息的,那么,在上述例子中,第一对话信息与第二对话信息仅可能是上段中表述的情况,而不会存在其他情况的可能。
多轮对话信息中不仅包括第一对话信息及第二对话信息,还可以包括其他对话信息,如:在上述例子中,第一对话信息为A说的“今天天气怎么样”,第二对话信息为B说的“天气晴朗,没有雾霾”,而在上述对话过程中,除第一对话信息及第二对话信息外,还包括B说的“温度在-7到0度之间”。在这一过程中,也可以将B说的“温度在-7到0度之间”与B说的“天气晴朗,没有雾霾”合并为一句,即认为这两句同属于第二对话信息。
步骤S12、根据多轮对话信息,确认多轮对话信息中的对话信息的关系;
确认多轮对话信息中的对话信息的关系,确认的是多轮对话信息中每一个对话信息与其他对话信息的关系,也可以为仅确认对话信息中第一对话信息与第二对话信息的关系,还可以为确认第一对话信息与多轮对话信息中除第一对话信息外其他对话信息的关系,以及,第二对话信息与多轮对话信息中除第二对话信息外的其他对话信息的关系。
其中,确认对话信息的关系,其确认的可以为:对话信息之间的逻辑关系,或者,待确定关系的对话信息是否属于同一客体输出的等。
其中,确认对话信息的关系的方式,可以为:根据对话信息中的内容的分析结果确定每两句对话信息所表达的意思,确定该两句对话信息之间的逻辑关系、先后顺序及这两句对话信息是输出与同一客体输出的还是不同客体输出的,还可以由此确定每句对话信息所对应的客体中哪一个输出提问方,哪一个属于回答方,由此确定两个客体之间的关系;
还可以通过对话信息中出现的关键词或者语气词确定对话信息所涉及的内容,每句对话信息对应的客体之间的关系,或者每个客体的身份等。
步骤S13、如果关系满足第一条件,执行控制指令以显示第一对话信息和第二对话信息,第一对话信息显示在第二对话信息之后。
当对话信息之间的关系满足第一条件时,就调整第一对话信息与第二对话信息的先后顺序,使第一对话信息与第二对话信息的先后顺序调整为:由原来的第一对话信息在第二对话信息之前,调整为第二对话信息显示在第一对话信息之前,从而使得第一对话信息与第二对话信息之间的关系被捋顺,而并非一贯按照时间先后顺序显示。
其中,对话信息之间的关系满足第一条件,可以具体为:第一对话信息与第二对话信息之间符合预设逻辑,如:因果逻辑,主次关系,从属关系等。
例如:用户A与用户B之间的多轮对话,如:
A:(21:19:18)最近在忙什么?
B:(21:19:30)正准备出去旅游,明天就出发。
B:(21:19:35)去马尔代夫。
A:(21:19:36)去哪儿。
A:(21:19:40)哦哦。
在上述A与B之间的多轮对话中,A发出的“去哪儿”与B发出的“去马尔代夫”,虽然,B发出的“去马尔代夫”的时间是在A发出的“去哪儿”之前,但是根据这两句对话的内容,可明确,A发出的“去哪儿”是问题,而B发出的“去马尔代夫”是针对该问题的回答,属于问答关系,且第二对话信息(即A:“去哪儿”)属于问题,第一对话信息(即B:去马尔代夫)属于回答,因此,可以在显示时,可以将第二对话信息(即A:“去哪儿”)显示在第一对话信息(即B:去马尔代夫)之前,以便于查看或阅读的顺畅。
当第一对话信息与第二对话信息之间的逻辑关系为因果关系时,若结果对应的第一对话信息产生时间早于原因对应的第二对话信息,则可将第二对话信息调整至第一对话信息之前显示;
当第一对话信息与第二对话信息之间的逻辑关系为主次关系时,若次要因素对应的第一对话信息产生时间早于主要因素对应的第二对话信息时,则将第二对话信息调整至第一对话信息之前显示;
当第一对话信息与第二对话信息之间的逻辑关系为从属关系时,若第一具体内容对应的第一对话信息产生时间早于概括内容对应的第二对话信息,同时,第二具体内容对应的第三对话信息产生时间晚于概括内容对应的第二对话信息,则调整第一对话信息、第二对话信息及第三对话信息的顺序,如:将第一对话信息及第三对话信息均显示在第二对话信息之前,或者,将第二对话信息显示在第一对话信息及第三对话信息之前。
由上述例子可明确,该关系满足第一条件,其中的第一条件可具体为:第一对话信息及第二对话信息满足能够使第二对话信息在第一对话信息之前显示的情况。
本实施例公开的处理方法,确定多轮对话信息,多轮对话信息至少包括第一对话信息及第二对话信息,第一对话信息产生时间早于第二对话信息,根据多轮对话信息确认多轮对话信息中的对话信息的关系,如果关系满足第一条件,执行控制指令以显示第一对话信息和第二对话信息,第一对话信息显示在第二对话信息之后。本方案中通过对第一对话信息和第二对话信息之间的关系的确定,根据其关系调整第一对话信息和第二对话信息的先后显示顺序,避免了对多轮对话信息进行分析时对应关系不能确定,从而导致的多轮对话信息中重要信息不明确的问题。
本实施例公开了一种处理方法,其流程图如图2所示,包括:
步骤S21、确定多轮对话信息,多轮对话信息至少包括第一对话信息及第二对话信息,第一对话信息产生时间早于第二对话信息;
步骤S22、根据多轮对话信息,确认多轮对话信息中的对话信息的关系;
步骤S23、按照产生时间顺序显示第一对话信息和第二对话信息,第一对话信息显示在第二对话信息之前;
步骤S24、如果关系满足第一条件,执行控制指令调整第一对话信息与第二对话信息的显示顺序,第一对话信息显示在第二对话信息之后。
本方案中,若第一对话信息的产生时间早于第二对话信息,则在确定第一对话信息与第二对话信息的关系之前,或者,在确定两者之间的关系的同时,就将第一对话信息与第二对话信息按照产生时间的顺序显示出来,即将第一对话信息显示在第二对话信息之前。
在对第一对话信息与第二对话信息之间的关系确定后,若该关系满足第一条件,则调整第一对话信息与第二对话信息的显示顺序,使第二对话信息显示在第一对话信息之前,以便于逻辑清晰,方便阅读及查询。
进一步的,还可以包括:
如果第一对话信息与第二对话信息之间的关系满足第一条件,在将第一对话信息与第二对话信息之间的显示顺序调整为第二对话信息显示在第一对话信息之前后,若接收到用户的指令,则按照产生时间的顺序显示第一对话信息和第二对话信息,第一对话信息显示在第二对话信息之前。
其中,用户的指令,即按照时间顺序显示第一对话信息和第二对话信息的指令,或者,也可以为:不按照第一对话信息与第二对话信息之间的关系调整其显示顺序的指令。
在此过程中,可以为:在确定第一对话信息和第二对话信息之间的关系满足第一条件后,输出是否调整第一对话信息和第二对话信息的显示顺序的提示信息,若在预设时间内未接收到用户的指令,则将第一对话信息显示在第二对话信息之后,若在预设时间内接收到用户的指令,则仍按照时间顺序显示第一对话信息和第二对话信息。这就避免了在确定第一对话信息和第二对话信息之间的关系后,就调整两者的顺序,而在接收到用户指令后,再次调整两者的顺序,导致的对对话信息的顺序进行多次调整的问题,而本方案中只需要在预设时间内未接收到用户的指令后,才进行调整,否则,不调整,减少了对话信息之间顺序的调整次数,提高了用户体验。
本实施例公开的处理方法,确定多轮对话信息,多轮对话信息至少包括第一对话信息及第二对话信息,第一对话信息产生时间早于第二对话信息,根据多轮对话信息确认多轮对话信息中的对话信息的关系,如果关系满足第一条件,执行控制指令以显示第一对话信息和第二对话信息,第一对话信息显示在第二对话信息之后。本方案中通过对第一对话信息和第二对话信息之间的关系的确定,根据其关系调整第一对话信息和第二对话信息的先后显示顺序,避免了对多轮对话信息进行分析时对应关系不能确定,从而导致的多轮对话信息中重要信息不明确的问题。
本实施例公开了一种处理方法,其流程图如图3所示,包括:
步骤S31、确定多轮对话信息,多轮对话信息至少包括第一对话信息及第二对话信息,第一对话信息产生时间早于第二对话信息;
步骤S32、对多轮对话信息中的每一句对话信息进行特征提取,并对提取的特征的特征值进行计算,其中,多轮对话信息包括n句对话信息;
步骤S33、根据提取的特征及提取的特征的特征值确定第i句之前的i-1句对话信息中的每一句对话信息相对于第i句对话信息的注意力值,其中,1<i≤n;
步骤S34、确定第i句之前的i-1句对话信息中的每一句对话信息相对于第i句对话信息的注意力值中的最大注意力值,将最大注意力值对应的第k句对话信息确定为第i句对话信息的对应关系,其中,0<k<i,第一对话信息为第k句对话信息,第二对话信息为第i句对话信息;
通过特征提取的方式对多轮对话信息中需要进行关系确定的第一对话信息及第二对话信息进行分析,即抽取预先定义的词语特征和句子特征。
具体的,对多轮对话中的每一句对话信息及每一句对话信息中每一个词语信息进行特征提取,并对提取的特征的特征值进行计算。
如表1所示:
表1
通过特征提取的方式可确定句子类型或词语的含义,从而明确该对话信息所表达的内容,以便于根据该对话信息所表达的内容确定两句对话信息之间的关系。
其中,注意力值,即为表达每两句对话信息之间的相关性大小的数值,通过该具体的数值可直观的明确该对应的两句对话信息之间的相关性大小;而其中,对应关系,即为与某一句对话信息的相关性最大的对话信息。
例如:一段多轮对话信息中,一共包括5句对话信息,按照时间先后的顺序排列为a,b,c,d,e,其中,第5句对话信息(即e)与其前边的对话信息(即a,b,c,d)之间的注意力值分别为0.11,0.33,0.57,0.82,由此可知,在这一段对话信息中,第4句对话信息(即d)与第5句对话信息(即e)之间的注意力值最大,其相关性也最大,而第1句对话信息(即a)与第5句对话信息(即e)之间的注意力值最小,即相关性最小;那么,第5句对话信息(即e)的对应关系即为第4句对话信息(即d)。
在确定注意力值的时候,仅确定第二对话信息之前的所有对话信息与其的注意力值,而对于第二对话信息之后的对话信息,在针对其之后的每句对话信息确定与其注意力值时,则可以确定出该句对话信息与第二对话信息之间的注意力值,这就避免了每两句对话信息之间重复确定注意力值的问题。
如:一段多轮对话信息中,一共包括5句对话信息,按照时间先后的顺序排列为a,b,c,d,e,在确定第3句对话信息(c)与其之前的对话信息(a,b)之间的注意力值时,仅需确定两个注意力值即可,这其中,并不包括与第4句对话信息(d)及第5句对话信息(e)之间的注意力值的确定;在确定第4句对话信息(d)与其之前的对话信息(a,b,c)之间的注意力值时,则可以确定出第4句对话信息(d)与第3句对话信息(c)之间的注意力值;而在确定第5句对话信息(e)与其之前的对话信息(a,b,c,d)之间的注意力值时,则可以确定出第5句对话信息(e)与第3句对话信息(c)之间的注意力值。
在确定出与第二对话信息的相关性最大的对话信息为第一对话信息时,即确定出与第i句对话信息的相关性最大的对话信息为第k句对话信息,之后再确定相关性最大的这两句对话信息之间的关系,确定其关系是否能够满足使第二对话信息在第一对话信息之前显示的情况,如果满足,则将第二对话信息调整至第一对话信息之前显示。
进一步的,在本方案中,还可以包括:对多轮对话信息进行预处理。
其中,预处理包括:过滤无用信息,如:整句对话信息全是停用词的对话信息,或,整句对话信息全是打招呼的对话信息,或,统计出的大量重复出现的对话信息,或,整句对话信息的长度小于一定阈值的对话信息,或,整句对话信息中没有实词的对话信息。
另外,还可以为:对多轮对话信息中单个角色信息的连续对话信息进行合并。
例如:如表2所示:
表2
其中,U3-U7为用户A的连续输入,将这5句对话信息合并为一句或多句对话信息,使得用户A能够一次或多次输出其要表达的语句,在本方案中,避免了一个用户的多条提问记录对应一条客服的回复,避免了逻辑关系的复杂和混乱,使得逻辑清晰,便于对应关系的确定。
具体的,将一个用户的多句连续输入合并为依据,可以通过:将一个用户的多句连续对话信息转换成固定维度的向量,将每个对话信息转换成高维空间中的样本点,在上例中,5个对话信息被转换成5个高维空间中的样本点;计算每两个连续的对话信息对应的样本点之间的距离,具体的距离计算可采用欧式距离;将所有的样本点按照顺序依次平铺在一维数轴上,两点之间的距离就是上一步骤中计算出的距离,这些点被确定为一维向量作为模型的样本点;利用密度聚类算法,将一维数轴上的样本点进行聚类,具体密度聚类算法可采用DBSCAN聚类算法,该算法仅与样本点的密度有关,而与样本点具体的分布形状无关;在上例中,U3-U7共5句对话信息,按照上述算法,其可能是U3及U4被聚成一类,U5、U6、U7被聚成一类;利用聚类结果得到一句或多句对话信息,将聚类得到的多句的连续对话信息进行拼接合并,记录合并任务,则最终U3-U4,U5-U7成为独立的对话信息。
步骤S35、如果第i句对话信息与第k句对话信息的对应关系满足第一条件,执行控制指令以显示第k句对话信息和第i句对话信息,第k句对话信息显示在第i句对话信息之后。
本实施例公开的处理方法,确定多轮对话信息,多轮对话信息至少包括第一对话信息及第二对话信息,第一对话信息产生时间早于第二对话信息,根据多轮对话信息确认多轮对话信息中的对话信息的关系,如果关系满足第一条件,执行控制指令以显示第一对话信息和第二对话信息,第一对话信息显示在第二对话信息之后。本方案中通过对第一对话信息和第二对话信息之间的关系的确定,根据其关系调整第一对话信息和第二对话信息的先后显示顺序,避免了对多轮对话信息进行分析时对应关系不能确定,从而导致的多轮对话信息中重要信息不明确的问题。
本实施例公开了一种处理方法,其流程图如图4所示,包括:
步骤S41、确定多轮对话信息,多轮对话信息至少包括第一对话信息及第二对话信息,第一对话信息产生时间早于第二对话信息;
步骤S42、对多轮对话信息中的每一句对话信息及每一句对话信息中每一个词语信息进行特征提取,并对提取的特征的特征值进行计算,多轮对话信息包括n句对话信息;
步骤S43、根据提取的特征确定特征的重要度等级系数;
步骤S44、根据提取的特征、特征值及特征的重要度等级系数确定第i句之前的i-1句对话信息中的每一句对话信息相对于第i句对话信息的注意力值,1<i≤n;
在选定第二对话信息,即第i句对话信息之后,对第i句之前的i-1句对话信息进行特征提取,同时可以对第i句对话信息进行特征提取,根据提取的特征可确定该句对话信息相对于第i句对话信息的重要度。
为特征设置重要度等级,不同的重要度等级对应不同的系数,重要度等级越高,其对应的系数越大,重要度等级越低,其对应的系数越小。其中,不同的重要度等级表示与第二对话信息之间的相关性最大的可能性大小,如:打招呼的语句与第二对话信息之间的相关性最大的可能性最小,与第二对话信息距离最近的对话信息与第二对话信息之间的相关性最大的可能性最大。
在对注意力值进行计算时,特征值、重要度等级系数均作为重要参数参与计算。
例如:一段多轮对话信息中,一共包括5句对话信息,按照时间先后的顺序排列为a,b,c,d,e,若确定第5句对话信息(e)为第二对话信息,对其之前的4句对话信息(a,b,c,d)进行特征提取,若确定第1句对话信息(a)为打招呼的语句,那么,将第1句对话信息(a)确定为重要度等级最低的,确定第4句对话信息(d)为与第5句对话信息(e)距离最近的对话信息,则将第4句对话信息(d)确定为重要度等级最高的。
另外,还可以为:将特征值及角色信息作为注意力值计算的重要参数参与计算过程。
具体的,根据多轮对话信息确定第i句对话信息的角色信息,根据提取的特征、提取的特征的特征值及第i句对话信息的角色信息确定第i句之前的i-1句对话信息中的每一句对话信息相对于第i句对话信息的注意力值。
不同的角色信息对注意力值的影响也不同。
例如:一段多轮对话信息中,一共包括7句对话信息,按照时间先后的顺序排列为a,b,c,d,e,f,g,若确定第7句对话信息(g)为第二对话信息,其为用户A所说,对于第7句对话信息(g)之前的6句对话信息(a,b,c,d,e,f),确定每一句的角色信息,若a,b,f均为用户B所说,c,e,均为用户A所说,d为用户C所说,由此可确定用户C仅说了一句d,且距离第7句对话信息(g)距离较远,因此,将d确定为重要度等级较低的对话信息。
进一步的,根据提取的特征及特征的特征值确定第i句之前的i-1句对话信息中的每一句对话信息相对于第i句对话信息的注意力值,具体为:
根据多轮对话信息确定第i句对话信息的角色信息,根据提取的特征、特征的特征值及多轮对话信息中的每一句对话信息的角色信息进行模型训练,确定第一数据模型,根据第一数据模型、提取的特征、提取的特征的特征值及多轮对话信息中的每一句对话信息的角色信息确定第i句之前的i-1句对话信息中的每一句对话信息相对于第i句对话信息的注意力值。
也就是说,本方案中,首先进行模型训练,之后,根据训练的模型进行注意力值的计算。
其中,模型训练的过程是通过对多个多轮对话信息中的特征、特征值及角色信息进行训练,从而确定对于不同的特征及特征值,该句对话信息所对应的角色信息。
之后,在通过多个多轮对话信息将数学模型训练完成后,将待确定注意力值的多轮对话信息中的信息输入至该数学模型,从而确定注意力值。
步骤S45、确定第i句之前的i-1句对话信息中的每一句对话信息相对于第i句对话信息的注意力值中的最大注意力值,将最大注意力值对应的第k句对话信息确定为第i句对话信息的对应关系,其中,0<k<i,第一对话信息为第k句对话信息,第二对话信息为第i句对话信息;
步骤S46、如果第i句对话信息与第k句对话信息的对应关系满足第一条件,执行控制指令以显示第k句对话信息和第i句对话信息,第k句对话信息显示在第i句对话信息之后。
具体的,对于所有的多轮对话信息打乱后按照一定比例切割成训练、测试数据,通常切割比例为4:1。对于一份有7句对话信息的数据U1-U7可以切割成U1-U2,U1-U3…U1-U7共6份数据,对于每份数据,取最后一句话的角色信息作为预测标签,其他为模型输入数据,最终所有数据都转换成了有标记数据。
训练模型样本时需要用到的数据包括:多轮对话信息U,对话的角色信息R,该多轮对话信息中共有n句对话信息,最后一条对话信息文本Ut,需要预测的值为最后一条对话信息的角色信息Rt。模型的输入包括:每条对话信息分词后的词向量,作为最初输入信号,句子级别特征和匹配特征进行拼接,其中,词向量的维度为100,其模型是Word2Vec经过大量相关多轮对话信息训练获得,每个特征都是热独码(onehot)向量,之后将多个热独码向量拼接成最终的句子特征向量。
对于输入的多轮对话信息的信号,模型首先利用双向LSTM层进行特征变换,对于一句对话信息,其输入词向量矩阵为M为输入词向量的个数,De为词向量维度,经过双向LSTM会将特征维度扩大为2倍。
对于该句对话信息和最后需要判别的对话信息,则会有E'和E′t两个特征矩阵,对两个特征矩阵做矩阵乘法,则由匹配矩阵Mm∈RM*M。之后,将Mm利用权值共享的CNN层进行卷积,最大池化层进行特征降维,张量拉伸(flatten)操纵进行维度转换,最终每条对话信息被编码成和待匹配对话信息相关的匹配特征向量。
每个匹配特征向量和句子特征向量拼接成LSTM层输入向量v∈Rp,其中,p表示拼接后的向量维度。通过单向LSTM层后,输出句子据别的特征矩阵h∈Rq,q表示LSTM的输出维度。利用LSTM层输入和输出的n个向量,对注意力进行计算,并得到最终的特征向量,则有:
ei=tT tanh(Wvi+Vhi+b) 公式(1)
其中,W∈Rk*p,V∈Rk*q,b∈Rk,t∈Rk为待学习参数。
首先对每个句子级特征向量的注意力值ai进行计算,之后将所有LSTM输出的隐状态根据a进行加权求和生成最终的特征向量v'。
在进行模型的训练和测试的时候,特征向量v'经过2层的全连接,并在最后添加softmax变换,最终特征维度将至2维,与标签的维度一致,即输出为待判断对话信息是角色1和角色2的概率,模型的损失函数采用多分类交叉熵函数。
在模型的训练过程中,根据数据的特征,需要对模型的超参数进行一定的调整,包括:单挑记录最长单词个数;双向、单向LSTM的输出维度;CNN的卷积窗口大小、卷积核数量、步长,卷积模式;池化操作的窗口大小、步长、卷积方法。
在模型训练完毕后,当需要标注对应关系时,对模型的输入信号不变,进行前向网络计算,但是输出的值为多轮对话信息中每条对话信息的注意力值向量a=[a1,a2,...,an],最终通过选择注意力值最大的对话信息,将其确定为对应关系,则由S=argmax(a),则S为Ut在前n条对话记录U中的对应关系记录的下标。
本实施例公开的处理方法,确定多轮对话信息,多轮对话信息至少包括第一对话信息及第二对话信息,第一对话信息产生时间早于第二对话信息,根据多轮对话信息确认多轮对话信息中的对话信息的关系,如果关系满足第一条件,执行控制指令以显示第一对话信息和第二对话信息,第一对话信息显示在第二对话信息之后。本方案中通过对第一对话信息和第二对话信息之间的关系的确定,根据其关系调整第一对话信息和第二对话信息的先后显示顺序,避免了对多轮对话信息进行分析时对应关系不能确定,从而导致的多轮对话信息中重要信息不明确的问题。
本实施例公开了一种电子设备,其结构示意图如图5所示,包括:
显示器51及处理器52。
显示器51用于显示对话信息;
处理器52用于确定多轮对话信息,多轮对话信息至少包括第一对话信息及第二对话信息,第一对话信息产生时间早于第二对话信息,根据多轮对话信息,确认多轮对话信息中的对话信息的关系,如果关系满足第一条件,执行控制指令以使显示器显示第一对话信息和第二对话信息,第一对话信息显示在第二对话信息之后。
多轮对话信息可以具体为:两个用户之间的对话信息,用户与客服之间的对话信息,警察与嫌疑人之间的对话信息等,即只要涉及到至少两个不同客体之间的对话均可以确定为对话信息。
多轮对话信息,即两个不同客体之间进行的多次语言或文字交互。
其中,第一对话信息及第二对话信息为两个不同客体之间任意一个或两个客体分别输出的对话信息,即第一对话信息及第二对话信息可以为同一个客体在多轮对话中输出的对话信息,也可以为不同客体在多轮对话中的输出。如:第一对话信息为第一客体输出,第二对话信息为第二客体输出;或者,第一对话信息为第一客体输出,第二对话信息为第一客体输出;或者,第一对话信息为第二客体输出,第二对话信息为第二客体输出等。
例如:A:今天天气怎么样?
B:天气晴朗,没有雾霾。
B:温度在-7到0度之间。
在这一例子中,第一客体为A,第二客体为B,当第一对话信息为A说的“今天天气怎么样”时,第二对话信息可以为B说的“天气晴朗,没有雾霾”,也可以为B说的“温度在-7到0度之间”;当第一对话信息为B说的“天气晴朗,没有雾霾”,那么,第二对话信息为“温度在-7到0度之间”。
由于第一对话信息的产生时间是早于第二对话信息的,那么,在上述例子中,第一对话信息与第二对话信息仅可能是上段中表述的情况,而不会存在其他情况的可能。
多轮对话信息中不仅包括第一对话信息及第二对话信息,还可以包括其他对话信息,如:在上述例子中,第一对话信息为A说的“今天天气怎么样”,第二对话信息为B说的“天气晴朗,没有雾霾”,而在上述对话过程中,除第一对话信息及第二对话信息外,还包括B说的“温度在-7到0度之间”。在这一过程中,也可以将B说的“温度在-7到0度之间”与B说的“天气晴朗,没有雾霾”合并为一句,即认为这两句同属于第二对话信息。
确认多轮对话信息中的对话信息的关系,确认的是多轮对话信息中每一个对话信息与其他对话信息的关系,也可以为仅确认对话信息中第一对话信息与第二对话信息的关系,还可以为确认第一对话信息与多轮对话信息中除第一对话信息外其他对话信息的关系,以及,第二对话信息与多轮对话信息中除第二对话信息外的其他对话信息的关系。
其中,确认对话信息的关系,其确认的可以为:对话信息之间的逻辑关系,或者,待确定关系的对话信息是否属于同一客体输出的等。
其中,确认对话信息的关系的方式,可以为:根据对话信息中的内容的分析结果确定每两句对话信息所表达的意思,确定该两句对话信息之间的逻辑关系、先后顺序及这两句对话信息是输出与同一客体输出的还是不同客体输出的,还可以由此确定每句对话信息所对应的客体中哪一个输出提问方,哪一个属于回答方,由此确定两个客体之间的关系;
还可以通过对话信息中出现的关键词或者语气词确定对话信息所涉及的内容,每句对话信息对应的客体之间的关系,或者每个客体的身份等。
当对话信息之间的关系满足第一条件时,就调整第一对话信息与第二对话信息的先后顺序,使第一对话信息与第二对话信息的先后顺序调整为:由原来的第一对话信息在第二对话信息之前,调整为第二对话信息显示在第一对话信息之前,从而使得第一对话信息与第二对话信息之间的关系被捋顺,而并非一贯按照时间先后顺序显示。
其中,对话信息之间的关系满足第一条件,可以具体为:第一对话信息与第二对话信息之间符合预设逻辑,如:因果逻辑,主次关系,从属关系等。
例如:用户A与用户B之间的多轮对话,如:
A:(21:19:18)最近在忙什么?
B:(21:19:30)正准备出去旅游,明天就出发。
B:(21:19:35)去马尔代夫。
A:(21:19:36)去哪儿。
A:(21:19:40)哦哦。
在上述A与B之间的多轮对话中,A发出的“去哪儿”与B发出的“去马尔代夫”,虽然,B发出的“去马尔代夫”的时间是在A发出的“去哪儿”之前,但是根据这两句对话的内容,可明确,A发出的“去哪儿”是问题,而B发出的“去马尔代夫”是针对该问题的回答,属于问答关系,且第二对话信息(即A:“去哪儿”)属于问题,第一对话信息(即B:去马尔代夫)属于回答,因此,可以在显示时,可以将第二对话信息(即A:“去哪儿”)显示在第一对话信息(即B:去马尔代夫)之前,以便于查看或阅读的顺畅。
当第一对话信息与第二对话信息之间的逻辑关系为因果关系时,若结果对应的第一对话信息产生时间早于原因对应的第二对话信息,则可将第二对话信息调整至第一对话信息之前显示;
当第一对话信息与第二对话信息之间的逻辑关系为主次关系时,若次要因素对应的第一对话信息产生时间早于主要因素对应的第二对话信息时,则将第二对话信息调整至第一对话信息之前显示;
当第一对话信息与第二对话信息之间的逻辑关系为从属关系时,若第一具体内容对应的第一对话信息产生时间早于概括内容对应的第二对话信息,同时,第二具体内容对应的第三对话信息产生时间晚于概括内容对应的第二对话信息,则调整第一对话信息、第二对话信息及第三对话信息的顺序,如:将第一对话信息及第三对话信息均显示在第二对话信息之前,或者,将第二对话信息显示在第一对话信息及第三对话信息之前。
由上述例子可明确,该关系满足第一条件,其中的第一条件可具体为:第一对话信息及第二对话信息满足能够使第二对话信息在第一对话信息之前显示的情况。
其中,显示器51按照产生时间顺序显示第一对话信息和第二对话信息,第一对话信息显示在第二对话信息之前,若处理器52确定关系满足第一条件,执行控制指令,以使显示器调整第一对话信息和第二对话信息的显示顺序,第一对话信息显示在第二对话信息之后。
本方案中,若第一对话信息的产生时间早于第二对话信息,则在确定第一对话信息与第二对话信息的关系之前,或者,在确定两者之间的关系的同时,就将第一对话信息与第二对话信息按照产生时间的顺序显示出来,即将第一对话信息显示在第二对话信息之前。
在对第一对话信息与第二对话信息之间的关系确定后,若该关系满足第一条件,则调整第一对话信息与第二对话信息的显示顺序,使第二对话信息显示在第一对话信息之前,以便于逻辑清晰,方便阅读及查询。
进一步的,还可以包括:
如果第一对话信息与第二对话信息之间的关系满足第一条件,在将第一对话信息与第二对话信息之间的显示顺序调整为第二对话信息显示在第一对话信息之前后,若接收到用户的指令,则按照产生时间的顺序显示第一对话信息和第二对话信息,第一对话信息显示在第二对话信息之前。
其中,用户的指令,即按照时间顺序显示第一对话信息和第二对话信息的指令,或者,也可以为:不按照第一对话信息与第二对话信息之间的关系调整其显示顺序的指令。
在此过程中,可以为:在确定第一对话信息和第二对话信息之间的关系满足第一条件后,输出是否调整第一对话信息和第二对话信息的显示顺序的提示信息,若在预设时间内未接收到用户的指令,则将第一对话信息显示在第二对话信息之后,若在预设时间内接收到用户的指令,则仍按照时间顺序显示第一对话信息和第二对话信息。这就避免了在确定第一对话信息和第二对话信息之间的关系后,就调整两者的顺序,而在接收到用户指令后,再次调整两者的顺序,导致的对对话信息的顺序进行多次调整的问题,而本方案中只需要在预设时间内未接收到用户的指令后,才进行调整,否则,不调整,减少了对话信息之间顺序的调整次数,提高了用户体验。
进一步的,处理器52根据多轮对话信息,确认多轮对话信息中的对话信息的关系,包括:
对多轮对话信息中的每一句对话信息进行特征提取,并对提取的特征的特征值进行计算,其中,多轮对话信息包括n句对话信息;根据提取的特征及提取的特征的特征值确定第i句之前的i-1句对话信息中的每一句对话信息相对于第i句对话信息的注意力值,其中,1<i≤n;确定第i句之前的i-1句对话信息中的每一句对话信息相对于第i句对话信息的注意力值中的最大注意力值,将最大注意力值对应的第k句对话信息确定为第i句对话信息的对应关系,其中,0<k<i,第一对话信息为第k句对话信息,第二对话信息为第i句对话信息。
通过特征提取的方式对多轮对话信息中需要进行关系确定的第一对话信息及第二对话信息进行分析,即抽取预先定义的词语特征和句子特征。
具体的,对多轮对话中的每一句对话信息及每一句对话信息中每一个词语信息进行特征提取,并对提取的特征的特征值进行计算。
如表1所示:
表1
通过特征提取的方式可确定句子类型或词语的含义,从而明确该对话信息所表达的内容,以便于根据该对话信息所表达的内容确定两句对话信息之间的关系。
其中,注意力值,即为表达每两句对话信息之间的相关性大小的数值,通过该具体的数值可直观的明确该对应的两句对话信息之间的相关性大小;而其中,对应关系,即为与某一句对话信息的相关性最大的对话信息。
例如:一段多轮对话信息中,一共包括5句对话信息,按照时间先后的顺序排列为a,b,c,d,e,其中,第5句对话信息(即e)与其前边的对话信息(即a,b,c,d)之间的注意力值分别为0.11,0.33,0.57,0.82,由此可知,在这一段对话信息中,第4句对话信息(即d)与第5句对话信息(即e)之间的注意力值最大,其相关性也最大,而第1句对话信息(即a)与第5句对话信息(即e)之间的注意力值最小,即相关性最小;那么,第5句对话信息(即e)的对应关系即为第4句对话信息(即d)。
在确定注意力值的时候,仅确定第二对话信息之前的所有对话信息与其的注意力值,而对于第二对话信息之后的对话信息,在针对其之后的每句对话信息确定与其注意力值时,则可以确定出该句对话信息与第二对话信息之间的注意力值,这就避免了每两句对话信息之间重复确定注意力值的问题。
如:一段多轮对话信息中,一共包括5句对话信息,按照时间先后的顺序排列为a,b,c,d,e,在确定第3句对话信息(c)与其之前的对话信息(a,b)之间的注意力值时,仅需确定两个注意力值即可,这其中,并不包括与第4句对话信息(d)及第5句对话信息(e)之间的注意力值的确定;在确定第4句对话信息(d)与其之前的对话信息(a,b,c)之间的注意力值时,则可以确定出第4句对话信息(d)与第3句对话信息(c)之间的注意力值;而在确定第5句对话信息(e)与其之前的对话信息(a,b,c,d)之间的注意力值时,则可以确定出第5句对话信息(e)与第3句对话信息(c)之间的注意力值。
在确定出与第二对话信息的相关性最大的对话信息为第一对话信息时,即确定出与第i句对话信息的相关性最大的对话信息为第k句对话信息,之后再确定相关性最大的这两句对话信息之间的关系,确定其关系是否能够满足使第二对话信息在第一对话信息之前显示的情况,如果满足,则将第二对话信息调整至第一对话信息之前显示。
进一步的,在本方案中,还可以包括:对多轮对话信息进行预处理。
其中,预处理包括:过滤无用信息,如:整句对话信息全是停用词的对话信息,或,整句对话信息全是打招呼的对话信息,或,统计出的大量重复出现的对话信息,或,整句对话信息的长度小于一定阈值的对话信息,或,整句对话信息中没有实词的对话信息。
另外,还可以为:对多轮对话信息中单个角色信息的连续对话信息进行合并。
例如:如表2所示:
表2
U1 | A | 你好,在么? |
U2 | B | 你好,我是客服,请问有什么可以帮您? |
U3 | A | 我在亚马逊买了一台Moto X Pure |
U4 | A | 买了已经有半年了 |
U5 | A | 我的手机突然没办法连电脑了 |
U6 | A | 我想连电脑拷照片 |
U7 | A | 请问该怎么连啊? |
U8 | B | 请问您能提供一下您手机的IMEI码吗? |
U9 | A | 23402834791 |
U10 | B | 好的!您可以参考这个网站:https://answer.com/detail/a_id/99592 |
其中,U3-U7为用户A的连续输入,将这5句对话信息合并为一句或多句对话信息,使得用户A能够一次或多次输出其要表达的语句,在本方案中,避免了一个用户的多条提问记录对应一条客服的回复,避免了逻辑关系的复杂和混乱,使得逻辑清晰,便于对应关系的确定。
具体的,将一个用户的多句连续输入合并为依据,可以通过:将一个用户的多句连续对话信息转换成固定维度的向量,将每个对话信息转换成高维空间中的样本点,在上例中,5个对话信息被转换成5个高维空间中的样本点;计算每两个连续的对话信息对应的样本点之间的距离,具体的距离计算可采用欧式距离;将所有的样本点按照顺序依次平铺在一维数轴上,两点之间的距离就是上一步骤中计算出的距离,这些点被确定为一维向量作为模型的样本点;利用密度聚类算法,将一维数轴上的样本点进行聚类,具体密度聚类算法可采用DBSCAN聚类算法,该算法仅与样本点的密度有关,而与样本点具体的分布形状无关;在上例中,U3-U7共5句对话信息,按照上述算法,其可能是U3及U4被聚成一类,U5、U6、U7被聚成一类;利用聚类结果得到一句或多句对话信息,将聚类得到的多句的连续对话信息进行拼接合并,记录合并任务,则最终U3-U4,U5-U7成为独立的对话信息。
进一步的,处理器52根据提取的特征及提取的特征的特征值确定第i句之前的i-1句对话信息中的每一句对话信息相对于第i句对话信息的注意力值,包括:
根据提取的特征确定特征的重要度等级系数,根据提取的特征、特征的特征值及特征的重要度等级系数确定第i句之前的i-1句对话信息中的每一句对话信息相对于第i句对话信息的注意力值。
在选定第二对话信息,即第i句对话信息之后,对第i句之前的i-1句对话信息进行特征提取,同时可以对第i句对话信息进行特征提取,根据提取的特征可确定该句对话信息相对于第i句对话信息的重要度。
为特征设置重要度等级,不同的重要度等级对应不同的系数,重要度等级越高,其对应的系数越大,重要度等级越低,其对应的系数越小。其中,不同的重要度等级表示与第二对话信息之间的相关性最大的可能性大小,如:打招呼的语句与第二对话信息之间的相关性最大的可能性最小,与第二对话信息距离最近的对话信息与第二对话信息之间的相关性最大的可能性最大。
在对注意力值进行计算时,特征值、重要度等级系数均作为重要参数参与计算。
例如:一段多轮对话信息中,一共包括5句对话信息,按照时间先后的顺序排列为a,b,c,d,e,若确定第5句对话信息(e)为第二对话信息,对其之前的4句对话信息(a,b,c,d)进行特征提取,若确定第1句对话信息(a)为打招呼的语句,那么,将第1句对话信息(a)确定为重要度等级最低的,确定第4句对话信息(d)为与第5句对话信息(e)距离最近的对话信息,则将第4句对话信息(d)确定为重要度等级最高的。
另外,还可以为:将特征值及角色信息作为注意力值计算的重要参数参与计算过程。
具体的,根据多轮对话信息确定第i句对话信息的角色信息,根据提取的特征、提取的特征的特征值及第i句对话信息的角色信息确定第i句之前的i-1句对话信息中的每一句对话信息相对于第i句对话信息的注意力值。
不同的角色信息对注意力值的影响也不同。
例如:一段多轮对话信息中,一共包括7句对话信息,按照时间先后的顺序排列为a,b,c,d,e,f,g,若确定第7句对话信息(g)为第二对话信息,其为用户A所说,对于第7句对话信息(g)之前的6句对话信息(a,b,c,d,e,f),确定每一句的角色信息,若a,b,f均为用户B所说,c,e,均为用户A所说,d为用户C所说,由此可确定用户C仅说了一句d,且距离第7句对话信息(g)距离较远,因此,将d确定为重要度等级较低的对话信息。
进一步的,根据提取的特征及特征的特征值确定第i句之前的i-1句对话信息中的每一句对话信息相对于第i句对话信息的注意力值,具体为:
根据多轮对话信息确定第i句对话信息的角色信息,根据提取的特征、特征的特征值及多轮对话信息中的每一句对话信息的角色信息进行模型训练,确定第一数据模型,根据第一数据模型、提取的特征、提取的特征的特征值及多轮对话信息中的每一句对话信息的角色信息确定第i句之前的i-1句对话信息中的每一句对话信息相对于第i句对话信息的注意力值。
也就是说,本方案中,首先进行模型训练,之后,根据训练的模型进行注意力值的计算。
其中,模型训练的过程是通过对多个多轮对话信息中的特征、特征值及角色信息进行训练,从而确定对于不同的特征及特征值,该句对话信息所对应的角色信息。
之后,在通过多个多轮对话信息将数学模型训练完成后,将待确定注意力值的多轮对话信息中的信息输入至该数学模型,从而确定注意力值。
具体的,对于所有的多轮对话信息打乱后按照一定比例切割成训练、测试数据,通常切割比例为4:1。对于一份有7句对话信息的数据U1-U7可以切割成U1-U2,U1-U3…U1-U7共6份数据,对于每份数据,取最后一句话的角色信息作为预测标签,其他为模型输入数据,最终所有数据都转换成了有标记数据。
训练模型样本时需要用到的数据包括:多轮对话信息U,对话的角色信息R,该多轮对话信息中共有n句对话信息,最后一条对话信息文本Ut,需要预测的值为最后一条对话信息的角色信息Rt。模型的输入包括:每条对话信息分词后的词向量,作为最初输入信号,句子级别特征和匹配特征进行拼接,其中,词向量的维度为100,其模型是Word2Vec经过大量相关多轮对话信息训练获得,每个特征都是热独码(onehot)向量,之后将多个热独码向量拼接成最终的句子特征向量。
对于输入的多轮对话信息的信号,模型首先利用双向LSTM层进行特征变换,对于一句对话信息,其输入词向量矩阵为M为输入词向量的个数,De为词向量维度,经过双向LSTM会将特征维度扩大为2倍。
对于该句对话信息和最后需要判别的对话信息,则会有E'和E′t两个特征矩阵,对两个特征矩阵做矩阵乘法,则由匹配矩阵Mm∈RM*M。之后,将Mm利用权值共享的CNN层进行卷积,最大池化层进行特征降维,张量拉伸(flatten)操纵进行维度转换,最终每条对话信息被编码成和待匹配对话信息相关的匹配特征向量。
每个匹配特征向量和句子特征向量拼接成LSTM层输入向量v∈Rp,其中,p表示拼接后的向量维度。通过单向LSTM层后,输出句子据别的特征矩阵h∈Rq,q表示LSTM的输出维度。利用LSTM层输入和输出的n个向量,对注意力进行计算,并得到最终的特征向量,则有:
ei=tT tanh(Wvi+Vhi+b) 公式(1)
其中,W∈Rk*p,V∈Rk*q,b∈Rk,t∈Rk为待学习参数。
首先对每个句子级特征向量的注意力值ai进行计算,之后将所有LSTM输出的隐状态根据a进行加权求和生成最终的特征向量v'。
在进行模型的训练和测试的时候,特征向量v'经过2层的全连接,并在最后添加softmax变换,最终特征维度将至2维,与标签的维度一致,即输出为待判断对话信息是角色1和角色2的概率,模型的损失函数采用多分类交叉熵函数。
在模型的训练过程中,根据数据的特征,需要对模型的超参数进行一定的调整,包括:单挑记录最长单词个数;双向、单向LSTM的输出维度;CNN的卷积窗口大小、卷积核数量、步长,卷积模式;池化操作的窗口大小、步长、卷积方法。
在模型训练完毕后,当需要标注对应关系时,对模型的输入信号不变,进行前向网络计算,但是输出的值为多轮对话信息中每条对话信息的注意力值向量a=[a1,a2,...,an],最终通过选择注意力值最大的对话信息,将其确定为对应关系,则由S=argmax(a),则S为Ut在前n条对话记录U中的对应关系记录的下标。
本实施例公开的电子设备,确定多轮对话信息,多轮对话信息至少包括第一对话信息及第二对话信息,第一对话信息产生时间早于第二对话信息,根据多轮对话信息确认多轮对话信息中的对话信息的关系,如果关系满足第一条件,执行控制指令以显示第一对话信息和第二对话信息,第一对话信息显示在第二对话信息之后。本方案中通过对第一对话信息和第二对话信息之间的关系的确定,根据其关系调整第一对话信息和第二对话信息的先后显示顺序,避免了对多轮对话信息进行分析时对应关系不能确定,从而导致的多轮对话信息中重要信息不明确的问题。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种处理方法,包括:
确定多轮对话信息,所述多轮对话信息至少包括第一对话信息及第二对话信息,所述第一对话信息产生时间早于所述第二对话信息;
根据所述多轮对话信息,确认所述多轮对话信息中的对话信息的关系;
如果所述关系满足第一条件,执行控制指令以显示所述第一对话信息和所述第二对话信息,所述第一对话信息显示在所述第二对话信息之后。
2.根据权利要求1所述的方法,其中,所述如果所述关系满足第一条件,执行控制指令以显示所述第一对话信息和所述第二对话信息,所述第一对话信息显示在所述第二对话信息之后,包括:
按照产生时间顺序显示所述第一对话信息和所述第二对话信息,所述第一对话信息显示在所述第二对话信息之前;
如果所述关系满足第一条件,执行控制指令调整所述第一对话信息与所述第二对话信息的显示顺序,所述第一对话信息显示在所述第二对话信息之后。
3.根据权利要求2所述的方法,其中,还包括:
如果所述关系满足第一条件,所述第一对话信息显示在所述第二对话信息之后,接收用户指令,按照产生时间顺序显示所述第一对话信息和所述第二对话信息,所述第一对话信息显示在所述第二对话信息之前。
4.根据权利要求1所述的方法,其中,所述根据多轮对话信息,确认所述多轮对话信息中的对话信息的关系,包括:
对所述多轮对话信息中的每一句对话信息进行特征提取,并对提取的所述特征的特征值进行计算,其中,所述多轮对话信息包括n句对话信息;
根据提取的所述特征以及提取的所述特征的特征值确定第i句之前的i-1句对话信息中的每一句对话信息相对于第i句对话信息的注意力值,其中,1<i≤n;
确定所述第i句之前的i-1句对话信息中的每一句对话信息相对于第i句对话信息的注意力值中的最大注意力值,将所述最大注意力值对应的第k句对话信息确定为所述第i句对话信息的对应关系,其中,0<k<i,第一对话信息为第k句对话信息,第二对话信息为第i句对话信息。
5.根据权利要求4所述的方法,其中,所述对所述多轮对话信息中的每一句对话信息进行特征提取,并对提取的所述特征的特征值进行计算,包括:
对所述多轮对话中的每一句对话信息及所述每一句对话信息中每一个词语信息进行特征提取,并对提取的所述特征的特征值进行计算。
6.根据权利要求4所述的方法,其中,所述根据提取的所述特征以及提取的所述特征的特征值确定第i句之前的i-1句对话信息中的每一句对话信息相对于第i句对话信息的注意力值,其中,1<i≤n,包括:
根据提取的所述特征确定所述特征的重要度等级系数;
根据提取的所述特征、所述特征的特征值及所述特征的重要度等级系数确定第i句之前的i-1句对话信息中的每一句对话信息相对于第i句对话信息的注意力值。
7.根据权利要求4所述的方法,其中,所述根据提取的所述特征以及提取的所述特征的特征值确定第i句之前的i-1句对话信息中的每一句对话信息相对于第i句对话信息的注意力值,其中,1<i≤n,包括:
根据所述多轮对话信息确定第i句对话信息的角色信息,其中,1<i≤n;
根据提取的所述特征、提取的所述特征的特征值及第i句对话信息的角色信息确定第i句之前的i-1句对话信息中的每一句对话信息相对于第i句对话信息的注意力值。
8.根据权利要求7所述的方法,其中,所述根据提取的所述特征以及提取的所述特征的特征值确定第i句之前的i-1句对话信息中的每一句对话信息相对于第i句对话信息的注意力值,其中,1<i≤n,包括:
根据所述多轮对话信息确定第i句对话信息的角色信息,其中,1<i≤n;
根据提取的所述特征、提取的所述特征的特征值及所述多轮对话信息中的每一句对话信息的角色信息进行模型训练,确定第一数据模型;
根据所述第一数据模型、提取的所述特征、提取的所述特征的特征值及所述多轮对话信息中的每一句对话信息的角色信息确定第i句之前的i-1句对话信息中的每一句对话信息相对于第i句对话信息的注意力值。
9.一种电子设备,包括:显示器及处理器,其中:
所述显示器用于显示对话信息;
所述处理器用于确定多轮对话信息,所述多轮对话信息至少包括第一对话信息及第二对话信息,所述第一对话信息产生时间早于所述第二对话信息,根据所述多轮对话信息,确认所述多轮对话信息中的对话信息的关系,如果所述关系满足第一条件,执行控制指令以使所述显示器显示所述第一对话信息和所述第二对话信息,所述第一对话信息显示在所述第二对话信息之后。
10.根据权利要求9所述的电子设备,其中,
所述显示器按照产生时间顺序显示所述第一对话信息和所述第二对话信息,所述第一对话信息显示在所述第二对话信息之前;
若所述处理器确定所述关系满足第一条件,执行控制指令,以使所述显示器调整所述第一对话信息和所述第二对话信息的显示顺序,所述第一对话信息显示在所述第二对话信息之后。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811612380.9A CN109753568B (zh) | 2018-12-27 | 2018-12-27 | 一种处理方法及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811612380.9A CN109753568B (zh) | 2018-12-27 | 2018-12-27 | 一种处理方法及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109753568A true CN109753568A (zh) | 2019-05-14 |
CN109753568B CN109753568B (zh) | 2021-09-14 |
Family
ID=66404113
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811612380.9A Active CN109753568B (zh) | 2018-12-27 | 2018-12-27 | 一种处理方法及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109753568B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111159401A (zh) * | 2019-12-20 | 2020-05-15 | 中国建设银行股份有限公司 | 基于短会的关联信息提方法、装置、电子设备及存储介质 |
CN112017660B (zh) * | 2020-10-30 | 2021-01-12 | 北京淇瑀信息科技有限公司 | 一种智能语音机器人的对话策略构建方法、装置及*** |
CN112214592A (zh) * | 2020-11-05 | 2021-01-12 | 中科讯飞互联(北京)信息科技有限公司 | 一种回复对话评分模型训练方法、对话回复方法及其装置 |
CN113407686A (zh) * | 2021-06-03 | 2021-09-17 | 北京得间科技有限公司 | 对话小说的交互展示方法、计算设备及计算机存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104598532A (zh) * | 2014-12-29 | 2015-05-06 | 中国联合网络通信有限公司广东省分公司 | 一种信息处理方法及装置 |
CN104753985A (zh) * | 2013-12-30 | 2015-07-01 | 腾讯科技(深圳)有限公司 | 会话列表显示方法和装置 |
CN107480143A (zh) * | 2017-09-12 | 2017-12-15 | 山东师范大学 | 基于上下文相关性的对话话题分割方法和*** |
CN108111396A (zh) * | 2017-12-13 | 2018-06-01 | 北京小米移动软件有限公司 | 对话消息排序方法、装置及设备 |
CN108460149A (zh) * | 2018-03-22 | 2018-08-28 | 平安科技(深圳)有限公司 | 文本数据处理方法、装置、设备及计算机可读存储介质 |
CN108509638A (zh) * | 2018-04-11 | 2018-09-07 | 联想(北京)有限公司 | 一种问题提取方法及电子设备 |
US20180329884A1 (en) * | 2017-05-12 | 2018-11-15 | Rsvp Technologies Inc. | Neural contextual conversation learning |
-
2018
- 2018-12-27 CN CN201811612380.9A patent/CN109753568B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104753985A (zh) * | 2013-12-30 | 2015-07-01 | 腾讯科技(深圳)有限公司 | 会话列表显示方法和装置 |
CN104598532A (zh) * | 2014-12-29 | 2015-05-06 | 中国联合网络通信有限公司广东省分公司 | 一种信息处理方法及装置 |
US20180329884A1 (en) * | 2017-05-12 | 2018-11-15 | Rsvp Technologies Inc. | Neural contextual conversation learning |
CN107480143A (zh) * | 2017-09-12 | 2017-12-15 | 山东师范大学 | 基于上下文相关性的对话话题分割方法和*** |
CN108111396A (zh) * | 2017-12-13 | 2018-06-01 | 北京小米移动软件有限公司 | 对话消息排序方法、装置及设备 |
CN108460149A (zh) * | 2018-03-22 | 2018-08-28 | 平安科技(深圳)有限公司 | 文本数据处理方法、装置、设备及计算机可读存储介质 |
CN108509638A (zh) * | 2018-04-11 | 2018-09-07 | 联想(北京)有限公司 | 一种问题提取方法及电子设备 |
Non-Patent Citations (1)
Title |
---|
王媛媛等: ""面向聊天记录的语义分析研究"", 《信息网络安全》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111159401A (zh) * | 2019-12-20 | 2020-05-15 | 中国建设银行股份有限公司 | 基于短会的关联信息提方法、装置、电子设备及存储介质 |
CN112017660B (zh) * | 2020-10-30 | 2021-01-12 | 北京淇瑀信息科技有限公司 | 一种智能语音机器人的对话策略构建方法、装置及*** |
CN112214592A (zh) * | 2020-11-05 | 2021-01-12 | 中科讯飞互联(北京)信息科技有限公司 | 一种回复对话评分模型训练方法、对话回复方法及其装置 |
CN112214592B (zh) * | 2020-11-05 | 2024-06-11 | 科大讯飞(北京)有限公司 | 一种回复对话评分模型训练方法、对话回复方法及其装置 |
CN113407686A (zh) * | 2021-06-03 | 2021-09-17 | 北京得间科技有限公司 | 对话小说的交互展示方法、计算设备及计算机存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109753568B (zh) | 2021-09-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109753568A (zh) | 一种处理方法及电子设备 | |
CN110457432B (zh) | 面试评分方法、装置、设备及存储介质 | |
CN109922032A (zh) | 用于确定登录账户的风险的方法和装置 | |
US11250513B2 (en) | Computer implemented system for generating assurance related planning process and documents for an entity and method thereof | |
CN110475032A (zh) | 多业务界面切换方法、装置、计算机装置及存储介质 | |
CN103049804B (zh) | 一种基于量子力学和社交网络的股票价格趋势预测方法 | |
CN111125520B (zh) | 一种面向新闻文本的基于深度聚类模型的事件线抽取方法 | |
Dua et al. | Discriminative training using noise robust integrated features and refined HMM modeling | |
CN110009480A (zh) | 司法催收路径的推荐方法、装置、介质、电子设备 | |
CN110264330A (zh) | 信用指标计算方法、装置、计算机可读存储介质 | |
CN108228808A (zh) | 确定热点事件的方法、装置和存储介质以及电子设备 | |
CN110399472A (zh) | 面试提问提示方法、装置、计算机设备及存储介质 | |
CN113553831A (zh) | 基于bagcnn模型的方面级别情感分析方法和*** | |
CN110489730A (zh) | 文本处理方法、装置、终端及存储介质 | |
CN113486174A (zh) | 模型训练、阅读理解方法、装置、电子设备及存储介质 | |
CN116542783A (zh) | 基于人工智能的风险评估方法、装置、设备及存储介质 | |
CN116402166A (zh) | 一种预测模型的训练方法、装置、电子设备及存储介质 | |
CN116485527A (zh) | 一种金融信用风险分析方法及装置 | |
CN111914084A (zh) | 一种基于深度学习的带有情感标签文本生成及评估*** | |
JP7344609B2 (ja) | 確定値及び推定値に基づくデータ定量化方法 | |
CN115797084A (zh) | 基于车主驾驶行为的投保定价指导方法及其相关设备 | |
CN114138954A (zh) | 用户咨询问题推荐方法、***、计算机设备及存储介质 | |
Huda et al. | A constraint-based evolutionary learning approach to the expectation maximization for optimal estimation of the hidden Markov model for speech signal modeling | |
CN110222150A (zh) | 一种自动提醒方法、自动提醒装置及计算机可读存储介质 | |
CN110110048A (zh) | 问询指引方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |