CN109783626A - 问题生成方法、智能问答***、介质以及计算机*** - Google Patents

问题生成方法、智能问答***、介质以及计算机*** Download PDF

Info

Publication number
CN109783626A
CN109783626A CN201811653507.1A CN201811653507A CN109783626A CN 109783626 A CN109783626 A CN 109783626A CN 201811653507 A CN201811653507 A CN 201811653507A CN 109783626 A CN109783626 A CN 109783626A
Authority
CN
China
Prior art keywords
sentence
word
session log
determined
intelligent answer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811653507.1A
Other languages
English (en)
Other versions
CN109783626B (zh
Inventor
程其江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Beijing Ltd
Original Assignee
Lenovo Beijing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lenovo Beijing Ltd filed Critical Lenovo Beijing Ltd
Priority to CN201811653507.1A priority Critical patent/CN109783626B/zh
Publication of CN109783626A publication Critical patent/CN109783626A/zh
Application granted granted Critical
Publication of CN109783626B publication Critical patent/CN109783626B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Machine Translation (AREA)

Abstract

本公开提供了一种问题生成方法,应用于智能问答***,智能问答***能够对获取到的对话记录进行处理并输出标准问题,该方法包括获取一条或多条对话记录;将一条或多条对话记录所包含的词语组合生成至少一个问题;以及从至少一个问题中确定与一条或多条对话记录所涉及的意图相对应的标准问题。本公开还提供了一种智能问答***、一种计算机可读存储介质以及一种计算机***。

Description

问题生成方法、智能问答***、介质以及计算机***
技术领域
本公开涉及一种问题生成方法、一种智能问答***、一种计算机可读存储介质以及一种计算机***。
背景技术
智能问答***可以为电子设备与用户之间建立基于自然语言的快捷有效的沟通,而问题的合理设置和推送可以进一步提高沟通效率。然而在相关技术中,生成问题的方式一般采用人工生成方式,这种方式不仅生成效率低,而且生成的问题数量有限。
发明内容
本公开的一个方面提供了一种问题生成方法,应用于智能问答***,上述智能问答***能够对获取到的对话记录进行处理并输出标准问题,上述方法包括获取一条或多条对话记录;将上述一条或多条对话记录所包含的词语组合生成至少一个问题;从上述至少一个问题中确定与上述一条或多条对话记录所涉及的意图相对应的标准问题。
可选地,将上述一条或多条对话记录所包含的词语组合生成至少一个问题包括根据上述一条或多条对话记录所包含的词语在对应对话记录中的语序生成有向词图,其中,上述有向词图包括多个节点,每个节点代表一个或多个词语,相同词语在上述有向词图中为同一节点;根据上述有向词图中的词语和语序生成至少一个句子;从上述至少一个句子中确定上述至少一个问题。
可选地,从上述至少一个句子中确定上述至少一个问题包括检测上述至少一个句子中每个句子的构造是否满足语法规则;以及从满足上述语法规则的句子中确定上述至少一个问题。
可选地,从上述至少一个句子中确定上述至少一个问题包括计算上述一条或多条对话记录所包含的任意两个词语在句子中相邻的概率;根据上述任意两个词语在句子中相邻的概率从上述至少一个句子中确定满足预设条件的目标句子;以及从上述目标句子中确定上述至少一个问题。
可选地,计算上述一条或多条对话记录所包含的任意两个词语在句子中相邻的概率包括将上述至少一个句子中的每个句子分别输入预先训练好的长短期记忆模型中;以及通过上述长短期记忆模型输出每个句子中的任意两个词语在句子中相邻的概率。
可选地,从上述至少一个问题中确定与上述一条或多条对话记录所涉及的意图相对应的标准问题包括采用自动摘要算法从上述至少一个问题中确定摘要句;以及将上述摘要句确定为与上述一条或多条对话记录所涉及的意图相对应的标准问题。
可选地,上述方法还包括获取用户输入至上述智能问答***的对话信息;确定与上述对话信息相匹配的标准问题;以及输出用于回答上述标准问题的内容,或者输出上述标准问题,以供用户确认上述对话信息的真实意图。
本公开的另一个方面提供了一种智能问答***,上述智能问答***能够对获取到的对话记录进行处理并输出标准问题,上述***包括第一获取模块,用于获取一条或多条对话记录;生成模块,用于将上述一条或多条对话记录所包含的词语组合生成至少一个问题;以及第一确定模块,用于从上述至少一个问题中确定与上述一条或多条对话记录所涉及的意图相对应的标准问题。
可选地,上述生成模块包括第一生成单元,用于根据上述一条或多条对话记录所包含的词语在对应对话记录中的语序生成有向词图,其中,上述有向词图包括多个节点,每个节点代表一个或多个词语,相同词语在上述有向词图中为同一节点;第二生成单元,用于根据上述有向词图中的词语和语序生成至少一个句子;以及确定单元,用于从上述至少一个句子中确定上述至少一个问题。
可选地,上述确定单元用于检测上述至少一个句子中每个句子的构造是否满足语法规则;以及从满足上述语法规则的句子中确定上述至少一个问题。
可选地,上述确定单元用于计算上述一条或多条对话记录所包含的任意两个词语在句子中相邻的概率;根据上述任意两个词语在句子中相邻的概率从上述至少一个句子中确定满足预设条件的目标句子;以及从上述目标句子中确定上述至少一个问题。
可选地,上述确定单元用于将上述至少一个句子中的每个句子分别输入预先训练好的长短期记忆模型中;以及通过上述长短期记忆模型输出每个句子中的任意两个词语在句子中相邻的概率。
可选地,上述第一确定模块用于采用自动摘要算法从上述至少一个问题中确定摘要句;以及将上述摘要句确定为与上述一条或多条对话记录所涉及的意图相对应的标准问题。
可选地,上述***还包括第二获取模块,用于获取用户输入至上述智能问答***的对话信息;第二确定模块,用于确定与上述对话信息相匹配的标准问题;输出模块,用于输出用于回答上述标准问题的内容,或者输出上述标准问题,以供用户确认上述对话信息的真实意图。
本公开的另一个方面提供了一种计算机***,包括处理器;以及计算机可读存储介质,存储有计算机可执行指令,上述指令在被上述处理器执行时用于实现如上所述的的方法。
本公开的另一方面提供了一种计算机可读存储介质,存储有计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。
本公开的另一方面提供了一种计算机程序,所述计算机程序包括计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。
附图说明
为了更完整地理解本公开及其优势,现在将参考结合附图的以下描述,其中:
图1示意性示出了根据本公开实施例的问题生成方法及智能问答***的应用场景图;
图2示意性示出了根据本公开实施例的问题生成方法的流程图;
图3示意性示出了根据本公开实施例的将一条或多条对话记录所包含的词语组合生成至少一个问题的流程图;
图4示意性示出了根据本公开实施例的有向词图的示意图;
图5示意性示出了根据本公开另一实施例的从至少一个句子中确定至少一个问题的示意图;
图6示意性示出了根据本公开实施例的智能问答***的框图;以及图7示意性示出了根据本公开实施例的适于实现上文描述的方法的计算机***的框图。
具体实施方式
以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的***”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的***等)。在使用类似于“A、B或C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B或C中至少一个的***”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的***等)。
附图中示出了一些方框图和/或流程图。应理解,方框图和/或流程图中的一些方框或其组合可以由计算机程序指令来实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,从而这些指令在由该处理器执行时可以创建用于实现这些方框图和/或流程图中所说明的功能/操作的装置。本公开的技术可以硬件和/或软件(包括固件、微代码等)的形式来实现。另外,本公开的技术可以采取存储有指令的计算机可读存储介质上的计算机程序产品的形式,该计算机程序产品可供指令执行***使用或者结合指令执行***使用。
本公开的实施例提供了一种问题生成方法,应用于智能问答***,智能问答***能够对获取到的对话记录进行处理并输出标准问题,方法包括获取一条或多条对话记录;将一条或多条对话记录所包含的词语组合生成至少一个问题;从至少一个问题中确定与一条或多条对话记录所涉及的意图相对应的标准问题。
图1示意性示出了根据本公开实施例的问题生成方法及智能问答***的应用场景图。需要注意的是,图1所示仅为可以应用本公开实施例的场景的示例,以帮助本领域技术人员理解本公开的技术内容,但并不意味着本公开实施例不可以用于其他设备、***、环境或场景。
如图1所示,在电子设备上可以运行智能问答***,智能问答***可以获取一条或多条对话记录101,每条对话记录101由一个或多个词语(图1中词语用英文字母替换)组成。根据本公开的实施例,可以将对话记录101进行分词处理,得到多个词语,然后将词语进行自动组合,生成至少一个问题102。根据本公开的实施例,可以对至少一个问题102进行语法校验,抛弃不合理的问题,并利用长短期记忆模型进行序列检查,抛弃不合理的问题,对合理的问题利用通用自动摘要算法寻找摘要句,可以得到标准问题103。
根据本公开的实施例,将对话记录所包含的词语组合生成至少一个问题,从至少一个问题中可以确定与对话记录所涉及的意图相对应的标准问题。由于根据对话记录自动生成标准问题,相比于现有技术中采用人工生成问题的方式,可以提高问题的生成效率,解决了相关技术中问题生成效率低,生成的问题数量有限的技术问题。
图2示意性示出了根据本公开实施例的问题生成方法的流程图。
根据本公开的实施例,问题生成方法应用于智能问答***,智能问答***能够对获取到的对话记录进行处理并输出标准问题,如图2所示,该方法包括操作S210~S230。
在操作S210,获取一条或多条对话记录。
根据本公开的实施例,可以从历史对话记录中获取一条或多条对话记录,该一条或多条对话记录可以是清洗之后得到的数据,例如,可以是对历史对话记录数据去掉HTML标签,或去掉特殊字符等异常数据后得到的对话记录数据。
在操作S220,将一条或多条对话记录所包含的词语组合生成至少一个问题。
根据本公开的实施例,例如,与保修单相关的对话记录可以包括:能告诉我在哪儿查询保修单、如何查询我的保修单、在哪儿有我的保修单、我如何把保修信息查询出来。根据本公开的实施例,可以对每一条对话记录进行分词处理,得到多个词语,然后将不同的词语重新进行组合,可以得到一个或多个问题。例如,如何把保修单查询出来、如何查询保修单、请问我的保修单在哪儿等等问题。
在操作S230,从至少一个问题中确定与一条或多条对话记录所涉及的意图相对应的标准问题。
根据本公开的实施例,例如,与保修单相关的三条对话记录可以包括:能告诉我在哪儿查询保修单、如何查询我的保修单、在哪儿有我的保修单。可以确定该三条对话记录所涉及的意图是如何查询保修单。
根据本公开的实施例,为了有效确定对话记录所涉及的意图,可以将大量的对话记录进行聚类,聚类算法的种类不做限定。例如可以采用kmeans算法,其中,参数K可以根据智能问答***能够解决的问题的子意图数进行选择。聚类的结果生成K个类集合,每个类集合含若干的句子集合S={s1,s2,s3…,sn},每个类集合中的句子可以表征一种意图。
根据本公开的实施例,可以采用自动摘要算法从至少一个问题中确定摘要句,将摘要句确定为与一条或多条对话记录所涉及的意图相对应的标准问题。
根据本公开的实施例,自动摘要算法例如可以是TextRank算法,可以利用TextRank算法从至少一个问题中确定摘要句,例如,从“如何把保修单查询出来、如何查询我的保修单、请问我的保修单在哪儿”等这些问题中可以确定出摘要句为“如何查询保修单?”。
根据本公开的实施例,摘要句一般比较简要,句子结构简单,语义也更容易理解。通过将摘要句确定为对话记录所涉及的意图相对应的标准问题,可以保证标准问题和对话记录相对应。
根据本公开的实施例,在生成标准问题之后,可以获取用户输入至智能问答***的对话信息,确定与对话信息相匹配的标准问题,输出用于回答标准问题的内容,或者输出标准问题,以供用户确认对话信息的真实意图。
根据本公开的实施例,例如,用户输入至智能问答***的对话信息可以是用户输入的问题,智能问答***可以将其匹配为标准问题,进而对用户输入的问题进行响应。在产生标准问题之后,智能问答***可以输出标准问题,以供用户确认对话信息的真实意图,或者直接响应用户的问题。比如用户问了智能问答***一个问题:“这部手机屏幕这么大,会带来什么问题么”。智能问答可以反问一个标准问:“您的意思是,大屏幕会影响手机电池续航么?”,或者直接输出“大屏幕会影响电池续航”,或者“大屏幕容易碎”等等。
根据本公开的实施例,将对话记录所包含的词语组合生成至少一个问题,从至少一个问题中可以确定与对话记录所涉及的意图相对应的标准问题。由于根据对话记录自动生成标准问题,相比于现有技术中采用人工生成问题的方式,可以提高问题的生成效率,解决了相关技术中问题生成效率低,生成的问题数量有限的技术问题。
下面参考图3~图4,结合具体实施例对图2所示的方法做进一步说明。
图3示意性示出了根据本公开实施例的将一条或多条对话记录所包含的词语组合生成至少一个问题的流程图。
如图3所示,将一条或多条对话记录所包含的词语组合生成至少一个问题包括包括操作S221~S223。
在操作S221,根据一条或多条对话记录所包含的词语在对应对话记录中的语序生成有向词图,其中,有向词图包括多个节点,每个节点代表一个或多个词语,相同词语在有向词图中为同一节点。
根据本公开的实施例,例如,对话记录1为如何查询我的保修单,对话记录2为请问我的保修单在哪儿。每条对话记录中的每个词在句子中都具有相应的位置,即每个句子都有相应的语序。例如,在对话记录1中,“如何”在“查询”的前面,“查询”在“我”前面,“我”在“的”前面,“的”在“保修单”前面。在对话记录1和对话记录2中,都包含“我”、“的”,“保修单”,在有向词图中就表征同一节点。
图4示意性示出了根据本公开实施例的有向词图的示意图。
如图4所示,图中的箭头表示不同词语之间的语序,每个节点可以代表一个或多个词语,相同词语在有向词图中为同一节点。根据本公开的实施例,可以用同一类别的对话记录句子集合S构造有向词图(word-graph),可以将该图表示为G=(V,E),节点V表示句子里的词,有向边E是句子中相邻两个词的语序关系,在构造有向词图时可以增加开始、结束两个虚节点,通过迭代方式可以把句子集合S中的每个句子都放入图中。
在操作S222,根据有向词图中的词语和语序生成至少一个句子。
根据本公开的实施例,可以根据有向词图中的词语和语序确定有向词图的最短路径句子集(即N-shortest-paths),最短路径句子集中可以包含至少一个句子。
在操作S223,从至少一个句子中确定至少一个问题。
根据本公开的实施例,生成的至少一个句子可以组成句子集,然后从句子集中确定至少一个问题。根据本公开的实施例,在从句子集中确定至少一个问题时,可以对句子集中的句子进行处理,滤除不合理的句子。具体地,例如,可以采用如下方式处理。
方式一,检测至少一个句子中每个句子的构造是否满足语法规则,然后从满足语法规则的句子中确定至少一个问题。
根据本公开的实施例,例如,通过图4所表示的有向词图生成句子“如何把保修信息查询保修单”路径就不符合语法规则,可以将该句子从句子集中里删除,通过图4所表示的有向词图生成句子“如何把保修信息查询出来”就符合语法规则。
方式二,计算一条或多条对话记录所包含的任意两个词语在句子中相邻的概率,根据任意两个词语在句子中相邻的概率从至少一个句子中确定满足预设条件的目标句子,从目标句子中确定至少一个问题。
根据本公开的实施例,可以将对话记录进行分词处理,得到多个词语,然后计算任意两个词语在组成句子时位置上相邻的概率。例如,在句子“如何查询出来保修单”中,“查询”与前面的序列“如何”相邻的概率为0.8,“出来”与前面的序列“查询”相邻的概率为0.3,“保修单”与前面的序列“出来”相邻的概率为0.2。
在组成多个句子之后,每个句子中的词语都有相应的概率,其中,句中词语包括与前面词语相邻的概率和与后面词语相邻的概率,句首词语只包括与后面词语相邻的概率,句尾词语只包括与前面词语相邻的概率。
根据本公开的实施例,预设条件可以是句子中的每个词语相对应的概率大于或等于阈值。阈值的大小可以根据实际情况确定,例如,阈值为0.6。从至少一个句子中确定满足预设条件的目标句子时,可以将句子中的每个词语相对应的概率与阈值进行比较,如果每个词语相对应的概率都大于或等于阈值,则可以将该句子确定为目标句子,如果存在词语相对应的概率小于阈值的情况,则可以滤除该句子。
根据本公开的实施例,计算一条或多条对话记录所包含的任意两个词语在句子中相邻的概率包括将至少一个句子中的每个句子分别输入预先训练好的长短期记忆模型中,通过长短期记忆模型输出每个句子中的任意两个词语在句子中相邻的概率。
根据本公开的实施例,可以利用历史对话记录对长短期记忆模型(即LSTM模型)进行训练,再利用训练好的长短期记忆模型对每个句子逐个计算当前词语在前面词语出现的序列下出现的概率。当出现的概率很低的时候,该句子组合可能不合理,滤除该句子。例如图4中可以组合得到句子“如何查询出来”中,“出来”跟前面的序列同时出现概率较低,该句子就会被抛弃。
根据本公开的实施例,对句子集中的每个句子利用长短期记忆模型进行序列检查,可以抛弃不合理的句子,从而提高生成的问题的合理性和有效性。
根据本公开的实施例,从至少一个句子中确定至少一个问题可以采用上述方式一和方式二分别进行确定,也可以同时采用方式一和方式二进行确定。
图5示意性示出了根据本公开另一实施例的从至少一个句子中确定至少一个问题的示意图。
如图5所示,在对历史对话记录数据去掉HTML标签或特殊字符等异常数据后得到对话记录数据,然后通过聚类模型对用户历史对话记录进行聚类,得到包含若干句子的类集合,表示为S={s1,s2,s3...,sn}。用同类对话记录句子集合S构造有向词图(word-graph),通过迭代方式把S的每个句子放入有向词图中。基于该有向词图可以生成N-shortest paths句子集。然后对该句子集中的句子进行语法校验,抛弃不合理的句子,并对句子集利用LSTM模型进行序列检查,抛弃不合理的句子。对合理的句子集利用通用自动摘要算法寻找摘要句,即为标准问题。
根据本公开的实施例,将对话记录所包含的词语组合生成至少一个问题,从至少一个问题中可以确定与对话记录所涉及的意图相对应的标准问题。由于根据对话记录自动生成标准问题,相比于现有技术中采用人工生成问题的方式,可以提高问题的生成效率,解决了相关技术中问题生成效率低,生成的问题数量有限的技术问题。
图6示意性示出了根据本公开实施例的智能问答***的框图。
本公开提供了一种智能问答***,智能问答***能够对获取到的对话记录进行处理并输出标准问题。如图6所示,智能问答***300包括第一获取模块310、生成模块320和第一确定模块330。
第一获取模块310用于获取一条或多条对话记录。
生成模块320用于将一条或多条对话记录所包含的词语组合生成至少一个问题。
第一确定模块330用于从至少一个问题中确定与一条或多条对话记录所涉及的意图相对应的标准问题。
根据本公开的实施例,将对话记录所包含的词语组合生成至少一个问题,从至少一个问题中确定与对话记录所涉及的意图相对应的标准问题。由于根据对话记录自动生成标准问题,相比于现有技术中采用人工生成问题的方式,可以提高问题的生成效率,解决了相关技术中问题生成效率低,生成的问题数量有限的技术问题。
根据本公开的实施例,生成模块320包括第一生成单元、第二生成单元和确定单元。第一生成单元用于根据一条或多条对话记录所包含的词语在对应对话记录中的语序生成有向词图,其中,有向词图包括多个节点,每个节点代表一个或多个词语,相同词语在有向词图中为同一节点。第二生成单元用于根据有向词图中的词语和语序生成至少一个句子。确定单元用于从至少一个句子中确定至少一个问题。
根据本公开的实施例,确定单元可以用于检测至少一个句子中每个句子的构造是否满足语法规则,从满足语法规则的句子中确定至少一个问题。
可选地,确定单元用于计算一条或多条对话记录所包含的任意两个词语在句子中相邻的概率,根据任意两个词语在句子中相邻的概率从至少一个句子中确定满足预设条件的目标句子,以及从目标句子中确定至少一个问题。
可选地,确定单元用于将至少一个句子中的每个句子分别输入预先训练好的长短期记忆模型中,以及通过长短期记忆模型输出每个句子中的任意两个词语在句子中相邻的概率。
根据本公开的实施例,对句子集中的每个句子利用长短期记忆模型进行序列检查,可以抛弃不合理的句子,从而提高生成的问题的合理性和有效性。
根据本公开的实施例,第一确定模块330可以用于采用自动摘要算法从至少一个问题中确定摘要句,将摘要句确定为与一条或多条对话记录所涉及的意图相对应的标准问题。
根据本公开的实施例,摘要句一般比较简要,句子结构简单,语义也更容易理解。通过将摘要句确定为对话记录所涉及的意图相对应的标准问题,可以保证标准问题和对话记录相对应。
根据本公开的实施例,智能问答***300还包括第二获取模块、第二确定模块和输出模块。第二获取模块用于获取用户输入至智能问答***的对话信息。第二确定模块用于确定与对话信息相匹配的标准问题。输出模块用于输出用于回答标准问题的内容,或者输出标准问题,以供用户确认对话信息的真实意图。
根据本公开的实施例,例如,用户输入至智能问答***的对话信息可以是用户输入的问题,智能问答***可以将其匹配为标准问题,进而对用户输入的问题进行响应。
根据本公开的实施例的模块、子模块、单元、子单元中的任意多个、或其中任意多个的至少部分功能可以在一个模块中实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以被拆分成多个模块来实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上***、基板上的***、封装上的***、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式的硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,根据本公开实施例的模块、子模块、单元、子单元中的一个或多个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
例如,第一获取模块310、生成模块320和第一确定模块330中的任意多个可以合并在一个模块中实现,或者其中的任意一个模块可以被拆分成多个模块。或者,这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合,并在一个模块中实现。根据本公开的实施例,第一获取模块310、生成模块320和第一确定模块330中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上***、基板上的***、封装上的***、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,第一获取模块310、生成模块320和第一确定模块330中的至少一个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
根据本公开的实施例,还提供了一种计算机可读存储介质,其上存储有计算机可执行指令,所述指令在被执行时用于如上所述的方法。
根据本公开的实施例,还提供了一种计算机***包括处理器,以及计算机可读存储介质,存储有计算机可执行指令,所述指令在被所述处理器执行时用于实现如上所述的方法。
图7示意性示出了根据本公开实施例的适于实现上文描述的方法的计算机***的框图。图7示出的计算机***仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图7所示,计算机***400包括处理器410和计算机可读存储介质420。该计算机***400可以执行根据本公开实施例的方法。
具体地,处理器410例如可以包括通用微处理器、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC)),等等。处理器410还可以包括用于缓存用途的板载存储器。处理器410可以是用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
计算机可读存储介质420,例如可以是非易失性的计算机可读存储介质,具体示例包括但不限于:磁存储装置,如磁带或硬盘(HDD);光存储装置,如光盘(CD-ROM);存储器,如随机存取存储器(RAM)或闪存;等等。
计算机可读存储介质420可以包括计算机程序421,该计算机程序421可以包括代码/计算机可执行指令,其在由处理器410执行时使得处理器410执行根据本公开实施例的方法或其任何变形。
计算机程序421可被配置为具有例如包括计算机程序模块的计算机程序代码。例如,在示例实施例中,计算机程序421中的代码可以包括一个或多个程序模块,例如包括421A、模块421B、……。应当注意,模块的划分方式和个数并不是固定的,本领域技术人员可以根据实际情况使用合适的程序模块或程序模块组合,当这些程序模块组合被处理器410执行时,使得处理器410可以执行根据本公开实施例的方法或其任何变形。
根据本发明的实施例,第一获取模块310、生成模块320和第一确定模块330中的至少一个可以实现为参考图7描述的计算机程序模块,其在被处理器410执行时,可以实现上面描述的相应操作。
本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的设备/装置/***中所包含的;也可以是单独存在,而未装配入该设备/装置/***中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本公开实施例的方法。
根据本公开的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质,例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。
附图中的流程图和框图,图示了按照本公开各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合,即使这样的组合或结合没有明确记载于本公开中。特别地,在不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。
尽管已经参照本公开的特定示例性实施例示出并描述了本公开,但是本领域技术人员应该理解,在不背离所附权利要求及其等同物限定的本公开的精神和范围的情况下,可以对本公开进行形式和细节上的多种改变。因此,本公开的范围不应该限于上述实施例,而是应该不仅由所附权利要求来进行确定,还由所附权利要求的等同物来进行限定。

Claims (10)

1.一种问题生成方法,应用于智能问答***,所述智能问答***能够对获取到的对话记录进行处理并输出标准问题,所述方法包括:
获取一条或多条对话记录;
将所述一条或多条对话记录所包含的词语组合生成至少一个问题;以及
从所述至少一个问题中确定与所述一条或多条对话记录所涉及的意图相对应的标准问题。
2.根据权利要求1所述的方法,其中,将所述一条或多条对话记录所包含的词语组合生成至少一个问题包括:
根据所述一条或多条对话记录所包含的词语在对应对话记录中的语序生成有向词图,其中,所述有向词图包括多个节点,每个节点代表一个或多个词语,相同词语在所述有向词图中为同一节点;
根据所述有向词图中的词语和语序生成至少一个句子;以及
从所述至少一个句子中确定所述至少一个问题。
3.根据权利要求2所述的方法,其中,从所述至少一个句子中确定所述至少一个问题包括:
检测所述至少一个句子中每个句子的构造是否满足语法规则;以及
从满足所述语法规则的句子中确定所述至少一个问题。
4.根据权利要求2所述的方法,其中,从所述至少一个句子中确定所述至少一个问题包括:
计算所述一条或多条对话记录所包含的任意两个词语在句子中相邻的概率;
根据所述任意两个词语在句子中相邻的概率从所述至少一个句子中确定满足预设条件的目标句子;以及
从所述目标句子中确定所述至少一个问题。
5.根据权利要求4所述的方法,其中,计算所述一条或多条对话记录所包含的任意两个词语在句子中相邻的概率包括:
将所述至少一个句子中的每个句子分别输入预先训练好的长短期记忆模型中;以及
通过所述长短期记忆模型输出每个句子中的任意两个词语在句子中相邻的概率。
6.根据权利要求1所述的方法,其中,从所述至少一个问题中确定与所述一条或多条对话记录所涉及的意图相对应的标准问题包括:
采用自动摘要算法从所述至少一个问题中确定摘要句;以及
将所述摘要句确定为与所述一条或多条对话记录所涉及的意图相对应的标准问题。
7.根据权利要求1所述的方法,其中,所述方法还包括:
获取用户输入至所述智能问答***的对话信息;
确定与所述对话信息相匹配的标准问题;以及
输出用于回答所述标准问题的内容,或者输出所述标准问题,以供用户确认所述对话信息的真实意图。
8.一种智能问答***,所述智能问答***能够对获取到的对话记录进行处理并输出标准问题,所述***包括:
第一获取模块,用于获取一条或多条对话记录;
生成模块,用于将所述一条或多条对话记录所包含的词语组合生成至少一个问题;以及
第一确定模块,用于从所述至少一个问题中确定与所述一条或多条对话记录所涉及的意图相对应的标准问题。
9.一种计算机可读存储介质,其上存储有计算机可执行指令,所述指令在被执行时用于实现权利要求1至7中任一项所述的方法。
10.一种计算机***,包括:
处理器;以及
计算机可读存储介质,存储有计算机可执行指令,所述指令在被所述处理器执行时用于实现权利要求1至7中任一项所述的方法。
CN201811653507.1A 2018-12-29 2018-12-29 问题生成方法、智能问答***、介质以及计算机*** Active CN109783626B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811653507.1A CN109783626B (zh) 2018-12-29 2018-12-29 问题生成方法、智能问答***、介质以及计算机***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811653507.1A CN109783626B (zh) 2018-12-29 2018-12-29 问题生成方法、智能问答***、介质以及计算机***

Publications (2)

Publication Number Publication Date
CN109783626A true CN109783626A (zh) 2019-05-21
CN109783626B CN109783626B (zh) 2022-05-31

Family

ID=66499073

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811653507.1A Active CN109783626B (zh) 2018-12-29 2018-12-29 问题生成方法、智能问答***、介质以及计算机***

Country Status (1)

Country Link
CN (1) CN109783626B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110175223A (zh) * 2019-05-29 2019-08-27 北京搜狗科技发展有限公司 一种实现问题生成的方法及装置
CN111221945A (zh) * 2020-04-24 2020-06-02 支付宝(杭州)信息技术有限公司 基于用户问句生成标准问题的方法和装置
CN112035610A (zh) * 2020-08-28 2020-12-04 康键信息技术(深圳)有限公司 医疗领域问答对的生成方法、装置、计算机设备和介质
CN112242136A (zh) * 2019-07-19 2021-01-19 国际商业机器公司 提高会话模型的测试覆盖

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110125734A1 (en) * 2009-11-23 2011-05-26 International Business Machines Corporation Questions and answers generation
CN102722558A (zh) * 2012-05-29 2012-10-10 百度在线网络技术(北京)有限公司 一种为用户推荐提问的方法和装置
CN105955965A (zh) * 2016-06-21 2016-09-21 上海智臻智能网络科技股份有限公司 问句信息处理方法及装置
US20160306800A1 (en) * 2015-04-16 2016-10-20 Fluenty Korea Inc. Reply recommendation apparatus and system and method for text construction
US20160358094A1 (en) * 2015-06-02 2016-12-08 International Business Machines Corporation Utilizing Word Embeddings for Term Matching in Question Answering Systems
US20180075016A1 (en) * 2016-09-15 2018-03-15 International Business Machines Corporation System and method for automatic, unsupervised paraphrase generation using a novel framework that learns syntactic construct while retaining semantic meaning
US20180075366A1 (en) * 2016-09-09 2018-03-15 International Business Machines Corporation System and method for generating full questions from natural language queries
CN108073600A (zh) * 2016-11-11 2018-05-25 阿里巴巴集团控股有限公司 一种智能问答交互方法、装置以及电子设备
CN108427707A (zh) * 2018-01-23 2018-08-21 深圳市阿西莫夫科技有限公司 人机问答方法、装置、计算机设备和存储介质
CN108509638A (zh) * 2018-04-11 2018-09-07 联想(北京)有限公司 一种问题提取方法及电子设备
CN108846126A (zh) * 2018-06-29 2018-11-20 北京百度网讯科技有限公司 关联问题聚合模型的生成、问答式聚合方法、装置及设备

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110125734A1 (en) * 2009-11-23 2011-05-26 International Business Machines Corporation Questions and answers generation
CN102722558A (zh) * 2012-05-29 2012-10-10 百度在线网络技术(北京)有限公司 一种为用户推荐提问的方法和装置
US20160306800A1 (en) * 2015-04-16 2016-10-20 Fluenty Korea Inc. Reply recommendation apparatus and system and method for text construction
US20160358094A1 (en) * 2015-06-02 2016-12-08 International Business Machines Corporation Utilizing Word Embeddings for Term Matching in Question Answering Systems
CN105955965A (zh) * 2016-06-21 2016-09-21 上海智臻智能网络科技股份有限公司 问句信息处理方法及装置
US20180075366A1 (en) * 2016-09-09 2018-03-15 International Business Machines Corporation System and method for generating full questions from natural language queries
US20180075016A1 (en) * 2016-09-15 2018-03-15 International Business Machines Corporation System and method for automatic, unsupervised paraphrase generation using a novel framework that learns syntactic construct while retaining semantic meaning
CN108073600A (zh) * 2016-11-11 2018-05-25 阿里巴巴集团控股有限公司 一种智能问答交互方法、装置以及电子设备
CN108427707A (zh) * 2018-01-23 2018-08-21 深圳市阿西莫夫科技有限公司 人机问答方法、装置、计算机设备和存储介质
CN108509638A (zh) * 2018-04-11 2018-09-07 联想(北京)有限公司 一种问题提取方法及电子设备
CN108846126A (zh) * 2018-06-29 2018-11-20 北京百度网讯科技有限公司 关联问题聚合模型的生成、问答式聚合方法、装置及设备

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110175223A (zh) * 2019-05-29 2019-08-27 北京搜狗科技发展有限公司 一种实现问题生成的方法及装置
CN112242136A (zh) * 2019-07-19 2021-01-19 国际商业机器公司 提高会话模型的测试覆盖
CN111221945A (zh) * 2020-04-24 2020-06-02 支付宝(杭州)信息技术有限公司 基于用户问句生成标准问题的方法和装置
CN111221945B (zh) * 2020-04-24 2020-08-04 支付宝(杭州)信息技术有限公司 基于用户问句生成标准问题的方法和装置
CN112035610A (zh) * 2020-08-28 2020-12-04 康键信息技术(深圳)有限公司 医疗领域问答对的生成方法、装置、计算机设备和介质
CN112035610B (zh) * 2020-08-28 2023-04-07 康键信息技术(深圳)有限公司 医疗领域问答对的生成方法、装置、计算机设备和介质

Also Published As

Publication number Publication date
CN109783626B (zh) 2022-05-31

Similar Documents

Publication Publication Date Title
US11734329B2 (en) System and method for text categorization and sentiment analysis
CN108121795B (zh) 用户行为预测方法及装置
CN109783626A (zh) 问题生成方法、智能问答***、介质以及计算机***
US10248689B2 (en) Supplementing candidate answers
US11675827B2 (en) Multimedia file categorizing, information processing, and model training method, system, and device
CN105574098B (zh) 知识图谱的生成方法及装置、实体对比方法及装置
CN110147722A (zh) 一种视频处理方法、视频处理装置及终端设备
US9817810B2 (en) SVO-based taxonomy-driven text analytics
CN106959920A (zh) 对包含多个测试用例的测试套件进行优化的方法和***
CN109933778B (zh) 分词方法、装置以及计算机可读存储介质
US20170293606A1 (en) Methods and systems for optimized selection of data features for a neuro-linguistic cognitive artifical intelligence system
CN109582799A (zh) 知识样本数据集的确定方法、装置及电子设备
US20150248409A1 (en) Sorting and displaying documents according to sentiment level in an online community
US11481442B2 (en) Leveraging intent resolvers to determine multiple intents
CN111402257A (zh) 一种基于多任务协同跨域迁移的医学图像自动分割方法
CN112015896B (zh) 基于人工智能的情感分类方法、以及装置
US11875784B2 (en) Methods and systems for optimized selection of data features for a neuro-linguistic cognitive artificial intelligence system
CN114153980A (zh) 知识图谱构建方法和装置、检查方法、存储介质
CN106033425A (zh) 数据处理设备和数据处理方法
US11003705B2 (en) Natural language processing and classification
CN111355696A (zh) 一种报文识别方法、装置、dpi设备及存储介质
US10074055B2 (en) Assisting database management
CN111310453A (zh) 一种基于深度学习的用户主题向量化表示方法和***
CN116467459A (zh) 物联网设备故障报告方法、装置、计算机设备和存储介质
CN114547391A (zh) 消息审核方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant