CN110019739A - 基于必要条件的问答方法和装置、计算机设备和存储介质 - Google Patents

基于必要条件的问答方法和装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN110019739A
CN110019739A CN201810046648.0A CN201810046648A CN110019739A CN 110019739 A CN110019739 A CN 110019739A CN 201810046648 A CN201810046648 A CN 201810046648A CN 110019739 A CN110019739 A CN 110019739A
Authority
CN
China
Prior art keywords
necessary condition
intention
word
answer
knowledge point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810046648.0A
Other languages
English (en)
Inventor
李波
曾永梅
朱频频
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Xiaoi Robot Technology Co Ltd
Shanghai Zhizhen Intelligent Network Technology Co Ltd
Original Assignee
Shanghai Zhizhen Intelligent Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Zhizhen Intelligent Network Technology Co Ltd filed Critical Shanghai Zhizhen Intelligent Network Technology Co Ltd
Priority to US16/052,143 priority Critical patent/US20190164064A1/en
Publication of CN110019739A publication Critical patent/CN110019739A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Machine Translation (AREA)

Abstract

本发明涉及一种基于必要条件的问答方法和装置、计算机设备和存储介质。该基于必要条件的问答方法包括:接收用户的问题;对所述问题进行分词处理,得到多个词语;根据所述多个词语从知识库获取所述至少一个意图,得到与所述至少一个意图中的每个意图相关的至少一个必要条件;将所述至少一个必要条件与知识库中的多个预设的必要条件知识点进行匹配以确定匹配的至少一个必要条件知识点;根据所述匹配的至少一个必要条件知识点执行对应的预设分支流程,得到所述分支流程对应的答案,将答案发送给所述用户。本发明能够提高计算效率及答案回复的准确率。

Description

基于必要条件的问答方法和装置、计算机设备和存储介质
技术领域
本发明涉及人机交互技术领域,尤其涉及一种基于必要条件的问答方法和装置、计算机设备和存储介质。
背景技术
人机交互(Human-Computer Interaction,HCI)是研究***与用户之间的交互关系的科学。***可以是各种各样的机器,也可以是计算机化的***和软件。例如,通过人机交互可以实现诸如智能客服***、语音控制***等各种人工智能***。
智能问答***是人机交互的一种典型应用。传统的智能问答***是将用户提出的问题直接与知识库中存储的大量问题进行相似度计算,得到与该问题相匹配的答案。但是,由于这种方法针对每个问题都要完整地进行相似度计算,因此,计算量非常大,导致计算效率低。另外,上述方法仅能够对单意图问题或者可以有效断句的多意图问题进行答复,且答案回复的准确率低,因此,导致用户体验差。
发明内容
有鉴于此,本发明的一个目的在于提供一种基于必要条件的问答方法和装置、计算机设备和存储介质,能够提高计算效率及答案回复的准确率。
本发明的一个方面提供一种基于必要条件的问答方法,包括:
接收用户的问题,所述问题包含至少一个意图和与所述至少一个意图中的每个意图相关的至少一个必要条件;
对所述问题进行分词处理,得到多个词语;
根据所述多个词语从知识库获取所述至少一个意图,其中所述至少一个意图中的每个意图对应所述多个词语中的至少一个词语,所述至少一个必要条件对应所述多个词语中除所述至少一个词语之外的词语;
将所述至少一个必要条件与知识库中的多个预设的必要条件知识点进行匹配以确定匹配的至少一个必要条件知识点;
根据所述匹配的至少一个必要条件知识点执行对应的预设分支流程,得到所述分支流程对应的答案,所述预设分支流程为每个意图知识点对应的至少一组必要条件知识点连接而成,每组必要条件知识点包括至少一个必要条件知识点,每个必要条件知识点的流程指向其他组必要条件知识点或答案;以及
将所述答案发送给所述用户。
本发明的另一个方面提供一种基于必要条件的问答装置,包括:
接收模块,用于接收用户的问题,所述问题包含至少一个意图和与所述至少一个意图中的每个意图相关的至少一个必要条件;
分词模块,用于对所述问题进行分词处理,得到多个词语;
意图获取模块,用于根据所述多个词语从知识库获取所述至少一个意图,得到与所述至少一个意图中的每个意图相关的至少一个必要条件,其中所述至少一个意图中的每个意图对应所述多个词语中的至少一个词语,所述至少一个必要条件对应所述多个词语中除所述至少一个词语之外的词语;
必要条件匹配模块,用于将所述至少一个必要条件与知识库中的多个预设的必要条件知识点进行匹配以确定匹配的至少一个必要条件知识点;
答案获取模块,用于根据所述匹配的至少一个必要条件知识点执行对应的预设分支流程,得到所述分支流程对应的答案,其中预先存储有每个意图对应的必要条件分支流程,所述预设分支流程为每个意图知识点对应的至少一组必要条件知识点连接而成,每组必要条件知识点包括至少一个必要条件知识点,每个必要条件知识点流程指向其他组必要条件知识点或答案;以及
答案发送模块,用于将所述答案发送给所述用户。
本发明的再一个方面提供一种计算机设备,包括:存储器、处理器及存储在存储器中并可在处理器中运行的可执行指令,处理器执行可执行指令时实现如上所述的任一种基于必要条件的问答方法。
本发明的又一个方面提供一种计算机可读存储介质,其上存储有计算机可执行指令,可执行指令被处理器执行时实现如上所述的任一种基于必要条件的问答方法。
根据本发明实施例提供的技术方案,通过接收用户的问题,该问题包含至少一个意图和与至少一个意图中的每个意图相关的至少一个必要条件;对问题进行分词处理,根据分词结果从知识库获取所述至少一个意图和与所述至少一个意图中的每个意图相关的至少一个必要条件;将所述至少一个必要条件与知识库中的多个预设的必要条件知识点进行匹配以确定匹配的至少一个必要条件知识点;根据所述匹配的至少一个必要条件知识点执行对应的预设分支流程,得到所述分支流程对应的答案,以及将答案发送给用户,能够提高计算效率及答案回复的准确率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是根据本发明一示例性实施例示出的一种基于必要条件的问答方法的流程图。
图2是根据本发明另一示例性实施例示出的一种基于必要条件的问答方法的流程图。
图3是根据本发明另一示例性实施例示出的一种基于必要条件的问答方法的流程图。
图4是根据本发明另一示例性实施例示出的一种基于必要条件的问答方法的流程图。
图5是根据本发明另一示例性实施例示出的一种基于必要条件的问答方法的流程图。
图6是根据本发明一示例性实施例示出的一种基于必要条件的问答装置的框图。
图7是根据本发明另一示例性实施例示出的一种基于必要条件的问答装置的框图。
图8是根据本发明一示例性实施例示出的用于基于必要条件的问答的装置700的框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。根据本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1是根据本发明一示例性实施例示出的一种基于必要条件的问答方法的流程图。图1的基于必要条件的问答方法可以由人机交互装置(例如,智能问答***等)执行,如图1所示,该基于必要条件的问答方法包括:
110:接收用户的问题,该问题包含至少一个意图和与至少一个意图中的每个意图相关的至少一个必要条件。
在本发明实施例中,用户的问题中可以包含一个或多个意图,意图中可以包含一个或多个必要条件,而问题中可能仅包含一个必要条件或对应意图的一部分必要条件。
进一步地,用户的问题可以是用户通过键盘或触摸屏等输入的文本信息,也可以是用户通过话筒等输入的语音信息,或者还可以是用户通过交互终端输入的文本消息、数据链接、语音消息、图片消息、图像消息和视频消息等,本发明对此不作限制。
这里,交互终端是能够与智能问答***进行信息交互的设备,例如,智能手机、平板电脑、个人电脑或其他智能终端等。举例来说,用户可以一边通过语音或视频向智能问答***提问,一边通过交互终端向智能问答***发送相应的数据链接。
需要说明的是,当接收到的问题为语音消息、图片消息、图像消息或视频消息时,智能问答***可以通过语音识别模块、图片识别模块或视频识别模块等将语音消息、图片消息、图像消息或视频消息转换为文本消息。
120:对问题进行分词处理,得到多个词语。
在本发明实施例中,根据预设的分词规则和预设的分词词典对用户的问题进行分词处理,得到多个词语。这里,分词规则可以包括但不限于正向最大匹配法、逆向最大匹配法、逐词遍历法或词频统计法、最少切分法、双相匹配法等。分词处理可以采用双向最大匹配法、维特比算法、隐马尔可夫模型算法和条件随机场算法中的一种或多种。
词汇组合是将多个词语排列组合在一起,并且这些词语在排列组合后所表达的意图可以是一个,也可以是多个。
130:根据多个词语从知识库获取至少一个意图,得到与至少一个意图中的每个意图相关的至少一个必要条件,其中至少一个意图中的每个意图对应多个词语中的至少一个词语,至少一个必要条件对应多个词语中除至少一个词语之外的词语。
140:将所述至少一个必要条件与知识库中的多个预设的必要条件知识点进行匹配以确定匹配的至少一个必要条件知识点。
在本发明实施例中,意图为通过自然语言处理的方法与预先设定在数据库中的意图匹配得到的,这里,数据库即为存储有意图知识点的知识库。可以根据分词处理对用户的问题进行意图分析,进一步地,也可以根据分词处理的结果对分词后的多个词语进行排列组合,并基于词汇组合的结果对用户的问题进行意图分析。
150:根据匹配的至少一个必要条件知识点执行对应的预设分支流程,得到分支流程对应的答案,预设分支流程为每个意图知识点对应的至少一组必要条件知识点连接而成,每组必要条件知识点包括至少一个必要条件知识点,每个必要条件知识点的流程指向其他组必要条件知识点或答案。
需要说明的是,意图流程和必要条件流程是预先设定好的。这里,预设分支流程为每个意图知识点对应的至少一组必要条件知识点连接而成,至少一组必要条件知识点中的每组必要条件知识点可以包括同一语义条件的肯定的必要条件知识点和否定的必要条件知识点,分别用于执行肯定的必要条件知识点对应的分支流程和否定的必要条件知识点对应的分支流程。
举例来说,离婚流程的必要条件知识点可以包括第一组必要条件知识点“是否愿意离婚”、第二组必要条件知识点“是否有财产争议”、第三组必要条件知识点“是否有抚养权争议”等。进一步地,第一组必要条件知识点“是否愿意离婚”包括肯定的必要条件知识点“对方愿意离婚”和否定的必要条件知识点“对方不愿意离婚”,第二组必要条件知识点“是否有财产争议”包括肯定的必要条件知识点“有财产争议”和否定的必要条件知识点“没有财产争议”,第三组必要条件知识点“是否有抚养权争议”包括肯定的必要条件知识点“有抚养权争议”和否定的必要条件知识点“没有抚养权争议”。
具体地,以导医问诊的智能问答***为例,假设用户的问题为“我头和颈椎都疼,还有点感冒,发烧39度,应该怎么办?”,通过意图分析可以得到用户问题中的意图为“感冒了,该怎么办”,必要条件为“头和颈椎都疼”和“发烧38度以上”,则智能问答***自动进入与“感冒”相关的意图流程,并进一步执行与必要条件“头和颈椎都疼”和“发烧38度以上”相关的必要条件流程,从而得到相关答案和建议。
在本发明实施例中,根据至少一个意图进入相应的意图流程,并进一步根据与至少一个意图中的每个意图相关的至少一个必要条件执行相应的必要条件流程,从而得到与问题对应的答案。
160:将所述答案发送给用户。
在本发明实施例中,可以通过文本、语音、图片、图像或视频中的一种或多种方式将答案发送给用户。
具体地,以招商银行的智能在线客服***为例,如果用户以文本方式输入“招商银行的***如何还款”,则招商银行的智能在线客服***以文本方式回复为“您可以在招商银行的柜台或ATM机还款,也可以通过网上银行、自动转账等方式还款”,同时,智能在线客服***的用户界面上会显示用户当前所在位置周边的招商银行的信息,用户可以通过点击该信息导航前往附近的招商银行进行还款。
根据本发明实施例提供的技术方案,通过接收用户的问题,该问题包含至少一个意图和与至少一个意图中的每个意图相关的至少一个必要条件;对问题进行分词处理,根据分词结果从知识库获取至少一个意图和与至少一个意图中的每个意图相关的至少一个必要条件;将至少一个必要条件与知识库中的多个预设的必要条件知识点进行匹配以确定匹配的至少一个必要条件知识点;根据匹配的至少一个必要条件知识点执行对应的预设分支流程,得到分支流程对应的答案,以及将答案发送给用户,能够提高计算效率及答案回复的准确率。
如附图2所示,在本发明的一实施例中,知识库包括多个预设的意图知识点,130中的:根据多个词语从知识库获取至少一个意图,包括:
1301:分别对多个词语进行语义解析,得到多个词语的语义信息。
在本发明实施例中,语义信息可以包括但不限于词语的同义词和/或同义词组合、词语的同类词和/或同类词组合、与词语具有相同或相似结构的实体。
1302:将语义信息与多个预设的意图知识点进行匹配以确定匹配的至少一个意图知识点;以及
1303:获取与匹配的至少一个意图知识点对应的至少一个意图。
进一步地,1302和1303中,将语义信息与知识库中预先存储的多个意图知识点进行语义相似度计算,并将语义相似度最高的意图知识点作为匹配的至少一个意图知识点。这里,语义相似度是指多个词语的语义信息与知识库中的多个预设的意图知识点和必要条件知识点之间基于字与词语上的匹配程度,以及语义的高度相似性。语义相似度计算可以采用基于向量空间模型(VectorSpaceModel,VSM)的计算方法、基于隐形语义索引模型(LatentSemanticIndexing,LSI)的计算方法、基于属性论的语义相似度计算方法和基于汉明距离的语义相似度计算方法中的一种或多种方法的结合。需要说明的是,语义相似度计算方法还可以为其他的语义相似度的计算方法。
最后,获取与匹配的至少一个意图知识点对应的至少一个意图。
如附图3所示,在一实施例中,1301之前,还包括1304:对多个词语进行过滤处理,得到至少一个关键词,过滤处理采用以下任一种或两种方式:去除前后缀和去除停用词。
过滤处理采用的方法可以为根据词性等对多个词语进行过滤,去除前后缀;也可以为根据频次对多个词语进行过滤,去除停用词;或者还可以先去除前后缀、再去除停用词等,本发明对此不作限制。这里,去除停用词是指去除问题中识别意义不大但出现频率高的词,例如,“这”、“的”、“和”等,这些词在计算相似度的过程中会引入较大的误差,可以看成是一种噪音。需要说明的是,过滤处理还可以去除部分无意义词语,例如,“我”、“想”、“吗”等。
1301包括:分别对至少一个关键词进行语义解析,得到多个词语的语义信息。
对至少一个关键词进行语义解析,得到多个词语的语义信息。通常,语义信息是指任何有含义的语言、文字、数据、符号等提供的信息。在本发明实施例中,语义信息即为用户问题中的意图,其可以通过例如词类替换、命名实体识别等方法获取。这里,语义信息可以包括但不限于词语的同义词和/或同义词组合、词语的同类词和/或同类词组合、与词语具有相同或相似结构的实体。
如图4所示,在一实施例中,150中执行分支流程的过程包括:
1501:确定至少一个意图中的至少一个意图的必要条件是否足以触发答案;
1502:如果至少一个意图中的至少一个意图的必要条件足以触发答案,则输出对应的答案;或者
如果至少一个意图中的至少一个意图的必要条件不足以触发答案,则以反问的形式要求用户补全用于触发答案的必要条件。
具体地,确定与至少一个意图中的至少一个意图相关的必要条件是否满足分支流程的触发条件,如果满足分支流程的触发条件,则执行该分支流程并输出必要条件对应的答案;如果不满足分支流程的触发条件,则提示用户需要将用于触发答案的必要条件补充完整。
在本发明的另一个实施例中,将至少一个必要条件与多个预设的必要条件知识点进行匹配以确定匹配的至少一个必要条件知识点,包括:将至少一个必要条件与多个预设的必要条件知识点进行语义相似度计算,其中至少一个意图中的每个意图对应多个词语中的至少一个词语,至少一个必要条件对应多个词语中除至少一个词语之外的词语;以及将语义相似度最高的必要条件知识点作为匹配的至少一个必要条件知识点。
具体地,将问题中的至少一个必要条件与知识库中预先存储的多个必要条件知识点进行语义相似度计算,并将语义相似度最高的必要条件知识点作为匹配的至少一个必要条件知识点。这里,语义相似度计算可以采用基于向量空间模型的计算方法、基于隐形语义索引模型的计算方法、基于属性论的语义相似度计算方法和基于汉明距离的语义相似度计算方法中的一种或多种方法的结合。需要说明的是,语义相似度计算方法还可以为其他的语义相似度的计算方法。
下文将以法律咨询的智能问答***的离婚流程为例对上述基于必要条件的问答方法进行详细描述。
具体地,智能问答***接收用户的问题“我想要办离婚,我老婆不愿意,而且我们有财产分配争议,应该怎么办?”,并根据预设的分词规则和预设的分词词典通过去除前后缀、停用词等方法对上述问题进行分词处理,得到多个词语“我要离婚”、“老婆不愿意”、“有财产分配争议”、“怎么办”。
接着,将分词处理后的词语与知识库中预存的知识点(例如,“我要离婚”、“对方愿意离婚”、“对方不愿意离婚”、“有财产争议”、“没有财产争议”等)进行语义相似度计算,得到上述问题中的意图为“我要离婚”,必要条件为“对方不愿意”和“有财产争议”。
进一步地,基于意图“我要离婚”执行离婚流程,并基于必要条件“对方不愿意”和“有财产争议”执行对应的分支流程,得到上述问题所对应的法律意见,并将该法律意见以文本、语音等方式呈现给用户。
图5是根据本发明另一示例性实施例示出的一种基于必要条件的问答方法的流程图。如图3所示,该基于必要条件的问答方法包括:
310:接收用户的问题,该问题包含多个意图。
在本发明实施例中,用户的问题可以包含多个意图,也可以仅包含一个意图,本发明对此不作限制。例如,用户的问题为“请告诉我北京和上海的天气”,则该问题中包含两个意图,即“北京的天气”和“上海的天气”。又如,用户的问题为“我的***丢了,请问该怎么挂失?”,则该问题中仅包含一个意图,即“***挂失”。
需要说明的是,用户的问题可以为文本消息、语音消息、图片消息、图像消息和视频消息中的一种或多种。此外,还需要说明的是,用户的问题中可以包含标点符号,也可以不包含标点符号。
320:对问题进行分词处理,得到多个词语。
在本发明实施例中,根据预设的分词规则和预设的分词词典对用户的问题进行分词得到分词结果,并通过去除前后缀、停用词等方法对用户的问题的分词结果进行过滤处理。
需要说明的是,对问题进行处理的方法不限于如上所述的分词处理,而是可以包括基于标点符号的断句处理、基于语义信息或固定字词的拆分处理等,本发明对此不作限制。
330:对多个词语进行语义解析,得到多个词语的语义信息。
在本发明实施例中,语义信息可以包括但不限于词语的同义词和/或同义词组合、词语的同类词和/或同类词组合、与词语具有相同或相似结构的实体。
340:根据语义信息对多个词语进行组合,得到待匹配词组,该待匹配词组中均包含多个意图中的一个意图。
在本发明实施例中,根据多个词语中的每个词语的语义信息对多个词语进行组合,得到待匹配词组,待匹配词组中均包含至少一个意图。例如,多个词语为“***”、“还款”、“时间”、“地点”、“分期”,则组合后得到的待匹配词组,其中包括多个意图为:为“***还款时间”、“***还款地点”和“***还款能否分期”。
350:按在问句中的前后顺序将待匹配词组中的至少两个词语组合与知识库中的多个预设的扩展问进行语义相似度计算,并将语义相似度最高的扩展问的意图知识点作为用户的意图。
在本发明实施例中,语义相似度计算可以采用基于向量空间模型的计算方法、基于隐形语义索引模型的计算方法、基于属性论的语义相似度计算方法和基于汉明距离的语义相似度计算方法中的一种或多种方法的结合。例如:“***”、“还款”、“时间”、“地点”,则从前到后顺序与知识库中的扩展问匹配,知识库中扩展问有“***还款时间”“***还款地点”,则“***还款”没有与知识库中的知识点匹配,则顺序取“***”、“还款”、“时间”与知识库中扩展问“***还款时间”匹配。
360:消除问题的待匹配词组中已匹配到意图的词语,并将已消除的词语暂时存储在已消除词语集中。
在本发明实施例中,当得到待匹配词组之后,按照从左到右的消费原则将已匹配的词语从用户的问题中消除,并将已消除的词语暂时保存在已消除词语集中。
370:判断问题中剩余的词语组成的待匹配词组是否与知识库中预设的扩展问完全匹配。
在本发明实施例中,将问题中的剩余的待匹配词组进行排列组合,并分别与知识库中多个预设的扩展问进行匹配。
380:如果问题的剩余的待匹配词组中的至少两个词语的组合与知识库中预设的扩展问完全匹配,则获取与匹配的扩展问对应的意图知识点作为问题中的又一个意图。
在本发明实施例中,如果用户的问题中没有剩余词语,则表明问题中的词语组成的至少一个扩展问均与多个预设的扩展问完全匹配,这时,将与匹配的扩展问对应的答案发送给用户。
需要说明的是,答案可以以文本、语音、图片、图像和视频中的一种或多种形式发送。
390:如果问题的剩余的待匹配词组未与多个预设的扩展问完全匹配,则从已消除词语集中补入缺少的词语,并返回350。
在本发明实施例中,如果用户的问题的剩余的待匹配词组中仍有剩余词语,则表明问题的剩余的待匹配词语中部分或全部词语组成的至少一个待匹配词组并未与知识库中预设的扩展问完全匹配,且缺少的词正好在已消除词语集中,这时,需要根据多个预设的扩展问从已消除词语集中补入缺少的词语,以使与预设的扩展问完整匹配;进一步地,继续执行350,直到用户问题中的所有词语全部被消除或无法与知识库中的扩展问匹配。
根据本发明实施例提供的技术方案,通过对包含多意图的用户问题进行分词处理、语义解析、排列组合及语义信息共享,能够提高答案回复的速度和准确率,并因此提升用户体验。
下文将以酒店的智能问答***为例对上述基于必要条件的问答方法进行详细描述。
具体地,智能问答***接收用户的问题“酒店早餐几点开始?是自助餐吗?在哪里吃?是免费的吗?”,并根据预设的分词规则和预设的分词词典通过对上述问题进行分词处理得到分词结果,再去除前后缀、停用词等方法对分词结果进行过滤上述问题进行分词处理,得到多个词语“酒店”、“早餐”、“几点”、“开始”、“自助餐”、“哪里”、“吃”、“免费”。进一步地,根据上述词语的语义信息对上述词语进行排列组合,得到与知识库中多个扩展问匹配:“酒店早餐几点开始”、“酒店早餐是自助餐吗”、“酒店早餐在哪里吃”等,多个扩展问中的每个扩展问仅包含一个意图。
接着,按照从左到右的消费原则,将待匹配词组中的至少两个词语的组合与知识库中的预设扩展问(即,表达式[酒店][早餐][何时][开始]、[酒店][早餐][是否][自助餐]、[酒店][早餐][哪里][吃]、[酒店][早餐][是否][免费|收费]等)进行语义相似度计算,得到第一个匹配的表达式为[酒店][早餐][何时][开始]。这时,将已匹配的词语“酒店”、“早餐”、“几点”、“开始”暂时保存在已消费的词语集中,并继续对用户问题中的剩余词语进行处理。
进一步地,将用户问题中的剩余词语“自助餐”、“哪里”、“吃”、“免费”与知识库中的表达式进行语义相似度计算。由于知识库中存储的表达式为[酒店][早餐][是否][自助餐],但用户问题中的剩余词语仅有“自助餐”,因此,缺少了两个必须的词语“酒店”和“早餐”,这时,从已消费的词语集中找到缺少的两个词语,并将这两个词语与“自助餐”一起组成一个完整的表达式[酒店][早餐][是否][自助餐],以便将该表达式消费完全,以此类推,直到用户问题中的词语全部被消费。
下述为本发明装置实施例,可以用于执行本发明方法实施例。对于本发明装置实施例中未披露的细节,请参照本发明方法实施例。
图6是根据本发明一示例性实施例示出的一种基于必要条件的问答装置400的框图。如图4所示,该基于必要条件的问答装置400包括:
接收模块410,用于接收用户的问题,该问题包含至少一个意图和与至少一个意图中的每个意图相关的至少一个必要条件;
分词模块420,用于对问题进行分词处理,得到多个词语;
意图获取模块430,用于根据多个词语从知识库获取至少一个意图,得到与至少一个意图中的每个意图相关的至少一个必要条件,其中至少一个意图中的每个意图对应多个词语中的至少一个词语,至少一个必要条件对应多个词语中除至少一个词语之外的词语;
必要条件匹配模块440,用于将至少一个必要条件与知识库中的多个预设的必要条件知识点进行匹配以确定匹配的至少一个必要条件知识点;
答案获取模块450,用于根据匹配的至少一个必要条件知识点执行对应的预设分支流程,得到分支流程对应的答案,其中预先存储有每个意图对应的必要条件分支流程,预设分支流程为每个意图知识点对应的至少一组必要条件知识点连接而成,每组必要条件知识点包括至少一个必要条件知识点,每个必要条件知识点流程指向其他组必要条件知识点或答案;以及
答案发送模块460,用于将答案发送给用户。
根据本发明实施例提供的技术方案,通过接收用户的问题,该问题包含至少一个意图和与至少一个意图中的每个意图相关的至少一个必要条件;对问题进行意图分析,得到至少一个意图和与至少一个意图中的每个意图相关的至少一个必要条件;根据至少一个意图和与至少一个意图中的每个意图相关的至少一个必要条件,获取问题对应的答案;以及将答案发送给用户,能够提高计算效率及答案回复的准确率。
在本发明的另一个实施例中,知识库包括多个预设的意图知识点,意图获取模块430包括:
语义解析单元431,用于分别对多个词语进行语义解析,得到多个词语的语义信息;
意图知识点匹配单元432,用于将语义信息与多个预设的意图知识点进行匹配以确定匹配的至少一个意图知识点;
意图匹配单元433,用于获取与匹配的至少一个意图知识点对应的至少一个意图;
其中,语义信息包括词语的同义词和/或同义词组合、词语的同类词和/或同类词组合、与词语具有相同或相似结构的实体中的至少一个。
如图7所示,在本发明的另一个实施例中,答案获取模块450,中还包括:
触发答案确定单元451,用于根据匹配的至少一个必要条件知识确定至少一个意图中的至少一个意图的必要条件是否足以触发答案;
答案判决单元452,用于如果至少一个意图中的至少一个意图的必要条件足以触发答案,则输出对应的答案;如果至少一个意图中的至少一个意图的必要条件不足以触发答案,则以反问的形式要求用户补全用于触发答案的必要条件。
在本发明的另一个实施例中,分词规则包括正向最大匹配法、逆向最大匹配法、逐词遍历法或词频统计法中的任一种。
在本发明的另一个实施例中,还包括:关键词提取模块470:用于对多个词语进行过滤处理,得到至少一个关键词,过滤处理采用以下任一种或两种方式:去除前后缀和去除停用词。
其中,语义解析单元431,进一步用于分别对至少一个关键词进行语义解析,得到多个词语的语义信息。
图8是根据本发明一示例性实施例示出的用于基于必要条件的问答的装置700的框图。
参照图7,装置700包括处理组件710,其进一步包括一个或多个处理器,以及由存储器720所代表的存储器资源,用于存储可由处理组件710的执行的指令,例如应用程序。存储器720中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件710被配置为执行指令,以执行上述基于必要条件的问答方法。
装置700还可以包括一个电源组件730被配置为执行装置700的电源管理,一个有线或无线网络接口740被配置为将装置700连接到网络,和一个输入输出(I/O)接口750。装置700可以操作基于存储在存储器720的操作***,例如WindowsServerTM,MacOSXTM,UnixTM,LinuxTM,FreeBSDTM或类似。
一种非临时性计算机可读存储介质,当存储介质中的指令由上述装置700的处理器执行时,使得上述装置700能够执行一种基于必要条件的问答方法,包括:接收用户的问题,该问题包含至少一个意图和与至少一个意图中的每个意图相关的至少一个必要条件;对问题进行意图分析,得到至少一个意图和与至少一个意图中的每个意图相关的至少一个必要条件;根据至少一个意图和与至少一个意图中的每个意图相关的至少一个必要条件,获取问题对应的答案;以及将答案发送给用户。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的***、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的***、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序校验码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (10)

1.一种基于必要条件的问答方法,其特征在于,包括:
接收用户的问题,所述问题包含至少一个意图和与所述至少一个意图中的每个意图相关的至少一个必要条件;
对所述问题进行分词处理,得到多个词语;
根据所述多个词语从知识库获取所述至少一个意图,得到与所述至少一个意图中的每个意图相关的至少一个必要条件,其中所述至少一个意图中的每个意图对应所述多个词语中的至少一个词语,所述至少一个必要条件对应所述多个词语中除所述至少一个词语之外的词语;
将所述至少一个必要条件与知识库中的多个预设的必要条件知识点进行匹配以确定匹配的至少一个必要条件知识点;
根据所述匹配的至少一个必要条件知识点执行对应的预设分支流程,得到所述分支流程对应的答案,所述预设分支流程为每个意图知识点对应的至少一组必要条件知识点连接而成,每组必要条件知识点包括至少一个必要条件知识点,每个必要条件知识点的流程指向其他组必要条件知识点或答案;以及
将所述答案发送给所述用户。
2.根据权利要求1所述的基于必要条件的问答方法,其特征在于,所述知识库包括多个预设的意图知识点,所述根据所述多个词语从知识库获取所述至少一个意图,包括:
分别对所述多个词语进行语义解析,得到所述多个词语的语义信息;
将所述语义信息与所述多个预设的意图知识点进行匹配以确定匹配的至少一个意图知识点;以及
获取与所述匹配的至少一个意图知识点对应的所述至少一个意图。
3.根据权利要求2所述的基于必要条件的问答方法,其特征在于,所述语义信息包括所述词语的同义词和/或同义词组合、所述词语的同类词和/或同类词组合、与所述词语具有相同或相似结构的实体中的至少一个。
4.根据权利要求2所述的基于必要条件的问答方法,其特征在于,所述分别对所述多个词语进行语义解析,得到所述多个词语的语义信息之前,所述基于必要条件的问答方法还包括:
对所述多个词语进行过滤处理,得到至少一个关键词,所述过滤处理采用以下任一种或两种方式:去除前后缀和去除停用词;
其中,所述分别对所述多个词语进行语义解析,得到所述多个词语的语义信息,包括:
分别对所述至少一个关键词进行语义解析,得到所述多个词语的语义信息。
5.根据权利要求1所述的基于必要条件的问答方法,其特征在于,所述执行分支流程的过程包括:
确定所述至少一个意图中的至少一个意图的必要条件是否足以触发答案;
如果所述至少一个意图中的至少一个意图的必要条件足以触发答案,则输出对应的答案;或者
如果所述至少一个意图中的至少一个意图的必要条件不足以触发答案,则以反问的形式要求用户补全用于触发答案的必要条件。
6.一种基于必要条件识别的基于必要条件的问答装置,其特征在于,包括:
接收模块,用于接收用户的问题,所述问题包含至少一个意图和与所述至少一个意图中的每个意图相关的至少一个必要条件;
分词模块,用于对所述问题进行分词处理,得到多个词语;
意图获取模块,用于根据所述多个词语从知识库获取所述至少一个意图,得到与所述至少一个意图中的每个意图相关的至少一个必要条件,其中所述至少一个意图中的每个意图对应所述多个词语中的至少一个词语,所述至少一个必要条件对应所述多个词语中除所述至少一个词语之外的词语;
必要条件匹配模块,用于将所述至少一个必要条件与知识库中的多个预设的必要条件知识点进行匹配以确定匹配的至少一个必要条件知识点;
答案获取模块,用于根据所述匹配的至少一个必要条件知识点执行对应的预设分支流程,得到所述分支流程对应的答案,其中预先存储有每个意图对应的必要条件分支流程,所述预设分支流程为每个意图知识点对应的至少一组必要条件知识点连接而成,每组必要条件知识点包括至少一个必要条件知识点,每个必要条件知识点流程指向其他组必要条件知识点或答案;以及
答案发送模块,用于将所述答案发送给所述用户。
7.根据权利要求6所述的基于必要条件的问答装置,其特征在于,所述知识库包括多个预设的意图知识点,所述意图获取模块包括:
语义解析单元,用于分别对所述多个词语进行语义解析,得到所述多个词语的语义信息;
意图知识点匹配单元,用于将所述语义信息与所述多个预设的意图知识点进行匹配以确定匹配的至少一个意图知识点;
意图匹配单元,用于获取与所述匹配的至少一个意图知识点对应的所述至少一个意图;
其中,所述语义信息包括所述词语的同义词和/或同义词组合、所述词语的同类词和/或同类词组合、与所述词语具有相同或相似结构的实体中的至少一个。
8.根据权利要求6所述的基于必要条件的问答装置,其特征在于,所述答案获取模块,中还包括:
触发答案确定单元,用于根据所述匹配的至少一个必要条件知识确定所述至少一个意图中的至少一个意图的必要条件是否足以触发答案;
答案判决单元,用于如果所述至少一个意图中的至少一个意图的必要条件足以触发答案,则输出对应的答案;如果所述至少一个意图中的至少一个意图的必要条件不足以触发答案,则以反问的形式要求用户补全用于触发答案的必要条件。
9.一种计算机设备,包括:存储器、处理器及存储在所述存储器中并可在所述处理器中运行的可执行指令,其特征在于,所述处理器执行所述可执行指令时实现如权利要求1至5中任一项所述的基于必要条件的问答方法。
10.一种计算机可读存储介质,其上存储有计算机可执行指令,其特征在于,所述可执行指令被处理器执行时实现如权利要求1至5中任一项所述的基于必要条件的问答方法。
CN201810046648.0A 2017-11-27 2018-01-17 基于必要条件的问答方法和装置、计算机设备和存储介质 Pending CN110019739A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US16/052,143 US20190164064A1 (en) 2017-11-27 2018-08-01 Question and answer interaction method and device, and computer readable storage medium

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2017112458669 2017-11-30
CN201711245866 2017-11-30

Publications (1)

Publication Number Publication Date
CN110019739A true CN110019739A (zh) 2019-07-16

Family

ID=67188255

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810046648.0A Pending CN110019739A (zh) 2017-11-27 2018-01-17 基于必要条件的问答方法和装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN110019739A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111737436A (zh) * 2020-06-24 2020-10-02 网易(杭州)网络有限公司 语料的意图识别方法及装置、电子设备、存储介质
CN113792126A (zh) * 2021-09-13 2021-12-14 安徽九广全景智慧科技有限公司 一种用于学校招生的智能客服的对话方法及***

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160133146A1 (en) * 2014-11-12 2016-05-12 Samsung Electronics Co., Ltd. Display apparatus and method for question and answer
CN105912629A (zh) * 2016-04-07 2016-08-31 上海智臻智能网络科技股份有限公司 一种智能问答方法及装置
CN105912600A (zh) * 2016-04-05 2016-08-31 上海智臻智能网络科技股份有限公司 问答知识库及其建立方法、智能问答方法和***
CN106649825A (zh) * 2016-12-29 2017-05-10 上海智臻智能网络科技股份有限公司 语音交互***及其创建方法和装置
CN106909572A (zh) * 2015-12-23 2017-06-30 北京奇虎科技有限公司 一种问答知识库的构建方法和装置
US20170228372A1 (en) * 2016-02-08 2017-08-10 Taiger Spain Sl System and method for querying questions and answers
CN107220380A (zh) * 2017-06-27 2017-09-29 北京百度网讯科技有限公司 基于人工智能的问答推荐方法、装置和计算机设备
CN107992543B (zh) * 2017-11-27 2020-11-17 上海智臻智能网络科技股份有限公司 问答交互方法和装置、计算机设备及计算机可读存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160133146A1 (en) * 2014-11-12 2016-05-12 Samsung Electronics Co., Ltd. Display apparatus and method for question and answer
CN106909572A (zh) * 2015-12-23 2017-06-30 北京奇虎科技有限公司 一种问答知识库的构建方法和装置
US20170228372A1 (en) * 2016-02-08 2017-08-10 Taiger Spain Sl System and method for querying questions and answers
CN105912600A (zh) * 2016-04-05 2016-08-31 上海智臻智能网络科技股份有限公司 问答知识库及其建立方法、智能问答方法和***
CN105912629A (zh) * 2016-04-07 2016-08-31 上海智臻智能网络科技股份有限公司 一种智能问答方法及装置
CN106649825A (zh) * 2016-12-29 2017-05-10 上海智臻智能网络科技股份有限公司 语音交互***及其创建方法和装置
CN107220380A (zh) * 2017-06-27 2017-09-29 北京百度网讯科技有限公司 基于人工智能的问答推荐方法、装置和计算机设备
CN107992543B (zh) * 2017-11-27 2020-11-17 上海智臻智能网络科技股份有限公司 问答交互方法和装置、计算机设备及计算机可读存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
康海燕等: "基于问句表征的web智能问答***", 《北京信息科技大学学报(自然科学版)》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111737436A (zh) * 2020-06-24 2020-10-02 网易(杭州)网络有限公司 语料的意图识别方法及装置、电子设备、存储介质
CN113792126A (zh) * 2021-09-13 2021-12-14 安徽九广全景智慧科技有限公司 一种用于学校招生的智能客服的对话方法及***

Similar Documents

Publication Publication Date Title
CN109858007A (zh) 语义分析问答方法和装置、计算机设备和存储介质
CN107992543A (zh) 问答交互方法和装置、计算机设备及计算机可读存储介质
CN109657238B (zh) 基于知识图谱的上下文识别补全方法、***、终端及介质
CN108536852A (zh) 问答交互方法和装置、计算机设备及计算机可读存储介质
US20190164064A1 (en) Question and answer interaction method and device, and computer readable storage medium
CN107992477B (zh) 文本主题确定方法及装置
WO2018086401A1 (zh) 自动问答***中的问题聚类处理方法及装置
CN110059305A (zh) 数据导出的方法和装置
CN110046806B (zh) 用于客服派单的方法、装置和计算设备
CN114387061A (zh) 产品推送方法、装置、电子设备及可读存储介质
WO2020149959A1 (en) Conversion of natural language query
CN113111162A (zh) 科室推荐方法、装置、电子设备及存储介质
CN110378203A (zh) 图像处理方法、装置、终端及存储介质
CN114579104A (zh) 数据分析场景的生成方法、装置、设备及存储介质
CN113919336A (zh) 基于深度学习的文章生成方法、装置及相关设备
CN107169092A (zh) 交互过程中智能识别并处理敏感内容的方法及***
CN110019739A (zh) 基于必要条件的问答方法和装置、计算机设备和存储介质
CN110223095A (zh) 确定商品属性的方法、装置、设备和存储介质
CN108829668A (zh) 文本信息的生成方法、装置、计算机设备及存储介质
CN108876527A (zh) 服务方法和服务装置、应用开放平台和存储介质
CN110232107A (zh) 一种产品数据获取方法
CN109146606A (zh) 一种品牌推荐方法、电子设备、存储介质及***
CN110491372A (zh) 一种反馈信息生成方法、装置、存储介质和智能设备
CN116703515A (zh) 基于人工智能的推荐方法、装置、计算机设备及存储介质
CN106022921A (zh) 一种交易数据处理方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190716