CN111368044A - 智能问答方法、装置、计算机设备和存储介质 - Google Patents

智能问答方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN111368044A
CN111368044A CN202010107521.2A CN202010107521A CN111368044A CN 111368044 A CN111368044 A CN 111368044A CN 202010107521 A CN202010107521 A CN 202010107521A CN 111368044 A CN111368044 A CN 111368044A
Authority
CN
China
Prior art keywords
target
user
entity
question
intention
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010107521.2A
Other languages
English (en)
Inventor
蔡国庆
孙俊
王永欣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Zhuiyi Technology Co Ltd
Original Assignee
Shenzhen Zhuiyi Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Zhuiyi Technology Co Ltd filed Critical Shenzhen Zhuiyi Technology Co Ltd
Priority to CN202010107521.2A priority Critical patent/CN111368044A/zh
Publication of CN111368044A publication Critical patent/CN111368044A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及一种智能问答方法、装置、计算机设备和存储介质。所述方法包括:接收用户提问,并获取所述用户提问对应的多个目标实体和多个目标用户意图;对所述多个目标实体和所述多个目标用户意图进行组合,得到多个组合结果;每个所述组合结果包括一个目标实体和一个目标用户意图;从多个所述组合结果中筛选出目标组合结果,并根据所述目标组合结果确定所述用户提问对应的目标查询内容;根据所述目标查询内容进行查找,得到所述用户提问对应的目标答案。采用本方法能够简化查询过程、提高查询效率。

Description

智能问答方法、装置、计算机设备和存储介质
技术领域
本申请涉及问答技术领域,特别是涉及一种智能问答方法、装置、计算机设备和存储介质。
背景技术
随着科技的发展,AI(Artificial Intelligence,人工智能)在多个行业中大放异彩,其中问答***在人工智能的加持下,变得越来越智能。
目前,发展出了基于知识图谱的问答***,首先根据用户提问构建DAG(有向无环图),然后根据DAG进行知识图谱的子图匹配,从而查找到用户提问对应的答案。
基于知识图谱的问答***可以给用户提供比较精准的回答。但是,在用户提问中实体之间无关系的场景下,构建DAG的过程比较复杂,会导致查询效率较低。
发明内容
基于此,有必要针对上述技术问题,提供一种能够简化查询过程、提高查询效率的智能问答方法、装置、计算机设备和存储介质。
一种智能问答方法,该方法包括:
接收用户提问,并获取用户提问对应的多个目标实体和多个目标用户意图;
对多个目标实体和多个目标用户意图进行组合,得到多个组合结果;每个组合结果包括一个目标实体和一个目标用户意图;
从多个组合结果中筛选出目标组合结果,并根据目标组合结果确定用户提问对应的目标查询内容;
根据目标查询内容进行查找,得到用户提问对应的目标答案。
在其中一个实施例中,上述从多个组合结果中筛选出目标组合结果,并根据目标组合结果确定用户提问对应的目标查询内容,包括:
确定各组合结果的目标量化值;目标量化值用于表征查询内容的准确率;
根据多个目标量化值从多个组合结果中选取出目标组合结果;
根据目标组合结果对应的目标用户意图确定目标查询内容。
在其中一个实施例中,上述确定各组合结果的目标量化值,包括:
确定各组合结果中目标实体与目标用户意图的匹配状态;
根据预先设置的匹配状态和状态值的对应关系,确定各组合结果的目标状态值;
将各组合结果中目标实体对应的置信度、目标用户意图对应的置信度和目标状态值输入到预先训练的回归模型中,得到各组合结果的目标量化值;目标实体对应的置信度用于表征目标实体的正确概率;目标用户意图对应的置信度用于表征目标用户意图的正确概率。
在其中一个实施例中,上述根据多个目标量化值从多个组合结果中选取出目标组合结果,包括:
根据多个目标量化值对多个组合结果进行排序;
根据排序结果,选取出目标量化值符合第一预设条件的目标组合结果;第一预设条件包括组合结果的目标量化值大于预设量化值。
在其中一个实施例中,上述获取用户提问对应的多个目标实体和多个目标用户意图,包括:
对用户提问进行实体识别处理,得到多个目标实体;
对用户提问进行意图识别处理,得到多个目标用户意图。
在其中一个实施例中,上述对用户提问进行实体识别处理,得到多个目标实体,包括:
采用预先设置的命名实体识别模型从用户提问中识别出至少一个实体文本;
根据实体文本从预先设置的实体数据库中查找到多个候选实体;
采用预先设置的实体链接模型对多个候选实体进行消歧处理,得到多个目标实体。
在其中一个实施例中,上述对用户提问进行意图识别处理,得到多个目标用户意图,包括:
对用户提问进行分词处理,得到多个提问词汇;
确定各提问词汇对应的词向量;
将各提问词汇对应的词向量输入到预先训练的意图识别模型中,得到意图识别模型输出的多个用户意图和各用户意图对应的置信度;
从多个用户意图中,选取出符合第二预设条件的目标用户意图;第二预设条件包括用户意图对应的置信度大于预设置信度。
一种智能问答装置,该装置包括:
实体意图获取模块,用于接收用户提问,并获取用户提问对应的多个目标实体和多个目标用户意图;
实体意图组合模块,用于对多个目标实体和多个目标用户意图进行组合,得到多个组合结果;每个组合结果包括一个目标实体和一个目标用户意图;
目标查询内容确定模块,用于从多个组合结果中筛选出目标组合结果,并根据目标组合结果确定用户提问对应的目标查询内容;
目标答案查找模块,用于根据目标查询内容进行查找,得到用户提问对应的目标答案。
在其中一个实施例中,上述目标查询内容确定模块,用于,包括:
目标量化值确定子模块,用于确定各组合结果的目标量化值;目标量化值用于表征查询内容的准确率;
目标组合结果选取子模块,用于根据多个目标量化值从多个组合结果中选取出目标组合结果;
目标查询内容确定子模块,用于根据目标组合结果对应的目标用户意图确定目标查询内容。
在其中一个实施例中,上述目标量化值确定子模块,具体用于确定各组合结果中目标实体与目标用户意图的匹配状态;根据预先设置的匹配状态和状态值的对应关系,确定各组合结果的目标状态值;将各组合结果中目标实体对应的置信度、目标用户意图对应的置信度和目标状态值输入到预先训练的回归模型中,得到各组合结果的目标量化值;目标实体对应的置信度用于表征目标实体的正确概率;目标用户意图对应的置信度用于表征目标用户意图的正确概率。
在其中一个实施例中,上述目标组合结果选取子模块,具体用于根据多个目标量化值对多个组合结果进行排序;根据排序结果,选取出目标量化值符合第一预设条件的目标组合结果;第一预设条件包括组合结果的目标量化值大于预设量化值。
在其中一个实施例中,上述实体意图获取模块,包括:
目标实体获取子模块,用于对用户提问进行实体识别处理,得到多个目标实体;
目标用户意图获取子模块,用于对用户提问进行意图识别处理,得到多个目标用户意图。
在其中一个实施例中,上述目标实体获取子模块,具体用于采用预先设置的命名实体识别模型从用户提问中识别出至少一个实体文本;根据实体文本从预先设置的实体数据库中查找到多个候选实体;采用预先设置的实体链接模型对多个候选实体进行消歧处理,得到多个目标实体。
在其中一个实施例中,上述目标用户意图获取子模块,具体用于对用户提问进行分词处理,得到多个提问词汇;确定各提问词汇对应的词向量;将各提问词汇对应的词向量输入到预先训练的意图识别模型中,得到意图识别模型输出的多个用户意图和各用户意图对应的置信度;从多个用户意图中,选取出符合第二预设条件的目标用户意图;第二预设条件包括用户意图对应的置信度大于预设置信度。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
接收用户提问,并获取用户提问对应的多个目标实体和多个目标用户意图;
对多个目标实体和多个目标用户意图进行组合,得到多个组合结果;每个组合结果包括一个目标实体和一个目标用户意图;
从多个组合结果中筛选出目标组合结果,并根据目标组合结果确定用户提问对应的目标查询内容;
根据目标查询内容进行查找,得到用户提问对应的目标答案。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
接收用户提问,并获取用户提问对应的多个目标实体和多个目标用户意图;
对多个目标实体和多个目标用户意图进行组合,得到多个组合结果;每个组合结果包括一个目标实体和一个目标用户意图;
从多个组合结果中筛选出目标组合结果,并根据目标组合结果确定用户提问对应的目标查询内容;
根据目标查询内容进行查找,得到用户提问对应的目标答案。
上述智能问答方法、装置、计算机设备和存储介质,接收用户提问,并获取用户提问对应的多个目标实体和多个目标用户意图;对多个目标实体和多个目标用户意图进行组合,得到多个组合结果;从多个组合结果中筛选出目标组合结果,并根据目标组合结果确定用户提问对应的目标查询内容;根据目标查询内容进行查找,得到用户提问对应的目标答案。通过本申请实施例,只需要将从用户提问中获取到的目标实体和目标用户意图进行组合,即可确定用户提问对应的目标查询内容,与现有技术中构建DAG的过程相比,本申请实施例确定目标查询内容的过程比较简单容易实现,因此可以提高查询效率。
附图说明
图1为一个实施例中智能问答方法的应用环境图;
图2为一个实施例中智能问答方法的流程示意图;
图3为一个实施例中筛选出目标组合结果,根据目标组合结果确定目标查询内容步骤的流程示意图;
图4为一个实施例中确定各组合结果的目标量化值步骤的流程示意图;
图5为一个实施例中获取用户提问对应的多个目标实体和多个目标用户意图步骤的流程示意图;
图6为另一个实施例中智能问答方法的流程示意图;
图7为一个实施例中智能问答装置的结构框图;
图8为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的智能问答方法,可以应用于如图1所示的应用环境中。该应用环境中包括终端102和服务器104,终端102与服务器104通过网络进行通信。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种智能问答方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
步骤201,接收用户提问,并获取用户提问对应的多个目标实体和多个目标用户意图。
本申请实施例中,可以先通过终端接收用户提问,服务器再接收终端发送的用户提问;也可以服务器直接接收用户提问。本申请实施例对此不作详细限定,可以根据实际情况进行设置。
在接收到用户提问后,可以对用户提问进行实体识别以及意图识别,得到用户提问对应的多个目标实体和多个目标用户意图。例如,接收到的用户提问为“平安银行的股价是多少”,对该用户提问进行实体识别和意图识别,得到2个候选实体为“000001(股票代码)”、“平安银行(公司名称)”,得到2个目标用户意图为“价格查询”、“股价诊断”。本申请实施例对实体识别和意图识别的具体方式不作详细限定,可以根据实际情况进行设置。
步骤202,对多个目标实体和多个目标用户意图进行组合,得到多个组合结果。
本申请实施例中,在得到多个目标实体和多个目标用户意图之后,进行目标实体和目标用户意图的组合,得到多个组合结果,其中,每个组合结果包括一个目标实体和一个目标用户意图。
例如,将2个目标实体“000001(股票代码)”、“平安银行(公司名称)”分别与2个目标用户意图“价格查询”、“股价诊断”进行组合,得到组合结果1为“000001(股票代码)”和“价格查询”,组合结果2为“000001(股票代码)”和“股价诊断”,组合结果3为“平安银行(公司名称)”和“价格查询”,组合结果4为“平安银行(公司名称)”和“股价诊断”。
步骤203,从多个组合结果中筛选出目标组合结果,并根据目标组合结果确定用户提问对应的目标查询内容。
本申请实施例中,在得到多个组合结果之后,根据预先设置的筛选条件筛选出目标组合结果。具体地,在进行目标实体和目标用户意图的组合之后,根据在实体识别时得到的目标实体的置信度,以及意图识别时得到的目标用户意图对应的置信度,计算组合结果对应的置信度;之后,根据组合结果的置信度筛选出目标组合结果。
例如,组合结果1的置信度为0.92,组合结果2的置信度为0.52,组合结果3的置信度为0.39,组合结果4的置信度为0.35,则可以将组合结果1确定为目标组合结果。
在实际应用中,还可以根据组合结果先进行消歧处理,由于目标用户意图是进行价格查询或股价诊断,因此不考虑目标实体“平安银行(公司名称)”对应的组合结果3和组合结果4,只根据组合结果1和组合结果2对应的置信度筛选目标组合结果。
在筛选出目标组合结果之后,根据目标组合结果中的目标实体和目标用户意图确定用户的真实查询意图,即目标根据组合结果确定目标查询内容。例如,组合结果1为目标组合结果,组合结果1中目标实体为“000001(股票代码)”,目标用户意图为“价格查询”,可以得到目标查询内容是:对000001(股票代码)进行价格查询。
步骤204,根据目标查询内容进行查找,得到用户提问对应的目标答案。
本申请实施例中,在确定目标查询内容之后,根据目标查询内容进行答案查找,从而得到用户提问对应的目标答案。例如,根据目标查询内容是:对000001(股票代码)进行价格查询,得到目标答案为“股票000001的价格是14.77元”。本申请实施例对答案查找方式不作详细限定,可以根据实际情况进行设置。
上述智能问答方法中,接收用户提问,并获取用户提问对应的多个目标实体和多个目标用户意图;对多个目标实体和多个目标用户意图进行组合,得到多个组合结果;从多个组合结果中筛选出目标组合结果,并根据目标组合结果确定用户提问对应的目标查询内容;根据目标查询内容进行查找,得到用户提问对应的目标答案。通过本申请实施例,只需要将从用户提问中获取到的目标实体和目标用户意图进行组合,即可确定用户提问对应的目标查询内容,与现有技术中构建DAG的过程相比,本申请实施例确定目标查询内容的过程比较简单容易实现,因此可以提高查询效率。并且,由于不需要构建DAG,因此无需对本体进行维护,降低了维护成本和使用门槛。
在另一个实施例中,如图3所示,本实施例涉及的是从多个组合结果中筛选出目标组合结果,并根据目标组合结果确定用户提问对应的目标查询内容的一种可选的过程。在上述实施例的基础上,上述步骤203具体可以包括以下步骤:
步骤301,确定各组合结果的目标量化值。
本申请实施例中,首先确定各组合结果的目标量化值,其中,目标量化值用于表征查询内容的准确率,即目标量化值指示该组合结果为用户真实想要查询内容的概率。确定目标量化值具体包括如下,见图4:
步骤3011,确定各组合结果中目标实体与目标用户意图的匹配状态。
其中,匹配状态可以包括匹配、部分缺省、实体拒识和纯意图中的至少一种。例如,目标实体为“陕西省”和“西安市”,目标用户意图为“有什么好吃的”,如果组合结果是“陕西省西安市有什么好吃的”,则匹配状态为匹配;如果组合结果是“陕西省有什么好吃的/西安市有什么好吃的”,则匹配状态为部分缺省;如果组合结果是“陕西省广州市有什么好吃的”,则匹配状态为实体拒识;如果组合结果为“有什么好吃的”,则匹配状态为纯意图。本申请实施例对匹配状态不作详细限定,可以根据实际情况进行设置。
步骤3012,根据预先设置的匹配状态和状态值的对应关系,确定各组合结果的目标状态值。
具体地,预先设置匹配状态和状态值之间的对应关系。例如,匹配对应90分,部分缺省对应80分,实体拒识对应30分,纯意图对应50分。在确定各组合结果对应的匹配状态之后,可以根据上述对应关系得到各组合结果的目标状态值。例如,组合结果1中目标实体为“000001(股票代码)”,目标用户意图为“价格查询”,确定组合结果1的匹配状态为匹配,则组合结果1的目标状态值为90分。
步骤3013,将各组合结果中目标实体对应的置信度、目标用户意图对应的置信度和目标状态值输入到预先训练的回归模型中,得到各组合结果的目标量化值。
其中,目标实体对应的置信度用于表征目标实体的正确概率;目标用户意图对应的置信度用于表征目标用户意图的正确概率。
具体地,预先训练回归模型,得到目标实体对应的置信度在回归模型中的实体权重,以及目标用户意图对应的置信度在回归模型中的意图权重。由于在进行实体识别和意图识别时,已经得到各目标实体对应的置信度和各目标用户意图对应的置信度,因此在得到各组合结果的目标状态值之后,对于每个组合结果,将组合结果中目标实体对应的置信度和目标用户意图对应的置信度,以及该组合结果的目标状态值输入到回归模型中,则回归模型输出该组合结果的目标量化值。
例如,组合结果1中目标实体“000001(股票代码)”对应的置信度为0.9385,目标用户意图“价格查询”对应的置信度为0.7138,组合结果1对应的目标状态值为90分,则将上述置信度和目标状态值输入到回归模型中,回归模型可以根据公式:目标量化值=(目标实体对应的置信度×实体权重+目标用户意图对应的置信度×意图权重)×目标状态值,得到组合结果1的目标量化值为0.9237。以此类推,得到组合结果2的目标量化值为0.5230。
步骤302,根据多个目标量化值从多个组合结果中选取出目标组合结果。
本申请实施例中,在得到各组合结果的目标量化值之后,根据多个目标量化值对多个组合结果进行排序;根据排序结果,选取出目标量化值符合第一预设条件的目标组合结果;第一预设条件包括组合结果的目标量化值大于预设量化值。
例如,组合结果1的目标量化值为0.9237,组合结果2的目标量化值为0.5230,按照目标量化值从高到低进行排序,组合结果1排第一位,组合结果2排第二位,可以直接将第一位的组合结果1确定为目标组合结果;也可以是将大于预设量化值0.8的组合结果1确定为目标组合结果。本申请实施例对预设量化值不作详细限定,可以根据实际情况进行设置。
步骤303,根据目标组合结果对应的目标用户意图确定目标查询内容。
本申请实施例中,在确定目标组合结果后,目标组合结果中目标用户意图指示用户真实想要查找的内容,可以根据目标用户意图确定目标查询内容。
上述从多个组合结果中筛选出目标组合结果,并根据目标组合结果确定用户提问对应的目标查询内容的步骤中,确定各组合结果的目标量化值;根据多个目标量化值从多个组合结果中选取出目标组合结果,由于目标组合结果中目标用户意图指示用户真实想要查找的内容,因此可以根据目标用户意图确定目标查询内容。通过本申请实施例,在确定用户真实想要查找的内容时,综合考虑目标实体和目标用户意图,因此可以提高目标查询内容的准确性,从而提高目标答***性,进而提升用户使用体验。
在另一个实施例中,如图5所示,本实施例涉及的是获取用户提问对应的多个目标实体和多个目标用户意图的一种可选的过程。在上述实施例的基础上,上述步骤201具体可以包括以下步骤:
步骤401,对用户提问进行实体识别处理,得到多个目标实体。
本申请实施例中,从用户提问中获取目标实体,可以包括如下步骤:采用预先设置的命名实体识别模型从用户提问中识别出至少一个实体文本;根据实体文本从预先设置的实体数据库中查找到多个候选实体;采用预先设置的实体链接模型对多个候选实体进行消歧处理,得到多个目标实体。
具体地,预先训练命名实体识别模型,采用命名实体识别模型识别出用户提问中的实体表述,即从用户提问中识别出至少一个实体文本。例如,用户提问是“平安银行的股价是多少”,从用户提问中识别出的实体文本是“平安银行”。
预先设置实体数据库,在识别出至少一个实体文本之后,从实体数据库中查找与实体文本匹配的多个候选实体。例如,实体文本是“平安银行”,从实体数据库中查找出与“平安银行”匹配的候选实体为“000001(股票代码)”和“平安银行(公司名称)”。
预先训练实体链接模型,将各候选实体输入到实体链接模型中,得到各候选实体对应的置信度。其中,候选实体对应的置信度越高,说明候选实体引入的歧义越小;候选实体对应的置信度越低,说明候选实体引入的歧义越大。去除置信度较低的候选实体,则得到用户提问对应的目标实体。
步骤402,对用户提问进行意图识别处理,得到多个目标用户意图。
本申请实施例中,从用户提问中获取目标实体,可以包括如下步骤:对用户提问进行分词处理,得到多个提问词汇;确定各提问词汇对应的词向量;将各提问词汇对应的词向量输入到预先训练的意图识别模型中,得到意图识别模型输出的多个用户意图和各用户意图对应的置信度;从多个用户意图中,选取出符合第二预设条件的目标用户意图;第二预设条件包括用户意图对应的置信度大于预设置信度。
例如,对用户提问“平安银行的股价是多少”进行分词处理,得到提问词汇“平安银行”、“股价”,然后确定“平安银行”对应词向量1,“股价”对应词向量2,分别将词向量1和词向量2输入到预先训练的意图识别模型中,则意图实体模型输出词向量1对应的用户意图和置信度,以及词向量2对应的用户意图和置信度。预设置信度为0.8,将置信度大于预设置信度的用户意图作为目标用户意图。本申请实施例对预设置信度不作详细限定,可以根据实际情况进行设置。
在其中一个实施例中,在得到多个目标用户意图后,可以结合目标用户意图对上述步骤中得到的目标实体进行消歧处理;或者在多轮会话中,根据历史轮会话对当前轮会话中的目标实体进行消歧处理。本申请实施例对消歧方式不作详细限定,可以根据实际情况进行设置。
上述获取用户提问对应的多个目标实体和多个目标用户意图的步骤中,通过命名实体模型、实体链接模型获取到目标实体和目标实体对应的置信度,通过意图识别模型获取到目标用户意图,便于后续根据目标实体和目标用户意图得到组合结果,进而得到目标查询内容。
在另一个实施例中,如图6所示,本实施例涉及的是智能问答方法的一种可选的过程。在上述实施例的基础上,具体可以包括以下步骤:
步骤501,接收用户提问。
步骤502,对用户提问进行实体识别处理,得到多个目标实体。
在其中一个实施例中,采用预先设置的命名实体识别模型从用户提问中识别出至少一个实体文本;根据实体文本从预先设置的实体数据库中查找到多个候选实体;采用预先设置的实体链接模型对多个候选实体进行消歧处理,得到多个目标实体。
步骤503,对用户提问进行意图识别处理,得到多个目标用户意图。
在其中一个实施例中,对用户提问进行分词处理,得到多个提问词汇;确定各提问词汇对应的词向量;将各提问词汇对应的词向量输入到预先训练的意图识别模型中,得到意图识别模型输出的多个用户意图和各用户意图对应的置信度;从多个用户意图中,选取出符合第二预设条件的目标用户意图;第二预设条件包括用户意图对应的置信度大于预设置信度。
本申请实施例对步骤502和步骤503的顺序不作详细限定,可以根据实际情况进行设置。
步骤504,对多个目标实体和多个目标用户意图进行组合,得到多个组合结果;每个组合结果包括一个目标实体和一个目标用户意图。
步骤505,确定各组合结果的目标量化值;目标量化值用于表征查询内容的准确率。
在其中一个实施例中,各组合结果中目标实体与目标用户意图的匹配状态;根据预先设置的匹配状态和状态值的对应关系,确定各组合结果的目标状态值;将各组合结果中目标实体对应的置信度、目标用户意图对应的置信度和目标状态值输入到预先训练的回归模型中,得到各组合结果的目标量化值;目标实体对应的置信度用于表征目标实体的正确概率;目标用户意图对应的置信度用于表征目标用户意图的正确概率。
步骤506,根据多个目标量化值从多个组合结果中选取出目标组合结果。
在其中一个实施例中,根据多个目标量化值对多个组合结果进行排序;根据排序结果,选取出目标量化值符合第一预设条件的目标组合结果;第一预设条件包括组合结果的目标量化值大于预设量化值。
步骤507,根据目标组合结果对应的目标用户意图确定目标查询内容。
步骤508,根据目标查询内容进行查找,得到用户提问对应的目标答案。
上述智能问答方法中,先接收用户提问,然后对用户提问进行实体识别处理和意图识别处理,得到目标实体和目标用户意图;接着,对目标实体和目标用户意图进行组合,根据各组合结果的目标量化值确定目标组合结果;最后,根据目标组合结果确定用户真实想要查找的目标查询内容,根据目标查询内容查找到目标答案。通过本申请实施例,无需构建DAG,确定目标查询内容的过程简单容易实现,可以提高查询效率,降低本体的维护成本。
应该理解的是,虽然图2-图6的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-图6中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图7所示,提供了一种智能问答装置,包括:
实体意图获取模块601,用于接收用户提问,并获取用户提问对应的多个目标实体和多个目标用户意图;
实体意图组合模块602,用于对多个目标实体和多个目标用户意图进行组合,得到多个组合结果;每个组合结果包括一个目标实体和一个目标用户意图;
目标查询内容确定模块603,用于从多个组合结果中筛选出目标组合结果,并根据目标组合结果确定用户提问对应的目标查询内容;
目标答案查找模块604,用于根据目标查询内容进行查找,得到用户提问对应的目标答案。
在其中一个实施例中,上述目标查询内容确定模块603,用于,包括:
目标量化值确定子模块,用于确定各组合结果的目标量化值;目标量化值用于表征查询内容的准确率;
目标组合结果选取子模块,用于根据多个目标量化值从多个组合结果中选取出目标组合结果;
目标查询内容确定子模块,用于根据目标组合结果对应的目标用户意图确定目标查询内容。
在其中一个实施例中,上述目标量化值确定子模块,具体用于确定各组合结果中目标实体与目标用户意图的匹配状态;根据预先设置的匹配状态和状态值的对应关系,确定各组合结果的目标状态值;将各组合结果中目标实体对应的置信度、目标用户意图对应的置信度和目标状态值输入到预先训练的回归模型中,得到各组合结果的目标量化值;目标实体对应的置信度用于表征目标实体的正确概率;目标用户意图对应的置信度用于表征目标用户意图的正确概率。
在其中一个实施例中,上述目标组合结果选取子模块,具体用于根据多个目标量化值对多个组合结果进行排序;根据排序结果,选取出目标量化值符合第一预设条件的目标组合结果;第一预设条件包括组合结果的目标量化值大于预设量化值。
在其中一个实施例中,上述实体意图获取模块601,包括:
目标实体获取子模块,用于对用户提问进行实体识别处理,得到多个目标实体;
目标用户意图获取子模块,用于对用户提问进行意图识别处理,得到多个目标用户意图。
在其中一个实施例中,上述目标实体获取子模块,具体用于采用预先设置的命名实体识别模型从用户提问中识别出至少一个实体文本;根据实体文本从预先设置的实体数据库中查找到多个候选实体;采用预先设置的实体链接模型对多个候选实体进行消歧处理,得到多个目标实体。
在其中一个实施例中,上述目标用户意图获取子模块,具体用于对用户提问进行分词处理,得到多个提问词汇;确定各提问词汇对应的词向量;将各提问词汇对应的词向量输入到预先训练的意图识别模型中,得到意图识别模型输出的多个用户意图和各用户意图对应的置信度;从多个用户意图中,选取出符合第二预设条件的目标用户意图;第二预设条件包括用户意图对应的置信度大于预设置信度。
关于智能问答装置的具体限定可以参见上文中对于智能问答方法的限定,在此不再赘述。上述智能问答装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图8所示。该计算机设备包括通过***总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***、计算机程序和数据库。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的数据库用于存储智能问答数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种智能问答方法。
本领域技术人员可以理解,图8中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
接收用户提问,并获取用户提问对应的多个目标实体和多个目标用户意图;
对多个目标实体和多个目标用户意图进行组合,得到多个组合结果;每个组合结果包括一个目标实体和一个目标用户意图;
从多个组合结果中筛选出目标组合结果,并根据目标组合结果确定用户提问对应的目标查询内容;
根据目标查询内容进行查找,得到用户提问对应的目标答案。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
确定各组合结果的目标量化值;目标量化值用于表征查询内容的准确率;
根据多个目标量化值从多个组合结果中选取出目标组合结果;
根据目标组合结果对应的目标用户意图确定目标查询内容。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
确定各组合结果中目标实体与目标用户意图的匹配状态;
根据预先设置的匹配状态和状态值的对应关系,确定各组合结果的目标状态值;
将各组合结果中目标实体对应的置信度、目标用户意图对应的置信度和目标状态值输入到预先训练的回归模型中,得到各组合结果的目标量化值;目标实体对应的置信度用于表征目标实体的正确概率;目标用户意图对应的置信度用于表征目标用户意图的正确概率。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
根据多个目标量化值对多个组合结果进行排序;
根据排序结果,选取出目标量化值符合第一预设条件的目标组合结果;第一预设条件包括组合结果的目标量化值大于预设量化值。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
对用户提问进行实体识别处理,得到多个目标实体;
对用户提问进行意图识别处理,得到多个目标用户意图。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
采用预先设置的命名实体识别模型从用户提问中识别出至少一个实体文本;
根据实体文本从预先设置的实体数据库中查找到多个候选实体;
采用预先设置的实体链接模型对多个候选实体进行消歧处理,得到多个目标实体。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
对用户提问进行分词处理,得到多个提问词汇;
确定各提问词汇对应的词向量;
将各提问词汇对应的词向量输入到预先训练的意图识别模型中,得到意图识别模型输出的多个用户意图和各用户意图对应的置信度;
从多个用户意图中,选取出符合第二预设条件的目标用户意图;第二预设条件包括用户意图对应的置信度大于预设置信度。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
接收用户提问,并获取用户提问对应的多个目标实体和多个目标用户意图;
对多个目标实体和多个目标用户意图进行组合,得到多个组合结果;每个组合结果包括一个目标实体和一个目标用户意图;
从多个组合结果中筛选出目标组合结果,并根据目标组合结果确定用户提问对应的目标查询内容;
根据目标查询内容进行查找,得到用户提问对应的目标答案。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
确定各组合结果的目标量化值;目标量化值用于表征查询内容的准确率;
根据多个目标量化值从多个组合结果中选取出目标组合结果;
根据目标组合结果对应的目标用户意图确定目标查询内容。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
确定各组合结果中目标实体与目标用户意图的匹配状态;
根据预先设置的匹配状态和状态值的对应关系,确定各组合结果的目标状态值;
将各组合结果中目标实体对应的置信度、目标用户意图对应的置信度和目标状态值输入到预先训练的回归模型中,得到各组合结果的目标量化值;目标实体对应的置信度用于表征目标实体的正确概率;目标用户意图对应的置信度用于表征目标用户意图的正确概率。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
根据多个目标量化值对多个组合结果进行排序;
根据排序结果,选取出目标量化值符合第一预设条件的目标组合结果;第一预设条件包括组合结果的目标量化值大于预设量化值。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
对用户提问进行实体识别处理,得到多个目标实体;
对用户提问进行意图识别处理,得到多个目标用户意图。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
采用预先设置的命名实体识别模型从用户提问中识别出至少一个实体文本;
根据实体文本从预先设置的实体数据库中查找到多个候选实体;
采用预先设置的实体链接模型对多个候选实体进行消歧处理,得到多个目标实体。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
对用户提问进行分词处理,得到多个提问词汇;
确定各提问词汇对应的词向量;
将各提问词汇对应的词向量输入到预先训练的意图识别模型中,得到意图识别模型输出的多个用户意图和各用户意图对应的置信度;
从多个用户意图中,选取出符合第二预设条件的目标用户意图;第二预设条件包括用户意图对应的置信度大于预设置信度。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种智能问答方法,其特征在于,所述方法包括:
接收用户提问,并获取所述用户提问对应的多个目标实体和多个目标用户意图;
对所述多个目标实体和所述多个目标用户意图进行组合,得到多个组合结果;每个所述组合结果包括一个目标实体和一个目标用户意图;
从多个所述组合结果中筛选出目标组合结果,并根据所述目标组合结果确定所述用户提问对应的目标查询内容;
根据所述目标查询内容进行查找,得到所述用户提问对应的目标答案。
2.根据权利要求1所述的方法,其特征在于,所述从多个所述组合结果中筛选出目标组合结果,并根据所述目标组合结果确定所述用户提问对应的目标查询内容,包括:
确定各所述组合结果的目标量化值;所述目标量化值用于表征查询内容的准确率;
根据多个所述目标量化值从多个所述组合结果中选取出所述目标组合结果;
根据所述目标组合结果对应的目标用户意图确定所述目标查询内容。
3.根据权利要求2所述方法,其特征在于,所述确定各所述组合结果的目标量化值,包括:
确定各所述组合结果中目标实体与目标用户意图的匹配状态;
根据预先设置的匹配状态和状态值的对应关系,确定各所述组合结果的目标状态值;
将各所述组合结果中目标实体对应的置信度、目标用户意图对应的置信度和所述目标状态值输入到预先训练的回归模型中,得到各所述组合结果的目标量化值;所述目标实体对应的置信度用于表征所述目标实体的正确概率;所述目标用户意图对应的置信度用于表征所述目标用户意图的正确概率。
4.根据权利要求2所述的方法,其特征在于,所述根据多个所述目标量化值从多个所述组合结果中选取出所述目标组合结果,包括:
根据多个所述目标量化值对多个所述组合结果进行排序;
根据排序结果,选取出所述目标量化值符合第一预设条件的所述目标组合结果;所述第一预设条件包括所述组合结果的目标量化值大于预设量化值。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述获取所述用户提问对应的多个目标实体和多个目标用户意图,包括:
对所述用户提问进行实体识别处理,得到所述多个目标实体;
对所述用户提问进行意图识别处理,得到所述多个目标用户意图。
6.根据权利要求5所述的方法,其特征在于,所述对所述用户提问进行实体识别处理,得到所述多个目标实体,包括:
采用预先设置的命名实体识别模型从所述用户提问中识别出至少一个实体文本;
根据所述实体文本从预先设置的实体数据库中查找到多个候选实体;
采用预先设置的实体链接模型对所述多个候选实体进行消歧处理,得到多个所述目标实体。
7.根据权利要求5所述的方法,其特征在于,所述对所述用户提问进行意图识别处理,得到所述多个目标用户意图,包括:
对所述用户提问进行分词处理,得到多个提问词汇;
确定各所述提问词汇对应的词向量;
将各所述提问词汇对应的词向量输入到预先训练的意图识别模型中,得到所述意图识别模型输出的多个用户意图和各所述用户意图对应的置信度;
从多个所述用户意图中,选取出符合第二预设条件的目标用户意图;所述第二预设条件包括所述用户意图对应的置信度大于预设置信度。
8.一种智能问答装置,其特征在于,所述装置包括:
实体意图获取模块,用于接收用户提问,并获取所述用户提问对应的多个目标实体和多个目标用户意图;
实体意图组合模块,用于对所述多个目标实体和所述多个目标用户意图进行组合,得到多个组合结果;每个所述组合结果包括一个目标实体和一个目标用户意图;
目标查询内容确定模块,用于从多个所述组合结果中筛选出目标组合结果,并根据所述目标组合结果确定所述用户提问对应的目标查询内容;
目标答案查找模块,用于根据所述目标查询内容进行查找,得到所述用户提问对应的目标答案。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN202010107521.2A 2020-02-21 2020-02-21 智能问答方法、装置、计算机设备和存储介质 Pending CN111368044A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010107521.2A CN111368044A (zh) 2020-02-21 2020-02-21 智能问答方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010107521.2A CN111368044A (zh) 2020-02-21 2020-02-21 智能问答方法、装置、计算机设备和存储介质

Publications (1)

Publication Number Publication Date
CN111368044A true CN111368044A (zh) 2020-07-03

Family

ID=71206390

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010107521.2A Pending CN111368044A (zh) 2020-02-21 2020-02-21 智能问答方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN111368044A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112183098A (zh) * 2020-09-30 2021-01-05 完美世界(北京)软件科技发展有限公司 会话的处理方法和装置、存储介质、电子装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109522393A (zh) * 2018-10-11 2019-03-26 平安科技(深圳)有限公司 智能问答方法、装置、计算机设备和存储介质
CN110427467A (zh) * 2019-06-26 2019-11-08 深圳追一科技有限公司 问答处理方法、装置、计算机设备和存储介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109522393A (zh) * 2018-10-11 2019-03-26 平安科技(深圳)有限公司 智能问答方法、装置、计算机设备和存储介质
CN110427467A (zh) * 2019-06-26 2019-11-08 深圳追一科技有限公司 问答处理方法、装置、计算机设备和存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112183098A (zh) * 2020-09-30 2021-01-05 完美世界(北京)软件科技发展有限公司 会话的处理方法和装置、存储介质、电子装置
CN112183098B (zh) * 2020-09-30 2022-05-06 完美世界(北京)软件科技发展有限公司 会话的处理方法和装置、存储介质、电子装置

Similar Documents

Publication Publication Date Title
CN110162633B (zh) 语音数据意图确定方法、装置、计算机设备和存储介质
CN111160017B (zh) 关键词抽取方法、话术评分方法以及话术推荐方法
CN111104495B (zh) 基于意图识别的信息交互方法、装置、设备和存储介质
CN110287285B (zh) 一种问题意图识别方法、装置、计算机设备及存储介质
CN108427707B (zh) 人机问答方法、装置、计算机设备和存储介质
CN108595695B (zh) 数据处理方法、装置、计算机设备和存储介质
CN110674319B (zh) 标签确定方法、装置、计算机设备及存储介质
CN110598206A (zh) 文本语义识别方法、装置、计算机设备和存储介质
CN109063217B (zh) 电力营销***中的工单分类方法、装置及其相关设备
CN110569500A (zh) 文本语义识别方法、装置、计算机设备和存储介质
CN113157863B (zh) 问答数据处理方法、装置、计算机设备及存储介质
US20210390370A1 (en) Data processing method and apparatus, storage medium and electronic device
CN108038544B (zh) 基于大数据和深度学习的神经网络深度学习方法和***
CN111078847A (zh) 电力用户意图识别方法、装置、计算机设备和存储介质
CN110472136B (zh) 查询结果的推送方法、装置、存储介质和计算机设备
CN111597313B (zh) 问答方法、装置、计算机设备和存储介质
CN112541079A (zh) 多意图识别方法、装置、设备及介质
CN110910864A (zh) 训练样本的选取方法、装置、计算机设备和存储介质
CN112766319A (zh) 对话意图识别模型训练方法、装置、计算机设备及介质
CN110555165B (zh) 信息识别方法、装置、计算机设备和存储介质
CN111400340A (zh) 一种自然语言处理方法、装置、计算机设备和存储介质
CN111178714A (zh) 亲密度确定方法、装置、计算机设备和存储介质
CN113239697B (zh) 实体识别模型训练方法、装置、计算机设备及存储介质
CN111124898A (zh) 问答***测试方法、装置、计算机设备和存储介质
CN113343711A (zh) 工单生成方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination