CN112287095A - 确定问题答案的方法、装置、计算机设备及存储介质 - Google Patents

确定问题答案的方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN112287095A
CN112287095A CN202011600408.4A CN202011600408A CN112287095A CN 112287095 A CN112287095 A CN 112287095A CN 202011600408 A CN202011600408 A CN 202011600408A CN 112287095 A CN112287095 A CN 112287095A
Authority
CN
China
Prior art keywords
entity
relationship
answer
target
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011600408.4A
Other languages
English (en)
Inventor
籍焱
王殿胜
唐红武
权桁
薄满辉
谭智隆
侯珺
李睿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Travelsky Mobile Technology Co Ltd
Original Assignee
China Travelsky Mobile Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Travelsky Mobile Technology Co Ltd filed Critical China Travelsky Mobile Technology Co Ltd
Priority to CN202011600408.4A priority Critical patent/CN112287095A/zh
Publication of CN112287095A publication Critical patent/CN112287095A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Databases & Information Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Animal Behavior & Ethology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供了一种确定问题答案的方法、装置、计算机设备及存储介质,涉及自然语言处理技术领域,用于提高确定问题答***度。方法主要包括:将目标问题输入到实体关系识别模型识别出目标问题对应的核心实体和关系,所述实体关系识别模型是根据样本问题及样本问题分别对应的实体标签和关系标签训练得到的;从知识图谱中匹配出与核心实体对应的实体节点;从所述知识图谱中与所述核心实体对应的实体节点对应的关系路径中选取与所述目标问题的关系匹配度最高的关系路径;将所述相似度最高的关系路径对应的答案确定为所述目标问题的答案。

Description

确定问题答案的方法、装置、计算机设备及存储介质
技术领域
本申请涉及自然语言处理技术领域,尤其涉及一种确定问题答案的方法、装置、计算机设备及存储介质。
背景技术
基于知识图谱的问答(Knowledge Base Question Answering,KBQA)能够充分应用知识图谱中的实体及实体间的关联信息,深入理解用户的语义信息并得到最匹配的答案,近年来受到了学术界和工业界的广泛关注。在KBQA任务中,自然语言问句的文本字符串通过各类方法被映射到知识图谱中的三元组上,最终生成表示问句答案的文本字符串。
在实体识别和关系抽取阶段,上述方法将这两个步骤分开进行,将其视为两个相互独立的子问题来单独解决,然后再对结果进行合并。但这两个步骤之间其实存在关联关系,忽略了子问题之间的关联信息,这样将导致结果准确率下降。
发明内容
本申请实施例提供一种确定问题答案的方法、装置、计算机设备及存储介质,用于提高确定问题答***度。
本发明实施例提供一种确定问题答案的方法,所述方法包括:
将目标问题输入到实体关系识别模型识别出所述目标问题对应的核心实体和关系,所述实体关系识别模型是根据样本问题及所述样本问题分别对应的实体标签和关系标签训练得到的;
从知识图谱中匹配出与所述核心实体对应的实体节点,所述知识图谱中包括多个实体节点,每个所述实体节点代表一个主题实体;
从所述知识图谱中与所述核心实体对应的实体节点对应的关系路径中选取与所述目标问题的关系匹配度最高的关系路径;
将所述匹配度最高的关系路径对应的答案确定为所述目标问题的答案。
本发明实施例提供一种确定问题答案的装置,所述装置包括:
识别模块,用于将目标问题输入到实体关系识别模型识别出所述目标问题对应的核心实体和关系,所述实体关系识别模型是根据样本问题及所述样本问题分别对应的实体标签和关系标签训练得到的;
匹配模块,用于从知识图谱中匹配出与所述核心实体对应的实体节点,所述知识图谱中包括多个实体节点,每个所述实体节点代表一个主题实体;
选取模块,用于从所述知识图谱中与所述核心实体对应的实体节点对应的关系路径中选取与所述目标问题的关系匹配度最高的关系路径;
确定模块,用于将所述匹配度最高的关系路径对应的答案确定为所述目标问题的答案。
一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述确定问题答案的方法。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述确定问题答案的方法。
本发明提供一种确定问题答案的方法、装置、计算机设备及存储介质,首先将目标问题输入到实体关系识别模型识别出目标问题对应的核心实体和关系,然后从知识图谱中匹配出与核心实体对应的实体节点,所述知识图谱中包括多个实体节点,每个实体节点代表一个主题实体;最后从知识图谱中与核心实体对应的实体节点对应的关系路径中选取与目标问题的关系匹配度最高的关系路径;将匹配度最高的关系路径对应的答案确定为目标问题的答案。与目前实体识别和关系抽取分开进行相比,本发明中的实体关系识别模型是根据样本问题及所述样本问题分别对应的实体标签和关系标签训练得到的,因此通过实体关系识别模型可直接提取到目标问题对应的核心实体和关系,提高了核心实体和关系之间的关联关系,然后基于识别的核心实体和关系从知识图谱确定目标问题对应的答案,从而通过本发明可以提高确定问题答***度。
附图说明
图1为本申请一个实施例提供的确定问题答案的方法流程图;
图2为本申请一个实施例实体关系识别模型内部结构示意图;
图3为本申请一个实施例知识图谱结构示意图;
图4为本申请一个实施例提供的一确定问题答案的方法流程图;
图5为本申请一个实施例提供的限制条件标注结果示意图;
图6为本申请一个实施例提供的确定问题答案的装置的结构框图;
图7为本申请一个实施例提供的计算机设备的一示意图。
具体实施方式
为了更好的理解上述技术方案,下面通过附图以及具体实施例对本申请实施例的技术方案做详细的说明,应当理解本申请实施例以及实施例中的具体特征是对本申请实施例技术方案的详细的说明,而不是对本申请技术方案的限定,在不冲突的情况下,本申请实施例以及实施例中的技术特征可以相互组合。
请参阅图1,所示为本发明第一实施例当中的确定问题答案的方法,该方法适用于多种领域,如民航领域等本发明实施例不做具体限定。所述方法具体包括步骤S01-步骤S04。
S01,将目标问题输入到实体关系识别模型识别出目标问题对应的核心实体和关系。
其中,核心实体是目标问题中的核心词语,关系是与核心实体对应的关联属性关系。例如,目标问题为“A公司的创始人是谁
Figure DEST_PATH_IMAGE001
”,则目标问题的核心实体为“A公司”;核心实体对应的关系为{创始时间,总部地点,创始人,公司类型,..,}。
在本发明实施例中,所述实体关系识别模型是根据样本问题及所述样本问题分别对应的实体标签和关系标签训练得到的;优选的,用约10000条已标注的样本问题进行训练,每条样本问题会标注该样本问题对应的实体标签和关系标签;本发明中,本领域技术人员能够理解所述样本问题实现为字符串。
具体的,实体关系识别模型的内部结构如图2所示,当输入样本问题“首都机场的大巴车在哪”后,首先通过词嵌入表示(Word Embedding,优选实现为附图2中的“词嵌入表示 Bert-wwm embedding layer”)将样本问题表示成向量形式(优选的,词嵌入表示中的词均为单个的字,例如为“首,都,机,场,的,大,巴,车,在,哪,
Figure 622265DEST_PATH_IMAGE001
”;这样,能够减少分词错误带来的不好影响),然后经过第一个编码层(Encoder,优选实现为附图2中的“编码层 Bert-wwm Multi-Head Attention layer”),该优选的编码层通过一个multi-head的注意力机制获得输入样本问题的词向量形式中每个字在不同语义空间下的增强语义向量,并对每个字的增强语义向量进行线性组合。再经过第二个编码层(优选实现为附图2中的“编码层BiLSTM layer”),该优选编码层是一个双向的长短时神经网络,并且在这里引入了一个序列标注(样本问题对应的实体标签和关系标签,即附图2中的CRF layer)任务来调整所述实体关系模型内部的表示能力,有利于提高模型整体的准确率;最后是将经过编码层得到的隐层向量分别输入到实体分类器和关系分类器中最终得到样本问题的核心实体e和关系集合<R>。
需要说明的是,在机器学习领域,多任务学习指的是把多个相关的任务放在一起学习,同时地去学习多个任务的关联信息。针对问句中核心实体和关系识别两个子问题,本发明将其视为互有关联的相关任务一起学习,并在学习过程中互相补充学习到的领域相关知识,提升问答的准确率。
S02,从知识图谱中匹配出与核心实体对应的实体节点。
其中,所述知识图谱中包括多个实体节点,每个所述实体节点代表一个主题实体,节点和节点连接边可以为实体之间的关系,与实体节点连接的节点可以为答案节点,也可以为中间节点(连接关系)。以图3所示的知识图谱为例,“A公司”为知识图谱中的实体节点,“A公司”和“王明”之间的连接边对应的关系为“创始人”;“A公司”和“1995.5.1”之间的连接边对应的关系为“创始时间”;“分公司地点”为中间节点,即通过该节点可以查找到A市和B市分公司的地点。具体的,图3中“王明”为查找A公司创始人的答案,“1995.5.1”为查找A公司创始时间的答案,“A市C区”为查找A公司在A市的分公司地点的答案,“B市D区”为查找A公司在B市的分公司地点的答案。
在本发明提供的一个实施例中,在得到核心实体和关系后,可以生成知识子图在知识图谱中找到正确答案。在知识子图中主要分为二个部分:主题实体、关系路径。主题实体即目标问题中所识别的核心实体,关系路径即问句中所识别的关系,当关系路径长度大于1时,需要中间实体来建立两个实体间的连接关系。
S03,从知识图谱中与核心实体对应的实体节点对应的关系路径中选取与目标问题的关系匹配度最高的关系路径。
假设给定一个问题,找答案的过程即是知识子图的生成过程。首先,将问句中的核心实体对应到知识图谱中,对于知识图谱中的每个实体,需事先构建该实体的别名集合,包含了该实体所有可能别提及的名称,这个别名集合是根据多种数据源如百科、航司和机场官网、文档等来生成的,有了别名集合即可将核心实体链接到知识图谱中节点,从而得到知识子图中的主题实体。
当知识子图含有主题实体后,下一步的有效动作即为扩展知识子图的关系路径,根据关系抽取生成的关系集合<R>,对于集合中的每一个Rn,将该节点相关的所有关系与Rn做语义匹配度计算得到关系匹配得分,对于多个关系的集合,最终的关系路径得分等于每个关系匹配得分的乘积,再从所有的得分中选择最高的一条关系路径作为最终的关系路径。
例如,目标问题为“A公司哪一年成立”,则在步骤S01中确定的目标问题对应的核心实体为“A公司”、关系为“成立时间”。如图3所示,经过匹配确定匹配度最高的关系路径为“A公司”-“创始时间”-“1995.5.1”,即确定匹配度最高的关系路径的答案节点“1995.5.1”为目标问题的答案。
S04,将匹配度最高的关系路径对应的答案确定为目标问题的答案。
本发明提供一种确定问题答案的方法,首先将目标问题输入到实体关系识别模型识别出目标问题对应的核心实体和关系,然后从知识图谱中匹配出与核心实体对应的实体节点,所述知识图谱中包括多个实体节点,每个实体节点代表一个主题实体;最后从知识图谱中与核心实体对应的实体节点对应的关系路径中选取与目标问题的关系匹配度最高的关系路径;将匹配度最高的关系路径对应的答案确定为目标问题的答案。与目前实体识别和关系抽取分开进行相比,本发明中的实体关系识别模型是根据样本问题及所述样本问题分别对应的实体标签和关系标签训练得到的,因此通过实体关系识别模型可直接提取到目标问题对应的核心实体和关系,提高了核心实体和关系之间的关联关系,然后基于识别的核心实体和关系从知识图谱确定目标问题对应的答案,从而通过本发明可以提高确定问题答***度。
请参阅图4,所示为本发明第一实施例当中的确定问题答案的方法,该方法适用于多种领域,如民航领域等会话问答领域,本发明实施例不做具体限定。所述方法具体包括步骤S10-步骤S50。
S10,将目标问题输入到实体关系识别模型识别出目标问题对应的核心实体和关系,识别所述目标问题对应的限制条件。
其中,所述实体关系识别模型是根据样本问题及所述样本问题分别对应的实体标签和关系标签训练得到的。
在实体识别和关系抽取阶段,本发明提出了基于多任务学习的方式,将两个互相联系的子问题放在一起学习,并且引入了民航知识图谱中的schema信息。例如对于实体“免税店”,它的属性有“地点”、“营业时间”、“联系电话”等,因此若识别到问句的核心实体为“免税店”,那么问句的关系应该是“地点”、“营业时间”、“联系电话”等“免税店”所固有属性中的一个或多个,而不是“途径点”、“年龄”等这些不属于“免税店”的固有属性。因此,相较于将实体识别和关系抽取视为两个独立的子任务进行,本发明提出的基于多任务学习的方式能够让模块自动地去学习这些内在联系,使结果的准确率更高,也更合理。
在本发明提供的一个实施例中,所述识别所述目标问题对应的限制条件,包括:将所述目标问题输入到限制条件识别模型得到所述目标问题对应的限制条件,所述限制条件模型是根据样本问题及与所述样本问题中各个字对应的属性标签训练得到的。其中,所述属性标签包括限制条件标签和非限制条件标签,所述限制条件标签包括多个类目标签,所述类目标签中包含限制类目和限制类目位置。
需要说明的是,面对一些复杂目标问题时,需要识别目标问题中的限制条件才能更好地理解问句中的意图,得到更准确的答案。本发明实施例中的限制条件识别模型采用长短时记忆网络(LSTM)和条件随机场(CRF)的模型来训练得到,然后基于训练得到的限制条件识别模型进行限制条件识别。限制条件识别模型如图5所示,首先将目标问题通过嵌入层转化为向量序列,然后输入到两个双向的LSTM中,将LSTM中每个时间序列的正向和反向输出进行拼接,最后通过一个随机条件场(CRF)来预测结果,CRF层的好处是可以为预测结果添加一些约束来保证预测的标签是合法的,而这些约束能够在训练时自动学习到约束。
具体的,限制条件可以根据需求进行设置。例如,在民航领域的问答语句中,可以将限制条件分为8个大类,具体的类别可见表1。参照表1中内容,目标问题中第一个词的标签只能是“B-“ 或“O”,而不是“I-”;序列“O I-label”是非法的,因为“I-label”之前一定有“B-label”,且两个label的类型应该相同。这里标签类别采用“BIO”方式,”B”代表限制条件头部,“I”代表限制条件非头部,“O”代表非限制条件。
Figure 8247DEST_PATH_IMAGE002
S20,从知识图谱中匹配出与核心实体对应的实体节点。
其中,所述知识图谱中包括多个实体节点,每个所述实体节点代表一个主题实体。步骤S20步骤S02中的内容相同,本发明实施例在此不再赘述。
S30,从知识图谱中与核心实体对应的实体节点对应的关系路径中选取与目标问题的关系匹配度最高的关系路径。
需要说明的是,步骤S30步骤S03中的内容相同,本发明实施例在此不再赘述。
S40,从所述匹配度最高的关系路径中选取限制条件对应的答案。
在限制条件的识别中,相比于人工构建规则和模板的方式,本发明提出的基于神经网络和条件随机场的自动识别方法具有更高的覆盖率和可移植性。例如“靠近A12登机口的吸烟室在哪里
Figure 991247DEST_PATH_IMAGE001
”对于构建模板来识别出问句中的地点是比较困难的,因为同样的语义可以引申出多个说法如“我现在在A12登机口,告诉我最近的吸烟室”,光靠人工手动定义模板很难去完全覆盖所有的句法形式。本发明提出的自动识别方法能够通过神经网络模型去抽取问句中的语法特征再通过条件随机场去预测结果,将约束条件的识别过程转化为序列标注任务,并将约束条件加入到最终的查询图中,能够识别到问句中的语义信息,并且能够对隐性的表达做一些处理,最终识别出问句中的限制条件,从而通过本发明实施例中的限制条件可以提高问题答案确定的准确度。
S50,将所述限制条件对应的答案确定为所述目标问题的答案。
本发明实施例提供的一种确定问题答案的方法,在得到核心实体、关系和约束条件后,可以生成知识子图在知识图谱中找到正确答案。在知识子图中主要分为三个部分:主题实体、关系路径、约束函数。主题实体即问句中所识别的核心实体,关系路径即问句中所识别的关系,当关系路径长度大于1时,需要中间实体来建立两个实体间的连接关系,而约束函数即由约束条件映射而来。
在本发明提供的一个实施例中,若所述目标问题对应多个关系,所述方法还包括:从所述知识图谱中与所述核心实体对应的实体节点对应的关系路径中选取路径得分最高的关系路径;所述路径得分等于所述目标问题对应的每个所述关系匹配得分的乘积。即当知识子图含有主题实体后,下一步的有效动作即为扩展知识子图的关系路径,根据关系抽取生成的关系集合<R>,对于其中的每一个Rn,将该节点相关的所有关系与Rn做语义匹配度计算得到关系匹配得分,对于多个关系的集合,最终的关系路径得分等于每个关系匹配得分的乘积,再从所有的得分中选择最高的一条关系路径作为最终的关系路径。
在本发明提供的一个实施例中,所述识别所述目标问题对应的限制条件之后,所述方法还包括:确定所述限制条件是否为合法约束;从所述匹配度最高的关系路径中选取限制条件对应的答案,包括:若所述限制条件为合法约束,则从所述匹配度最高的关系路径中选取限制条件对应的答案。
在本发明提供的一个民航领域应用场景中,主要流程为:核心实体识别和关系抽取、限制条件识别,构建知识子图生成答案。本实施例面向民航领域数据的实时性、动态性和多样性,重点针对机场、航班、航空公司的信息所呈现出的来源广泛、形式多样和具备时效性等特征,首先构建民航领域知识图谱,并可通过管理端实时新增、修改数据和配置语料;然后通过基于多任务学习的语义分析方法对目标问题进行处理,得到问句的核心实体及关系;再通过一个限制条件识别模型(双向的长短时记忆循环神经网络和条件随机场)得到问句的限制条件;最后根据核心实体、关系、限制条件及知识图谱生成知识子图,最终得到目标问题对应的答案。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
在一实施例中,提供一种确定问题答案的装置,该确定问题答案的装置与上述实施例中确定问题答案的方法一一对应。如图6所示,所述确定问题答案的装置各功能模块详细说明如下:
识别模块10,用于将目标问题输入到实体关系识别模型识别出所述目标问题对应的核心实体和关系,所述实体关系识别模型是根据样本问题及所述样本问题分别对应的实体标签和关系标签训练得到的;
匹配模块20,用于从知识图谱中匹配出与所述核心实体对应的实体节点,所述知识图谱中包括多个实体节点,每个所述实体节点代表一个主题实体;
选取模块30,用于从所述知识图谱中与所述核心实体对应的实体节点对应的关系路径中选取与所述目标问题的关系匹配度最高的关系路径;
确定模块40,用于将所述匹配度最高的关系路径对应的答案确定为所述目标问题的答案。
进一步的,所述识别模块10,还用于识别所述目标问题对应的限制条件;
所述选取模块30,还用于从所述匹配度最高的关系路径中选取限制条件对应的答案;
所述确定模块40,还用于将所述限制条件对应的答案确定为所述目标问题的答案。
所述识别模块10,具体用于将所述目标问题输入到限制条件识别模型得到所述目标问题对应的限制条件,所述限制条件模型是根据样本问题及与所述样本问题中各个字对应的属性标签训练得到的。
进一步的,所述确定模块40,还用于确定所述限制条件是否为合法约束;
所述选取模块30,还用于若所述限制条件为合法约束,则从所述匹配度最高的关系路径中选取限制条件对应的答案。
具体的,所述属性标签包括限制条件标签和非限制条件标签,所述限制条件标签包括多个类目标签,所述类目标签中包含限制类目和限制类目位置。
进一步的,所述选取模块30,还用于从所述知识图谱中与所述核心实体对应的实体节点对应的关系路径中选取路径得分最高的关系路径;所述路径得分等于所述目标问题对应的每个所述关系匹配得分的乘积。
关于确定问题答案的装置的具体限定可以参见上文中对于确定问题答案的方法的限定,在此不再赘述。上述设备中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图7所示。该计算机设备包括通过***总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***、计算机程序和数据库。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种确定问题答案的方法。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:
将目标问题输入到实体关系识别模型识别出所述目标问题对应的核心实体和关系,所述实体关系识别模型是根据样本问题及所述样本问题分别对应的实体标签和关系标签训练得到的;
从知识图谱中匹配出与所述核心实体对应的实体节点,所述知识图谱中包括多个实体节点,每个所述实体节点代表一个主题实体;
从所述知识图谱中与所述核心实体对应的实体节点对应的关系路径中选取与所述目标问题的关系匹配度最高的关系路径;
将所述匹配度最高的关系路径对应的答案确定为所述目标问题的答案。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
将目标问题输入到实体关系识别模型识别出所述目标问题对应的核心实体和关系,所述实体关系识别模型是根据样本问题及所述样本问题分别对应的实体标签和关系标签训练得到的;
从知识图谱中匹配出与所述核心实体对应的实体节点,所述知识图谱中包括多个实体节点,每个所述实体节点代表一个主题实体;
从所述知识图谱中与所述核心实体对应的实体节点对应的关系路径中选取与所述目标问题的关系匹配度最高的关系路径;
将所述匹配度最高的关系路径对应的答案确定为所述目标问题的答案。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink) DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (10)

1.一种确定问题答案的方法,其特征在于,所述方法包括:
将目标问题输入到实体关系识别模型识别出所述目标问题对应的核心实体和关系,所述实体关系识别模型是根据样本问题及所述样本问题分别对应的实体标签和关系标签训练得到的;
从知识图谱中匹配出与所述核心实体对应的实体节点,所述知识图谱中包括多个实体节点,每个所述实体节点代表一个主题实体;
从所述知识图谱中与所述核心实体对应的实体节点对应的关系路径中选取与所述目标问题的关系匹配度最高的关系路径;
将所述匹配度最高的关系路径对应的答案确定为所述目标问题的答案。
2.根据权利要求1所述的确定问题答案的方法,其特征在于,所述方法还包括:
识别所述目标问题对应的限制条件;
所述将所述匹配度最高的关系路径对应的答案确定为所述目标问题的答案,包括:
从所述匹配度最高的关系路径中选取限制条件对应的答案;
将所述限制条件对应的答案确定为所述目标问题的答案。
3.根据权利要求2所述的确定问题答案的方法,其特征在于,所述识别所述目标问题对应的限制条件,包括:
将所述目标问题输入到限制条件识别模型得到所述目标问题对应的限制条件,所述限制条件模型是根据样本问题及与所述样本问题中各个字对应的属性标签训练得到的。
4.根据权利要求2或3所述的确定问题答案的方法,其特征在于,所述识别所述目标问题对应的限制条件之后,所述方法还包括:
确定所述限制条件是否为合法约束;
从所述匹配度最高的关系路径中选取限制条件对应的答案,包括:
若所述限制条件为合法约束,则从所述匹配度最高的关系路径中选取限制条件对应的答案。
5.根据权利要求3所述的确定问题答案的方法,其特征在于,所述属性标签包括限制条件标签和非限制条件标签,所述限制条件标签包括多个类目标签,所述类目标签中包含限制类目和限制类目位置。
6.根据权利要求1所述的确定问题答案的方法,其特征在于,若所述目标问题对应多个关系,所述方法还包括:
从所述知识图谱中与所述核心实体对应的实体节点对应的关系路径中选取路径得分最高的关系路径;所述路径得分等于所述目标问题对应的每个所述关系匹配得分的乘积。
7.一种确定问题答案的装置,其特征在于,所述装置包括:
识别模块,用于将目标问题输入到实体关系识别模型识别出所述目标问题对应的核心实体和关系,所述实体关系识别模型是根据样本问题及所述样本问题分别对应的实体标签和关系标签训练得到的;
匹配模块,用于从知识图谱中匹配出与所述核心实体对应的实体节点,所述知识图谱中包括多个实体节点,每个所述实体节点代表一个主题实体;
选取模块,用于从所述知识图谱中与所述核心实体对应的实体节点对应的关系路径中选取与所述目标问题的关系匹配度最高的关系路径;
确定模块,用于将所述匹配度最高的关系路径对应的答案确定为所述目标问题的答案。
8.根据权利要求7所述的确定问题答案的装置,其特征在于,
所述识别模块,还用于识别所述目标问题对应的限制条件;
所述选取模块,还用于从所述匹配度最高的关系路径中选取限制条件对应的答案;
所述确定模块,还用于将所述限制条件对应的答案确定为所述目标问题的答案。
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述的确定问题答案的方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的确定问题答案的方法。
CN202011600408.4A 2020-12-30 2020-12-30 确定问题答案的方法、装置、计算机设备及存储介质 Pending CN112287095A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011600408.4A CN112287095A (zh) 2020-12-30 2020-12-30 确定问题答案的方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011600408.4A CN112287095A (zh) 2020-12-30 2020-12-30 确定问题答案的方法、装置、计算机设备及存储介质

Publications (1)

Publication Number Publication Date
CN112287095A true CN112287095A (zh) 2021-01-29

Family

ID=74426283

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011600408.4A Pending CN112287095A (zh) 2020-12-30 2020-12-30 确定问题答案的方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN112287095A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112966122A (zh) * 2021-03-03 2021-06-15 平安科技(深圳)有限公司 语料意图识别方法、装置、存储介质及计算机设备
CN113010651A (zh) * 2021-03-02 2021-06-22 中国工商银行股份有限公司 一种针对用户提问的答复方法、装置及设备
CN113468314A (zh) * 2021-08-31 2021-10-01 阿里巴巴达摩院(杭州)科技有限公司 关系预测及问答方法、装置、电子设备及计算机存储介质
CN114201603A (zh) * 2021-11-04 2022-03-18 阿里巴巴(中国)有限公司 实体分类方法、装置、存储介质、处理器及电子装置
CN114722823A (zh) * 2022-03-24 2022-07-08 华中科技大学 构建航空知识图谱的方法及装置、计算机可读介质
CN114818683A (zh) * 2022-06-30 2022-07-29 北京宝兰德软件股份有限公司 一种基于移动端的运维方法及装置
CN115033679A (zh) * 2022-08-10 2022-09-09 深圳联友科技有限公司 基于知识图谱搜索汽车维修数据的方法
WO2022227162A1 (zh) * 2021-04-25 2022-11-03 平安科技(深圳)有限公司 问答数据处理方法、装置、计算机设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110137919A1 (en) * 2009-12-09 2011-06-09 Electronics And Telecommunications Research Institute Apparatus and method for knowledge graph stabilization
CN108427707A (zh) * 2018-01-23 2018-08-21 深圳市阿西莫夫科技有限公司 人机问答方法、装置、计算机设备和存储介质
CN109492077A (zh) * 2018-09-29 2019-03-19 北明智通(北京)科技有限公司 基于知识图谱的石化领域问答方法及***
CN109857846A (zh) * 2019-01-07 2019-06-07 阿里巴巴集团控股有限公司 用户问句与知识点的匹配方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110137919A1 (en) * 2009-12-09 2011-06-09 Electronics And Telecommunications Research Institute Apparatus and method for knowledge graph stabilization
CN108427707A (zh) * 2018-01-23 2018-08-21 深圳市阿西莫夫科技有限公司 人机问答方法、装置、计算机设备和存储介质
CN109492077A (zh) * 2018-09-29 2019-03-19 北明智通(北京)科技有限公司 基于知识图谱的石化领域问答方法及***
CN109857846A (zh) * 2019-01-07 2019-06-07 阿里巴巴集团控股有限公司 用户问句与知识点的匹配方法和装置

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113010651A (zh) * 2021-03-02 2021-06-22 中国工商银行股份有限公司 一种针对用户提问的答复方法、装置及设备
WO2022183547A1 (zh) * 2021-03-03 2022-09-09 平安科技(深圳)有限公司 语料意图识别方法、装置、存储介质及计算机设备
CN112966122B (zh) * 2021-03-03 2024-05-10 平安科技(深圳)有限公司 语料意图识别方法、装置、存储介质及计算机设备
CN112966122A (zh) * 2021-03-03 2021-06-15 平安科技(深圳)有限公司 语料意图识别方法、装置、存储介质及计算机设备
WO2022227162A1 (zh) * 2021-04-25 2022-11-03 平安科技(深圳)有限公司 问答数据处理方法、装置、计算机设备及存储介质
CN113468314B (zh) * 2021-08-31 2022-02-08 阿里巴巴达摩院(杭州)科技有限公司 关系预测及问答方法、装置、电子设备及计算机存储介质
CN113468314A (zh) * 2021-08-31 2021-10-01 阿里巴巴达摩院(杭州)科技有限公司 关系预测及问答方法、装置、电子设备及计算机存储介质
CN114201603A (zh) * 2021-11-04 2022-03-18 阿里巴巴(中国)有限公司 实体分类方法、装置、存储介质、处理器及电子装置
CN114722823A (zh) * 2022-03-24 2022-07-08 华中科技大学 构建航空知识图谱的方法及装置、计算机可读介质
CN114722823B (zh) * 2022-03-24 2023-04-14 华中科技大学 构建航空知识图谱的方法及装置、计算机可读介质
CN114818683A (zh) * 2022-06-30 2022-07-29 北京宝兰德软件股份有限公司 一种基于移动端的运维方法及装置
CN115033679A (zh) * 2022-08-10 2022-09-09 深圳联友科技有限公司 基于知识图谱搜索汽车维修数据的方法
CN115033679B (zh) * 2022-08-10 2023-01-13 深圳联友科技有限公司 基于知识图谱搜索汽车维修数据的方法

Similar Documents

Publication Publication Date Title
CN112287095A (zh) 确定问题答案的方法、装置、计算机设备及存储介质
CN109582949B (zh) 事件元素抽取方法、装置、计算设备及存储介质
CN107679039B (zh) 用于确定语句意图的方法和装置
CN111159385B (zh) 一种基于动态知识图谱的无模板通用智能问答方法
US20200184307A1 (en) Utilizing recurrent neural networks to recognize and extract open intent from text inputs
CN104679826B (zh) 基于分类模型的上下文识别的方法和***
CN109857846B (zh) 用户问句与知识点的匹配方法和装置
CN111191275A (zh) 敏感数据识别方法、***及其装置
CN111723569A (zh) 一种事件抽取方法、装置和计算机可读存储介质
WO2022174496A1 (zh) 基于生成模型的数据标注方法、装置、设备及存储介质
CN112328761A (zh) 一种意图标签设置方法、装置、计算机设备及存储介质
CN110377733A (zh) 一种基于文本的情绪识别方法、终端设备及介质
CN114676255A (zh) 文本处理方法、装置、设备、存储介质及计算机程序产品
CN113268560A (zh) 用于文本匹配的方法和装置
CN114580424A (zh) 一种用于法律文书的命名实体识别的标注方法和装置
CN115115984A (zh) 视频数据处理方法、装置、程序产品、计算机设备和介质
CN112487154B (zh) 一种基于自然语言的智能搜索方法
CN111783425B (zh) 基于句法分析模型的意图识别方法及相关装置
CN116522905B (zh) 文本纠错方法、装置、设备、可读存储介质及程序产品
CN117473054A (zh) 基于知识图谱的通用智能问答方法及装置
CN115115432B (zh) 基于人工智能的产品信息推荐方法及装置
WO2022262080A1 (zh) 一种对话关系处理方法、计算机及可读存储介质
Ajees et al. A named entity recognition system for Malayalam using conditional random fields
CN115658845A (zh) 一种适用于开源软件供应链的智能问答方法及装置
CN114691716A (zh) Sql语句转换方法、装置、设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210129