CN111538844A - 目标领域知识库的生成、问题解答方法及装置 - Google Patents
目标领域知识库的生成、问题解答方法及装置 Download PDFInfo
- Publication number
- CN111538844A CN111538844A CN202010202748.5A CN202010202748A CN111538844A CN 111538844 A CN111538844 A CN 111538844A CN 202010202748 A CN202010202748 A CN 202010202748A CN 111538844 A CN111538844 A CN 111538844A
- Authority
- CN
- China
- Prior art keywords
- event
- predicate
- concept
- slot
- logic formula
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 155
- 230000003068 static effect Effects 0.000 claims abstract description 13
- 230000001960 triggered effect Effects 0.000 claims abstract description 12
- 230000006870 function Effects 0.000 claims description 196
- 230000011218 segmentation Effects 0.000 claims description 64
- 230000008569 process Effects 0.000 claims description 46
- 230000015654 memory Effects 0.000 claims description 38
- 238000012545 processing Methods 0.000 claims description 29
- 230000009471 action Effects 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 10
- 238000011144 upstream manufacturing Methods 0.000 claims description 9
- 238000013461 design Methods 0.000 description 40
- 238000010586 diagram Methods 0.000 description 23
- 238000004891 communication Methods 0.000 description 22
- 230000000694 effects Effects 0.000 description 22
- 238000012790 confirmation Methods 0.000 description 17
- 238000012946 outsourcing Methods 0.000 description 14
- 238000003860 storage Methods 0.000 description 13
- 238000013473 artificial intelligence Methods 0.000 description 12
- 238000013145 classification model Methods 0.000 description 10
- 238000012549 training Methods 0.000 description 9
- 230000003993 interaction Effects 0.000 description 8
- 238000007726 management method Methods 0.000 description 8
- 238000009795 derivation Methods 0.000 description 7
- 238000007781 pre-processing Methods 0.000 description 7
- 238000010200 validation analysis Methods 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 5
- 238000004519 manufacturing process Methods 0.000 description 5
- 239000013598 vector Substances 0.000 description 5
- 230000006399 behavior Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 230000001364 causal effect Effects 0.000 description 4
- 238000013500 data storage Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000002776 aggregation Effects 0.000 description 3
- 238000004220 aggregation Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 230000004069 differentiation Effects 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 238000011049 filling Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- IAYPIBMASNFSPL-UHFFFAOYSA-N Ethylene oxide Chemical compound C1CO1 IAYPIBMASNFSPL-UHFFFAOYSA-N 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 230000005611 electricity Effects 0.000 description 2
- 230000008570 general process Effects 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 238000011068 loading method Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 230000006403 short-term memory Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 238000010521 absorption reaction Methods 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000011217 control strategy Methods 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000005538 encapsulation Methods 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000011022 operating instruction Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000010897 surface acoustic wave method Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种目标领域知识库的生成、问题解答方法及装置,本申请根据目标领域知识的知识类型,确定所述目标领域知识的概念图谱、事理图谱及谓词逻辑公式;进而生成目标领域知识库。概念图谱用于表示概念词间的静态关系;事理图谱用于表示事件之间顺序和事件之间的事理关系;谓词逻辑公式用于表示目标领域知识中的业务规则。问题解答方法包括:从事理图谱中确定出问题的N个分词短语触发的M个事件,并根据N个分词短语中与概念图谱匹配的K个分词短语确定出M个事件的槽位的槽位值;根据M个事件,以及M个事件的槽位的槽位值,对问题的咨询对象对应的谓词逻辑公式进行运算;进而确定问题的答案。
Description
技术领域
本申请涉及计算机技术领域,主要涉及人工智能中自然语言处理技术,尤其涉及一种目标领域知识库的生成、问题解答方法及装置。
背景技术
问题解答***的核心步骤是从现有的储备知识库中搜寻相关知识,进而生成答案。现有技术中,可以按照问题涉及的范围做知识的目录分类,建立知识图谱。或者,直接面向应用的问答实例,建立常见问题解答(Frequently Asked Questions,FAQ)库,还可以将知识图谱与FAQ库结合,知识图谱的节点与内容相关的FQA建立链接。但是,无论是采用 FAQ方式的检索,还是FAQ与本体库融合的方式检索,都只能在现有的FAQ和基于本体库扩展的知识库中获取答案,如果用户的提问的内容在原有的FAQ库不存在,则无法生成答案。
发明内容
本申请提供一种目标领域知识库的生成、问题解答方法及装置,用于解决现有技术中的问答***若用户的提问的内容在原有的知识库不存在,则无法生成答案的问题。
第一方面,本申请提供一种问题解答方法,包括:从所述问题中确定N个分词短语;从事理图谱中确定出所述N个分词短语触发的M个事件,并根据所述N个分词短语中与概念图谱匹配的K个分词短语确定出所述M个事件的槽位的槽位值;所述N、M、K为正整数;所述K小于或等于N,所述M小于或等于N;根据预设的事件与谓词逻辑公式的对应关系,确定出所述问题的咨询对象对应的谓词逻辑公式;其中,谓词逻辑公式中的谓词函数与事理图谱中的事件对应,谓词函数的参数与事件的槽位对应,谓词函数的参数值与事件的槽位的槽位值对应;所述咨询对象对应的谓词逻辑公式是根据所述咨询对象对应的目标领域知识中的业务规则得到的;根据所述M个事件,以及所述M个事件的槽位的槽位值,对所述谓词逻辑公式进行运算;根据所述谓词逻辑公式的运算结果,确定所述问题的答案。
针对现有技术中仅通过搜索方法难以获得的需要进行逻辑推理才能得到的复杂问题,根据目标领域知识库中的事理图谱、概念图谱及谓词逻辑公式形成的多知识表示,在通过事理图谱、概念图谱及谓词逻辑公式建立的知识之间的逻辑链接的基础上,从用户输入的问题中确定出的N个分词短语中,确定出N个分词短语触发的M个事件,并根据N个分词短语中与概念图谱匹配的K个分词短语,确定M个事件的事件实例,即M个事件的槽位的槽位值,进而,根据问题的咨询对象,与谓词逻辑公式关联,确定问题的咨询对象所对应的谓词逻辑公式,进行逻辑推导,推断出问题结果,完成知识推理,获取问题的答案,解决现有技术中的问答***无法处理复杂问题的推理,难以获得复杂问题的答案的问题。
一种可能的设计,针对所述M个事件中的每个事件,所述事件满足以下条件:所述N个分词短语中存在一个分词短语与所述事件的触发词匹配,且:所述与概念图谱匹配的K个分词短语中存在一个分词短语,该分词短语在所述概念图谱中关联的一个概念与所述事件的第一槽位的槽位类型匹配,所述第一槽位为所述事件中的一个槽位。
通过对N个分词短语中存在一个分词短语与所述事件的触发词匹配,确定N个分词短语中可能匹配的事件,并且,根据与概念图谱匹配的K个分词短语,与事件中的第一槽位的槽位类型匹配,确定N个分词短语中可能匹配的事件,进而确定出N个分词短语中匹配的M个事件,可以从出发词和事件的槽位类型2个方面对事件进行匹配,有效提高了事件匹配的准确率和事件识别的概率。
一种可能的设计,针对所述M个事件中的每个事件,所述事件满足以下条件:所述N个分词短语中存在一个分词短语与所述事件的触发词匹配,且:所述与概念图谱匹配的K个分词短语中存在一个分词短语,该分词短语在所述概念图谱中关联的一个概念与所述事件的第一槽位的槽位类型匹配,且该分词短语为所述事件的所述第一槽位的槽位值,所述第一槽位为所述事件中的一个槽位。
通过从出发词和事件的槽位类型2个方面对事件进行匹配,进一步的,通过在所述概念图谱中关联的一个概念与所述事件的第一槽位的槽位类型匹配,确定出匹配的事件的事件实例中的所述第一槽位的槽位值,进而对后续谓词逻辑公式中的谓词函数的参数值的确定奠定基础。
一种可能的设计,所述概念词包括概念和概念实例;针对所述K个分词短语中的一个分词短语,该分词短语所述概念图谱中关联的一个概念,包括:在所述概念图谱中匹配的概念实例对应的上游节点的概念;或者,在所述概念图谱中匹配的概念。
通过上述方法,可以将匹配的概念词扩展为概念图谱中的概念和概念实例,有效提高了概念图谱中的概念词与事件的槽位类型匹配的概率,提高事件及事件实例确定的成功率。
一种可能的设计,若所述问题的类型为判断型问题,则将所述谓词逻辑公式的运算结果作为所述答案;若所述问题的类型为解释型问题,则将所述谓词逻辑公式的运算过程,以及所述谓词逻辑公式的运算结果作为所述答案。
通过上述方法,可以有效确定出用户提出的问题的类型,进而,针对不同问题类型,给出不同的答案的内容,提高用户体验。
一种可能的设计,所述谓词逻辑公式中包括一个或多个谓词函数;所述谓词逻辑公式中存在一个谓词函数,所述谓词函数为另一个谓词逻辑公式的运算结果。
通过上述方法,有效利用了谓词逻辑公式的逻辑运算的方法,进而通过事件与谓词函数的对应关系,实现事件间的逻辑运算,以实现复杂问题中所需的逻辑推导,进而解决现有技术中的问答***无法处理复杂推理的问题。
一种可能的设计,针对所述谓词逻辑公式中的每个谓词函数,执行:若所述谓词函数对应的事件为第一事件,所述第一事件为所述M个事件中的一个事件,且:所述谓词函数的参数对应的事件的槽位,与所述第一事件的第一槽位相同,则:所述谓词函数的参数值为所述第一事件的所述第一槽位的槽位值。
通过上述方法,通过事件与谓词函数的对应关系,通过事件的槽位的槽位值,确定对应的谓词逻辑公式中的谓词函数的参数,进而确定出咨询对象对应的谓词逻辑公式,实现事件间的逻辑运算,以实现复杂问题中所需的逻辑推导,进而解决现有技术中的问答***无法处理复杂推理的问题。
一种可能的设计,所述问题场景为财经经营核算领域。
第二方面,本申请提供一种目标领域知识库的生成方法,包括:根据目标领域知识的知识类型,确定所述目标领域知识的概念图谱、事理图谱及谓词逻辑公式;其中,所述概念图谱用于表示概念词间的静态关系;所述概念词用于表示所述目标领域知识的对象;所述事理图谱用于表示事件之间顺序和事件之间的事理关系;所述事件用于表示所述目标领域知识内用谓词表达的概念词间的关系或概念词间的动作;所述谓词逻辑公式中的谓词函数与所述事理图谱中的事件对应,所述谓词函数的参数与所述事件的槽位对应,所述谓词函数的参数值与事件的槽位的槽位值对应;所述谓词逻辑公式用于表示所述目标领域知识中的业务规则;根据所述概念图谱、所述事理图谱及所述谓词逻辑公式,生成目标领域知识库。
通过上述方法,建立目标领域知识库中的事理图谱、概念图谱及谓词逻辑公式,以形成目标领域知识库的多知识表示,通过概念图谱表示概念词间的静态关系,通过事理图谱表示事件之间顺序和事件之间的事理关系,并通过事件表示所述目标领域知识内用谓词表达的概念词间的关系或概念词间的动作,进而,通过谓词逻辑公式中的谓词函数与所述事理图谱中的事件对应,所述谓词函数的参数与所述事件的槽位对应,所述谓词函数的参数值与事件的槽位的槽位值对应;建立事理图谱、概念图谱及谓词逻辑公式间的逻辑关系,实现不同类型的知识之间的逻辑链接,并通过谓词逻辑公式实现知识间的逻辑推导的可能,为问题解答***提供知识推导的基础,以解决现有技术中只能通过搜索的方式获得问题的答案,导致的复杂问题无法进行推导而难以获得问题的答案的技术问题。
一种可能的设计,所述事件包括:触发词和事件的槽位;所述触发词用于标识所述事件发生时对应的谓词;所述事件的槽位的槽位类型对应所述概念图谱中的至少一个概念词。
通过事件包括的触发词和事件的槽位,且,所述事件的槽位的槽位类型对应所述概念图谱中的至少一个概念词,实现事件与概念词的逻辑关系的建立,为知识库中多种知识表示提供基础。
一种可能的设计,所述谓词逻辑公式的确定方式,包括:根据所述业务规则涉及的事件,确定所述谓词逻辑公式中的谓词函数;根据所述业务规则中事件间的逻辑关系,确定所述谓词函数间的逻辑运算符;通过所述逻辑运算符,将所述谓词逻辑公式中的谓词函数连接,确定所述谓词逻辑公式。
通过确定事件对应的谓词函数,及业务规则确定的事件间的逻辑关系,通过谓词函数间的逻辑运算符表示为谓词逻辑公式的形式,实现了将语言中的业务规则转化为可以进行逻辑运算的谓词逻辑公式,进而,实现了业务规则间的逻辑推导,建立了知识库中知识间的逻辑关系,实现了通过逻辑运算对知识进行推导的方案,为问题解答***提供支持。
第三方面,本申请提供一种问题解答装置,包括:获取单元,用于从所述问题中确定N 个分词短语;从事理图谱中确定出所述N个分词短语触发的M个事件,并根据所述N个分词短语中与概念图谱匹配的K个分词短语确定出所述M个事件的槽位的槽位值;所述N、 M、K为正整数;所述K小于或等于N,所述M小于或等于N;确定单元,用于根据预设的事件与谓词逻辑公式的对应关系,确定出所述问题的咨询对象对应的谓词逻辑公式;其中,谓词逻辑公式中的谓词函数与事理图谱中的事件对应,谓词函数的参数与事件的槽位对应,谓词函数的参数值与事件的槽位的槽位值对应;所述咨询对象对应的谓词逻辑公式是根据所述咨询对象对应的目标领域知识中的业务规则得到的;根据所述M个事件,以及所述M个事件的槽位的槽位值,对所述谓词逻辑公式进行运算;根据所述谓词逻辑公式的运算结果,确定所述问题的答案。
一种可能的设计,针对所述M个事件中的每个事件,所述事件满足以下条件:所述N个分词短语中存在一个分词短语与所述事件的触发词匹配,且:所述与概念图谱匹配的K个分词短语中存在一个分词短语,该分词短语在所述概念图谱中关联的一个概念与所述事件的第一槽位的槽位类型匹配,所述第一槽位为所述事件中的一个槽位。
一种可能的设计,针对所述M个事件中的每个事件,所述事件满足以下条件:所述N个分词短语中存在一个分词短语与所述事件的触发词匹配,且:所述与概念图谱匹配的K个分词短语中存在一个分词短语,该分词短语在所述概念图谱中关联的一个概念与所述事件的第一槽位的槽位类型匹配,且该分词短语为所述事件的所述第一槽位的槽位值,所述第一槽位为所述事件中的一个槽位。
一种可能的设计,所述概念词包括概念和概念实例;针对所述K个分词短语中的一个分词短语,该分词短语所述概念图谱中关联的一个概念,包括:在所述概念图谱中匹配的概念实例对应的上游节点的概念;或者,在所述概念图谱中匹配的概念。
一种可能的设计,所述确定单元,具体用于:若所述问题的类型为判断型问题,则将所述谓词逻辑公式的运算结果作为所述答案;若所述问题的类型为解释型问题,则将所述谓词逻辑公式的运算过程,以及所述谓词逻辑公式的运算结果作为所述答案。
一种可能的设计,所述谓词逻辑公式中包括一个或多个谓词函数;所述谓词逻辑公式中存在一个谓词函数,所述谓词函数为另一个谓词逻辑公式的运算结果。
一种可能的设计,所述确定单元,具体用于:针对所述谓词逻辑公式中的每个谓词函数,执行:若所述谓词函数对应的事件为第一事件,所述第一事件为所述M个事件中的一个事件,且:所述谓词函数的参数对应的事件的槽位,与所述第一事件的第一槽位相同,则:所述谓词函数的参数值为所述第一事件的所述第一槽位的槽位值。
一种可能的设计,所述问题场景为财经经营核算领域。
第四方面,本申请提供一种目标领域知识库的生成装置,包括:确定单元,用于根据目标领域知识的知识类型,确定所述目标领域知识的概念图谱、事理图谱及谓词逻辑公式;其中,所述概念图谱用于表示概念词间的静态关系;所述概念词用于表示所述目标领域知识的对象;所述事理图谱用于表示事件之间顺序和事件之间的事理关系;所述事件用于表示所述目标领域知识内用谓词表达的概念词间的关系或概念词间的动作;所述谓词逻辑公式中的谓词函数与所述事理图谱中的事件对应,所述谓词函数的参数与所述事件的槽位对应,所述谓词函数的参数值与事件的槽位的槽位值对应;所述谓词逻辑公式用于表示所述目标领域知识中的业务规则;生成单元,用于根据所述概念图谱、所述事理图谱及所述谓词逻辑公式,生成目标领域知识库。
一种可能的设计,所述事件包括:触发词和事件的槽位;所述触发词用于标识所述事件发生时对应的谓词;所述事件的槽位的槽位类型对应所述概念图谱中的至少一个概念词。
一种可能的设计,所述确定单元,具体用于:根据所述业务规则涉及的事件,确定所述谓词逻辑公式中的谓词函数;根据所述业务规则中事件间的逻辑关系,确定所述谓词函数间的逻辑运算符;通过所述逻辑运算符,将所述谓词逻辑公式中的谓词函数连接,确定所述谓词逻辑公式。
第五方面,本申请实施例还提供了一种电子设备,该电子设备具有实现上述第一方面方法实例中电子设备行为的功能。所述功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。
在一个可能的设计中,所述电子设备的结构中包括处理单元、输入单元和输出单元,这些单元可以执行上述第一方面方法示例中的相应功能,具体参见方法示例中的详细描述,此处不做赘述。
在一种可能的设计中,所述电子设备的结构中包括处理器和通信单元,还可以包括存储器。所述通信单元用于与用户进行交互;所述处理器被配置为支持所述电子设备执行上述第一方面方法中相应的功能。所述存储器与所述处理器耦合,其保存所述电子设备必要的程序指令和数据。
在一种可能的设计中,所述电子设备中包括相互连接的处理器与存储器,所述处理器用于读取并执行所述存储器中存储的程序指令,执行上述第一方面中任一可能的设计中所提及的方法。
第六方面,本申请实施例还提供了一种电子设备,该电子设备具有实现上述第二方面方法实例中电子设备行为的功能。所述功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。
在一个可能的设计中,所述电子设备的结构中包括处理单元和输出单元,还可以包括输入单元,这些单元可以执行上述第二方面方法示例中的相应功能,具体参见方法示例中的详细描述,此处不做赘述。
在一种可能的设计中,所述电子设备的结构中包括处理器和通信单元,还可以包括存储器。所述通信单元用于与用户进行交互;所述处理器被配置为支持所述电子设备执行上述第二方面方法中相应的功能。所述存储器与所述处理器耦合,其保存所述电子设备必要的程序指令和数据。
在一种可能的设计中,所述电子设备中包括相互连接的处理器与存储器,所述处理器用于读取并执行所述存储器中存储的程序指令,执行上述第二方面中任一可能的设计中所提及的方法。
第七方面,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机可执行指令,所述计算机可执行指令在被所述计算机调用时用于使所述计算机执行上述第一方面或第二方面中任一可能的设计中所提及的方法。
第八方面,本申请实施例还提供了一种包含指令的计算机程序产品,当其在电子设备上运行时,使得所述电子设备执行上述第一方面或第二方面中任一可能的设计中所提及的方法。
第九方面,本申请实施例还提供了一种电子设备,所述电子设备可以为芯片,所述芯片与存储器相连,用于读取并执行所述存储器中存储的程序指令,以实现上述第一方面或第二方面中任一可能的设计中所提及的方法。
附图说明
图1为本申请提供的一种人工智能主体框架示意图;
图2为本申请提供的一种应用场景的示意图;
图3为本申请提供的一种电子设备的结构示意图;
图4A为本申请提供的一种目标领域知识库的生成方法示意图;
图4B-图4D为本申请提供的一种目标领域知识库的示意图;
图5为本申请提供的一种事理图谱的示意图;
图6为本申请提供的一种问题解答方法的流程示意图;
图7A-图7B为本申请提供的一种问题识别方法的示意图;
图8A-图8B为本申请提供的一种问题识别方法的示意图;
图9为本申请提供的一种问题解答方法的示意图;
图10为本申请提供的一种问题解答装置的结构示意图;
图11为本申请提供的一种目标领域知识库的生成装置的结构示意图;
图12为本申请提供的一种电子设备的结构图。
具体实施方式
下面结合附图,对本申请实施例进行介绍。
图1示出了一种人工智能主体框架示意图,该主体框架描述了人工智能***总体工作流程,适用于通用的人工智能领域需求。
下面从“智能信息链”(水平轴)和“IT价值链”(垂直轴)两个维度对上述人工智能主题框架进行阐述。
“智能信息链”反映从数据的获取到处理的一列过程。举例来说,可以是智能信息感知、智能信息表示与形成、智能推理、智能决策、智能执行与输出的一般过程。在这个过程中,数据经历了“数据—信息—知识—智慧”的凝练过程。“IT价值链”从人智能的底层基础设施、信息(提供和处理技术实现)到***的产业生态过程,反映人工智能为信息技术产业带来的价值。
(1)基础设施:基础设施为人工智能***提供计算能力支持,实现与外部世界的沟通,并通过基础平台实现支撑。通过传感器与外部沟通;计算能力由智能芯片(CPU、NPU、GPU、ASIC、FPGA等硬件加速芯片)提供;基础平台包括分布式计算框架及网络等相关的平台保障和支持,可以包括云存储和计算、互联互通网络等。举例来说,传感器和外部沟通获取数据,这些数据提供给基础平台提供的分布式计算***中的智能芯片进行计算。
(2)数据:基础设施的上一层的数据用于表示人工智能领域的数据来源。数据涉及到图形、图像、语音、文本,还涉及到传统设备的物联网数据,包括已有***的业务数据以及力、位移、液位、温度、湿度等感知数据。
(3)数据处理:数据处理通常包括数据训练,机器学习,深度学习,搜索,推理,决策等方式。其中,机器学习和深度学习可以对数据进行符号化和形式化的智能信息建模、抽取、预处理、训练等。推理是指在计算机或智能***中,模拟人类的智能推理方式,依据推理控制策略,利用形式化的信息进行机器思维和求解问题的过程,典型的功能是搜索与匹配。决策是指智能信息经过推理后进行决策的过程,通常提供分类、排序、预测等功能。
(4)通用能力:对数据经过上面提到的数据处理后,进一步基于数据处理的结果可以形成一些通用的能力,比如可以是算法或者一个通用***,例如,翻译,文本的分析,计算机视觉的处理,语音识别,图像的识别等等。
(5)智能产品及行业应用:智能产品及行业应用指人工智能***在各领域的产品和应用,是对人工智能整体解决方案的封装,将智能信息决策产品化、实现落地应用,其应用领域主要包括:智能制造、智能交通、智能家居、智能医疗、智能安防、自动驾驶,平安城市,智能终端等。
人工智能在很多领域都有着广泛的应用,例如人机问答交互等领域。本申请提供的基于目标领域知识库的问题解答方法,属于人工智能领域。
本申请实施例提供的基于目标领域知识库的问题解答方法,应用于目标领域知识库的问题解答***。应理解,问答为一问一答,这种问答通常包含两种:一种是人问机器答,一种是机器问人答。而本申请实施例提供的基于目标领域知识库的问题解答方法,一般是发生在机器为用户与目标领域知识库交互的过程中发生的用户和机器之间的问答交互。
图2示出了本申请实施例提供的基于目标领域知识库的问题解答方法适用的一种可能应用场景,所述应用场景中可以包括用户和电子设备。其中:
在本申请实施例中,用户一般指需要对目标领域知识库操作(例如,阅读,查询等)的用户,因此,在本申请实施例中仅以用户为例进行说明。所述电子设备可以为具有输出语音功能的实体设备,在具体的实施方式中,所述电子设备可以为智能终端,例如图2所示的智能手机、智能终端等;所述电子设备还可以为图2所示的穿戴式终端或者机器人等。当然所述电子设备不仅仅限于图2中所示的示例,还可以为其他电子设备,例如笔记本电脑、平板电脑、车载电脑、个人数字助理(personal digital assistant,PDA)、智能手表、个人计算机((personal computer,PC)、电视机等等。当然所述电子设备不限于上述列举的设备,本申请对此不作限定。
所述电子设备至少具有接收声音、语音,以及输出声音、语音的功能。
一种可选的方式中,所述电子设备除上述功能外,还具有声音或语音分析、语义分析、语音合成等功能,若电子设备可以具备数据存储与数据处理的能力,在该应用场景中只存在用户和所述电子设备即可以完成基于目标领域知识库的问题解答过程。
在另一种可选的实施方式中,若电子设备不具备数据存储和数据处理能力时,所述电子设备可以通过网络与服务器连接,由服务器完成数据的存储与处理,如图2中所示。
当然,在所述电子设备具备数据存储与数据处理的能力时,为了减少所述电子设备的能耗,所述电子设备同样可以通过网络与服务器连接,由服务器完成数据的存储与处理,本申请对此不作限定。
可选的,所述电子设备除了上述功能外,还可以包括摄像头,可以用于拍摄知识对象 (文本),以实现知识对象(文本)的阅读,或者拍摄用户的图像,用于后续的图像分析等等。当然所述电子设备在是机器人或者其他具有可活动部件的设备的情况下,所述电子设备还可以通过肢体或者可活动部件与用户进行更灵活地交互,例如拥抱,指示等等。
需要说明的是,图2示出的应用场景示意图还可包括其他设备,在此不再示出。
由于本申请实施例提供的基于目标领域知识库的问题解答方法适用于电子设备,下面对所述电子设备进行简单介绍。图3示出了与本实施例相关的电子设备的部分结构框图。参阅图3所示,所述电子设备300可以包括:通信单元310、电源320、处理器330、存储器340、输入单元350、输出单元360、音频电路370等部件。本领域技术人员可以理解,图3中示出的电子设备的结构并不构成对电子设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
下面结合图3对电子设备300的各个构成部件进行具体的介绍:
所述通信单元310可以提供语音或数据的通信能力,可以提供有线或无线通信的接口。可选的,所述通信单元310可以包括射频(radio frequency,RF)收发元件、全球定位*** (global positioning system,GPS)收发元件(例如图3所示的RF电路311)、无线保真(wireless fidelity,WiFi)元件(例如图3所示的WiFi模块312)、其他元件等等中的部分或者全部;所述通信单元310还可以是软件和硬件(例如,天线、调制/解调器、编/解码器、模拟/数字处理电路等)的结合。
其中,所述RF电路311可用于收发信息或通话过程中,数据的接收和发送。特别地,所述RF电路311在接收到基站的下行数据后,发送给所述处理器330处理;另外,将待发送的上行数据发送给基站。通常,所述RF电路311包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(low noise amplifier,LNA)、双工器等。此外,所述RF 电路311还可以通过无线通信与网络和其他设备通信。所述无线通信可以使用任一通信标准或协议,包括但不限于全球移动通讯***(global system of mobile communication,GSM)、通用分组无线服务(general packet radio service,GPRS)、码分多址(code divisionmultiple access,CDMA)、宽带码分多址(wideband code division multiple access,WCDMA)、长期演进(long term evolution,LTE)、电子邮件、短消息服务(short messagingservice,SMS) 等。
所述音频电路370、所述扬声器371,所述麦克风372可提供用户与所述电子设备300 之间的音频接口。所述音频电路370可将接收到的音频数据转换后的电信号,传输到所述扬声器371,由所述扬声器371转换为声音信号输出;另一方面,所述麦克风372将收集的声音信号转换为电信号,由所述音频电路370接收后转换为音频数据,再将音频数据输出至所述RF电路310以发送给比如另一电子设备,或者将音频数据输出至所述存储器340以便进一步处理。
WiFi属于短距离无线传输技术,所述电子设备300通过所述WiFi模块312可以连接接入点(access point,AP),从而实现数据网络的访问。所述WiFi模块312可用于与其他设备进行通信过程中,数据的接收和发送。
所述存储器340可用于存储软件程序以及模块。所述处理器330通过运行存储在所述存储器340的软件程序以及模块,从而执行所述电子设备300的各种功能应用以及数据处理。可选的,所述存储器340可以主要包括存储程序区和存储数据区,其中,所述存储程序区可存储操作***、各种应用程序等;存储数据区可存储根据所述电子设备300的使用所创建的数据等。具体可选的,所述处理器340还可以存储所述处理器330和其他模块上所需的静态数据(例如图像等)和规则等等。例如,在本申请实施例中,所述存储器340 可以存储知识对象(文本)内容以及与知识对象(文本)相关的数据库等。此外,所述存储器340可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件等。
需要说明的是,上述存储器340的功能可以在如图3所示的电子设备300中体现,还可以在服务器(例如云服务器)等中实现,这里仅以作为电子设备300的一部分示例性说明,但并不作为对存储器的限定。
所述输入单元350可用于接收输入的数字、声音或字符信息,以及产生与所述电子设备300的用户设置以及功能控制有关的键信号输入。例如,在本身请实施例中所述输入单元350可以接收输入用户的语音。具体地,所述输入单元350可以包括触控面板351以及其他输入设备352。
其中,所述触控面板351,也可以称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板351上或在触控面板351附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,所述触控面板351可以包括触摸检测装置和触摸控制器两个部分。其中,所述触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给所述触摸控制器;所述触摸控制器从所述触摸检测装置上接收触摸信息,并将它转换成触点坐标,再传送给所述处理器330,并能接收所述处理器330发来的命令并加以执行。例如,所述用户在所述触控面板351上用手触摸所述显示面板3611上显示的知识对象(文本)目录时,所述触摸检测装置检测到此次触摸带来的这个信号,然后将该信号传送给所述触摸控制器,所述触摸控制器再将这个信号转换成坐标发送给所述处理器330,所述处理器330根据该坐标和该信号的类型(触摸)确定对该知识对象(文本)目录所执行的操作(选择知识对象(文本)目录中的一个知识对象(文本)),然后所述处理器330将指示对选择的知识对象(文本)进行阅读。
此外,所述触控面板351可以采用电阻式、电容式、红外线以及表面声波等多种类型实现。
可选的,所述其他输入设备352可以但不限于包括物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
所述输出单元360可以用于输出用于用户交互或提供给用户的各种信息。可选的,所述输出单元360可以包括显示单元361,还可以包括震动马达(可用于提供震动反馈)等等。
其中,所述显示单元361可用于显示由用户输入的信息、提供给用户的信息以及所述电子设备300的各种菜单,所述显示单元361即为所述电子设备300的显示***,用于呈现界面,实现人机交互。例如,所述输入单元350接收到用户的需要人机交互的指令时,将所述指令传输给所述处理器330,然后所述处理器330根据所述指令通过所述显示单元 361显示知识对象(文本)(具体可以通过显示面板3611显示所述知识对象(文本)),从而使用户看到知识对象(文本),进而可以实现人机交互。
所述显示单元361可以包括显示面板3611,可选的,所述显示面板3611可以采用液晶显示屏(liquid crystal display,LCD)、有机发光二极管(organic light-emittingdiode,OLED) 等形式来配置。进一步地,所述触控面板351可覆盖所述显示面板3611,当所述触控面板 351检测到在其上或附近的触摸操作后,传送给所述处理器330以确定触摸事件的类型,随后所述处理器330根据触摸事件的类型在所述显示面板3611上提供相应的视觉输出。例如,当所述触控面板351检测用户在其上点击选择了一个知识对象(文本)后,传送给所述处理器330,所述处理器330确定触摸事件的类型为点击,在所述显示面板3611上显示被选择后对应的知识对象(文本)内容,比如被选择的知识对象(文本)中的图画等等,达到知识对象(文本)显示的目的。
虽然在图3中,所述触控面板351与所述显示面板3611是作为两个独立的部件来实现所述电子设备300的输入和输入功能,但是在某些实施例中,可以将所述触控面板351与所述显示面板3611集成而实现所述电子设备300的输入和输出功能。
所述处理器330是所述电子设备300的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或执行存储在所述存储器340内的软件程序和/或模块,以及调用存储在所述存储器340内的数据,执行所述电子设备300的各种功能和处理数据,从而实现基于所述电子设备300的多种业务。可选的,所述处理器330可包括一个或多个处理单元;具体的,所述处理器330可集成应用处理器和调制解调处理器,其中,所述应用处理器主要处理操作***、用户界面和应用程序等,所述调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到所述处理器330中。例如,在本申请中,所述处理器330中可以包括显示驱动单元,当所述处理器330生成知识对象(文本) 之后,可以通过所述显示驱动单元控制所述显示面板3611呈现所述知识对象(文本)内容。又例如,所述存储器340中存储了显示驱动程序,所述处理器330可以调用所述存储器340 中的驱动程序控制所述显示面板3611呈现知识对象(文本)内容。
所述电子设备300还包括给各个部件供电的所述电源320(比如电池),可选的,所述电源320可以通过电源管理***与所述处理器330逻辑相连,从而通过所述电源管理***实现管理充电、放电、以及功耗等功能。
需要说明的是,尽管图3中未示出,所述电子设备300还可以包括摄像头、蓝牙模块、传感器等,在此不再赘述。
问题解答***需要从现有的储备知识中搜寻相关知识,生成答案。因此在问题解答***中,知识的表示显得尤为重要。当前数字化时代,无论是互联网行业,还是传统企业在内部业务流程运作过程中积累了大量数据,这些数据既包括底层作业过程中产生的记录,也有各专业领域专家在实际工作中积累下来的经验和专业问题决策判断的规则等不同层次,不同表现形式的知识。现有的业务领域背景知识比较复杂,例如,不同企业的知识表示多样,缺少一种有效的知识表示方法将不同知识表示之间存在的联系融合在一起,充分发挥不同知识类型的作用。特别是在构建知识消费***(例如,问题解答***)时,由于专家积累的知识已经存在,这些知识大多数散落在各种文本中,各文本间的知识彼此缺少结构化的表示,很难建立基于内部逻辑的知识关联,防碍了知识的有效运用。例如,在问题解答***为用户查找答案时,很难将答案直接相关知识和业务背景知识综合考虑在内。而问题解答***在利用已有知识得到最终答案过程中,需要综合多个知识点,确定知识点之间的内在联系,最终才能给出准确答案。如果缺乏适当的知识表示方式,很难支撑知识获取,通过逻辑推断,确定知识点之间的内在联系,及推理给出准确答案的过程。
基于上述业务领域的专业知识类型多样,逻辑链条较长,一种知识表示方式无法表述目标领域知识全景的问题,本申请实施例提供一种问题解答方法,该问题解答方法基于目标领域知识相关的一个知识库,所述知识库需要预先建立好,可以预存在所述电子设备中,由所述电子设备进行数据处理,或者预存在与所述电子设备连接的服务器中,由所述服务器辅助进行数据处理。如图4B所示,本申请实施例中的目标领域知识库可以包括:概念图谱,事理图谱,谓词逻辑公式。如图4A所示,本申请提供一种目标领域知识库的生成方法,包括以下步骤:
步骤401:根据目标领域知识的知识类型,确定所述目标领域知识的概念图谱、事理图谱及谓词逻辑公式;
其中,所述概念图谱用于表示概念词间的静态关系;所述概念词用于表示所述目标领域知识的对象;所述事理图谱用于表示事件之间顺序和事件之间的事理关系;所述事件用于表示所述目标领域知识内用谓词表达的概念词间的关系或概念词间的动作;所述谓词逻辑公式中的谓词函数与所述事理图谱中的事件对应,所述谓词函数的参数与所述事件的槽位对应,所述谓词函数的参数值与事件的槽位的槽位值对应;所述谓词逻辑公式用于表示所述目标领域知识中的业务规则;
步骤402:根据所述概念图谱、所述事理图谱及所述谓词逻辑公式,生成目标领域知识库。
针对步骤401中,可以对目标领域知识根据知识类型,拆分成3个层级。其中,目标领域知识可以为业务领域知识,例如,财经经营核算领域,也可以为将专业领域、行业领域、公共领域或其他领域知识,在此不做限定。
第一层中,可以确定目标领域知识的概念实例和概念,以确定目标领域知识的概念词,进而,根据概念词间的关系,确定概念图谱,可以作为第一层知识表示的方法。概念词可以用于定义目标领域知识中的对象。
概念图谱:用于描述静态的对象,及概念或概念实例之间语义关系。例如,将专业领域,公共领域的知识表达成更接近人类认知世界的形式,提供了一种更好地组织、管理和理解目标领域内知识的能力。通过收集目标领域知识的问题解答***所涉及的范围内的相关语料,政策,文档等方式,确定概念图谱的目录、概念实例或术语。例如,从语料库中获取的问答库,语料库通过网络爬虫采集,结合已存储在关系数据库语料形成问答库;手工提取的本体库,本体库从语料中提取出来本体知识作为概念实例,包括目标领域内知识目录及分类,各类别的概念实例;以本体概念为基础,以结构化的形式建立的本体库,用于描述客观世界中概念实例及概念实例间的关系。术语库可以包括专有名词的定义描述,术语的同义词,属性。通过语料库、本体库、术语库等建立概念图谱,并抽象提炼出概念,概念可以为概念实例对应的根节点。概念实例作为概念的下游节点或叶子节点。概念图谱中,以概念实例为节点,以及概念实例关系为边,概念实例之间的关系可以包括:上下位关系或包含关系等。
例如,如图4C所示,概念图谱表示的概念实例,可以包括:人员,公司员工,外包员工。概念实例关系为人员包括公司员工,外包员工。客户,个人用户,机构公司。例如,概念图谱表示的概念实例,可以包括:项目支出,人员支出,设备支出。概念实例关系为:项目支出包括人员支出,设备支出。再比如,概念实例,比如“刘德华”,概念,比如“演员”,概念实例和概念之间可以为类属关系(isA关系),比如“刘德华isA演员”,概念与概念之间可以包括类属关系(subclassOf关系)。比如“电影演员isA演员”。
将目标领域知识通过事理图谱表示可以作为第二层知识的表示方式,用于描述单个或多个对象动作、行为等过程性动态知识。
一种可能的实施方式中,事理图谱中包括事件及事件间的事理关系。事件可以采用框架表示,框架可以包含一个或多个槽位,事件的槽位用于描述事件的要素,这些槽位属于的槽位类型可以对应概念图谱中的概念或概念实例。进而,可以通过链接到概念图谱获取事件的要素的语义关系。每个事件节点都以该事件的框架表示,槽位的槽位值与该槽位的槽位类型相关。所述事件的槽位的槽位类型对应所述概念图谱中的至少一个概念词。其中,对应的至少一个概念词可以为在所述概念图谱中匹配的概念实例对应的上游节点的概念;或者,在所述概念图谱中匹配的概念。
另外,事件还可以包括触发词,触发词可以用于标识事件发生时对应的谓词,进而,可以用于匹配事件。
如图4D所示,“合同交付事件”,合同交付事件的触发词为合同交付。有交付人,被交付方,交付内容,这几大要素组成,称为事件框架的槽位。其槽位的值也有槽位类型的限制,比如交付人应该填充值的槽位类型为人员;概念实例可以为员工、公司员工、外包员工等。被交付方填充的槽位值对应的槽位类型为客户;对应的概念实例为个人用户、机构公司;交付内容对应的槽位类型可以包括合同、站点;交付内容填充的槽位值对应的概念实例可以为具体的合同内容、合同交付的地点。
再比如,定义产生支出事件,产生支出的触发词为提供劳务,事件框架的槽位包括主体和支出内容,主体槽位对应的槽位类型可以为合同交付活动,主体槽位对应的槽位值可以为具体的合同交付的概念实例。支出内容槽位对应的槽位类型可以为活动支出、人员支出。支出内容槽位对应的槽位值可以包括项目支出、人员支出、设备支出等。
通过事件槽位的槽位类型与概念词建立事件和概念词间连接,以建立概念图谱与事理图谱之间的关系。这一关系的建立,会为后续事件识别,知识推理提供知识之间的相互印证和校验。
事理图谱:事理图谱以事件为载体描述过程性动态知识。研究对象的是组成事件以及事件及其之间的关系。事件由多个要素组成,是比概念粒度更大的知识单元。
事理图谱侧重描述目标领域知识中的事件及事件间的事理关系。事理图谱中的节点表示事件,事理图谱中的边表示事件之间发生的顺序,以及事件之间的事理关系。通过连接事件的关系作为边,进而形成事理图谱。目前,事理图谱的建立中主要还是以人工为主,用于确定事件之间的事理关系,事理关系可以有顺序关系、因果关系、条件关系、蕴含关系等。例如,事理图谱可以用于表示财经事件及发生顺序。如图5所示,合同交付事件与产生支出事件直接为因果事理关系。
事理关系可以表示以下几种:
本申请实施例中,可以通过谓词逻辑公式表示目标领域知识的业务规则,可以作为目标领域知识的第三层知识表示方式。在表达专业领域复杂的业务规则时,涉及到多个事件,多个事件间的长路径之间的蕴含关系,仅通过事理图谱无法确定,本申请实施例中,通过谓词逻辑公式表述业务规则,以建立多个事件间的长路径之间的蕴含关系所涉及的业务规则。谓词逻辑公式的运算为形式推理方法,不依赖于具体领域,具有较大通用性,有较强的逻辑表达能力。
谓词逻辑:数理逻辑中一种符号形式***。谓词逻辑把简单命题分为其主项,谓项,和量项并借以研究命题的形式结构及其推理的规律与规则的逻辑验算理论。谓词逻辑在描述领域知识的逻辑关系方面具备有较强的逻辑表达能力。适合应用在通过已知条件,选择适配规则做知识推理的场景。一般过程包括:用户将已知条件作为事实输入,通过以谓词逻辑公式表示的包含领域知识规则库进行推理,得到答案的过程。例如,一些专家***,比如医疗诊断,财务投资决策等有很多基于谓词逻辑完成的推断。再比如,还有基于谓词逻辑公式的数学题答题质量评判的***,分析学生在做数学证明题中过程中推理的正确性。但是,由于在问题解答***中,用户问题语言表达比较灵活,而谓词逻辑表达的前置条件比较固定,用户问题对应的语言很难直接和谓词逻辑公式表达的规则关联上,现有的问题解答***无法基于现有的谓词逻辑公式,确定问题的答案。
本申请实施例中,将目标领域知识之间的业务规则通过谓词逻辑公式来表示。谓词逻辑公式中的谓词函数用于表示动作,与实理图谱的事件对应;谓词逻辑公式中的谓词函数的参数用于表示对象间静态关系,可以与概念图谱的概念实例或概念对应。
谓词逻辑公式:以概念图谱定义的概念实例或概念,和事理图谱定义的事件为基础,通过谓词逻辑公式表达领域知识中多个事件间的业务规则。
谓词逻辑公式可以分为规则头和规则体两部分,规则体为前置条件,也称为事实FACT,规则头为基于事实FACT推导出的结论。这两部分都由谓词函数构成。本申请实施例中,以一阶谓词逻辑公式为例,表示专业领域的业务规则。
一阶谓词逻辑公式的基本要素可以包括:标点符号,括号,逻辑运算符,常量符号集,量词,n元函数符号集,n元谓词符号集。
举例来说,用谓词逻辑公式表示---父亲的父亲是祖父可以表示为:
谓词函数:Fatherof(X,Y),Fatherof(Y,Z),Grandfatherof(X,Z)
逻辑运算符:Λ,表示合取,即谓词函数Fatherof(X,Y)和谓词函数Fatherof(Y,Z)同时发生时,可以推出谓词函数Grandfatherof(X,Z)。
例如:财经领域的经营核算规则中有文本描述:与服务合同交付相关的活动或人员发生的支出应当记入服务成本。这服务成本定义的业务规则里,包含了3个层次的知识,最底层是领域的概念实例,包括,活动,人员,服务成本。基于概念实例之上的事件,包括合同交付事件,产生支出事件,属于服务成本事件,属于活动支出事件,属于人员支出事件。在概念实例和事件之上建立的业务规则,其中,业务规则包括的规则体为:服务合同交付,产生支出,属于活动支出,属于人员支出;业务规则包括的规则头为属于服务成本。此时,谓词函数可以包括:产生支出(X,Y),合同交付(X),属于活动支出(Y),属于人员支出(Y),属于服务成本(Y)。其中,X可以为人员或活动,Y为支出对应的值。此时,谓词逻辑公式可以表示为:
ЭxЭy(产生支出(X,Y)Λ合同交付(X)Λ(属于活动支出(Y)∨属于人员支出(Y)))->属于服务成本(Y)。
其中,ЭxЭy表示存在x存在y。逻辑运算符,例如,∨表示析取(两个或多个事件中只要有一个事件发生即可就是析取),Λ表示合取(两个或多个事件必须同时发生就是合取),蕴含,或否定等逻辑运算符。多个谓词函数通过逻辑运算符进行连接,表达了事件之间的关联关系,蕴含关系,表达了由已知事件推导出新的事件,或者推导出新的事件间的关系。
运用谓词逻辑公式进行运算时,还可以根据形式演绎推理常用的性质和定律,生成谓词逻辑公式,包括:
狄.摩根定律
分配律
交换律
结合律
量词分配
逆否定律
量词否定
约束变量的虚元性(约束变量名不影响)
谓词逻辑公式是基于概念词和事件的知识表示基础上表达得出的业务规则间的可以进行逻辑运算的知识表示方法。谓词逻辑公式中的谓词函数,对应事件,谓词函数中的参数对应事件的槽位,谓词函数的参数值类型对应概念图谱中的概念实例或概念。谓词逻辑公式作为规则的知识表示,通过谓词函数与事件关联,谓词函数参数与事件槽位对应,实现谓词逻辑的表示与概念图谱和事理图谱之间的融合。
结合概念图谱,事理图谱,谓词逻辑公式三种知识表示方式,有效提炼出3个层级的知识表示方法,利用在概念图谱,事理图谱,谓词逻辑公式表述目标领域知识时的优点,以提高表达目标领域知识的完整性。采用谓词逻辑公式的方式来表达业务规则间的逻辑关系,实现业务规则的逻辑运算,以实现业务规则间的知识推理。并且通过概念图谱,事理图谱的知识表示融合,建立知识点之间的内在逻辑联系,以建立目标领域知识中概念词、事件和业务规则间的关系,支撑知识之间的推理,解决复杂的目标领域知识中的不同知识表达形式。通过建立概念图谱,事理图谱,谓词逻辑公式三种知识表示方式及其关系,实现从灵活的语言中提取不同的知识,以对知识点提炼泛化,有助于实现知识间的推理,进而有助于支撑问题解答***中难度较高的解释型问题的回答。
示例一
本申请实施例提供一种在财经经营核算规则领域的知识表示方式,经营核算规则领域主要是对公司主要的经营指标定义核算规则或核算口径。本申请实施使用的硬件平台可以是通用的PC计算机,软件可以使用Python3.5进行实现,目标领域知识库的构建的步骤可以包括:
确定三类知识表示方式:概念词,事件,谓词逻辑公式。概念词包括概念实例或概念,是目标领域知识中的对象的抽象,表达静态知识。事件描述对象的行为,动作或状态,表达动态的知识。谓词逻辑公式是对目标领域知识中的规则(例如,目标领域知识内所遵循的规范和准则)的抽象描述,谓词逻辑公式可以由规则头和规则体组成,通过规则体的逻辑运算可以推导出规则头,以表达目标领域知识内多个事件间的业务规则,实现显式的表示知识之间的蕴含关系。
(一)图谱的构建。
提炼收集目标领域知识内的概念词,梳理概念词之间的关系,形成概念图谱。以服务成本的定义为例。
概念实例可以包括:服务成本,与服务成本相关的概念包括:服务成本差异、结算成本、人力成本、服务成本的定义、核算范围、结算规则、其他服务成本。其中,核算范围包括:归属方式,包括:按部门、按科目、按科目和产品、按科目和项目。其中,结算规则包括:交付领域;交付领域包括:结算场景。
与人力成本相关的概念包括:人力成本的定义、核算范围、人力成本类型、结算人力成本、项目吸收成本。
直接分摊规则可以包括:交付项目成本、服务部门成本等场景下的成本;交付项目成本可以包括服务产品;例如,服务产品可以包括服务产品3,服务产品4,服务产品5。
(二)事理图谱
提炼收集目标领域知识内事件,梳理事件之间的关系,形成事理图谱。
如图5所示,事理图谱可以包括,合同交付事件、产生支出事件、服务成本确认事件、人力成本确认事件、工单结算事件、结算成本确认事件。
其中,服务成本确认事件的触发词包括:是/属于,服务成本,服务成本确认事件的槽位包括主语和宾语,服务成本确认事件中的主语的槽位类型包括:劳务支出或人员支出。服务成本确认事件中的宾语的槽位类型包括:服务成本。
人力成本确认事件的触发词包括:是/属于,人力成本,人力成本确认事件的槽位包括主语和宾语,人力成本确认事件中的主语的槽位类型包括:人员支出。人力成本确认事件中的宾语的槽位类型包括:人力成本。
结算成本确认事件的触发词包括:是/属于,结算成本,结算成本确认事件的槽位包括主语和宾语,人力成本确认事件中的主语的槽位类型包括:工单结算。人力成本确认事件中的宾语的槽位类型包括:结算成本。
工单结算事件的触发词包括:工单结算,工单结算事件的槽位包括结算成本,工单结算事件的槽位对应的槽位类型可以为:
其中,合同交付事件与产生支出事件为因果事理关系,产生支出事件与服务成本确认事件为条件事理关系,产生支出事件与人力成本确认事件为条件事理关系,合同交付事件与工单结算事件为因果事理关系,工单结算事件与结算成本确认事件为条件事理关系。
(三)谓词逻辑公式:
针对概念图谱,及对应的事件,可以查找涉及的业务规则,提炼收集目标领域知识中的业务规则(例如,核算规则),并根据谓词逻辑,生成谓词逻辑公式集。谓词逻辑公式对应的业务规则可以包括:服务成本规则,人力成本规则,结算成本规则,结算成本差异规则。服务成本规则的规则类型为业务指引。人力成本规则、结算成本规则、服务成本差异规则的规则类型为核算指引。下面以示例1-示例4说明上述4种业务规则对应的谓词逻辑公式的生成方法。
示例1
具体的,服务成本规则,包括:与服务合同交付直接相关的活动或人员所发生的支出应当记入服务成本,包括直接从事服务及直接管理和支持这些从事服务的人员所发生的支出。
服务成本规则中,可以识别出的事件包括:产生支出事件、合同交付事件、服务成本确认事件、可以识别出的概念实例包括:活动、人员。因此,服务成本规则可以表示为:ЭxЭy (产生支出(X,Y)Λ合同交付(X)Λ(活动支出(Y)∨人员支出(Y)))->服务成本(Y)
根据谓词逻辑的生成规则,确定服务成本规则包括的规则头为服务成本确认事件。规则体包括:产生支出事件、合同交付事件、属于活动支出事件、属于人员支出事件。对应的谓词函数可以包括:
产生支出事件对应谓词函数:产生支出(主体=X,内容=Y)
合同交付事件对应的谓词函数:合同交付(交付人=X)
将可以识别的概念通过事件的槽位的槽位类型进行匹配,确定识别的概念对应的事件,进而,根据概念图谱或事理图谱中定义的概念,确定谓词逻辑中包含的事件实例(具体的知识)。
其中,活动支出对应的事件为属于活动支出事件,人员支出对应的事件为属于人员支出事件,因此,可以根据概念对应的事件,确定概念对应的事件实例。例如,属于活动支出为事件,采购原料发生的费用为属于活动支出事件对应的事件实例。
属于活动支出事件对应的谓词函数:属于活动支出(Y)
属于人员支出事件对应的谓词函数:属于人员支出(Y)
属于服务成本事件对应的谓词函数:属于服务成本(Y)
因此,服务成本规则对应的谓词逻辑公式可以表示为:ЭxЭy(产生支出(主体=X,内容=Y)Λ合同交付(交付人=X)Λ(属于活动支出(Y)∨属于人员支出(Y)))->属于服务成本(Y)
示例2
人力成本规则,包括主要指从事交付活动的公司自有和外包人力的支出,可以包括工资、奖金、社会保险、水电气费、通讯费、差旅费等。
人力成本规则中,可以识别出的事件包括:产生支出事件、合同交付事件、人力成本确认事件、可以识别出的概念包括:公司自有人力、外包人力,支出内容:工资、奖金、社会保险、水电气费、通讯费、差旅费等。因此,人力成本规则对应的谓词逻辑公式可以表示为:ЭxЭy(产生支出(X,Y)Λ合同交付(X)Λ(公司人员支出(Y)∨外包人员支出(Y))) ->人力成本(Y)
人力成本规则中,规则头为服务成本确认事件。规则体包括:产生支出事件、合同交付事件、属于公司人员支出事件、属于外包人员支出事件。对应的谓词函数可以包括:
产生支出事件实例对应谓词函数:产生支出(主体=X,内容=Y)
合同交付事件实例对应的谓词函数:合同交付(交付人=X)
属于人力成本事件实例对应的谓词函数:属于人力成本支出(Y)
将可以识别的概念通过事件的槽位的槽位类型进行匹配,确定识别的概念实例或概念对应的事件,进而,根据概念图谱或事理图谱中定义的概念实例或概念,确定谓词逻辑中包含的事件实例(具体的知识)。
其中,公司人员支出对应的事件为:属于人员支出事件;外包人员支出对应的事件为:属于人员支出事件,进而可以根据概念确定对应的事件实例。
属于人员支出事件的事件实例对应的谓词函数:属于公司人员支出(Y)
属于人员支出事件的事件实例对应的谓词函数:属于外包人员支出(Y)
因此,服务成本规则对应的谓词逻辑公式可以表示为:ЭxЭy(产生支出(主体=X,内容=Y)Λ合同交付(交付人=X)Λ(属于公司人员支出(Y)∨属于外包人员支出(Y)))->属于人力成本(Y)
示例3
结算成本规则,包括:全球服务交付共享中心部门下的工单结算成本等。
结算成本规则中,可以识别出的事件包括:工单结算成本事件、服务交付发生事件、结算成本确认事件;可以识别出的概念实例包括:服务交付共享中心部门,结算、服务成本。因此,结算成本规则可以表示为:Эx工单结算成本(X)Λ服务交付发生(X)->结算成本(X)
结算成本规则中,规则头为结算成本确认事件。规则体包括:工单结算成本事件、服务交付事件。对应的谓词函数可以包括:
工单结算成本事件实例对应谓词函数:工单结算成本(X)
将可以识别的概念实例通过事件的槽位的槽位类型进行匹配,确定识别的概念实例对应的事件,进而,根据概念图谱或事理图谱中定义的概念实例或概念,确定谓词逻辑中包含的事件实例(具体的知识)。
服务交付发生事件对应的事件实例的谓词函数:服务交付发生(X)
属于结算成本事件实例对应的谓词函数:属于结算成本(Y)
示例4
服务成本差异规则,包括:指人力、服务等资源部门中,未通过直接归集或内部结算方式(如填报工时)吸收到交付项目的服务成本。
服务成本差异规则中,可以识别的事件包括:服务成本确认事件,服务成本差异事件,归集到交付项目事件。可以识别的概念包括:费用直接归集到交付项目,内部结算到交付项目。因此,服务成本差异规则可以表示为:Эy服务成本(Y)Λ(┐(费用直接归集到交付项目(Y))∨┐(内部结算到交付项目(Y)))->服务成本差异(Y)
其中,┐表示否定关系,Э表示存在。
服务成本事件实例对应谓词函数:服务成本(Y)
服务成本差异实例对应谓词函数:服务成本差异(Y)
将可以识别的概念通过事件的槽位的槽位类型进行匹配,确定识别的概念对应的事件,进而,根据概念图谱或事理图谱中定义的概念,确定谓词逻辑中包含的事件实例(具体的知识)。
此处,费用直接归集到交付项目对应的事件可以为:归集到交付项目事件
内部结算到交付项目对应的事件可以为:归集到交付项目事件
因此,对应的事件实例的谓词函数为:费用直接归集到交付项目(Y),内部结算到交付项目(Y)
因此,服务成本差异规则对应的谓词逻辑公式可以表示为:Эy服务成本(Y)Λ(┐(费用直接归集到交付项目(Y))∨┐(内部结算到交付项目(Y)))->服务成本差异(Y)
目标领域中其他谓词逻辑公式的生成方法可以参考上述实施例,在此不再赘述。
基于本申请提供的知识库,如图6所示,本申请实施例提供一种问题解答方法,可以包括以下交互过程:用户向电子设备提问,电子设备回答用户的问题。当然,还有上述过程中用户和电子设备之间的其他语音交互等,在此不做限定。具体可以包括以下步骤:
步骤601:从所述问题中确定出N个分词短语;所述N为正整数;
步骤602:从事理图谱中确定出所述N个分词短语触发的M个事件,并根据所述N个分词短语中与概念图谱匹配的K个分词短语确定出所述M个事件的槽位的槽位值;
步骤603:根据预设的事件与谓词逻辑公式的对应关系,确定出所述问题的咨询对象对应的谓词逻辑公式;其中,谓词逻辑公式中的谓词函数与事理图谱中的事件对应,谓词函数的参数与事件的槽位对应,谓词函数的参数值与事件的槽位的槽位值对应;所述咨询对象对应的谓词逻辑公式是根据所述咨询对象对应的规则得到的;
步骤604:根据所述M个事件,以及所述M个事件的槽位的槽位值,对所述谓词逻辑公式进行运算;
步骤605:根据所述谓词逻辑公式的运算结果,确定所述问题的答案。
针对用户问题的问法比较灵活,专业领域的问题解答***在面对用户提出解释型问题时,目标领域知识库中没有现成的答案即无法通过检索的方式确定问题的答案,尤其是在领域知识中包括有更为复杂的业务规则的逻辑关系时,比如多个前置条件,问题与答案间的推理路径较长时,通过现有技术中检索的方案是无法获得的。本申请实施例中,通过上述方法,根据用户输入的问题,从目标领域知识库中调用预设的咨询对象与谓词逻辑公式的对应关系,确定所述问题的咨询对象对应的谓词逻辑公式;并根据事理图谱和概念图谱,对谓词逻辑公式中的谓词函数的参数进行赋值,并对所述谓词逻辑公式进行运算,经过推理的方法,可以推导出所述问题的答案。例如,一种可能的场景中,在电子设备(例如,财经问答机器人)接收到用户(财经业务人员)提出的解释型问题时,利用目标领域知识库(例如,目标领域知识可以为会计政策发文的相关知识形成的目标领域知识库)为用户提供答案。
首先,问题解答***可以从用户侧采集的问题中进行文本解析,完成语义理解(可以包括:分词短语识别,词句法分析,概念词识别,事件识别);将语义理解的结果作为输入,进一步识别出用户的意图:包括分析出用户提出的问题的咨询对象,问题的类型等信息,以更全面的理解用户的问题,有助于确定咨询对象对应的谓词逻辑公式,进而实现对谓词逻辑公式的运算,以得到问题的解答。
如图7A所示,问题解答***中,可以包括以下模块:预处理模块、概念词识别模块、事件识别模块、意图识别模块、事件的槽位值确定模块、谓词逻辑公式筛选模块、谓词逻辑公式运算模块、运算结果输出模块、答案生成模块。
针对步骤601,获得N个分词短语的步骤可以通过文本预处理模块执行。文本预处理模块用于完成对问题的分词,去除问题中的停用词,及文本中分词确定的分词短语的词性标注等过程,以获得问题中的N个分词短语。
对用户的问题进行预处理,包括:对问题进行分词,去除问题中的停用词等预处理方式。其中,停用词是指为节省存储空间和提高搜索效率,搜索引擎在索引页面或处理搜索请求时会自动忽略某些字或词,例如,语气助词、副词、介词、连接词等,通常自身并无明确的意义的词。在分词过程中,通过加载新词词典,将文本与新词词典中的短语进行匹配,确定分词短语。其中,新词词典包括了从大量领域语料中通过新词发现的方式,确定出的文档中大量频繁出现的固定搭配的短语。
例如,用户输入的问题包括n个原子词,W1,,W2,W3,,W4,,W5,,W6,…,Wn-1,Wn。根据问题中的n个原子词及n个原子词间的顺序关系,与新词词典中的短语进行匹配,可以确定出W1,,W2为固定搭配的新词短语,因此,可以将n个原子词分成k个短语,如下公式所示:
W1,,W2,W3,,W4,,W5,,W6,…,Wn-1,Wn=>(W1,,W2),W3,,W4,,(W5,,W6,…), Wn-1,Wn=S1,S2,S3,.....Sk,
新词发现的方法可以参考现有技术,在此不作赘述。
进一步的,可以通过概念图谱的概念词识别模块对N个分词短语进行识别,用于确定问题中分词短语关联的概念或概念实例。
在目标领域知识库的概念图谱中,包括目标领域知识对应的语料中出现的概念实例或概念,以及概念实例或概念之间的上下位关系,包含关系,相关关系等关系。通过分词短语识别过程,通过对分词短语本体和概念图谱中的概念实例或概念匹配,确定分词短语在概念图谱中关联的一个概念词。
具体的,可以根据概念图谱中概念实例或概念,进行模糊匹配和相似度计算,完成概念词识别。通过概念词识别算法,将用户输入的分词短语集合S={S1,S2,S3,.....SN,}中关联的概念或概念实例识别出来{Sk->Cj,},建立与概念图谱之间的链接。相似度计算可以通过以下公式确定:
方式一
其中,Si∈S,S为分词短语集合,Cj∈C,C为概念图谱中的概念实例或概念。Ldist表示字符串Si,与Cj的编辑距离。|Si|,|Ci|分别表示字符串Si与Ci的长度。1≦i,j≦N。N,i,j为正整数。
方式二
Similarity2(Si,Cj)=COS(word2vec(Si),word2vec(Cj))
其中,word2vec(Si)表示词语Si对应的词向量表示。COS(word2vec(Si),word2vec(Cj))表示Si与Cj的余弦相似度。词向量可以通过领域专业语料训练。词向量训练中分词短语粒度保持原子级语义最小粒度。其中,Si=W1,W2…Wn由多个原子词组成,此时对应的词向量可以表示为:
方式三
Similarity(Si,Cj)=W1×Similarity1(Si,Cj)+(1-W1)×Similarity2(Si,Cj)
结合方式一和方式二中的相似度,进行加权平均,确定出分词短语对应的概念实例或概念,还通过概念图谱找到概念实例的上游节点的概念,作为该分词短语相关的概念,用于匹配该分词短语相关的事件。
例如,用户问句“合同交付过程中张三产生的支出属于服务成本吗”出现“张三”的分词短语,而张三在概念图谱中可以根据上述相似度算法,找到张三这个概念实例对应的节点,进而通过概念图谱找到该概念实例对应的上游节点的概念,确定“张三”是“公司员工”这个概念的概念实例,进而完成了分词短语“张三”的概念词识别。
针对步骤602,从事理图谱中确定出所述N个分词短语触发的M个事件,其中,1≦M≦ N。M为正整数。可以通过事件识别模块实现,用于根据触发词语义相似度计算,结合槽位模式匹配计算,完成事件识别。将专业领域语料中出现的事件,事件之间的顺序关系存储在事理图谱中。每类事件采用框架定义,框架中包含描述事件的多个槽位,槽位的值类型是某个槽位类型,比如合同交付事件,有个交付人的槽位,这个槽位的值对应该是员工这个槽位类型。
一种可能的设计,针对所述M个事件中的每个事件,所述事件满足以下条件:所述N个分词短语中存在一个分词短语与所述事件的触发词匹配,且所述N个分词短语中存在一个分词短语,该分词短语在概念图谱中关联的一个概念实例与所述事件的第一槽位的槽位类型匹配,所述第一槽位为所述事件中的一个槽位。
举例来说,可以包括以下步骤:
步骤6021:在概念图谱中以分词短语关联到的概念词Cj(此时的j的取值范围是根据概念图谱中,与该概念词关联的概念词的个数确定的)为起点,沿着上游节点方向(isA关系的边)遍历概念图谱,找到与该分词短语关联的事件中第一槽位的槽位类型对应的概念实例或概念,可以包括事件中的槽位对应的槽位值及槽位对应的槽位类型。
如图7B所示,根据S1,S2,Sl对应的概念图谱上的节点C11,C41,Cl1,沿isA关系,查找对应的事件中第一槽位的槽位类型对应的概念实例,此时,节点C11对应C1,C1对应事件Event1中的元素Elment1的槽位类型对应的概念实例。节点C41对应C2,C2对应事件 Event1中的元素Elment2的槽位类型对应的概念实例。节点Cl1对应Cl,Cl对应事件Event2 中的元素Elment2的槽位类型对应的概念实例。节点Cl1对应C51,C51对应事件Event2中的元素Elment1的槽位类型对应的概念实例。
需要说明的是,概念词识别在事件识别的过程中也可以用于辅助事件识别。根据合同交付事件的框架,确定交付人的槽位对应的槽位值类型与分词短语“公司员工”符合,根据公司员工对应的合同交付事件,确认是否有分词短语与合同交付事件对应的触发词匹配。从而增大了合同交付事件确认的概率。
步骤6022:从分词短语集合S中剔除掉在概念图谱中找到了对应关联的概念实例或概念的K个分词短语,形成第一分词短语集合第一分词短语集合中包括N-K个分词短语,用于匹配事件的触发词。进而可以避免概念实例或概念对应的分词短语对事件识别的干扰,减少事件识别的复杂度。
计算分词短语与事件中的触发词相似度的方式与概念词识别的相似度方式类似,可以参考上述概念词识别中相似度计算的方法,在此不再赘述。其公式可以表示为:
其中,Tj为事件j中的触发词。上述分词短语与事件中的触发词相似度的公式中,j小于或等于N-K,j为正整数。
步骤6024:确定触发词Tk所在的事件k为分词短语集合S中识别出的事件。1≦k≦N-K, k为正整数。
进一步的,可以将在概念图谱中关联的一个概念实例与所述事件的第一槽位的槽位类型匹配的分词短语,作为所述事件的所述第一槽位的槽位值,即在事件k中通过步骤6032 建立的概念实例与分词短语Si的关联关系,并且,该概念实例对应匹配事件的所述第一槽位的槽位值的槽位类型的概念实例。因此,Si即为事件k在识别出的事件中第一槽位的槽位值,进而确定事件k的事件实例。
如图7B所示,可以确定事件Event1和事件Event2,其中,事件Event1中的槽位包括: C1和C2,槽位的值可以填充为:S1和S2;事件Event2中的元素包括:C51和Cl,槽位的值可以填充为:S2和Sl。
结合上述例子,合同交付事件的事件实例中,“交付人”槽位填值为“张三”。
进一步的,可以通过循环执行步骤6031-步骤6035,确定事件识别和事件槽位填充后的事件实例。
例如,将合同交付事件填充槽位后生成的事件实例,作为谓词逻辑公式中的谓词函数,例如:合同交付事件实例对应的谓词函数为:合同交付(X=张三),产生支出事件实例对应的谓词函数为:产生支出(X=张三,Y=A交付合同)。上述事件实例可以作为后续谓词逻辑公式的事实输入。
在步骤603中,可以通过意图识别模块确定问题的咨询对象。意图识别模块还可以用于确定用户的问题的类型,以便有针对性的给出答案。问题的类型可以通过分类模型确定,该分类模型可以用于识别出问题的类型,本申请实施例中,主要将问题分为两种类型。可以包括:判断型问题,用于判断事件的真伪;还可以包括解释型问题,用于解释事件成立的原因。问题的咨询对象可以采用序列标注的方式建立分类模型进行预测,用于对问题的咨询对象进行识别。例如“合同交付过程中张三产生的支出属于服务成本吗”属于判断问题类型,“为什么合同交付过程中张三产生的支出属于服务成本呢?”属于解释问题类型。其问题的咨询对象都是服务成本确认事件。
具体的,可以通过问题中的N个分词短语及N个分词短语中识别出的M个事件,N个分词短语中关联的概念词,对问题进行标注。利用标注后的问题作为分类模型的输入,确定问题的类型及问题的咨询对象。
如图8A所示,为问题类型判断的分类模型训练,分类模型可以采用组合的长短期记忆网络BI-LSTM模型。其中,BI-LSTM模型为前向的长短期记忆网络LSTM与后向的长短期记忆网络LSTM结合成的分类模型。具体的训练过程可以包括:
步骤801:对N个分词短语进行预处理。
根据N个分词短语中确定的M个事件及关联的概念实例或概念,将N个分词短语中关联的事件的分词短语替换为事件触发词标准名称,例如,将S2替换为E2,将Sk替换为Em。将N个分词短语中关联的概念实例或概念的分词短语替换为概念图谱中概念的标准名。例如,将S1替换为C1,将S4替换为Cl。替换后的分词短语集合可以表示为:
C1,E2,S3,,..Cl,...,Em
进一步的,可以对替换后的分词短语集合进行标注。例如,标注后的分词短语包括:合同交付(事件),服务成本(事件),张三(人员),产生支出(事件)。
步骤802:将预处理后的分词短语集合作为分类模型的训练样本。
步骤803:将预处理后的分词短语转换为词向量矩阵.在词向量矩阵最后拼接一个事件标志位,作为分类模型的输入,输入到分类模型进行训练。其中,事件标志位用于提供事件的信息,以更好的支持对问题的文本进行序列标注。
如图8B所示,标注待回答问题的咨询对象的模型训练,分类模型采用的组合的长短期记忆网络BI-LSTM+条件随机场CRF模型,用于确定问题的类型的同时,确定问题的咨询对象。具体的训练过程可以参考图8A中的方式,在此不再赘述。
在步骤603中,当概念词识别和事件识别完成后,可以通过事件的槽位值确定模块,将问题中关联的概念实例与识别的事件中的槽位值类型匹配,可将匹配的概念实例对应的分词短语作为槽位的槽位值,进而实现事件的实例化,为后续生成对应的谓词逻辑公式做准备。
而事件识别,概念词识别同时也可以作为所述问题的咨询对象对应的谓词逻辑公式的实例化。事件与谓词逻辑公式中的谓词函数对应,事件中槽位的槽位值与谓词函数中的参数值对应。
例如,合同交付事件匹配到谓词逻辑公式中的合同交付谓词函数,交付人与谓词函数的参数匹配后,将槽位值对应谓词函数的参数值。
例如,将合同交付事件填充至槽位的槽位值后生成的事件实例,作为谓词逻辑公式中的谓词函数,例如:合同交付事件实例对应的谓词函数为:合同交付(X=张三),产生支出事件实例对应的谓词函数为:产生支出(X=张三,Y=A交付合同),属于服务成本(张三的支出)。
综合分词短语以及概念图谱中概念间的关系,确定所述问题的咨询对象对应的谓词逻辑公式,进而,对谓词逻辑公式中谓词函数的匹配和参数赋值,有助于后续谓词逻辑公式的运算,以确定问题的答案。
例如,根据概念图谱中,张三属于外包员工,外包员工属于项目人员。
可以确定属于项目人员事件对应的谓词函数:属于项目人员(张三);
属于人员支出事件对应的谓词函数:属于人员支出(张三)。
针对步骤603,可以通过意图识别筛选所述问题的咨询对象对应的谓词逻辑公式,并对筛选后的谓词逻辑公式中的参数赋值,以确定所述问题的咨询对象对应的谓词逻辑公式。如图9所示,通过事件与谓词逻辑公式库中的谓词函数链接,筛选出与问题的咨询对象相关的谓词逻辑公式,即确定与问题的咨询对象相关的规则头的谓词逻辑公式。具体的步骤包括:
步骤6031:确定问题咨询对象对应的事件Ei。其中,i小于或等于M,大于或等于1。
如图9所示,通过意图识别确定问题的咨询对象为事件Event2。结合上述例子,可以确定问题的咨询对象为“属于服务成本”。
步骤6032:遍历识别的事件Ei链接到谓词逻辑公式Rj的规则头。其中,谓词逻辑公式 Rj中的j小于或等于Pi,大于或等于1。Pi表示与事件Ei相关的谓词逻辑公式的总数。
例如,如图9所示,通过问题的咨询对象对应的事件Event2,确定规则头为事件Event2 的谓词逻辑公式。例如,Event2与R4的规则头head有链接,则确定事件Event2关联的谓词逻辑公式为R4。
结合上述例子,可以确定属于服务成本对应的谓词逻辑公式为:ЭxЭy(产生支出(主体=X,内容=Y)Λ合同交付(交付人=X)Λ(属于活动支出(Y)∨属于人员支出(Y)))->属于服务成本(Y)
步骤6033:以Rj为起点,遍历Rj的前置规则。
如图9所示,根据事件Event2关联的谓词逻辑公式为R4,确定前置规则,例如,R1,R2,R3。
结合上述例子,属于服务成本对应的谓词逻辑公式中的前置规则包括:属于人员支出对应的谓词逻辑公式。进而,可以确定属于服务成本成立的推理链条包括:属于人员支出对应的谓词逻辑公式->属于服务成本对应的谓词逻辑公式。
步骤6024:谓词逻辑公式集合{Rx},可以作为推导问题的咨询对象Ei的推理链条。
其中,x小于或等于P,大于或等于1。P表示谓词逻辑公式集合中谓词逻辑公式R的总数。
谓词逻辑公式中包括一个或多个谓词函数;谓词逻辑公式Rx中存在一个谓词函数,所述谓词函数为另一个谓词逻辑公式的运算结果。
例如,谓词逻辑公式Rx的规则头的结论可以作为下一个的谓词逻辑公式中的事实FACT,用于推导出该谓词逻辑公式的结论,推导方向可以根据谓词逻辑公式中的运算规则确定。
如图9所示,可以确定Event2成立的推理链条为R1->R3->R4;或,R2->R3->R4。即可以根据R1的规则头的结论可以作为谓词逻辑公式R3中的事实FACT,用于推导出谓词逻辑公式R3的结论,谓词逻辑公式R3的结论可以进一步作为谓词逻辑公式R4中的事实FACT,用于推导出谓词逻辑公式R4的结论。可以根据R2的规则头的结论可以作为谓词逻辑公式 R3中的事实FACT,用于推导出谓词逻辑公式R3的结论,谓词逻辑公式R3的结论可以进一步作为谓词逻辑公式R4中的事实FACT,用于推导出谓词逻辑公式R4的结论。
步骤6025:通过谓词函数的参数赋值模块对谓词逻辑公式{Rx}中的谓词函数的参数赋值。
在谓词逻辑公式库中,搜索满足前置条件的谓词逻辑公式。并根据事件识别及槽位填充的槽位值,对对应的谓词逻辑公式的参数赋值。例如,结合上述例子,可以确定出1条逻辑链条:属于人员支出对应的谓词逻辑公式->属于服务成本对应的谓词逻辑公式。包括2条谓词逻辑公式:
服务成本的谓词逻辑公式:ЭxЭy(产生支出(主体=X,内容=Y)Λ合同交付(交付人=X)Λ(属于活动支出(Y)∨属于人员支出(Y)))->属于服务成本(Y)
人员支出的谓词逻辑公式:Эx(产生支出(主体=X)Λ属于项目人员(交付人=X))-> 属于人员支出(X)
链条中的每个谓词逻辑公式中的谓词函数,赋值的结果可以表示为:
产生支出(X=张三,Y=A交付合同)
合同交付(Y=A合同交付)
属于项目人员(张三)
属于服务成本(张三的支出)
属于人员支出(张三)
在步骤604中,将赋值后的谓词逻辑公式送入谓词逻辑公式运算模块,以对谓词逻辑公式运算,完成问题到答案的知识推理,并通过运算结果输出模块,获得谓词逻辑公式运算的结果。
一种可能的设计,包括:针对所述谓词逻辑公式中的每个谓词函数,执行:若所述谓词函数对应的事件为第一事件,所述第一事件为所述M个事件中的一个事件,且所述谓词函数的参数对应的事件的槽位,与所述第一事件的第一槽位相同,则所述谓词函数的参数值为所述第一事件的所述第一槽位的槽位值。
根据所述问题的咨询对象对应的谓词逻辑公式,通过对谓词逻辑公式的运算,完成从事实到结论的推导。这个过程可能包括多个谓词逻辑公式的推导:由输入的R1中的谓词函数中的知识点A,满足R1的事实,触发R1规则推导出B结论,又由A+B知识点,触发R3规则,推导出C。在推导过程中,会逐步检查中间结果是否可以确定问题的咨询对象。如已达成,即停止运算过程。否则一直循环下去,直到确定问题的结果。
根据人员支出的谓词逻辑公式的运算:
根据概念图谱中,张三属于外包员工,外包员工属于项目人员。
可以推导出产生支出(张三)Λ属于项目人员(张三)->属于人员支出(张三)
根据服务成本的谓词逻辑公式的运算:
产生支出(张三,张三的支出)Λ合同交付(张三)Λ属于人员支出(张三)->服务成本(张三的支出)
在步骤605中,可以通过答案生成模块输出问题的答案。具体的,可以包括:若所述问题的类型为判断型问题,则将所述谓词逻辑公式的运算结果作为所述答案;若所述问题的类型为解释型问题,则将所述谓词逻辑公式的运算过程,以及所述谓词逻辑公式的运算结果作为所述答案。
若意图识别的问题类型为判断事件的真伪,则输出推理输出的推理结果,例如,是或否;或者,真的或假的。
即当谓词逻辑公式运算过程中得到的结果可以对应问题的咨询对象时,则确定谓词逻辑公式运算停止,可以确定出问题的答案。结合上述例子,可以确定问题“合同交付过程中张三产生的支出属于服务成本吗”中,谓词逻辑公式运算过程中得到的结果为属于服务成本,则可以确定答案为是。若该问题的谓词逻辑公式运算过程中得到的结果为不属于服务成本,或属于其他与服务成本互斥的结果,则可以确定答案为否。
在用户不仅要得到推理答案,而且需要解释为什么得到该答案的场景下时,可向用户展现谓词逻辑公式的运算过程。若意图识别的问题类型为解释型问题,则输出谓词逻辑公式{Rx}的运算过程。
一种可能的方式,可以将谓词逻辑公式的运算过程,包括前置条件,得出结论,以结构化的方式呈现给用户,以生成解释型问题的答案。
例如,结合上述例子,可以确定问题“为什么合同交付过程中张三产生的支出属于服务成本”。
答案可以包括:
根据概念图谱中,张三属于外包员工,外包员工属于项目人员。
可以推导出产生支出(张三)Λ属于项目人员(张三)->属于人员支出(张三)
根据服务成本的谓词逻辑公式的推导:
产生支出(张三,张三的支出)Λ合同交付(张三)Λ属于人员支出(张三)->服务成本(张三的支出)
根据目标领域知识库中的多知识表示,建立的知识之间的逻辑链接的基础上,通过用户输入问题做语义分析,提取出领域内抽象的概念和事件,解析出概念实例,事件,识别出知识点,理解用户提出的问题,促进用户语义理解。基于这一提炼的知识表示,识别意图,定位用户关注点,获取用户待解释的对象。根据用户待解释的对象,与谓词逻辑公式关联,完成谓词逻辑公式体的前置条件的匹配,从满足规则体条件中筛选并装载谓词逻辑公式,通过知识表示之间的链接,及知识匹配调用推理所需知识点,进行逻辑推导,推断出问题结果,完成知识推理,获取问题的答案。
基于以上实施例,本申请实施例还提供了一种问题解答装置。该问题解答装置用于实现本申请实施例提供的问题解答方法。参阅图10所示,该电子设备1000可以包括:确定单元1001和获取单元1002。
在一个实施例中,图10所示的问题解答装置可以用于执行图6所示的问题解答方法中电子设备的操作。具体的:
获取单元1002,用于从所述问题中确定N个分词短语;从事理图谱中确定出所述N个分词短语触发的M个事件,并根据所述N个分词短语中与概念图谱匹配的K个分词短语确定出所述M个事件的槽位的槽位值;所述N、M、K为正整数;所述K小于或等于N,所述M小于或等于N;确定单元1001,用于根据预设的事件与谓词逻辑公式的对应关系,确定出所述问题的咨询对象对应的谓词逻辑公式;其中,谓词逻辑公式中的谓词函数与事理图谱中的事件对应,谓词函数的参数与事件的槽位对应,谓词函数的参数值与事件的槽位的槽位值对应;所述咨询对象对应的谓词逻辑公式是根据所述咨询对象对应的目标领域知识中的业务规则得到的;根据所述M个事件,以及所述M个事件的槽位的槽位值,对所述谓词逻辑公式进行运算;根据所述谓词逻辑公式的运算结果,确定所述问题的答案。
一种可能的设计,针对所述M个事件中的每个事件,所述事件满足以下条件:所述N个分词短语中存在一个分词短语与所述事件的触发词匹配,且:所述与概念图谱匹配的K个分词短语中存在一个分词短语,该分词短语在所述概念图谱中关联的一个概念与所述事件的第一槽位的槽位类型匹配,所述第一槽位为所述事件中的一个槽位。
一种可能的设计,针对所述M个事件中的每个事件,所述事件满足以下条件:所述N个分词短语中存在一个分词短语与所述事件的触发词匹配,且:所述与概念图谱匹配的K个分词短语中存在一个分词短语,该分词短语在所述概念图谱中关联的一个概念与所述事件的第一槽位的槽位类型匹配,且该分词短语为所述事件的所述第一槽位的槽位值,所述第一槽位为所述事件中的一个槽位。
一种可能的设计,所述概念词包括概念和概念实例;针对所述K个分词短语中的一个分词短语,该分词短语所述概念图谱中关联的一个概念,包括:在所述概念图谱中匹配的概念实例对应的上游节点的概念;或者,在所述概念图谱中匹配的概念。
一种可能的设计,所述确定单元1001,具体用于:若所述问题的类型为判断型问题,则将所述谓词逻辑公式的运算结果作为所述答案;若所述问题的类型为解释型问题,则将所述谓词逻辑公式的运算过程,以及所述谓词逻辑公式的运算结果作为所述答案。
一种可能的设计,所述谓词逻辑公式中包括一个或多个谓词函数;所述谓词逻辑公式中存在一个谓词函数,所述谓词函数为另一个谓词逻辑公式的运算结果。
一种可能的设计,所述确定单元1001,具体用于:针对所述谓词逻辑公式中的每个谓词函数,执行:若所述谓词函数对应的事件为第一事件,所述第一事件为所述M个事件中的一个事件,且:所述谓词函数的参数对应的事件的槽位,与所述第一事件的第一槽位相同,则:所述谓词函数的参数值为所述第一事件的所述第一槽位的槽位值。
一种可能的设计,所述问题场景为财经经营核算领域。
在另一个实施例中,如图11所示的目标领域知识库的生成装置可以用于执行图4A所示的目标领域知识库的生成方法中电子设备的操作。其中,该目标领域知识库的生成装置,可以包括:确定单元1101和生成单元1102。
其中,确定单元1101,用于根据目标领域知识的知识类型,确定所述目标领域知识的概念图谱、事理图谱及谓词逻辑公式;其中,所述概念图谱用于表示概念词间的静态关系;所述概念词用于表示所述目标领域知识的对象;所述事理图谱用于表示事件之间顺序和事件之间的事理关系;所述事件用于表示所述目标领域知识内用谓词表达的概念词间的关系或概念词间的动作;所述谓词逻辑公式中的谓词函数与所述事理图谱中的事件对应,所述谓词函数的参数与所述事件的槽位对应,所述谓词函数的参数值与事件的槽位的槽位值对应;所述谓词逻辑公式用于表示所述目标领域知识中的业务规则;
生成单元1102,用于根据所述概念图谱、所述事理图谱及所述谓词逻辑公式,生成目标领域知识库。
一种可能的设计,所述事件包括:触发词和事件的槽位;所述触发词用于标识所述事件发生时对应的谓词;所述事件的槽位的槽位类型对应所述概念图谱中的至少一个概念词。
一种可能的设计,所述确定单元1101,具体用于:根据所述业务规则涉及的事件,确定所述谓词逻辑公式中的谓词函数;根据所述业务规则中事件间的逻辑关系,确定所述谓词函数间的逻辑运算符;通过所述逻辑运算符,将所述谓词逻辑公式中的谓词函数连接,确定所述谓词逻辑公式。
需要说明的是,本申请实施例中对单元的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。在本申请的实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
基于以上实施例,本申请实施例还提供了一种电子设备,该电子设备可以实现本申请实施例提供的问题解答方法。可以参阅图12所示,所述电子设备1200包括:通信单元1201 和处理器1202,可选的还可以包括存储器1203,其中:
其中,处理器1202可以是中央处理器(central processing unit,CPU),网络处理器 (network processor,NP)或者CPU和NP的组合等等。处理器1202还可以进一步包括硬件芯片。上述硬件芯片可以是专用集成电路(application-specific integrated circuit,ASIC),可编程逻辑器件(programmable logic device,PLD)或其组合。上述PLD可以是复杂可编程逻辑器件(complex programmable logic device,CPLD),现场可编程逻辑门阵列(field-programmable gate array,FPGA),通用阵列逻辑(generic array logic,GAL)或其任意组合。处理器1202在实现上述功能时,可以通过硬件实现,当然也可以通过硬件执行相应的软件实现。
通信单元1201和处理器1202之间相互连接。可选的,通信单元1201和处理器1202通过总线1204相互连接;总线1204可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA) 总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,图12中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
在一种可选的实施方式中,存储器1203,与处理器1202耦合,用于存放程序等。具体地,程序可以包括程序代码,该程序代码包括计算机操作指令。存储器1203可能包括RAM,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。处理器1202执行存储器1203所存放的应用程序,实现上述功能,从而实现电子设备的功能,即实现问题解答方法。
在一个实施例中,图12所示的电子设备可用于执行上述图4A所示的实施例中的目标领域知识库的生成方法中的电子设备的操作。具体的:
所述处理器1202,用于:根据目标领域知识的知识类型,确定所述目标领域知识的概念图谱、事理图谱及谓词逻辑公式;其中,所述概念图谱用于表示概念词间的静态关系;所述概念词用于表示所述目标领域知识的对象;所述事理图谱用于表示事件之间顺序和事件之间的事理关系;所述事件用于表示所述目标领域知识内用谓词表达的概念词间的关系或概念词间的动作;所述谓词逻辑公式中的谓词函数与所述事理图谱中的事件对应,所述谓词函数的参数与所述事件的槽位对应,所述谓词函数的参数值与事件的槽位的槽位值对应;所述谓词逻辑公式用于表示所述目标领域知识中的业务规则;根据所述概念图谱、所述事理图谱及所述谓词逻辑公式,生成目标领域知识库。
在另一个实施例中,图12所示的电子设备可以用于执行图6所示的问题解答方法中电子设备的操作。具体的:
所述处理器1202,用于从所述问题中确定N个分词短语;从事理图谱中确定出所述N 个分词短语触发的M个事件,并根据所述N个分词短语中与概念图谱匹配的K个分词短语确定出所述M个事件的槽位的槽位值;所述N、M、K为正整数;所述K小于或等于N,所述M小于或等于N;根据预设的事件与谓词逻辑公式的对应关系,确定出所述问题的咨询对象对应的谓词逻辑公式;其中,谓词逻辑公式中的谓词函数与事理图谱中的事件对应,谓词函数的参数与事件的槽位对应,谓词函数的参数值与事件的槽位的槽位值对应;所述咨询对象对应的谓词逻辑公式是根据所述咨询对象对应的目标领域知识中的业务规则得到的;根据所述M个事件,以及所述M个事件的槽位的槽位值,对所述谓词逻辑公式进行运算;根据所述谓词逻辑公式的运算结果,确定所述问题的答案。
本领域内的技术人员应明白,本申请的实施例可提供为方法、***、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
Claims (24)
1.一种问题解答方法,其特征在于,包括:
从所述问题中确定N个分词短语;
从事理图谱中确定出所述N个分词短语触发的M个事件,并根据所述N个分词短语中与概念图谱匹配的K个分词短语确定出所述M个事件的槽位的槽位值;所述N、M、K为正整数;所述K小于或等于N,所述M小于或等于N;
根据预设的事件与谓词逻辑公式的对应关系,确定出所述问题的咨询对象对应的谓词逻辑公式;其中,谓词逻辑公式中的谓词函数与事理图谱中的事件对应,谓词函数的参数与事件的槽位对应,谓词函数的参数值与事件的槽位的槽位值对应;所述咨询对象对应的谓词逻辑公式是根据所述咨询对象对应的目标领域知识中的业务规则得到的;
根据所述M个事件,以及所述M个事件的槽位的槽位值,对所述谓词逻辑公式进行运算;
根据所述谓词逻辑公式的运算结果,确定所述问题的答案。
2.如权利要求1所述的方法,其特征在于,针对所述M个事件中的每个事件,所述事件满足以下条件:
所述N个分词短语中存在一个分词短语与所述事件的触发词匹配,且:
所述与概念图谱匹配的K个分词短语中存在一个分词短语,该分词短语在所述概念图谱中关联的一个概念与所述事件的第一槽位的槽位类型匹配,所述第一槽位为所述事件中的一个槽位。
3.如权利要求1所述的方法,其特征在于,针对所述M个事件中的每个事件,所述事件满足以下条件:
所述N个分词短语中存在一个分词短语与所述事件的触发词匹配,且:
所述与概念图谱匹配的K个分词短语中存在一个分词短语,该分词短语在所述概念图谱中关联的一个概念与所述事件的第一槽位的槽位类型匹配,且该分词短语为所述事件的所述第一槽位的槽位值,所述第一槽位为所述事件中的一个槽位。
4.如权利要求2或3所述的方法,其特征在于,所述概念词包括概念和概念实例;针对所述K个分词短语中的一个分词短语,该分词短语所述概念图谱中关联的一个概念,包括:
在所述概念图谱中匹配的概念实例对应的上游节点的概念;或者,
在所述概念图谱中匹配的概念。
5.如权利要求1所述的方法,其特征在于,所述根据所述谓词逻辑公式的运算结果,确定所述问题的答案,包括:
若所述问题的类型为判断型问题,则将所述谓词逻辑公式的运算结果作为所述答案;
若所述问题的类型为解释型问题,则将所述谓词逻辑公式的运算过程,以及所述谓词逻辑公式的运算结果作为所述答案。
6.如权利要求1所述的方法,其特征在于,所述谓词逻辑公式中包括一个或多个谓词函数;
所述谓词逻辑公式中存在一个谓词函数,所述谓词函数为另一个谓词逻辑公式的运算结果。
7.如权利要求2或3所述的方法,其特征在于,所述根据所述M个事件,以及所述M个事件的槽位的槽位值,对所述谓词逻辑公式进行运算,包括:
针对所述谓词逻辑公式中的每个谓词函数,执行:
若所述谓词函数对应的事件为第一事件,所述第一事件为所述M个事件中的一个事件,且:
所述谓词函数的参数对应的事件的槽位,与所述第一事件的第一槽位相同,则:
所述谓词函数的参数值为所述第一事件的所述第一槽位的槽位值。
8.如权利要求1-7任一项所述的方法,其特征在于,所述问题场景为财经经营核算领域。
9.一种目标领域知识库的生成方法,其特征在于,包括:
根据目标领域知识的知识类型,确定所述目标领域知识的概念图谱、事理图谱及谓词逻辑公式;
其中,所述概念图谱用于表示概念词间的静态关系;所述概念词用于表示所述目标领域知识的对象;
所述事理图谱用于表示事件之间顺序和事件之间的事理关系;所述事件用于表示所述目标领域知识内用谓词表达的概念词间的关系或概念词间的动作;
所述谓词逻辑公式中的谓词函数与所述事理图谱中的事件对应,所述谓词函数的参数与所述事件的槽位对应,所述谓词函数的参数值与事件的槽位的槽位值对应;所述谓词逻辑公式用于表示所述目标领域知识中的业务规则;
根据所述概念图谱、所述事理图谱及所述谓词逻辑公式,生成目标领域知识库。
10.如权利要求9所述的方法,其特征在于,所述事件包括:触发词和事件的槽位;所述触发词用于标识所述事件发生时对应的谓词;所述事件的槽位的槽位类型对应所述概念图谱中的至少一个概念词。
11.如权利要求10所述的方法,其特征在于,所述谓词逻辑公式的确定方式,包括:
根据所述业务规则涉及的事件,确定所述谓词逻辑公式中的谓词函数;
根据所述业务规则中事件间的逻辑关系,确定所述谓词函数间的逻辑运算符;
通过所述逻辑运算符,将所述谓词逻辑公式中的谓词函数连接,确定所述谓词逻辑公式。
12.一种问题解答装置,其特征在于,包括:
获取单元,用于从所述问题中确定N个分词短语;从事理图谱中确定出所述N个分词短语触发的M个事件,并根据所述N个分词短语中与概念图谱匹配的K个分词短语确定出所述M个事件的槽位的槽位值;所述N、M、K为正整数;所述K小于或等于N,所述M小于或等于N;
确定单元,用于根据预设的事件与谓词逻辑公式的对应关系,确定出所述问题的咨询对象对应的谓词逻辑公式;其中,谓词逻辑公式中的谓词函数与事理图谱中的事件对应,谓词函数的参数与事件的槽位对应,谓词函数的参数值与事件的槽位的槽位值对应;所述咨询对象对应的谓词逻辑公式是根据所述咨询对象对应的目标领域知识中的业务规则得到的;根据所述M个事件,以及所述M个事件的槽位的槽位值,对所述谓词逻辑公式进行运算;根据所述谓词逻辑公式的运算结果,确定所述问题的答案。
13.如权利要求12所述的装置,其特征在于,针对所述M个事件中的每个事件,所述事件满足以下条件:所述N个分词短语中存在一个分词短语与所述事件的触发词匹配,且:所述与概念图谱匹配的K个分词短语中存在一个分词短语,该分词短语在所述概念图谱中关联的一个概念与所述事件的第一槽位的槽位类型匹配,所述第一槽位为所述事件中的一个槽位。
14.如权利要求12所述的装置,其特征在于,针对所述M个事件中的每个事件,所述事件满足以下条件:所述N个分词短语中存在一个分词短语与所述事件的触发词匹配,且:所述与概念图谱匹配的K个分词短语中存在一个分词短语,该分词短语在所述概念图谱中关联的一个概念与所述事件的第一槽位的槽位类型匹配,且该分词短语为所述事件的所述第一槽位的槽位值,所述第一槽位为所述事件中的一个槽位。
15.如权利要求13或14所述的装置,其特征在于,所述概念词包括概念和概念实例;针对所述K个分词短语中的一个分词短语,该分词短语所述概念图谱中关联的一个概念,包括:在所述概念图谱中匹配的概念实例对应的上游节点的概念;或者,在所述概念图谱中匹配的概念。
16.如权利要求12所述的装置,其特征在于,所述确定单元,具体用于:
若所述问题的类型为判断型问题,则将所述谓词逻辑公式的运算结果作为所述答案;若所述问题的类型为解释型问题,则将所述谓词逻辑公式的运算过程,以及所述谓词逻辑公式的运算结果作为所述答案。
17.如权利要求12所述的装置,其特征在于,所述谓词逻辑公式中包括一个或多个谓词函数;所述谓词逻辑公式中存在一个谓词函数,所述谓词函数为另一个谓词逻辑公式的运算结果。
18.如权利要求13或14所述的装置,其特征在于,所述确定单元,具体用于:
针对所述谓词逻辑公式中的每个谓词函数,执行:若所述谓词函数对应的事件为第一事件,所述第一事件为所述M个事件中的一个事件,且:所述谓词函数的参数对应的事件的槽位,与所述第一事件的第一槽位相同,则:所述谓词函数的参数值为所述第一事件的所述第一槽位的槽位值。
19.如权利要求1-7任一项所述的装置,其特征在于,所述问题场景为财经经营核算领域。
20.一种目标领域知识库的生成装置,其特征在于,包括:
确定单元,用于根据目标领域知识的知识类型,确定所述目标领域知识的概念图谱、事理图谱及谓词逻辑公式;其中,所述概念图谱用于表示概念词间的静态关系;所述概念词用于表示所述目标领域知识的对象;所述事理图谱用于表示事件之间顺序和事件之间的事理关系;所述事件用于表示所述目标领域知识内用谓词表达的概念词间的关系或概念词间的动作;所述谓词逻辑公式中的谓词函数与所述事理图谱中的事件对应,所述谓词函数的参数与所述事件的槽位对应,所述谓词函数的参数值与事件的槽位的槽位值对应;所述谓词逻辑公式用于表示所述目标领域知识中的业务规则;
生成单元,用于根据所述概念图谱、所述事理图谱及所述谓词逻辑公式,生成目标领域知识库。
21.如权利要求20所述的装置,其特征在于,所述事件包括:触发词和事件的槽位;所述触发词用于标识所述事件发生时对应的谓词;所述事件的槽位的槽位类型对应所述概念图谱中的至少一个概念词。
22.如权利要求21所述的装置,其特征在于,所述确定单元,具体用于:
根据所述业务规则涉及的事件,确定所述谓词逻辑公式中的谓词函数;根据所述业务规则中事件间的逻辑关系,确定所述谓词函数间的逻辑运算符;通过所述逻辑运算符,将所述谓词逻辑公式中的谓词函数连接,确定所述谓词逻辑公式。
23.一种电子设备,其特征在于,包括至少一个处理单元、以及至少一个存储单元,其中,所述存储单元存储有计算机程序,当所述程序被所述处理单元执行时,使得所述处理单元执行权利要求1~8或9~11任一权利要求所述方法的步骤。
24.一种计算机可读介质,其特征在于,其存储有可由终端设备执行的计算机程序,当所述程序在终端设备上运行时,使得所述终端设备执行权利要求1~8或9~11任一所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010202748.5A CN111538844B (zh) | 2020-03-20 | 2020-03-20 | 目标领域知识库的生成、问题解答方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010202748.5A CN111538844B (zh) | 2020-03-20 | 2020-03-20 | 目标领域知识库的生成、问题解答方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111538844A true CN111538844A (zh) | 2020-08-14 |
CN111538844B CN111538844B (zh) | 2022-03-25 |
Family
ID=71978676
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010202748.5A Active CN111538844B (zh) | 2020-03-20 | 2020-03-20 | 目标领域知识库的生成、问题解答方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111538844B (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112182242A (zh) * | 2020-09-27 | 2021-01-05 | 武汉大学 | 一种面向电力作业全过程的安全管控知识图谱构建方法 |
CN112232085A (zh) * | 2020-10-15 | 2021-01-15 | 海南大学 | 面向本质计算与推理的跨dikw模态文本歧义处理方法 |
CN112784064A (zh) * | 2021-01-28 | 2021-05-11 | 电子科技大学 | 一种面向社交网络的层次化超维知识图谱构建方法 |
CN112966492A (zh) * | 2021-02-09 | 2021-06-15 | 柳州智视科技有限公司 | 利用已知知识解决问题的方法 |
CN112988704A (zh) * | 2021-03-05 | 2021-06-18 | 无锡星凝互动科技有限公司 | 一种基于ai咨询数据库集群搭建方法和*** |
CN113312494A (zh) * | 2021-05-28 | 2021-08-27 | 中国电力科学研究院有限公司 | 垂直领域知识图谱构建方法、***、设备及存储介质 |
CN113392361A (zh) * | 2021-05-24 | 2021-09-14 | 北京京东振世信息技术有限公司 | 业务处理方法、装置、电子设备和计算机可读介质 |
CN114462903A (zh) * | 2022-04-14 | 2022-05-10 | 四川省大数据中心 | 一种水电气业务报装*** |
CN115032901A (zh) * | 2021-12-22 | 2022-09-09 | 荣耀终端有限公司 | 一种设备控制方法及电子设备 |
CN115203441A (zh) * | 2022-09-19 | 2022-10-18 | 江西风向标智能科技有限公司 | 高中数学公式的解析方法、***、存储介质及设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106055641A (zh) * | 2016-05-31 | 2016-10-26 | 北京光年无限科技有限公司 | 一种面向智能机器人的人机交互方法及装置 |
US20170103069A1 (en) * | 2015-10-13 | 2017-04-13 | International Business Machines Corporation | Supplementing candidate answers |
CN108717441A (zh) * | 2018-05-16 | 2018-10-30 | 腾讯科技(深圳)有限公司 | 问题模板所对应的谓词的确定方法及装置 |
CN109033305A (zh) * | 2018-07-16 | 2018-12-18 | 深圳前海微众银行股份有限公司 | 问题回答方法、设备及计算机可读存储介质 |
CN109492077A (zh) * | 2018-09-29 | 2019-03-19 | 北明智通(北京)科技有限公司 | 基于知识图谱的石化领域问答方法及*** |
CN109919763A (zh) * | 2019-01-28 | 2019-06-21 | 深圳壹账通智能科技有限公司 | 基于智能合约展示问答式文件的方法、装置及计算机设备 |
-
2020
- 2020-03-20 CN CN202010202748.5A patent/CN111538844B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170103069A1 (en) * | 2015-10-13 | 2017-04-13 | International Business Machines Corporation | Supplementing candidate answers |
CN106055641A (zh) * | 2016-05-31 | 2016-10-26 | 北京光年无限科技有限公司 | 一种面向智能机器人的人机交互方法及装置 |
CN108717441A (zh) * | 2018-05-16 | 2018-10-30 | 腾讯科技(深圳)有限公司 | 问题模板所对应的谓词的确定方法及装置 |
CN109033305A (zh) * | 2018-07-16 | 2018-12-18 | 深圳前海微众银行股份有限公司 | 问题回答方法、设备及计算机可读存储介质 |
CN109492077A (zh) * | 2018-09-29 | 2019-03-19 | 北明智通(北京)科技有限公司 | 基于知识图谱的石化领域问答方法及*** |
CN109919763A (zh) * | 2019-01-28 | 2019-06-21 | 深圳壹账通智能科技有限公司 | 基于智能合约展示问答式文件的方法、装置及计算机设备 |
Non-Patent Citations (3)
Title |
---|
XIANG WANG等: "A Potential Solution for Intelligent Energy Management - Knowledge Graph", 《IEEE》 * |
陈程等: "基于中医药知识图谱的智能问答技术研究", 《中国新通信》 * |
项威: "事件知识图谱构建技术与应用综述", 《计算机与现代化》 * |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112182242A (zh) * | 2020-09-27 | 2021-01-05 | 武汉大学 | 一种面向电力作业全过程的安全管控知识图谱构建方法 |
CN112232085A (zh) * | 2020-10-15 | 2021-01-15 | 海南大学 | 面向本质计算与推理的跨dikw模态文本歧义处理方法 |
CN112232085B (zh) * | 2020-10-15 | 2021-10-08 | 海南大学 | 面向本质计算与推理的跨dikw模态文本歧义处理方法 |
CN112784064A (zh) * | 2021-01-28 | 2021-05-11 | 电子科技大学 | 一种面向社交网络的层次化超维知识图谱构建方法 |
CN112784064B (zh) * | 2021-01-28 | 2023-05-12 | 电子科技大学 | 一种面向社交网络的层次化超维知识图谱构建方法 |
CN112966492A (zh) * | 2021-02-09 | 2021-06-15 | 柳州智视科技有限公司 | 利用已知知识解决问题的方法 |
CN112988704A (zh) * | 2021-03-05 | 2021-06-18 | 无锡星凝互动科技有限公司 | 一种基于ai咨询数据库集群搭建方法和*** |
CN113392361A (zh) * | 2021-05-24 | 2021-09-14 | 北京京东振世信息技术有限公司 | 业务处理方法、装置、电子设备和计算机可读介质 |
CN113392361B (zh) * | 2021-05-24 | 2024-05-17 | 北京京东振世信息技术有限公司 | 业务处理方法、装置、电子设备和计算机可读介质 |
CN113312494A (zh) * | 2021-05-28 | 2021-08-27 | 中国电力科学研究院有限公司 | 垂直领域知识图谱构建方法、***、设备及存储介质 |
CN115032901B (zh) * | 2021-12-22 | 2023-03-28 | 荣耀终端有限公司 | 一种设备控制方法及电子设备 |
CN115032901A (zh) * | 2021-12-22 | 2022-09-09 | 荣耀终端有限公司 | 一种设备控制方法及电子设备 |
CN114462903A (zh) * | 2022-04-14 | 2022-05-10 | 四川省大数据中心 | 一种水电气业务报装*** |
CN114462903B (zh) * | 2022-04-14 | 2022-07-05 | 四川省大数据中心 | 一种水电气业务报装*** |
CN115203441B (zh) * | 2022-09-19 | 2022-12-20 | 江西风向标智能科技有限公司 | 高中数学公式的解析方法、***、存储介质及设备 |
CN115203441A (zh) * | 2022-09-19 | 2022-10-18 | 江西风向标智能科技有限公司 | 高中数学公式的解析方法、***、存储介质及设备 |
Also Published As
Publication number | Publication date |
---|---|
CN111538844B (zh) | 2022-03-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111538844B (zh) | 目标领域知识库的生成、问题解答方法及装置 | |
Tiddi et al. | Knowledge graphs as tools for explainable machine learning: A survey | |
Calegari et al. | On the integration of symbolic and sub-symbolic techniques for XAI: A survey | |
US11347783B2 (en) | Implementing a software action based on machine interpretation of a language input | |
Kim et al. | Futuristic data-driven scenario building: Incorporating text mining and fuzzy association rule mining into fuzzy cognitive map | |
Pathak et al. | Survey of modular ontology techniques and their applications in the biomedical domain | |
Bouhana et al. | An ontology-based CBR approach for personalized itinerary search systems for sustainable urban freight transport | |
CN112106056A (zh) | 构造虚构的话语树来提高回答聚敛性问题的能力 | |
US20120323558A1 (en) | Method and apparatus for creating a predicting model | |
Villata et al. | Thirty years of artificial intelligence and law: the third decade | |
Zhang et al. | A survey on fuzzy ontologies for the Semantic Web | |
El-Sappagh et al. | An ontological case base engineering methodology for diabetes management | |
Barukh et al. | Cognitive augmentation in processes | |
Wang et al. | Smartphone-based bulky waste classification using convolutional neural networks | |
Do et al. | Semantic-enhanced neural collaborative filtering models in recommender systems | |
CN114860916A (zh) | 知识检索方法及装置 | |
Calderón et al. | Distributed supervised sentiment analysis of tweets: Integrating machine learning and streaming analytics for big data challenges in communication and audience research | |
Richmond et al. | Explainable AI and law: an evidential survey | |
Biswas et al. | A review on fundamentals of case-based reasoning and its recent application in different domains | |
Li et al. | A new fuzzy ontology development methodology (FODM) proposal | |
Okoye | Linked open data: State-of-the-art mechanisms and conceptual framework | |
Jordanov et al. | Knowledge-based and intelligent information and engineering systems | |
Zamanirad | Superimposition of natural language conversations over software enabled services | |
Umar et al. | A survey on state-of-the-art knowledge-based system development and issues | |
Daosabah et al. | Dynamic composition of services: an approach driven by the user's intention and context |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |