CN111241252A - 一种问答方法及问答装置、电子设备、存储介质 - Google Patents

一种问答方法及问答装置、电子设备、存储介质 Download PDF

Info

Publication number
CN111241252A
CN111241252A CN202010306777.6A CN202010306777A CN111241252A CN 111241252 A CN111241252 A CN 111241252A CN 202010306777 A CN202010306777 A CN 202010306777A CN 111241252 A CN111241252 A CN 111241252A
Authority
CN
China
Prior art keywords
semantic
question
query statement
natural
natural query
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010306777.6A
Other languages
English (en)
Other versions
CN111241252B (zh
Inventor
康青杨
刘世林
罗镇权
张学锋
崔诚煜
唐万琪
李楠
范森
吴桐
曾途
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Business Big Data Technology Co Ltd
Original Assignee
Chengdu Business Big Data Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Business Big Data Technology Co Ltd filed Critical Chengdu Business Big Data Technology Co Ltd
Priority to CN202010306777.6A priority Critical patent/CN111241252B/zh
Publication of CN111241252A publication Critical patent/CN111241252A/zh
Application granted granted Critical
Publication of CN111241252B publication Critical patent/CN111241252B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种问答方法及问答装置、电子设备、存储介质,其中方法包括:获取用户输入的自然查询语句,并将所述自然查询语句转换为语义符号串;根据所述自然查询语句与所述语义符号串,生成所述自然查询语句对应的语义路径;根据语义路径,生成存储知识图谱的数据库所能识别的机器查询语句;根据机器查询语句,在存储知识图谱的数据库中查询机器查询语句对应的问答结果,并反馈问答结果。本发明无需针对于不同知识图谱分别构建问答模板,相较于现有的问答***具有更好的通用性,而且效率高、准确性高。

Description

一种问答方法及问答装置、电子设备、存储介质
技术领域
本发明涉及信息搜索技术领域,具体涉及一种问答方法及问答装置、电子设备、存储介质。
背景技术
互联网的出现和普及给用户带来了大量的信息,满足了用户在信息时代对信息的需求,但随着网络的迅速发展而带来的网上信息量的大幅增长,使得用户在面对大量信息时无法从中获得对自己真正有用的那部分信息,对信息的使用效率反而降低了,这就是所谓的信息超载问题。目前,利用问答***精确的获取用户所需信息已成为一个获取信息的重要途径。
现有的问答***主要是通过搜索技术完成,将问句在网页上搜索然后返回匹配度最高的网页。这样得到的信息跟问句的联系不够相关,得到的不是精确的答案。随着知识图谱技术的发展,有人提出了基于知识图谱的问题***。例如公开号为CN108268580A、名称为“基于知识图谱的问答方法及装置”的中国发明,采用问题模板的形式,事先预设一些问题模板,符合问题模板的问题即可被准确回答,继而提高问答结果的准确性。但是该方案依然存在缺陷,例如要求针对特定的知识图谱设计问题模板,只有符合问题模板的问题才能被正确回答,然而,问题的方式多种多样,通过设置问题模板涵盖的问题是很有限的。而且这种方法不具有通用性,对于不同的知识图谱需要专门设计不同的问题模板,效率低。
发明内容
为了解决现有技术存在的通用性差、效率低的问题,本发明实施例提供了一种问答方法及问答装置、电子设备、存储介质,该方法在知识图谱的问答领域具有更好的通用性。
为了达到上述目的,本申请的实施例所采用的技术方案如下:
一种问答方法,包括:
获取用户输入的自然查询语句,并将所述自然查询语句转换为语义符号串;
根据所述自然查询语句与所述语义符号串,生成所述自然查询语句对应的语义路径;
根据所述语义路径,生成存储知识图谱的数据库所能识别的机器查询语句;
根据所述机器查询语句,在存储知识图谱的数据库中查询所述机器查询语句对应的问答结果,并反馈所述问答结果。
上述方案中,通过将问句符号化,然后生成语义路径,最后转换成数据库可识别的查询语句进行查找,并返回精确查询结果。这种方式无需人工设计问题模板,对于不同的知识图谱都通用,因此适应性强,不受知识图谱结构的限制,且效率高。
所述获取用户输入的自然查询语句,并将所述自然查询语句转换为语义符号串,包括:
获取用户输入的自然查询语句;
从数据集中匹配出自然查询语句中各个有效词组对应的语料,所述数据集包括实体库、属性库、标签库以及关系库;
根据所述语料对应的数据集类别确定所述自然查询语句的各个有效词组对应的语义符号;
根据语义符号得到自然查询语句对应的语义符号串。
所述从数据集中匹配出自然查询语句中各个有效词组对应的语料,包括:
依次使用实体库、属性库、标签库以及关系库匹配所述自然查询语句中各个有效词组对应的语料。
所述根据所述自然查询语句与所述语义符号串,生成所述自然查询语句对应的语义路径,包括:
根据所述语义符号串中的所有实体、属性或者标签依次确定所述语义路径的所有节点,每一个所述节点包括对应的实体、属性或者标签的语义符号以及所述实体、属性或者标签对应的词组;
根据所述语义符号串中的关系语义符号以及所述关系语义符号相应的词组链接所有节点中相应的节点。
所述根据所述语义符号串中的所有实体、属性或者标签依次确定所述语义路径的所有节点的步骤中,
当多个实体、属性或者标签相邻时,求取所述多个实体、属性或者标签的交集,作为一个节点交集,所述节点交集包括所述多个实体、属性或者标签的语义符号以及所述多个实体、属性或者标签对应的词组。
使用Neo4j数据库将所述语义路径生成所述机器查询语句。
一种问答装置,包括:
获取模块,获取用户输入的自然查询语句,并将所述自然查询语句转换为语义符号串;
解析模块,根据所述自然查询语句与所述语义符号串,生成所述自然查询语句对应的语义路径,以及根据所述语义路径,生成存储知识图谱的数据库所能识别的机器查询语句;
查询模块,根据所述机器查询语句,在存储知识图谱的数据库中查询所述机器查询语句对应的问答结果,并反馈所述问答结果。
一种电子设备,包括:
处理器以及存储器,存储器用于存储计算机程序指令;
其中,当所述计算机程序由所述处理器加载并运行时,所述处理器执行如前所述的问答方法。
一种计算机可读储存介质,所述计算机可读储存介质存储计算机程序指令,所述计算机程序被处理器加载并运行时,所述处理器执行如前所述的问答方法。
与现有技术相比,本申请的实施例具有以下有益效果:
本发明实施例提供的问答方法中,使用语义路径转换自然查询语句后,语义路径问句的链路长度没有限制,在每一个节点可以有很多限制描述,这样可以将很多复杂的问句成功转换为由各个节点组成的语义路径,从而扩大了本实施例在知识问答领域的应用场景,使得本发明实施例提供的问答方法更加适合各种领域的查询以及各种复杂语句的查询。
同时,相较于现有的问答***中需要根据不同的知识图谱初始化不同的逻辑表达规则以将特定自然咨询语句转化,本发明实施例提供的基于知识图谱的问答方法中将自然查询语句转换为语义符号串,进一步转换为语义路径,从而无须预设规则,从而可以应用于各种知识图谱中,不需要针对不同的知识图谱预设置模板或者重新初始化规则,本发明实施例提供的问答方法具有更好的通用性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明的一个实施例的问答方法的场景示意图;
图2a是本发明一个实施例的问答方法的流程图;
图2b是问答方法中步骤S100的流程图;
图3为本发明的其中一个实施例的语义路径;
图4为本发明的又一个实施例的语义路径;
图5为本发明的又一个实施例的语义路径;
图6为本发明的又一个实施例的语义路径;
图7为本发明的一个实施例的问答装置示意图;
图8为本发明的一个实施例的电子设备框架图。
具体实施方式
为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
请参阅图1,图1为本发明提供的问答方法的场景示意图。在该场景中,包括查询终端10、问答设备20和数据库30,查询终端10可以与问答设备20通信,以便于向其发送查询请求,以及问答设备20将问答结果给查询终端10进行展示,问答设备20也可以基于所述查询请求从数据库30中查找相应数据。该查询终端10提供一个用户界面,并在用户界面提供一个输入窗口、查询按钮,以及查询结果展示界面,输入窗口用于输入文本的问句,即自然查询语句,查询结果展示界面用于将查询结果可视化。查询终端 10可以为手机、便携式电脑、平板等安装有浏览器的用户设备。当用户在浏览器上输入自然查询语句之后,浏览器向问答设备20发送该自然查询语句,问答设备20对该自然查询语句进行识别和处理,然后在数据库30中获取该自然查询语句对应的问答结果,最后向用户反馈该问答结果。问答设备20集成有后文中所述的基于知识图谱的问答装置,可以执行后文中基于知识图谱的问答方法的处理步骤,问答设备20可以是具有存储和处理能力的电脑或服务器等设备。
知识图谱用于描述真实世界中存在的各种实体及其关系。知识图谱中包括实体,实体的属性,实体的标签,以及各实体之间的关系。知识图谱可以看做是一张巨大的网。其中,属性广义上还包括属性值,属性值可以是精确的值,也可以是范围。具体的,知识图谱是由实体、实体的属性、实体与实体的关系以及实体的标签构成。
比如本发明实施例提供的知识图谱中包括公司和自然人两种实体标签。其中公司包括各种组织。其中公司有全称、简称、注册资本、经营范围、行业、地址等属性。自然人有姓名、年龄、学历、薪酬等属性。公司与公司之间有投资、被投资、供应商、客户等关系。公司与自然人有CEO、自然人股东、任职等关系。
本发明实施例提供了一种问答方法,该问答方法基于知识图谱技术实现。具体地,请参阅图2a,本发明一个实施例的问答方法包括以下步骤:
S100、获取用户输入的自然查询语句,并识别出所述自然查询语句对应于知识图谱中的语义符号,将所述自然查询语句转换为语义符号串。
在一些实施例中,请参阅图2b,本步骤S100包括以下步骤:
S101、获取用户输入的自然查询语句。
用户通过终端提供的用户界面即可输入自然查询语句,问答设备即可获得终端发送的自然查询语句。
S102、从知识图谱的数据集中匹配出自然查询语句中各个有效词组对应的语料,数据集包括实体库、属性库、标签库以及关系库。
本发明实施例中,将知识图谱中的公司全称、简称以及自然人姓名生成实体库,公司和自然人的属性生成属性库,公司与自然人的关系生成关系库,公司和自然人构成标签库。
获得自然查询语句后,先对自然查询语句进行分词,分词器加载数据集中的词,能够保证分词的时候正确的把这些词切分出来(分词技术为现有技术,本实施例中不展开具体讨论)。然后将各个词组与各个数据集进行匹配。较佳的,优选依次使用实体库、属性库、标签库以及关系库匹配自然查询语句中各个有效词组对应的语料。
例如,将“世界卫生组织的总干事
Figure DEST_PATH_IMAGE001
”中的有效词组“世界卫生组织”先从知识图谱中的实体库中匹配出来,然后在从关系库中将“总干事”匹配出来。
S103、根据语料对应的数据集类别确定自然查询语句中各个有效词组对应的语义符号。
行业中,一般用字符E代表实体,用字符R代表实体之间的关系,用字符P代表实体的属性,用字符L代表实体的标签,用字符V表示属性值,因此本步骤中,实体的语义符号为E,属性的语义符号为P,关系的语义符号为R,标签的语义符号为L,属性值的语义符号为V。
例如,将“世界卫生组织”对应的语义符号确定为E,将“总干事”对应的语义符号确定为“R”。
在一些实施例中,自然查询语句中还含有属性值,V是这样识别的:在P之后和另一个语义符号之前的语句中,去除停用词后剩下的部分。V可以是精确的值,也可以是一个范围,还可以是最大或者最小。
例如,自然查询语句“A公司投资的注册资本大于5000万的公司有哪些
Figure 194149DEST_PATH_IMAGE001
”中,有效词组“A公司”对应的语义符号为E,有效词组“投资”对应的语义符号为R,有效词组“注册资本”对应的语义符号为P,有效词组“公司”对应的语义符号为“L”,此时,有效词组“注册资本”与“公司”之间的词组“大于5000万”对应的语义符号为属性值V,下文使用V代替属性值。
在一些实施例中,“注册资本大于5000万”可使用语义符号PV对应表示。
需要说明的是,从一确定的数据集中匹配出自然人输入的自然查询语句中具有一定特征的语料是本领域技术人员已知技术,也不是本发明实施例保护的要点,此处不再赘述。
S104、根据语义符号得到自然查询语句对应的语义符号串。也就是将依次得到的语义符号依次组合即可得到语义符号串。
例如,“世界卫生组织的总干事
Figure 845710DEST_PATH_IMAGE001
”对应的语义符号依次为E和R,则语义符号串就为ER。
例如,“A公司的CEO的薪酬是多少
Figure 156606DEST_PATH_IMAGE001
”对应的语义符号依次为E、R和P,则语义符号串为ERP。
从而,本发明实施例提供的基于知识图谱的方法可将所有的查询语句分为2类,一类是以P结尾,表示该自然查询语句询问实体的属性,另一类不以P结尾,表示该自然查询语句询问的是实体。
例如,“世界卫生组织的总干事
Figure 82974DEST_PATH_IMAGE001
”对应的语义符号串就为ER,不以P结尾,表示该自然查询语句询问的是实体。“A公司的CEO的薪酬是多少
Figure 694084DEST_PATH_IMAGE001
”对应的语义符号串为ERP,表示该自然查询语句查询的是属性。
S200、根据自然查询语句与语义符号串,生成自然查询语句对应的语义路径。所述语义路径包括至少两个节点,且至少两个节点之间通过关系语义符号以及关系语义符号相应的词组链接,每个节点包括对应的实体、属性或者标签的语义符号以及实体、属性或者标签对应的词组。
该步骤用于动态构建语义路径,从而无需再针对于各种知识图谱使用各种规则来构建逻辑表达式,或者针对不同知识图谱构建不同的问答模板。
例如,在生成“A公司的CEO的薪酬是多少
Figure 59423DEST_PATH_IMAGE001
”对应的语义符号串ERP之后,可以构建相应的语义路径,如图3所示。
例如,在生成“A公司投资的注册资本大于5000万的公司有哪些
Figure 60877DEST_PATH_IMAGE001
”对应的语义符号串ERPVL后,可以构建相应的语义路径,如图4所示。
例如,在生成“投资A公司的公司还投资了什么公司”对应的语义符号串RELRL后,可以构建相应的语义路径,如图5所示。较佳的,在RE此种情况时,构建语义路径时,可将节点E构建于前,从而使得语义路径更加通顺。
例如,在生成“注册资本最多的公司的CEO的薪酬是多少
Figure 790936DEST_PATH_IMAGE001
”对应的语义符号PVLRP串后,可以构建相应的语义路径,如图6所示。
根据上述语义路径可得,一般的,所有自然查询问句查询的对象在构建的语义路径中均被最后一个节点,即末位节点表示。而每一个节点可以看出存在很多的PV和L以及该PV和L对应的词组对其进行限制。而且一个自然查询语句对应的语义路径长度理论上没有限制,通过这种方式可以将很复杂的问句成功转化为简略的语义路径,进而转化为机器可识别的机器语言。
具体的,该步骤S200包括以下步骤:
S201、根据语义符号串中的所有实体、属性或者标签依次确定语义路径的所有节点,每一个节点包括对应的实体、属性或者标签的语义符号以及实体、属性或者标签对应的词组。
例如,参阅图3,“A公司的CEO的薪酬是多少
Figure 990973DEST_PATH_IMAGE001
”的语义符号串为ERP,其中,E和P均可以依次构建为节点:(E:A公司)和(P:薪酬)。
例如,参阅图5,“投资A公司的公司还投资了什么公司”对应的语义符号串RELRL,其中,E、L以及L可依次构建出3个节点:(E:A公司)、(L:公司)以及(L:公司)。
在一些实施例中,该步骤S201中当多个实体、属性或者标签相邻(出现在一起)时,认为是对同一对象(E或PV或L)的描述,因此取他们的节点交集,节点交集包括多个实体、属性或者标签的语义符号以及多个实体、属性或者标签对应的词组。
例如,参阅图4,“A公司投资的注册资本大于5000万的公司有哪些
Figure 781075DEST_PATH_IMAGE001
”对应的语义符号ERPVL,其中,PVL三者相邻,且其一端为R,另一端无,即PVL可视为一个节点交集。从而,可以依次构建出2个节点:(E:A公司)和(PV:注册资本>5000万|L: 公司)。
S202、根据语义符号串中的关系语义符号以及关系语义符号相应的词组链接所有节点中对应的节点。
例如,“A公司的CEO的薪酬是多少
Figure 66562DEST_PATH_IMAGE001
”的语义符号串为ERP,R以及其对应的词组“CEO”用于链接这两个节点。
例如,“投资A公司的公司还投资了什么公司” 对应的语义符号串RELRL,第一个R与其对应的词组“投资”用于将第二个节点(L:公司)链接至第一节点(E:A公司),第二个R与其对应的词组“投资”用于将第二个节点(L:公司)链接至第三节点(L:公司)。
例如,“A公司投资的注册资本大于5000万的公司有哪些
Figure 537995DEST_PATH_IMAGE001
”对应的语义符号ERPVL,其中,可以依次构建出2个节点:(E:A公司)和(PV:注册资本>5000万|L: 公司),R及其对应的词组“投资”用于链接这两个节点。
S300、根据语义路径,生成知识图谱对应的机器查询语句。
该步骤用于将语义路径转换成本实施例的知识图谱所在数据库的查询语句。例如,若知识图谱存储在Neo4j数据库中,则可使用Neo4j数据库将语义路径生成机器查询语句。
例如,“投资A公司的公司还投资了什么公司”根据其语义路径转换成如下查询语句:
MATCH (n0 {名称:‘A公司’})<-[:投资]-(n1)-[:投资]->(n2:公司)
RETURN n2。
例如,“注册资本最多的公司的CEO的薪酬是多少
Figure 592539DEST_PATH_IMAGE001
”,根据器语义路径转换成下面的查询语句:
MATCH (n0:公司)-[:CEO]->(n1)
WITH n0,n1,n0.注册资本 as pv
ORDER BY pv DESC
RETURN n1.薪酬 LIMIT 1。
S400、根据机器查询语句,在Neo4j数据库中查询机器查询语句对应的问答结果,并反馈问答结果。
本领域技术人员可以理解,该机器查询语句为知识图谱对应的数据库匹配的查询语句,针对得到的机器查询语句,可以在知识图谱对应的数据库进行查询,得到问答结果。
例如,用户在搜索框中输入了自然查询语句“世界卫生组织的总干事”,用户通过终端10向问答设备20(例如是服务器)发送该自然语言查询语句,问答设备20对该自然查询语句进行识别和处理,并从数据库30中得到问答结果“谭德塞·阿达诺姆”。
本发明实施例中,通过将将自然查询语句中的各个有效词组匹配出来,并将转化为对应的语义符号,然后基于语义符号构成的语义符号串生成语义路径,最后将语义路径转换成例如Neo4j数据库查询语句,即可从数据库中查找到并返回精确查询结果。这种方式无需人工设计问题模板,继而提高效率,而且语义路径是根据自然查询语句而动态变化的,与知识图谱不具有对应性,因此对于不同的知识图谱都通用。问句的语义链路长度没有限制,在每一个节点可以有很多限制描述,这样可以解决很复杂的问句类型。可以通用于各个知识图谱中,从而在知识问答领域有广阔的应用前景。
为便于更好的实施本发明实施例的上述方案,下面还提供用于实施上述方案的相关装置。
本发明实施例提供了一种问答装置,该问答装置基于知识图谱技术实现。具体地,请参阅图7,本实施例提供的问答装置,包括:
获取模块101,获取用户输入的自然查询语句,并将所述自然查询语句转换为语义符号串。其中一个具体实施方式是,获取自然查询语句后,识别出自然查询语句对应于知识图谱中的语义符号,语义符号包括实体、实体的属性、实体的标签以及各实体之间的关系,然后基于语义符号生成语义符号串。
解析模块102,根据所述自然查询语句与所述语义符号串,生成所述自然查询语句对应的语义路径,以及根据所述语义路径,生成存储所述知识图谱的数据库所能识别的机器查询语句。其中,语义路径包括至少两个节点,且至少两个节点之间通过关系语义符号以及关系语义符号相应的词组链接,每个节点包括对应的实体、属性或者标签的语义符号以及实体、属性或者标签对应的词组。
查询模块103,根据机器查询语句,在知识图谱中查询机器查询语句对应的问答结果,并反馈问答结果。
本实施例中的问答装置是实现前述问答方法的软件***,执行前述问答方法的各个步骤,因此,对于未描述之处可以参见前述问答方法中的相关描述。
请参阅图8,本申请的实施例还提供了一种电子设备,该电子设备可以是智能手机、平板电脑、笔记本电脑、台式电脑、服务器等。
通常,电子设备包括:至少一个处理器301;以及存储器302,用于存储计算机程序指令。
处理器301可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器301可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器301也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(CentralProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器301可以在集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。处理器301还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作,使得基于知识图谱的问答可以自主训练学习,提高效率和准确度。
存储器302可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器302还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器302中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器801所执行以实现本申请中方法实施例提供的基于知识图谱的问答方法。
在一些实施例中,还可选包括有:通信接口303和至少一个***设备。处理器301、存储器302和通信接口303之间可以通过总线或信号线相连。各个***设备可以通过总线、信号线或电路板与通信接口303相连。具体地,***设备包括:射频电路304、显示屏305和电源306中的至少一种。
通信接口303可被用于将I/O(Input/Output,输入/输出)相关的至少一个***设备连接到处理器301和存储器302。在一些实施例中,处理器301、存储器302和通信接口303被集成在同一芯片或电路板上;在一些其他实施例中,处理器301、存储器302和通信接口303中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
射频电路304用于接收和发射RF(Radio Frequency,射频)信号,也称电磁信号。射频电路304通过电磁信号与通信网络以及其他通信设备进行通信。射频电路304将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路304包括:天线***、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路304可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:城域网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity,无线保真)网络。在一些实施例中,射频电路304还可以包括NFC(Near Field Communication,近距离无线通信)有关的电路,本申请对此不加以限定。
显示屏305用于显示UI(User Interface,用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏305是触摸显示屏时,显示屏305还具有采集在显示屏305的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器301进行处理。此时,显示屏305还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏305可以为一个,电子设备的前面板;在另一些实施例中,显示屏305可以为至少两个,分别设置在电子设备的不同表面或呈折叠设计;在再一些实施例中,显示屏305可以是柔性显示屏,设置在电子设备的弯曲表面上或折叠面上。甚至,显示屏305还可以设置成非矩形的不规则图形,也即异形屏。显示屏305可以采用LCD(LiquidCrystal Display,液晶显示屏)、OLED(Organic Light-Emitting Diode,有机发光二极管)等材质制备。
电源306用于为电子设备中的各个组件进行供电。电源306可以是交流电、直流电、一次性电池或可充电电池。当电源306包括可充电电池时,该可充电电池可以支持有线充电或无线充电。该可充电电池还可以用于支持快充技术。
另外需说明的是,以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外,本发明提供的装置实施例附图中,模块之间的连接关系表示它们之间具有通信连接,具体可以实现为一条或多条通信总线或信号线。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件的方式来实现,当然也可以通过专用硬件包括专用集成电路、专用CPU、专用存储器、专用元器件等来实现。一般情况下,凡由计算机程序完成的功能都可以很容易地用相应的硬件来实现,而且,用来实现同一功能的具体硬件结构也可以是多种多样的,例如模拟电路、数字电路或专用电路等。但是,对本发明而言更多情况下软件程序实现是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在可读取的存储介质中,如计算机的软盘、U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,RandomAccessMemory)、磁碟或者光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
应该理解,以上描述是为了进行图示说明而不是为了进行限制。通过阅读上述描述,在所提供的示例之外的许多实施方式和许多应用对本领域技术人员来说都将是显而易见的。因此,本教导的范围不应该参照上述描述来确定,而是应该参照所附权利要求以及这些权利要求所拥有的等价物的全部范围来确定。出于全面之目的,所有文章和参考包括专利申请和公告的公开都通过参考结合在本文中。在前述权利要求中省略这里公开的主题的任何方面并不是为了放弃该主体内容,也不应该认为发明人没有将该主题考虑为所公开的发明主题的一部分。

Claims (9)

1.一种问答方法,其特征在于,包括:
获取用户输入的自然查询语句,并将所述自然查询语句转换为语义符号串;
根据所述自然查询语句与所述语义符号串,生成所述自然查询语句对应的语义路径;
根据所述语义路径,生成存储知识图谱的数据库所能识别的机器查询语句;
根据所述机器查询语句,在存储知识图谱的数据库中查询所述机器查询语句对应的问答结果,并反馈所述问答结果。
2.根据权利要求1所述的问答方法,其特征在于,所述获取用户输入的自然查询语句,并将所述自然查询语句转换为语义符号串, 包括:
获取用户输入的自然查询语句;
从数据集中匹配出自然查询语句中各个有效词组对应的语料,所述数据集包括实体库、属性库、标签库以及关系库;
根据所述语料对应的数据集类别确定所述自然查询语句的各个有效词组对应的语义符号;
根据语义符号得到自然查询语句对应的语义符号串。
3.根据权利要求2所述的问答方法,其特征在于,所述从数据集中匹配出自然查询语句中各个有效词组对应的语料,包括:
依次使用实体库、属性库、标签库以及关系库匹配所述自然查询语句中各个有效词组对应的语料。
4.根据权利要求1所述的问答方法,其特征在于,所述根据所述自然查询语句与所述语义符号串,生成所述自然查询语句对应的语义路径,包括:
根据所述语义符号串中的所有实体、属性或者标签依次确定所述语义路径的所有节点,每一个所述节点包括对应的实体、属性或者标签的语义符号以及所述实体、属性或者标签对应的词组;
根据所述语义符号串中的关系语义符号以及所述关系语义符号相应的词组链接所有节点中相应的节点。
5.根据权利要求4所述的问答方法,其特征在于,所述根据所述语义符号串中的所有实体、属性或者标签依次确定所述语义路径的所有节点的步骤中,
当多个实体、属性或者标签相邻时,求取所述多个实体、属性或者标签的交集,作为一个节点交集,所述节点交集包括所述多个实体、属性或者标签的语义符号以及所述多个实体、属性或者标签对应的词组。
6.根据权利要求1所述的问答方法,其特征在于,使用Neo4j数据库将所述语义路径生成所述机器查询语句。
7.一种问答装置,其特征在于,包括:
获取模块,获取用户输入的自然查询语句,并将所述自然查询语句转换为语义符号串;
解析模块,根据所述自然查询语句与所述语义符号串,生成所述自然查询语句对应的语义路径,以及根据所述语义路径,生成存储知识图谱的数据库所能识别的机器查询语句;
查询模块,根据所述机器查询语句,在存储知识图谱的数据库中查询所述机器查询语句对应的问答结果,并反馈所述问答结果。
8.一种电子设备,包括:
处理器以及存储器,存储器用于存储计算机程序指令;
其中,当所述计算机程序由所述处理器加载并运行时,所述处理器执行如权利要求1-6任一所述的问答方法。
9.一种计算机可读储存介质,其特征在于,所述计算机可读储存介质存储计算机程序指令,所述计算机程序被处理器加载并运行时,所述处理器执行如权利要求1-6任一所述的问答方法。
CN202010306777.6A 2020-04-17 2020-04-17 一种问答方法及问答装置、电子设备、存储介质 Active CN111241252B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010306777.6A CN111241252B (zh) 2020-04-17 2020-04-17 一种问答方法及问答装置、电子设备、存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010306777.6A CN111241252B (zh) 2020-04-17 2020-04-17 一种问答方法及问答装置、电子设备、存储介质

Publications (2)

Publication Number Publication Date
CN111241252A true CN111241252A (zh) 2020-06-05
CN111241252B CN111241252B (zh) 2020-08-14

Family

ID=70864735

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010306777.6A Active CN111241252B (zh) 2020-04-17 2020-04-17 一种问答方法及问答装置、电子设备、存储介质

Country Status (1)

Country Link
CN (1) CN111241252B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112559709A (zh) * 2020-12-16 2021-03-26 中国平安人寿保险股份有限公司 基于知识图谱的问答方法、装置、终端以及存储介质
CN112579600A (zh) * 2020-12-21 2021-03-30 广州橙行智动汽车科技有限公司 一种基于车载问答的数据处理方法和装置
CN112966075A (zh) * 2021-02-23 2021-06-15 北京新方通信技术有限公司 一种基于特征树的语义匹配问答方法及***
CN113515640A (zh) * 2021-04-13 2021-10-19 北京捷通华声科技股份有限公司 查询语句生成方法及装置
CN113535919A (zh) * 2021-07-16 2021-10-22 北京元年科技股份有限公司 一种数据查询的方法、装置、计算机设备以及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140280307A1 (en) * 2013-03-15 2014-09-18 Google Inc. Question answering to populate knowledge base
CN107247736A (zh) * 2017-05-08 2017-10-13 广州索答信息科技有限公司 一种基于知识图谱的厨房领域问答方法及***
CN108268580A (zh) * 2017-07-14 2018-07-10 广东神马搜索科技有限公司 基于知识图谱的问答方法及装置
CN108959433A (zh) * 2018-06-11 2018-12-07 北京大学 一种从软件项目数据中提取知识图谱并问答的方法与***
CN109033135A (zh) * 2018-06-06 2018-12-18 北京大学 一种面向软件项目知识图谱的自然语言查询方法及***
CN109492077A (zh) * 2018-09-29 2019-03-19 北明智通(北京)科技有限公司 基于知识图谱的石化领域问答方法及***
CN110837550A (zh) * 2019-11-11 2020-02-25 中山大学 基于知识图谱的问答方法、装置、电子设备及存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140280307A1 (en) * 2013-03-15 2014-09-18 Google Inc. Question answering to populate knowledge base
CN107247736A (zh) * 2017-05-08 2017-10-13 广州索答信息科技有限公司 一种基于知识图谱的厨房领域问答方法及***
CN108268580A (zh) * 2017-07-14 2018-07-10 广东神马搜索科技有限公司 基于知识图谱的问答方法及装置
CN109033135A (zh) * 2018-06-06 2018-12-18 北京大学 一种面向软件项目知识图谱的自然语言查询方法及***
CN108959433A (zh) * 2018-06-11 2018-12-07 北京大学 一种从软件项目数据中提取知识图谱并问答的方法与***
CN109492077A (zh) * 2018-09-29 2019-03-19 北明智通(北京)科技有限公司 基于知识图谱的石化领域问答方法及***
CN110837550A (zh) * 2019-11-11 2020-02-25 中山大学 基于知识图谱的问答方法、装置、电子设备及存储介质

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112559709A (zh) * 2020-12-16 2021-03-26 中国平安人寿保险股份有限公司 基于知识图谱的问答方法、装置、终端以及存储介质
CN112579600A (zh) * 2020-12-21 2021-03-30 广州橙行智动汽车科技有限公司 一种基于车载问答的数据处理方法和装置
CN112966075A (zh) * 2021-02-23 2021-06-15 北京新方通信技术有限公司 一种基于特征树的语义匹配问答方法及***
CN113515640A (zh) * 2021-04-13 2021-10-19 北京捷通华声科技股份有限公司 查询语句生成方法及装置
CN113535919A (zh) * 2021-07-16 2021-10-22 北京元年科技股份有限公司 一种数据查询的方法、装置、计算机设备以及存储介质

Also Published As

Publication number Publication date
CN111241252B (zh) 2020-08-14

Similar Documents

Publication Publication Date Title
CN111241252B (zh) 一种问答方法及问答装置、电子设备、存储介质
CN107735804B (zh) 用于不同标记集合的转移学习技术的***和方法
US20220198327A1 (en) Method, apparatus, device and storage medium for training dialogue understanding model
US20220019744A1 (en) Multi-modal pre-training model acquisition method, electronic device and storage medium
CN111985240B (zh) 命名实体识别模型的训练方法、命名实体识别方法及装置
CN110619050B (zh) 意图识别方法及设备
JP2018073411A (ja) 自然言語の生成方法、自然言語の生成装置及び電子機器
CN104424358A (zh) 用于具有多功率模式的计算设备的动态信息适配
CN108628830A (zh) 一种语义识别的方法和装置
CN112131401B (zh) 一种概念知识图谱构建方法和装置
CN105426508A (zh) 网页生成方法和装置
CN106919711A (zh) 基于人工智能的标注信息的方法和装置
CN114186690B (zh) 飞行器知识图谱构建方法、装置、设备及存储介质
CN110874534B (zh) 数据处理方法和数据处理装置
CN116303537A (zh) 数据查询方法及装置、电子设备、存储介质
CN110674637B (zh) 一种人物关系识别模型训练方法、装置、设备及介质
CN111553163A (zh) 文本相关度的确定方法、装置、存储介质及电子设备
CN114092948B (zh) 一种票据识别方法、装置、设备以及存储介质
CN117909560A (zh) 搜索方法、模型的训练方法、装置、设备、介质及程序产品
CN115248890A (zh) 用户兴趣画像的生成方法、装置、电子设备以及存储介质
US20210263915A1 (en) Search Text Generation System and Search Text Generation Method
CN114490990B (zh) 待标注文本的确定方法、装置、设备和存储介质
WO2023183070A1 (en) Method and system of retrieving multimodal assets
CN112069267A (zh) 一种数据处理方法和装置
CN112084780B (zh) 自然语言处理中共指消解方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Question answering method, question answering device, electronic equipment and storage medium

Effective date of registration: 20210818

Granted publication date: 20200814

Pledgee: The Agricultural Bank of Chengdu branch of Limited by Share Ltd. Chinese Sichuan

Pledgor: CHENGDU BUSINESS BIG DATA TECHNOLOGY Co.,Ltd.

Registration number: Y2021980007811

PE01 Entry into force of the registration of the contract for pledge of patent right
PP01 Preservation of patent right

Effective date of registration: 20240428

Granted publication date: 20200814

PP01 Preservation of patent right