CN110347810A - 对话式检索回答方法、装置、计算机设备及存储介质 - Google Patents

对话式检索回答方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN110347810A
CN110347810A CN201910464157.2A CN201910464157A CN110347810A CN 110347810 A CN110347810 A CN 110347810A CN 201910464157 A CN201910464157 A CN 201910464157A CN 110347810 A CN110347810 A CN 110347810A
Authority
CN
China
Prior art keywords
knowledge
keyword
node
financial
sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910464157.2A
Other languages
English (en)
Other versions
CN110347810B (zh
Inventor
张瑜
李钢
秦鹏
谭瑞
车驰
权佳成
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Ruyi Information Technology Co ltd
Original Assignee
Chongqing Financial Assets Exchange LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing Financial Assets Exchange LLC filed Critical Chongqing Financial Assets Exchange LLC
Priority to CN201910464157.2A priority Critical patent/CN110347810B/zh
Publication of CN110347810A publication Critical patent/CN110347810A/zh
Application granted granted Critical
Publication of CN110347810B publication Critical patent/CN110347810B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种基于知识图谱的对话式检索回答方法、装置、计算机设备及存储介质,方法包括通过获取财政问题语句;语义识别财政问题语句,将财政问题语句拆分为若干个关键词;根据若干个关键词在财政问题语句中的前后顺序,确认出在财政知识图谱中知识节点的节点搜索路径;根据节点搜索路径在财政知识图谱中查找到对应的答案知识节点,并调取答案知识节点的答案内容,将答案内容反馈至计算机设备;从而解决目前机器没有消除歧义的功能,以及解决财政类知识图谱未成型回答速度慢的技术问题。

Description

对话式检索回答方法、装置、计算机设备及存储介质
技术领域
本发明涉及财政类知识图谱领域,特别涉及一种对话式检索回答方法、装置、计算机设备及存储介质。
背景技术
目前市面上财政类知识图谱并未成型;在用户搜索财政类问题时,通常是计算机需要针对用户说出的问题在互联网中进行查找,将查找到的答案回答给用户,这样并没有使用到财政知识图谱,机器的回答速度慢。
同时,当用户在对话时说出具有歧义的话语时,机器没有消除歧义的功能,导致机器无法给出用户想要的答案。
发明内容
本发明的目的是提供一种对话式检索回答方法、装置、计算机设备及存储介质,旨在解决机器没有消除歧义的功能,和解决财政类知识图谱未成型回答速度慢的技术问题。
为实现上述目的,本发明提供如下技术方案:
本发明提供一种对话式检索回答方法,包括:
获取用户通过计算机设备输入的财政问题语句;
语义识别所述财政问题语句,将所述财政问题语句拆分为若干个关键词;
分析所述若干个关键词中是否存在歧义关键词,所述歧义关键词为在预先建立的财政知识图谱中能够查找到多个知识节点的关键词;
若存在,则将所述歧义关键词对应的多个知识节点反馈至所述计算机设备以供所述用户选择其中一个知识节点作为所述歧义关键词对应的知识节点;
分析所述若干个关键词中是否具有所述财政知识图谱中不存在对应知识节点的无效关键词;
若具有,则在所述财政知识图谱中创建对应所述无效关键词的新的知识节点,并根据所述无效关键词进行对应的互联网搜索,将搜索到的关键词内容作为所述新的知识节点的节点内容;
在所述财政知识图谱中,确定所述若干个关键词中的正常关键词对应的知识节点;并根据所述歧义关键词、无效关键词与正常关键词在所述财政问题语句中的前后顺序以及所述歧义关键词、无效关键词与正常关键词分别对应的知识节点,确认出对应的节点搜索路径;其中,所述正确关键词为所述预先建立的财政知识图谱中能够查找到唯一知识节点的关键词;
根据所述节点搜索路径在所述财政知识图谱中查找到对应的答案知识节点,并调取所述答案知识节点的答案内容,将所述答案内容反馈至所述计算机设备。
进一步地,所述财政知识图谱的建立方法包括:
获取管理人员通过管理终端输入的文本资料数据,所述文本资料数据包括实体类数据和事件类数据,所述实体类数据为所有的知识节点,所述事件类数据关联不同的所述知识节点;
通过所述事件类数据将所述知识节点进行关联连接,得到网状的初步知识图谱;
针对所述网状的初步知识图谱中所有的知识节点进行互联网搜索,得到与所述所有的知识节点一一对应的知识节点内容;
将所述所有的知识节点与对应的所述知识节点内容进行关联,得到所述财政知识图谱。
进一步地,所述获取管理人员通过管理终端输入的文本资料数据的步骤之后包括:
识别出所述所有的知识节点中是否存在相同语义的相同知识节点;
若是,则将两项及以上的所述相同时间节点整合为一个知识节点。
进一步地,所述分析所述若干个关键词中是否具有所述财政知识图谱中不存在对应知识节点的无效关键词的步骤之后,包括:
若存在,则将所述无效关键词进行互联网搜索以判断是否为缩写关键词;
若是,则获取所述缩写关键词对应的完整关键词;
在所述财政知识图谱中查找是否存有所述完整关键词对应的知识节点;
若不存在,则将所述完整关键词作为所述无效关键词,生成指令以用于在所述财政知识图谱中创建对应所述无效关键词的新的知识节点,并根据所述无效关键词进行对应的互联网搜索。
进一步地,所述语义识别所述财政问题语句,将所述财政问题语句拆分为若干个关键词的步骤包括:
将所述财政问题语句拆分为多个词语,并识别所述多个词语分别对应的关键词;
若识别不到,则在专业术语库中查找是否存在与所述识别不到的词语对应的专业术语词,其中,所述专业术语库为预存有所有所述专业术语词的数据库;
调取所述专业术语词作为所述识别不到的词语对应的关键词,根据所述多个词语分别对应的关键词作为所述财政问题语句拆分得到的若干个关键词。
本发明提供一种对话式检索回答装置,包括:
语句获取单元,用于获取用户通过计算机设备输入的财政问题语句;
关键词识别单元,用于语义识别所述财政问题语句,将所述财政问题语句拆分为若干个关键词;
歧义分析单元,用于分析所述若干个关键词中是否存在歧义关键词,所述歧义关键词为在预先建立的财政知识图谱中能够查找到多个知识节点的关键词;
歧义确定单元,用于若存在,则将所述歧义关键词对应的多个知识节点反馈至所述计算机设备以供所述用户选择其中一个知识节点作为所述歧义关键词对应的知识节点;
无效分析单元,用于分析所述若干个关键词中是否具有所述财政知识图谱中不存在对应知识节点的无效关键词;
无效确定单元,用于若具有,则在所述财政知识图谱中创建对应所述无效关键词的新的知识节点,并根据所述无效关键词进行对应的互联网搜索,将搜索到的关键词内容作为所述新的知识节点的节点内容;
路径确定单元,用于在所述财政知识图谱中,确定所述若干个关键词中的正常关键词对应的知识节点;并根据所述歧义关键词、无效关键词与正常关键词在所述财政问题语句中的前后顺序以及所述歧义关键词、无效关键词与正常关键词分别对应的知识节点,确认出对应的节点搜索路径;其中,所述正确关键词为所述预先建立的财政知识图谱中能够查找到唯一知识节点的关键词;
答案反馈单元,用于根据所述节点搜索路径在所述财政知识图谱中查找到对应的答案知识节点,并调取所述答案知识节点的答案内容,将所述答案内容反馈至所述计算机设备。
进一步地,对话式检索回答装置还包括:
资料获取单元,用于获取管理人员通过管理终端输入的文本资料数据,所述文本资料数据包括实体类数据和事件类数据,所述实体类数据为所有的知识节点,所述事件类数据关联不同的所述知识节点;
初步形成单元,用于通过所述事件类数据将所述知识节点进行关联连接,得到网状的初步知识图谱;
内容查找单元,用于针对所述网状的初步知识图谱中所有的知识节点进行互联网搜索,得到与所述所有的知识节点一一对应的知识节点内容;
内容关联单元,用于将所述所有的知识节点与对应的所述知识节点内容进行关联,得到所述财政知识图谱。
进一步地,对话式检索回答装置还包括:
相同语义识别单元,用于识别出所有的知识节点中是否存在相同语义的相同知识节点;
整合单元,用于若是,则将两项及以上的相同时间节点整合为一个知识节点
本发明还提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述的对话式检索回答方法的步骤。
本发明还提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现上述的对话式检索回答方法的步骤。
本发明提供了一种对话式检索回答方法、装置、计算机设备及存储介质,具有以下有益效果:
服务器通过获取用户通过计算机设备输入的财政问题语句;语义识别财政问题语句,将财政问题语句拆分为若干个关键词;分析若干个关键词中是否存在歧义关键词,歧义关键词为一个关键词在预先建立的财政知识图谱中能够查找到多个知识节点的关键词;若存在,则将歧义关键词对应的多个知识节点反馈至计算机设备以供用户选择其中一个知识节点作为歧义关键词对应的知识节点;分析若干个关键词中是否具有财政知识图谱中不存在对应知识节点的无效关键词;若具有,则在财政知识图谱中创建对应无效关键词的新的知识节点,并根据无效关键词进行对应的互联网搜索,将搜索到的关键词内容作为新的知识节点的节点内容;在财政知识图谱中,确定若干个关键词中的正常关键词对应的知识节点;并根据若干个关键词在财政问题语句中的前后顺序以及各个关键词分别对应的知识节点,确认出对应的节点搜索路径;根据节点搜索路径在财政知识图谱中查找到对应的答案知识节点,并调取答案知识节点的答案内容,将答案内容反馈至计算机设备,从而解决机器没有消除歧义的功能,和解决财政类知识图谱未成型回答速度慢的技术问题。
附图说明
图1为本发明第一实施例中对话式检索回答方法的流程示意图;
图2为本发明第二实施例中对话式检索回答方法的流程示意图;
图3为本发明第一实施例中对话式检索回答装置的结构示意框图;
图4为本发明第二实施例中对话式检索回答装置的结构示意框图;
图5为本发明的计算机设备一实施例的结构示意框图。
本发明为目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供一种服务器,由服务器执行对话式检索回答方法。
参考附图1,为本发明提供的对话式检索回答方法的流程示意图包括:
S100,获取用户通过计算机设备输入的财政问题语句;
财政问题语句为用户通过操作计算机设备输入的文本语句,包括识别用户语音信息形成的文本语句和用户手动输入的文本语句。具体为财政类的问题,例如:A省B市C年的税收数据,若上述财政问题语句为用户通过计算机设备语音输入的,则服务器对该财政问题语音进行自然语言处理,以得到文本形式的财政问题语句。
S200,语义识别财政问题语句,将财政问题语句拆分为若干个关键词;
为了去除财政问题语句中无用的文本,例如:财政问题语句为“A省B市C年的税收数据和GPD增长率是?”去除无用的文本后,得到关键词“A省、B市、C年、税收数据、GDP增长率”得到上述若干个关键词的步骤具有三种:
第一种为,识别财政问题语句的语义,仅保留财政问题语句中的名词,从而得到若干个关键词。
第二种为,在服务器的关键词存储库中预存有管理人员事先设定的预设关键词,若财政问题语句中出现有与预设关键词相同的关键词,则保留该关键词,从而得到若干个关键词;
第三种为,财政知识图谱中具有A省、B市、C年、税收数据、GDP增长率的知识节点,通过财政知识图谱中的知识节点在财政问题语句中找出关键词,从而得到若干个关键词。
S300,分析若干个关键词中是否存在歧义关键词,歧义关键词为在预先建立的财政知识图谱中能够查找到多个知识节点的关键词;
上述财政知识图谱为事先创建并保存于服务器的知识图谱,服务器在获取到上述若干个关键词后,判断若干个关键词在财政知识图谱中是否存在一个关键词对应多个知识节点的歧义关键词。例如:X为一般公共,在财政知识图谱中存有一般公共预算、一般公共预算支出和一般公共预算收入的知识节点,故财政问题语句中的关键词X在财政知识图谱中存在三个知识节点,关键词X为歧义关键词。
S400,若存在,则将歧义关键词对应的多个知识节点反馈至计算机设备以供用户选择其中一个知识节点作为歧义关键词对应的知识节点;
若服务器判定一个关键词对应有多个知识节点,则服务器将上述多个知识节点以选项的形式调取出来,并将多个知识节点对应的选项以文本形式发送至计算机设备,便于在计算机设备的屏幕上呈现,通过用户进行选择一个知识节点达到消除关键词歧义的效果。例如:关键词X为一般公共,则服务器在财政知识图谱中调取与关键词X对应的一般公共预算、一般公共预算支出和一般公共预算收入,将上述一般公共预算、一般公共预算支出和一般公共预算收入反馈给用户的计算机设备选择任意一项,从而达到消除关键词X歧义的效果。
S500,分析若干个关键词中是否具有财政知识图谱中不存在的对应知识节点的无效关键词;
服务器分析上述若干个关键词中是否具有财政知识图谱中不存在的无效关键词,方式即为:在财政知识图谱中查找是否存在与关键词相同词义的知识节点。例如:在财政问题语句中出现了关键词“广州市、纳税数据”,但在财政知识图谱中仅存在“广州市”但不存在“纳税数据”,故关键词“纳税数据”为无效关键词。
S600,若具有,则在财政知识图谱中创建对应无效关键词的新的知识节点,并根据无效关键词进行对应的互联网搜索,将搜索到的关键词内容作为新的知识节点的节点内容;
若服务器识别到上述若干个关键词中存在无效关键词,则将无效关键词作为新的知识节点添加于财政知识图谱中,但该无效关键词没有关联任何的内容,故服务器通过互联网搜索与无效关键词对应的内容,以得到节点内容,以上述节点内容作为无效关键词的内容,通过此种方式拓展训练财政知识图谱。
例如:以关键词“纳税数据”作为无效关键词,在财政知识图谱中添加“纳税数据”的新的知识节点,并在互联网中搜索“纳税数据”对应的内容,将搜索的内容作为节点内容,并将节点内容与“纳税数据”的知识节点进行关联。
S700,在财政知识图谱中,确定若干个关键词中的正常关键词对应的知识节点;并根据歧义关键词、无效关键词与正常关键词在财政问题语句中的前后顺序以及歧义关键词、无效关键词与正常关键词分别对应的知识节点,确认出对应的节点搜索路径;其中,正确关键词为预先建立的财政知识图谱中能够查找到唯一知识节点的关键词;
如上述例子所示,上述若干个关键词在财政问题语句中的前后顺序是“A省、B市、C年、税收数据”,故服务器在财政知识图谱中找到“A省、B市、C年、税收数据”对应知识节点的节点搜索路径。
S800,根据节点搜索路径在财政知识图谱中查找到对应的答案知识节点,并调取答案知识节点的答案内容,将答案内容反馈至计算机设备。
如上述例子所示,上述若干个关键词在财政问题语句中的节点搜索路径是“A省、B市、C年、税收数据”,故答案知识节点为“税收数据”,故服务器调取“税收数据”的答案内容,将答案内容反馈至计算机设备,其中答案内容包括文本答案、表格答案或图片答案一项或多项。
通过上述获取用户操作计算机设备输入的财政问题语句;语义识别财政问题语句,将财政问题语句拆分为若干个关键词;分析若干个关键词中在预先建立的财政知识图谱中是否存在一个关键词对应多个知识节点的歧义关键词;若是,则将多个知识节点反馈至计算机设备以供用户选择一个知识节点作为歧义关键词对应的知识节点;分析若干个关键词中是否具有财政知识图谱中不存在的无效关键词;若是,则在财政知识图谱中创建对应无效关键词的新的知识节点,并根据无效关键词进行对应的互联网搜索,将搜索到的关键词内容作为新的知识节点的节点内容;根据若干个关键词在财政问题语句中的前后顺序,确认出在财政知识图谱中知识节点的节点搜索路径;根据节点搜索路径在财政知识图谱中查找到对应的答案知识节点,并调取答案知识节点的答案内容,将答案内容反馈至计算机设备;从而解决目前机器没有消除歧义的功能,以及解决财政类知识图谱未成型回答速度慢的技术问题。
参考附图2,为本发明对话式检索回答方法在一个实施例中的流程示意图,提出一种财政知识图谱的建立方法包括:
S001,获取管理人员通过管理终端输入的文本资料数据,文本资料数据包括实体类数据和事件类数据,实体类数据为所有的知识节点,事件类数据为关联关联不同的知识节点;
上述管理人员为通过服务器制作财政知识图谱,并管理服务器的用户;上述实体类数据包括一阶实体、二阶实体、三阶实体等,事件类数据为实体类数据的连接桥梁,可以是一阶实体通过一个事件连接二阶实体,也可以是一阶实体通过一个事件连接另一个一阶实体。
例如:一阶实体为“A省”,二阶实体为“B市”,事件类数据包含一个事件类型是“下级市”,故在财政知识图谱中“A省”通过“下级市”的事件与“B市”进行关联。需要说明:实体类数据均为知识节点,而事件类数据为关联各个知识节点的条件。
S002,通过事件类数据将知识节点进行关联连接,得到网状的初步知识图谱;
S003,针对网状的初步知识图谱中所有的知识节点进行互联网搜索,得到与所有的知识节点一一对应的知识节点内容;
S004,将所有的知识节点与对应的知识节点内容进行关联,得到财政知识图谱。
在服务器制作了初步知识图谱之后,需要对所有的知识节点进行内容的田中,方式为:将所有的知识节点一一通过互联网进行搜索,得到一一对应的知识节点内容;最终,通过将知识节点内容与其对应的知识节点进行关联绑定,得到财政知识图谱。
在另一个实施例中,财政知识图谱在预设时间内会重新制作,目的为更新数据,如一个月更新一次。
在一个实施例中,获取管理人员通过管理终端输入的文本资料数据的步骤S001之后包括:
S011识别出所有的知识节点中是否存在相同语义的相同知识节点;
S021若是,则将两项及以上的相同时间节点整合为一个知识节点。
在制作财政知识图谱的过程中,若服务器识别所有的知识节点中存在相同语义的相同知识节点,如:得到A省政府和A省人民政府两个知识节点,服务器识别该两个知识节点的语义,若语义相同,则整合为一个知识节点,即A省政府。
在一个实施例中,分析若干个关键词中是否具有财政知识图谱中不存在对应知识节点的无效关键词的步骤S400之后,包括:
S410,若存在,则将无效关键词进行互联网搜索以判断是否为缩写关键词;
S420,若是,则获取缩写关键词对应的完整关键词;
S430,在财政知识图谱中查找是否存有完整关键词对应的知识节点;
S440,若不存在,则将完整关键词作为无效关键词,生成指令以用于在财政知识图谱中创建对应无效关键词的新的知识节点,并根据无效关键词进行对应的互联网搜索。
例如:用户输入的财政问题语句为“深圳市的高新企业”,其中“高新企业”在财政知识图谱中不存在对应的知识节点,故将该“高新企业”进行互联网搜索,判断是否为缩写关键词,若服务器经过互联网搜索查找到对应的完整关键词,则获取该完整关键词,如“高新企业”进行互联网搜索后得到“高新技术企业”。服务器在财政知识图谱中查找是否存在完整关键词对应的知识节点,若无,则将完整关键词作为无效关键词,生成用于在财政知识图谱中创建对应无效关键词的新的知识节点,并根据无效关键词进行对应的互联网搜索的创建指令。
在一个实施例中,语义识别财政问题语句,将财政问题语句拆分为若干个关键词的步骤S200包括:
S210,将财政问题语句拆分为多个词语,并识别多个词语分别对应的关键词;
S220,若识别不到,则在专业术语库中查找是否存在与识别不到的词语对应的专业术语词,其中,专业术语库为预存有所有专业术语词的数据库;
S230,调取专业术语词作为识别不到的词语对应的关键词,根据多个词语分别对应的关键词作为财政问题语句拆分得到的若干个关键词。
上述无法辨识的关键词为服务器无法通过语义处理得到的关键词,故需要在专业术语库中查找对应的专业术语词。
参考附图3,为本发明提供的对话式检索回答装置的结构示意框图包括:
语句获取单元10,用于获取用户通过计算机设备输入的财政问题语句;
财政问题语句为用户通过操作计算机设备输入的文本语句,包括识别用户语音信息形成的文本语句和用户手动输入的文本语句。具体为财政类的问题,例如:A省B市C年的税收数据,若上述财政问题语句为用户通过计算机设备语音输入的,则服务器对该财政问题语音进行自然语言处理,以得到文本形式的财政问题语句。
关键词识别单元20,用于语义识别财政问题语句,将财政问题语句拆分为若干个关键词;
为了去除财政问题语句中无用的文本,例如:财政问题语句为“A省B市C年的税收数据和GPD增长率是?”去除无用的文本后,得到关键词“A省、B市、C年、税收数据、GDP增长率”得到上述若干个关键词的步骤具有三种:
第一种为,识别财政问题语句的语义,仅保留财政问题语句中的名词,从而得到若干个关键词。
第二种为,在服务器的关键词存储库中预存有管理人员事先设定的预设关键词,若财政问题语句中出现有与预设关键词相同的关键词,则保留该关键词,从而得到若干个关键词;
第三种为,财政知识图谱中具有A省、B市、C年、税收数据、GDP增长率的知识节点,通过财政知识图谱中的知识节点在财政问题语句中找出关键词,从而得到若干个关键词。
歧义分析单元30,用于分析若干个关键词中是否存在歧义关键词,歧义关键词为在预先建立的财政知识图谱中能够查找到多个知识节点的关键词;
上述财政知识图谱为事先创建并保存于服务器的知识图谱,服务器在获取到上述若干个关键词后,判断若干个关键词在财政知识图谱中是否存在一个关键词对应多个知识节点的歧义关键词。例如:关键词X为一般公共,则在财政知识图谱中存有一般公共预算、一般公共预算支出和一般公共预算收入的知识节点,故财政问题语句中的关键词X在财政知识图谱中存在三个知识节点,关键词X为歧义关键词。
歧义确定单元40,用于若存在,则将歧义关键词对应的多个知识节点反馈至计算机设备以供用户选择其中一个知识节点作为歧义关键词对应的知识节点;
若服务器判定一个关键词对应有多个知识节点,则服务器将上述多个知识节点以选项的形式调取出来,并将多个知识节点以文本形式发送至计算机设备,便于在计算机设备的屏幕上呈现,通过用户进行选择一个知识节点达到消除关键词歧义的效果。例如:服务器在财政知识图谱中调取与关键词X对应的一般公共预算、一般公共预算支出和一般公共预算收入,将上述一般公共预算、一般公共预算支出和一般公共预算收入反馈给用户的计算机设备选择任意一项,从而达到消除关键词X歧义的效果。
无效分析单元50,用于分析若干个关键词中是否具有财政知识图谱中不存在的对应知识节点的无效关键词;
服务器分析上述若干个关键词中是否具有财政知识图谱中不存在的无效关键词,方式即为:在财政知识图谱中查找是否存在与关键词相同词义的知识节点。例如:在财政问题语句中出现了关键词“广州市、纳税数据”,但在财政知识图谱中仅存在“广州市”但不存在“纳税数据”,故关键词“纳税数据”为无效关键词。
无效确定单元60,用于若具有,则在财政知识图谱中创建对应无效关键词的新的知识节点,并根据无效关键词进行对应的互联网搜索,将搜索到的关键词内容作为新的知识节点的节点内容;
若服务器识别到上述若干个关键词中存在无效关键词,则将无效关键词作为新的知识节点添加于财政知识图谱中,但该无效关键词没有关联任何的内容,故服务器通过互联网搜索与无效关键词对应的内容,以得到节点内容,以上述节点内容作为无效关键词的内容,通过此种方式拓展训练财政知识图谱。
例如:以关键词“纳税数据”作为无效关键词,在财政知识图谱中添加“纳税数据”的新的知识节点,并在互联网中搜索“纳税数据”对应的内容,将搜索的内容作为节点内容,并将节点内容与“纳税数据”的知识节点进行关联。
路径确定单元70,用于在财政知识图谱中,确定若干个关键词中的正常关键词对应的知识节点;并根据歧义关键词、无效关键词与正常关键词在财政问题语句中的前后顺序以及歧义关键词、无效关键词与正常关键词分别对应的知识节点,确认出对应的节点搜索路径;其中,正确关键词为预先建立的财政知识图谱中能够查找到唯一知识节点的关键词;
如上述例子所示,上述若干个关键词在财政问题语句中的前后顺序是“A省、B市、C年、税收数据”,故服务器在财政知识图谱中找到“A省、B市、C年、税收数据”对应知识节点的节点搜索路径。
答案反馈单元80,用于根据节点搜索路径在财政知识图谱中查找到对应的答案知识节点,并调取答案知识节点的答案内容,将答案内容反馈至计算机设备。
如上述例子所示,上述若干个关键词在财政问题语句中的节点搜索路径是“A省、B市、C年、税收数据”,故答案知识节点为“税收数据”,故服务器调取“税收数据”的答案内容,将答案内容反馈至计算机设备,其中答案内容包括文本答案、表格答案或图片答案一项或多项。
通过上述获取用户操作计算机设备输入的财政问题语句;语义识别财政问题语句,将财政问题语句拆分为若干个关键词;分析若干个关键词中在预先建立的财政知识图谱中是否存在一个关键词对应多个知识节点的歧义关键词;若是,则将多个知识节点反馈至计算机设备以供用户选择一个知识节点作为歧义关键词对应的知识节点;分析若干个关键词中是否具有财政知识图谱中不存在的无效关键词;若是,则在财政知识图谱中创建对应无效关键词的新的知识节点,并根据无效关键词进行对应的互联网搜索,将搜索到的关键词内容作为新的知识节点的节点内容;根据若干个关键词在财政问题语句中的前后顺序,确认出在财政知识图谱中知识节点的节点搜索路径;根据节点搜索路径在财政知识图谱中查找到对应的答案知识节点,并调取答案知识节点的答案内容,将答案内容反馈至计算机设备;从而解决目前机器没有消除歧义的功能,以及解决财政类知识图谱未成型回答速度慢的技术问题。
参考附图4,为本发明对话式检索回答装置在一个实施例的结构示意框图,通过如下单元执行财政知识图谱的建立过程包括:
资料获取单元01,用于获取管理人员通过管理终端输入的文本资料数据,文本资料数据包括实体类数据和事件类数据,实体类数据为所有的知识节点,事件类数据为关联关联不同的知识节点;
上述管理人员为通过服务器制作财政知识图谱,并管理服务器的用户;上述实体类数据包括一阶实体、二阶实体、三阶实体等,事件类数据为实体类数据的连接桥梁,可以是一阶实体通过一个事件连接二阶实体,也可以是一阶实体通过一个事件连接另一个一阶实体。
例如:一阶实体为“A省”,二阶实体为“B市”,事件类数据包含一个事件类型是“下级市”,故在财政知识图谱中“A省”通过“下级市”的事件与“B市”进行关联。需要说明:实体类数据均为知识节点,而事件类数据为关联各个知识节点的条件。
初步形成单元02,用于通过事件类数据将知识节点进行关联连接,得到网状的初步知识图谱;
内容查找单元03,用于针对网状的初步知识图谱中所有的知识节点进行互联网搜索,得到与所有的知识节点一一对应的知识节点内容;
内容关联单元04,用于将所有的知识节点与对应的知识节点内容进行关联,得到财政知识图谱。
在服务器制作了初步知识图谱之后,需要对所有的知识节点进行内容的田中,方式为:将所有的知识节点一一通过互联网进行搜索,得到一一对应的知识节点内容;最终,通过将知识节点内容与其对应的知识节点进行关联绑定,得到财政知识图谱。
在另一个实施例中,财政知识图谱在预设时间内会重新制作,目的为更新数据,如一个月更新一次。
在一个实施例中,对话式检索回答装置还包括:
相同语义识别单元,用于识别出所有的知识节点中是否存在相同语义的相同知识节点;
整合单元,用于若是,则将两项及以上的相同时间节点整合为一个知识节点。
在制作财政知识图谱的过程中,若服务器识别所有的知识节点中存在相同语义的相同知识节点,如:得到A省政府和A省人民政府两个知识节点,服务器识别该两个知识节点的语义,若语义相同,则整合为一个知识节点,即A省政府。
在一个实施例中,对话式检索回答装置还包括:
缩写关键词判断单元,用于若存在,则将无效关键词进行互联网搜索以判断是否为缩写关键词;
完整关键词获取单元,用于若是,则获取缩写关键词对应的完整关键词;
查找单元,用于在财政知识图谱中查找是否存有完整关键词对应的知识节点;
创建指令生成单元,用于若不存在,则将完整关键词作为无效关键词,生成指令以用于在财政知识图谱中创建对应无效关键词的新的知识节点,并根据无效关键词进行对应的互联网搜索。
例如:用户输入的财政问题语句为“深圳市的高新企业”,其中“高新企业”在财政知识图谱中不存在对应的知识节点,故将该“高新企业”进行互联网搜索,判断是否为缩写关键词,若服务器经过互联网搜索查找到对应的完整关键词,则获取该完整关键词,如“高新企业”进行互联网搜索后得到“高新技术企业”。服务器在财政知识图谱中查找是否存在完整关键词对应的知识节点,若无,则将完整关键词作为无效关键词,生成用于在财政知识图谱中创建对应无效关键词的新的知识节点,并根据无效关键词进行对应的互联网搜索的创建指令。
在一个实施例中,关键词识别单元20包括:
无法辨识确认模块,用于将财政问题语句拆分为多个词语,并识别多个词语分别对应的关键词;
专业术语确定模块,用于若识别不到,则在专业术语库中查找是否存在与识别不到的词语对应的专业术语词,其中,专业术语库为预存有所有专业术语词的数据库;
术语调取模块,用于调取专业术语词作为识别不到的词语对应的关键词,根据多个词语分别对应的关键词作为财政问题语句拆分得到的若干个关键词。
上述无法辨识的关键词为服务器无法通过语义处理得到的关键词,故需要在专业术语库中查找对应的专业术语词。
参照图5,本申请实施例中还提供一种计算机设备,该计算机设备可以是服务器,其内部结构可以如图5所示。该计算机设备包括通过***总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***、计算机程序和数据库。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的数据库用于存储财政知识图谱等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种对话式检索回答方法。
上述处理器执行对话式检索回答方法,包括:
获取用户通过计算机设备输入的财政问题语句;
语义识别财政问题语句,将财政问题语句拆分为若干个关键词;
分析若干个关键词中是否存在歧义关键词,歧义关键词为一个关键词在预先建立的财政知识图谱中能够查找到多个知识节点的关键词;
若存在,则将歧义关键词对应的多个知识节点反馈至计算机设备以供用户选择其中一个知识节点作为歧义关键词对应的知识节点;
分析若干个关键词中是否具有财政知识图谱中不存在对应知识节点的无效关键词;
若具有,则在财政知识图谱中创建对应无效关键词的新的知识节点,并根据无效关键词进行对应的互联网搜索,将搜索到的关键词内容作为新的知识节点的节点内容;
在财政知识图谱中,确定若干个关键词中的正常关键词对应的知识节点;并根据歧义关键词、无效关键词与正常关键词在财政问题语句中的前后顺序以及歧义关键词、无效关键词与正常关键词分别对应的知识节点,确认出对应的节点搜索路径;其中,正确关键词为预先建立的财政知识图谱中能够查找到唯一知识节点的关键词;
根据节点搜索路径在财政知识图谱中查找到对应的答案知识节点,并调取答案知识节点的答案内容,将答案内容反馈至计算机设备。
在一个实施例中,上述处理器执行财政知识图谱的建立方法包括:
获取管理人员通过管理终端输入的文本资料数据,文本资料数据包括实体类数据和事件类数据,实体类数据为所有的知识节点,事件类数据关联不同的知识节点;
通过事件类数据将知识节点进行关联连接,得到网状的初步知识图谱;
针对网状的初步知识图谱中所有的知识节点进行互联网搜索,得到与所有的知识节点一一对应的知识节点内容;
将所有的知识节点与对应的知识节点内容进行关联,得到财政知识图谱。
在一个实施例中,上述处理器执行获取管理人员通过管理终端输入的文本资料数据的步骤之后包括:
识别出所有的知识节点中是否存在相同语义的相同知识节点;
若是,则将两项及以上的相同时间节点整合为一个知识节点。
在一个实施例中,上述处理器执行分析若干个关键词中是否具有财政知识图谱中不存在对应知识节点的无效关键词的步骤之后,包括:
若存在,则将无效关键词进行互联网搜索以判断是否为缩写关键词;
若是,则获取缩写关键词对应的完整关键词;
在财政知识图谱中查找是否存有完整关键词对应的知识节点;
若不存在,则将完整关键词作为无效关键词,生成指令以用于在财政知识图谱中创建对应无效关键词的新的知识节点,并根据无效关键词进行对应的互联网搜索。
在一个实施例中,上述处理器执行语义识别财政问题语句,将财政问题语句拆分为若干个关键词的步骤包括:
将财政问题语句拆分为多个词语,并识别多个词语分别对应的关键词;
若识别不到,则在专业术语库中查找是否存在与识别不到的词语对应的专业术语词,其中,专业术语库为预存有所有专业术语词的数据库;
调取专业术语词作为识别不到的词语对应的关键词,根据多个词语分别对应的关键词作为财政问题语句拆分得到的若干个关键词。
上述无法辨识的关键词为服务器无法通过语义处理得到的关键词,故需要在专业术语库中查找对应的专业术语词。
本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定。
本申请一实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现一种对话式检索回答方法的步骤,具体为:
上述处理器执行对话式检索回答方法,包括:
获取用户通过计算机设备输入的财政问题语句;
语义识别财政问题语句,将财政问题语句拆分为若干个关键词;
分析若干个关键词中是否存在歧义关键词,歧义关键词为一个关键词在预先建立的财政知识图谱中能够查找到多个知识节点的关键词;
若存在,则将歧义关键词对应的多个知识节点反馈至计算机设备以供用户选择其中一个知识节点作为歧义关键词对应的知识节点;
分析若干个关键词中是否具有财政知识图谱中不存在对应知识节点的无效关键词;
若具有,则在财政知识图谱中创建对应无效关键词的新的知识节点,并根据无效关键词进行对应的互联网搜索,将搜索到的关键词内容作为新的知识节点的节点内容;
在财政知识图谱中,确定若干个关键词中的正常关键词对应的知识节点;并根据歧义关键词、无效关键词与正常关键词在财政问题语句中的前后顺序以及歧义关键词、无效关键词与正常关键词分别对应的知识节点,确认出对应的节点搜索路径;其中,正确关键词为预先建立的财政知识图谱中能够查找到唯一知识节点的关键词;
根据节点搜索路径在财政知识图谱中查找到对应的答案知识节点,并调取答案知识节点的答案内容,将答案内容反馈至计算机设备。
在一个实施例中,上述处理器执行财政知识图谱的建立方法包括:
获取管理人员通过管理终端输入的文本资料数据,文本资料数据包括实体类数据和事件类数据,实体类数据为所有的知识节点,事件类数据关联不同的知识节点;
通过事件类数据将知识节点进行关联连接,得到网状的初步知识图谱;
针对网状的初步知识图谱中所有的知识节点进行互联网搜索,得到与所有的知识节点一一对应的知识节点内容;
将所有的知识节点与对应的知识节点内容进行关联,得到财政知识图谱。
在一个实施例中,上述处理器执行获取管理人员通过管理终端输入的文本资料数据的步骤之后包括:
识别出所有的知识节点中是否存在相同语义的相同知识节点;
若是,则将两项及以上的相同时间节点整合为一个知识节点。
在一个实施例中,上述处理器执行分析若干个关键词中是否具有财政知识图谱中不存在对应知识节点的无效关键词的步骤之后,包括:
若存在,则将无效关键词进行互联网搜索以判断是否为缩写关键词;
若是,则获取缩写关键词对应的完整关键词;
在财政知识图谱中查找是否存有完整关键词对应的知识节点;
若不存在,则将完整关键词作为无效关键词,生成指令以用于在财政知识图谱中创建对应无效关键词的新的知识节点,并根据无效关键词进行对应的互联网搜索。
在一个实施例中,上述处理器执行语义识别财政问题语句,将财政问题语句拆分为若干个关键词的步骤包括:
将财政问题语句拆分为多个词语,并识别多个词语分别对应的关键词;
若识别不到,则在专业术语库中查找是否存在与识别不到的词语对应的专业术语词,其中,专业术语库为预存有所有专业术语词的数据库;
调取专业术语词作为识别不到的词语对应的关键词,根据多个词语分别对应的关键词作为财政问题语句拆分得到的若干个关键词。
上述无法辨识的关键词为服务器无法通过语义处理得到的关键词,故需要在专业术语库中查找对应的专业术语词。
综上所述,服务器通过获取用户通过计算机设备输入的财政问题语句;语义识别财政问题语句,将财政问题语句拆分为若干个关键词;分析若干个关键词中是否存在歧义关键词,歧义关键词为一个关键词在预先建立的财政知识图谱中能够查找到多个知识节点的关键词;若存在,则将歧义关键词对应的多个知识节点反馈至计算机设备以供用户选择其中一个知识节点作为歧义关键词对应的知识节点;分析若干个关键词中是否具有财政知识图谱中不存在对应知识节点的无效关键词;若具有,则在财政知识图谱中创建对应无效关键词的新的知识节点,并根据无效关键词进行对应的互联网搜索,将搜索到的关键词内容作为新的知识节点的节点内容;在财政知识图谱中,确定若干个关键词中的正常关键词对应的知识节点;并根据若干个关键词在财政问题语句中的前后顺序以及各个关键词分别对应的知识节点,确认出对应的节点搜索路径;根据节点搜索路径在财政知识图谱中查找到对应的答案知识节点,并调取答案知识节点的答案内容,将答案内容反馈至计算机设备,从而解决机器没有消除歧义的功能,和解决财政类知识图谱未成型回答速度慢的技术问题。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储与一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM通过多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其它变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其它要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
以上所述仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其它相关的技术领域,均同理包括在本申请的专利保护范围内。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (10)

1.一种对话式检索回答方法,其特征在于,包括:
获取用户通过计算机设备输入的财政问题语句;
语义识别所述财政问题语句,将所述财政问题语句拆分为若干个关键词;
分析所述若干个关键词中是否存在歧义关键词,所述歧义关键词为在预先建立的财政知识图谱中能够查找到多个知识节点的关键词;
若存在,则将所述歧义关键词对应的多个知识节点反馈至所述计算机设备以供所述用户选择其中一个知识节点作为所述歧义关键词对应的知识节点;
分析所述若干个关键词中是否具有所述财政知识图谱中不存在对应知识节点的无效关键词;
若具有,则在所述财政知识图谱中创建对应所述无效关键词的新的知识节点,并根据所述无效关键词进行对应的互联网搜索,将搜索到的关键词内容作为所述新的知识节点的节点内容;
在所述财政知识图谱中,确定所述若干个关键词中的正常关键词对应的知识节点;并根据所述歧义关键词、无效关键词与正常关键词在所述财政问题语句中的前后顺序以及所述歧义关键词、无效关键词与正常关键词分别对应的知识节点,确认出对应的节点搜索路径;其中,所述正确关键词为所述预先建立的财政知识图谱中能够查找到唯一知识节点的关键词;
根据所述节点搜索路径在所述财政知识图谱中查找到对应的答案知识节点,并调取所述答案知识节点的答案内容,将所述答案内容反馈至所述计算机设备。
2.根据权利要求1所述的对话式检索回答方法,其特征在于,所述财政知识图谱的建立方法包括:
获取管理人员通过管理终端输入的文本资料数据,所述文本资料数据包括实体类数据和事件类数据,所述实体类数据为所有的知识节点,所述事件类数据关联不同的所述知识节点;
通过所述事件类数据将所述知识节点进行关联连接,得到网状的初步知识图谱;
针对所述网状的初步知识图谱中所有的知识节点进行互联网搜索,得到与所述所有的知识节点一一对应的知识节点内容;
将所述所有的知识节点与对应的所述知识节点内容进行关联,得到所述财政知识图谱。
3.根据权利要求2所述的对话式检索回答方法,其特征在于,所述获取管理人员通过管理终端输入的文本资料数据的步骤之后包括:
识别出所述所有的知识节点中是否存在相同语义的相同知识节点;
若是,则将两项及以上的所述相同时间节点整合为一个知识节点。
4.根据权利要求1所述的对话式检索回答方法,其特征在于,所述分析所述若干个关键词中是否具有所述财政知识图谱中不存在对应知识节点的无效关键词的步骤之后,包括:
若存在,则将所述无效关键词进行互联网搜索以判断是否为缩写关键词;
若是,则获取所述缩写关键词对应的完整关键词;
在所述财政知识图谱中查找是否存有所述完整关键词对应的知识节点;
若不存在,则将所述完整关键词作为所述无效关键词,生成指令以用于在所述财政知识图谱中创建对应所述无效关键词的新的知识节点,并根据所述无效关键词进行对应的互联网搜索。
5.根据权利要求1所述的对话式检索回答方法,其特征在于,所述语义识别所述财政问题语句,将所述财政问题语句拆分为若干个关键词的步骤包括:
将所述财政问题语句拆分为多个词语,并识别所述多个词语分别对应的关键词;
若识别不到,则在专业术语库中查找是否存在与所述识别不到的词语对应的专业术语词,其中,所述专业术语库为预存有所有所述专业术语词的数据库;
调取所述专业术语词作为所述识别不到的词语对应的关键词,根据所述多个词语分别对应的关键词作为所述财政问题语句拆分得到的若干个关键词。
6.一种对话式检索回答装置,其特征在于,包括:
语句获取单元,用于获取用户通过计算机设备输入的财政问题语句;
关键词识别单元,用于语义识别所述财政问题语句,将所述财政问题语句拆分为若干个关键词;
歧义分析单元,用于分析所述若干个关键词中是否存在歧义关键词,所述歧义关键词为在预先建立的财政知识图谱中能够查找到多个知识节点的关键词;
歧义确定单元,用于若存在,则将所述歧义关键词对应的多个知识节点反馈至所述计算机设备以供所述用户选择其中一个知识节点作为所述歧义关键词对应的知识节点;
无效分析单元,用于分析所述若干个关键词中是否具有所述财政知识图谱中不存在对应知识节点的无效关键词;
无效确定单元,用于若具有,则在所述财政知识图谱中创建对应所述无效关键词的新的知识节点,并根据所述无效关键词进行对应的互联网搜索,将搜索到的关键词内容作为所述新的知识节点的节点内容;
路径确定单元,用于在所述财政知识图谱中,确定所述若干个关键词中的正常关键词对应的知识节点;并根据所述歧义关键词、无效关键词与正常关键词在所述财政问题语句中的前后顺序以及所述歧义关键词、无效关键词与正常关键词分别对应的知识节点,确认出对应的节点搜索路径;其中,所述正确关键词为所述预先建立的财政知识图谱中能够查找到唯一知识节点的关键词;
答案反馈单元,用于根据所述节点搜索路径在所述财政知识图谱中查找到对应的答案知识节点,并调取所述答案知识节点的答案内容,将所述答案内容反馈至所述计算机设备。
7.根据权利要求6所述的对话式检索回答装置,其特征在于,还包括:
资料获取单元,用于获取管理人员通过管理终端输入的文本资料数据,所述文本资料数据包括实体类数据和事件类数据,所述实体类数据为所有的知识节点,所述事件类数据关联不同的所述知识节点;
初步形成单元,用于通过所述事件类数据将所述知识节点进行关联连接,得到网状的初步知识图谱;
内容查找单元,用于针对所述网状的初步知识图谱中所有的知识节点进行互联网搜索,得到与所述所有的知识节点一一对应的知识节点内容;
内容关联单元,用于将所述所有的知识节点与对应的所述知识节点内容进行关联,得到所述财政知识图谱。
8.根据权利要求7所述的对话式检索回答装置,其特征在于,还包括:
相同语义识别单元,用于识别出所有的知识节点中是否存在相同语义的相同知识节点;
整合单元,用于若是,则将两项及以上的相同时间节点整合为一个知识节点。
9.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至5中任一项所述的对话式检索回答方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5中任一项所述的对话式检索回答方法的步骤。
CN201910464157.2A 2019-05-30 2019-05-30 对话式检索回答方法、装置、计算机设备及存储介质 Active CN110347810B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910464157.2A CN110347810B (zh) 2019-05-30 2019-05-30 对话式检索回答方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910464157.2A CN110347810B (zh) 2019-05-30 2019-05-30 对话式检索回答方法、装置、计算机设备及存储介质

Publications (2)

Publication Number Publication Date
CN110347810A true CN110347810A (zh) 2019-10-18
CN110347810B CN110347810B (zh) 2022-08-19

Family

ID=68174506

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910464157.2A Active CN110347810B (zh) 2019-05-30 2019-05-30 对话式检索回答方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN110347810B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111209389A (zh) * 2019-12-31 2020-05-29 天津外国语大学 一种电影故事生成方法
CN112115276A (zh) * 2020-09-18 2020-12-22 平安科技(深圳)有限公司 基于知识图谱的智能客服方法、装置、设备及存储介质
CN112396898A (zh) * 2020-11-09 2021-02-23 江苏创设未来教育发展有限公司 一种基于人工智能的技能学习实训教育***
CN112818092A (zh) * 2020-04-20 2021-05-18 腾讯科技(深圳)有限公司 知识图谱查询语句生成方法、装置、设备及存储介质
CN117633540A (zh) * 2024-01-25 2024-03-01 杭州阿里云飞天信息技术有限公司 样本数据构建方法及装置

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103914548A (zh) * 2014-04-10 2014-07-09 北京百度网讯科技有限公司 信息搜索方法和装置
US20140282219A1 (en) * 2013-03-15 2014-09-18 Robert Haddock Intelligent internet system with adaptive user interface providing one-step access to knowledge
CN105843875A (zh) * 2016-03-18 2016-08-10 北京光年无限科技有限公司 一种面向智能机器人的问答数据处理方法及装置
US20170109355A1 (en) * 2015-10-16 2017-04-20 Baidu Usa Llc Systems and methods for human inspired simple question answering (hisqa)
CN106919655A (zh) * 2017-01-24 2017-07-04 网易(杭州)网络有限公司 一种***方法和装置
US20170293690A1 (en) * 2016-04-11 2017-10-12 Rovi Guides, Inc. Systems and methods for identifying a meaning of an ambiguous term in a natural language query
CN108153901A (zh) * 2018-01-16 2018-06-12 北京百度网讯科技有限公司 基于知识图谱的信息推送方法和装置
CN108170662A (zh) * 2016-12-07 2018-06-15 富士通株式会社 缩简词的消歧方法和消歧设备
CN109145102A (zh) * 2018-09-06 2019-01-04 杭州安恒信息技术股份有限公司 智能问答方法及其知识图谱***构建方法、装置、设备
CN109492111A (zh) * 2018-09-19 2019-03-19 平安科技(深圳)有限公司 最短路径查询方法、***、计算机设备和存储介质
CN109614476A (zh) * 2018-12-11 2019-04-12 平安科技(深圳)有限公司 客服***问答方法、装置、计算机设备及存储介质
CN109753557A (zh) * 2018-12-26 2019-05-14 出门问问信息科技有限公司 问答***的答案输出方法、装置、设备及存储介质

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140282219A1 (en) * 2013-03-15 2014-09-18 Robert Haddock Intelligent internet system with adaptive user interface providing one-step access to knowledge
CN103914548A (zh) * 2014-04-10 2014-07-09 北京百度网讯科技有限公司 信息搜索方法和装置
US20170109355A1 (en) * 2015-10-16 2017-04-20 Baidu Usa Llc Systems and methods for human inspired simple question answering (hisqa)
CN105843875A (zh) * 2016-03-18 2016-08-10 北京光年无限科技有限公司 一种面向智能机器人的问答数据处理方法及装置
US20170293690A1 (en) * 2016-04-11 2017-10-12 Rovi Guides, Inc. Systems and methods for identifying a meaning of an ambiguous term in a natural language query
CN108170662A (zh) * 2016-12-07 2018-06-15 富士通株式会社 缩简词的消歧方法和消歧设备
CN106919655A (zh) * 2017-01-24 2017-07-04 网易(杭州)网络有限公司 一种***方法和装置
CN108153901A (zh) * 2018-01-16 2018-06-12 北京百度网讯科技有限公司 基于知识图谱的信息推送方法和装置
CN109145102A (zh) * 2018-09-06 2019-01-04 杭州安恒信息技术股份有限公司 智能问答方法及其知识图谱***构建方法、装置、设备
CN109492111A (zh) * 2018-09-19 2019-03-19 平安科技(深圳)有限公司 最短路径查询方法、***、计算机设备和存储介质
CN109614476A (zh) * 2018-12-11 2019-04-12 平安科技(深圳)有限公司 客服***问答方法、装置、计算机设备及存储介质
CN109753557A (zh) * 2018-12-26 2019-05-14 出门问问信息科技有限公司 问答***的答案输出方法、装置、设备及存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
SAHA A 等: "Complex sequential question answering: Towards learning to converse over linked question answer pairs with a knowledge graph", 《PROCEEDINGS OF THE AAAI CONFERENCE ON ARTIFICIAL INTELLIGENCE》 *
康准 等: "基于知识图谱的生物学科知识问答***", 《软件》 *
张淼: "基于中文知识图谱的智能问答***设计与实现", 《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111209389A (zh) * 2019-12-31 2020-05-29 天津外国语大学 一种电影故事生成方法
CN111209389B (zh) * 2019-12-31 2023-08-11 天津外国语大学 一种电影故事生成方法
CN112818092A (zh) * 2020-04-20 2021-05-18 腾讯科技(深圳)有限公司 知识图谱查询语句生成方法、装置、设备及存储介质
CN112818092B (zh) * 2020-04-20 2023-08-11 腾讯科技(深圳)有限公司 知识图谱查询语句生成方法、装置、设备及存储介质
CN112115276A (zh) * 2020-09-18 2020-12-22 平安科技(深圳)有限公司 基于知识图谱的智能客服方法、装置、设备及存储介质
CN112115276B (zh) * 2020-09-18 2024-05-24 平安科技(深圳)有限公司 基于知识图谱的智能客服方法、装置、设备及存储介质
CN112396898A (zh) * 2020-11-09 2021-02-23 江苏创设未来教育发展有限公司 一种基于人工智能的技能学习实训教育***
CN117633540A (zh) * 2024-01-25 2024-03-01 杭州阿里云飞天信息技术有限公司 样本数据构建方法及装置
CN117633540B (zh) * 2024-01-25 2024-04-30 杭州阿里云飞天信息技术有限公司 样本数据构建方法及装置

Also Published As

Publication number Publication date
CN110347810B (zh) 2022-08-19

Similar Documents

Publication Publication Date Title
CN110347810A (zh) 对话式检索回答方法、装置、计算机设备及存储介质
CN101630314B (zh) 一种基于领域知识的语义查询扩展方法
CN110147445A (zh) 基于文本分类的意图识别方法、装置、设备及存储介质
CN101140588A (zh) 一种关联关系搜索结果的排序方法及装置
CN109857846B (zh) 用户问句与知识点的匹配方法和装置
CN104679910A (zh) 智能应答方法及***
CN110866089B (zh) 基于同义多语境分析的机器人知识库构建***及方法
CN109274845A (zh) 智能语音自动回访方法、装置、计算机设备及存储介质
CN110442603A (zh) 地址匹配方法、装置、计算机设备及存储介质
CN101398810A (zh) 自适应服务选择设备及其方法,查询***及其方法
CN108536807B (zh) 一种信息处理方法及装置
CN112052324A (zh) 智能问答的方法、装置和计算机设备
CN110287292B (zh) 一种裁判量刑偏离度预测方法及装置
CN110851576A (zh) 问答处理方法、装置、设备及可读介质
CN108763529A (zh) 一种智能检索方法、装置和计算机可读存储介质
CN112632252B (zh) 对话应答方法、装置、计算机设备和存储介质
CN110110053A (zh) 在间接话语和事务之间建立逻辑连接
CN109922131A (zh) 基于区块链的数据存储方法、装置、设备及存储介质
CN111813916B (zh) 一种智能问答方法、装置、计算机设备和介质
CN110246494A (zh) 基于语音识别的服务请求方法、装置及计算机设备
CN113127604A (zh) 基于评论文本的细粒度物品推荐方法及***
US20050102065A1 (en) Method and system for programming virtual robots using a template
CN111783465B (zh) 一种命名实体归一化方法、***及相关装置
CN113158688B (zh) 一种领域知识库构建方法、装置、设备及存储介质
CN110209804B (zh) 目标语料的确定方法和装置、存储介质及电子装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20230704

Address after: No. 888, Huanhu West 2nd Road, Lingang New District, China (Shanghai) pilot Free Trade Zone, Pudong New Area, Shanghai, 200120

Patentee after: Shanghai Ruyi Information Technology Co.,Ltd.

Address before: 400010 38 / F, 39 / F, unit 1, 99 Wuyi Road, Yuzhong District, Chongqing

Patentee before: CHONGQING FINANCIAL ASSETS EXCHANGE Co.,Ltd.

TR01 Transfer of patent right