CN108804521B - 一种基于知识图谱的问答方法及农业百科问答*** - Google Patents

一种基于知识图谱的问答方法及农业百科问答*** Download PDF

Info

Publication number
CN108804521B
CN108804521B CN201810392883.3A CN201810392883A CN108804521B CN 108804521 B CN108804521 B CN 108804521B CN 201810392883 A CN201810392883 A CN 201810392883A CN 108804521 B CN108804521 B CN 108804521B
Authority
CN
China
Prior art keywords
question
questions
similarity
knowledge graph
entity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810392883.3A
Other languages
English (en)
Other versions
CN108804521A (zh
Inventor
花云程
吴刚
杨成彪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Keji Data Technology Co ltd
Original Assignee
Nanjing Keji Data Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Keji Data Technology Co ltd filed Critical Nanjing Keji Data Technology Co ltd
Priority to CN201810392883.3A priority Critical patent/CN108804521B/zh
Publication of CN108804521A publication Critical patent/CN108804521A/zh
Application granted granted Critical
Publication of CN108804521B publication Critical patent/CN108804521B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/02Agriculture; Fishing; Forestry; Mining

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Marine Sciences & Fisheries (AREA)
  • General Business, Economics & Management (AREA)
  • Animal Husbandry (AREA)
  • Agronomy & Crop Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Mining & Mineral Resources (AREA)
  • Economics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提出一种基于知识图谱的问答方法及农业百科问答***,可以自动分析用户提出的自然语言问题,形成基于句法树的拓扑结构,通过拓扑结构与语法库中的问题模板进行检索和比对,根据拓扑结构与谓词指称的映射关系、同义词集合与知识图谱中关系或属性的映射关系,得到问题映射的谓词,并结合问题中识别的实体,生成最终的结构化的知识图谱查询语句,根据该查询语句到知识图谱中进行检索,返回最终的结果。当在问题模板库中无法检索到相关拓扑结构时,会调用FAQ问题库的常问问答对,进行问题的回答。该问答***能够针对用户提出的问句给出精确的答案检索,提高用户对农业百科问题检索的满意度。

Description

一种基于知识图谱的问答方法及农业百科问答***
技术领域
本发明涉及基于人工智能的问答方法,更具体地涉及基于知识图谱的问答方法和基于该方法的农业问答***。
背景技术
当前的互联网中,海量信息分布于不同的信息源,相关性较为稀疏,使用传统搜索引擎,准确、快速地获得有价值的信息变得愈发困难。传统的基于人工的知识管理方式,并不能实时高效地满足用户对于农业领域知识的获取需求。此外,很多社区问答中遇到的问题,并不能保证答***性,且一些答案已不具备时效性。相较而言,问答***的出现,旨在快速得到高质量信息或答案。其中,基于知识图谱的智能问答***,通过引入自然语言处理技术,方便高效地从农业领域知识图谱中搜索相关答案,并推送给用户,辅助用户学习相关知识。
目前,农业知识管理***中的知识问答,主要以网页检索、文档检索的方式为主,导致一些在线交流的问题无法得到及时回复或者延时太长,影响用户知识获取的效率。目前,随着人工智能技术的成熟,有必要在知识管理***中增加智能问答功能,***自动分析问题(规则分析、模型等方式),通过模板匹配、推理机、神经网络等技术,从知识库中搜索相关答案,并推送给用户,辅助用户学习和获取精确的农业百科相关知识。
对于农业领域,目前已有的问答***,如专利《一种基于移动互联网的农业专家问答平台》是通过软件实现用户与农业专家的信息交互,建立其普通用户与农业技术人员的联系,并解决用户的农业相关问题。这样的***,需要时刻有专家在软件服务端提供咨询服务,会耗费大量的人力,并且无法自动地为用户提供服务。
发明内容
为了克服现有技术的低效,以及已有农业问答***的弊端,本发明提供一种能够自动化理解用户的问句并快速准确地检索到知识图谱中答案的问答方法及基于该方法的农业问答***。
本发明解决上述技术问题所采用的技术方案为:一种基于知识图谱的问答方法,包括以下步骤:
1)构建用于存储农业领域知识的数据库、用于存储同义词集合和问题模板的语法库以及用于存储常问问题集的FAQ问题库,具体为:
1.1构建农业领域知识图谱,并将知识图谱数据存储到结构化的RDF数据库TDB中,利用TDB服务进行知识图谱三元组的检索;
1.2构建用于存储同义词集合和问题模板的语法库,将同义词集合与问题模板存储到语法库,所述的同义词集合包括与知识图谱中关系和属性相关的关键字,并提取问题中的拓扑结构形成问题模板库,存储到语法库,所述同义词集合和问题模板的具体建立步骤为:
1.2.1首先收集领域相关问题的样本,形成样本集,并根据样本所涉及的关系或属性,对所述样本集进行分类,对问题样本进行命名实体识别后,去除实体指称,再将剩余部分进行分词、去除停用词操作,得到仅含有关键字的精简问题样例,并将涉及同一个关系或属性的精简问题样例归为一类,再将属于这些精简问题样例的关键字合并为一个集合,即得到一个同义词集合,而每一个同义词集合对应知识图谱中的一个关系或属性;
1.2.2对每一个问题样本,进行命名实体识别,实体指称以通配符替代,再对问题样本进行分词和词性标注,并根据分词和词性标注结果建立句法树;分析句法树的结构,对问题样本进行分类,分类的依据为:归为一类的问题样本,其句法树中都有相同的子树,即这些子树的结构相同,且子树中相同位置的树节点,其词性也相同,这些相同的子树表示一种拓扑结构;对于每一类问题样本,记录下句法树拓扑结构中谓词指称所对应的部分,以此得到拓扑结构与谓词指称的对应关系,该对应关系即为问题模板,并形成问题模板库;
1.3通过网络收集社区问答所提供的、用户交互衍生的大规模问题答案对,从中统计出高频的问题答案对,形成常问问题集,并将常问问题及相关答案存储到问题库,每一个问题对应一个标准答案,即为问题与答案的映射,以此构建FAQ问题库;
2)对问题进行解析,具体步骤为:
2.1对问题进行命名实体识别操作,将问句与知识图谱中的实体进行字符串匹配,得到问题的实体指称部分;
2.2对问题进行实体链接操作,将实体指称链接到知识图谱中的某个实体;
2.3问题的实体指称部分以通配符替代,并对问题的剩余部分进行分词,即将问句分割为一系列分词词组,并对所述分词词组进行词性标注;
2.4用标注词性的分词词组,进行句法分析,建立句法树;
2.5用句法树的词性拓扑结构,与步骤1.2.2中得到的问题模板库中的问题模板进行检索,判断问题对应的句法树拓扑结构,是否与某个问题模板中的结构相同,若是则视为匹配到模板,进入步骤3.1;否则进入步骤3.2;
3)检索答案,具体步骤为:
3.1从农业领域知识库中检索答案,具体步骤为:
3.1.1根据步骤2.5检索匹配到的模板,得到问题的句法树拓扑结构中对应的谓词指称部分;
3.1.2根据所述谓词指称部分对应的词性,从步骤2.3标注词性的分词词组中,取出问题中谓词指称部分的词组;
3.1.3将问题中谓词指称部分的词组,与步骤1.2.1得到的同义词集合,进行相似度计算,对于相似度最大的同义词集合,其对应于知识图谱的关系或属性,即为问题映射到知识图谱的关系或属性;
3.1.4将步骤2.2得到的实体视为主语或宾语,与步骤3.1.3得到的谓词相结合,生成SPARQL查询,从知识图谱中检索并找到对应的三元组,若将步骤2.2得到的实体视为主语,则以该三元组中的宾语作为问题的答案;若将步骤2.2得到的实体视为宾语,则以该三元组中的主语作为问题的答案,若没有检索到对应的三元组,则进入步骤3.3;
3.2从FAQ问题库中检索答案,具体步骤为:
3.2.1基于编辑距离,计算原始问题与FAQ问题库常问问题的相似度;
3.2.2取相似度最大的常问问题为候选问题,若原始问题与候选问题的相似度大于问句相似度阈值,则视为原始问题匹配到该常问问题,进入步骤3.2.3;否则进入步骤3.3;
3.2.3根据匹配得到的常问问题,以及FAQ问题库中常问问题与答案的映射关系,得到常问问题对应的答案,即作为原始问题的答案;
3.3给出提示,无法回答问题。
进一步的,本发明方法中,步骤3.1.3中计算谓词指称部分词组与同义词集合的相似度的具体过程为:
X=(x1,x2,…,xn,xn+1,…)为自然问句谓词指称部分的词组,其中xn表示问句谓词指称部分中的一个词;令Yi=(yi1,yi2,…,yim,yim+1,…)表示第i个同义词集合,共有L 个同义词集合;yim表示第i个同义词集合中的一个词;xn与yim的相似度计算是基于词向量的语义相似度,即xn与yim都以k维词向量表示,有xn=(xn1,xn2,…,xnk), yim=(yim1,yim2,…,yimk),根据下式计算xn与yim的相似度:
Figure BDA0001643857720000031
Figure BDA0001643857720000032
其中T为同义词相似度阈值,为一个超参数,表示当两个词的相似度超过这个阈值时,则视为两个词是同义词或近义词,否则就将相似度置为0;
谓词指称部分的词组与同义词集合的相似度为:
Figure BDA0001643857720000033
其中|X|表示谓词指称部分词组的词个数,|Yi|表示一个同义词集合Yi的词个数,sim(xj,yim)为问句谓词指称部分中的一个词xj与第i个同义词集合中的一个词yim的词向量相似度。
进一步的,本发明方法中,步骤3.2.1中计算原始问题与FAQ问题库常问问题的相似度的具体过程为:
对原始问题q与FAQ问题库中第i个常问问题xi进行预处理,去除问题中的非中文字符;使用基于编辑距离的相似度计算公式,计算原始问题与FAQ问题库中第i个常问问题的相似度:
Figure BDA0001643857720000041
其中|q|、|xi|分别表示两个问题的字符串长度,EditDistance(q,xi)是使用编辑距离计算得到的两个问题相互转换的最小操作次数。
本发明的农业百科问答***,包括离线模块和在线模块,所述离线模块用以利用事先得到的问题-答案对,生成拓扑结构-谓词指称的映射关系以及生成谓词-同义词集合的映射关系,形成问题模板库和同义词集合,建立农业百科知识相关的知识图谱;所述的在线模块用以对用户输入的问句进行预处理和解析,根据解析结果匹配问题模板,根据模板找到问句中谓词指称部分,匹配与谓词指称最相近的同义词集合,得到谓词指称对应于知识图谱中的某个关系或属性,将问句映射为知识图谱中的实体-关系 /属性组合,生成结构化查询语句。
进一步的,本发明***中,离线模块包括知识图谱建立单元、问题样本处理单元、问题模板训练单元和同义词集合生成单元;所述的知识图谱建立单元用以结合百度百科、***、或互动百科中已有的农业概念分类体系,进行人工建立农业分类树,并从百度百科、***、或互动百科的网页中通过网络爬虫抽取农业分类树相关的农业百科知识,且通过三大百科网页的信息框数据和网页文本自动生成表达农业实体关系或属性的三元组,形成农业知识图谱;所述的问题样本处理单元用以通过网络爬虫挖掘农业问答社区网站、农业百科垂直网站、百科知道类网站的农业相关问题,形成问题样本集,并通过众包形式的分析与审核,找到可以映射为知识图谱中关系或属性的问题,形成问题样本集;所述的问题模板训练单元用以对问题样本进行命名实体识别、实体链接、替换命名实体指称、去除停用词、分词、词性标注和句法树构建等的预处理,并借助机器学习或审核的方法找到句法树中的特定句法子树以及句法子树的谓词指称部分,形成拓扑结构与结构中谓词指称部分的映射关系,这种映射关系即为一种问题模板,形成问题模板集合,所述特定句法子树被称为一种拓扑结构;所述的同义词集合生成单元用以分析问题样本处理单元形成的问题样本集,找到知识图谱中某个属性或关系所对应的一类问题样本,并对这类问题样本进行命名实体识别后,去除实体指称,再将剩余部分进行分词、去除停用词操作,得到仅含有关键字的精简问题样例,并把属于这些精简问题样例的关键字合并为一个集合,从而得到一个同义词集合,每一个同义词集合对应知识图谱中的一个关系或属性。
进一步的,本发明***中,在线模块包括I/O单元、命名实体识别单元、问句预处理单元、问题模板匹配单元、答案检索单元、FAQ问题库答案获取单元和答案处理单元,所述的I/O单元用于接受用户输入的问题并展示检索答案给用户,所述的命名实体识别单元用于识别问句中的实体指称部分、并将实体指称与知识图谱的实体进行链接,所述的问句预处理单元用以将问句中的实体指称以通配符替换、并对问句进行分词和去除停用词,所述的问题模板匹配单元用以对预处理后的问句进行词性标注并生成句法树、根据句法树在问题模板库中检索匹配的问题模板并确定问句的谓词指称部分、根据问句的谓词指称词组检索匹配的同义词集合并确定同义词集合映射的知识图谱关系或属性,所述的答案检索单元用以根据识别出的问题实体和属性/关系组成结构化查询语句、并根据结构化查询语句在知识图谱中检索对应的三元组后返回答案实体,所述的FAQ问题库答案获取单元用于从FAQ问题库获取问题的答案,所述的答案处理单元用以根据问句的谓词指称与同义词集合的相似度计算答案可信度、计算问句与FAQ问题库中常问问题的相似度作为答案可信度。
本发明的基于知识图谱的问答方法及基于该方法的农业百科问答***,可以自动分析用户提出的自然语言问题,并形成基于句法树的拓扑结构,通过拓扑结构与语法库中的问题模板进行检索和比对,根据所述的拓扑结构与谓词指称的映射关系、以及同义词集合与知识图谱中关系或属性的映射关系,得到问题映射的谓词,并结合问题中识别的实体,生成最终的结构化的知识图谱查询语句,根据该查询语句到知识图谱中进行检索,返回最终的结果。当在问题模板库中无法检索到相关拓扑结构时,会调用FAQ问题库的问答对,进行问题的回答。该问答***能够针对用户提出的问句给出精确的答案检索,提高用户对农业百科问题检索的满意度。该方法用于农科百科问答时,能够涵盖知识图谱范围内99%以上的问题,通过测试准确率达到93%以上。
附图说明
图1为本发明基于知识图谱的问答方法的步骤流程图;
图2为本发明农业百科问答***的结构示意图。
具体实施方式
以下结合附图实施例对本发明作进一步阐述,本发明的目的和效果将变得更明显。
一种基于知识图谱的问答方法,如图1所示,包括:
构建数据库,解析问题和检索答案,具体步骤为:
1)构建用于存储农业领域知识的数据库、用于存储同义词集合和问题模板的语法库以及用于存储常问问题集(frequent asked questions,FAQ)的FAQ问题库,具体为:
1.1构建农业领域知识图谱,并将知识图谱数据存储到结构化的RDF(ResourceDescription Framework)数据库TDB(Triple Database)中,利用TDB服务进行知识图谱三元组的检索;
1.2构建用于存储同义词集合和问题模板的语法库,将同义词集合与问题模板存储到语法库,所述的同义词集合包括与知识图谱中关系和属性相关的关键字,并提取问题中的拓扑结构形成问题模板库,存储到语法库,所述同义词集合和问题模板的具体建立步骤为:
1.2.1首先收集领域相关问题的样本,形成样本集,并根据样本所涉及的关系或属性,对所述样本集进行分类,对问题样本进行命名实体识别后,去除实体指称,再将剩余部分进行分词、去除停用词操作,得到仅含有关键字的精简问题样例,并将涉及同一个关系或属性的精简问题样例归为一类,再将属于这些精简问题样例的关键字合并为一个集合,即得到一个同义词集合,而每一个同义词集合对应知识图谱中的一个关系或属性;例如对于知识图谱中的属性“别名”,其对应的同义词集合为“名字、姓名、别名、名称、其他、名、别称、又名”等;
1.2.2对每一个问题样本,进行命名实体识别,实体指称以通配符替代,再对问题样本进行分词和词性标注,并根据分词和词性标注结果建立句法树;分析句法树的结构,对问题样本进行分类,分类的依据为:归为一类的问题样本,其句法树中都有相同的子树,即这些子树的结构相同,且子树中相同位置的树节点,其词性也相同,这些相同的子树表示一种拓扑结构;对于每一类问题样本,记录下句法树拓扑结构中谓词指称所对应的部分,以此得到拓扑结构与谓词指称的对应关系,该对应关系即为问题模板,并形成问题模板库;
1.3通过网络收集社区问答(community question answering,CQA)所提供的、用户交互衍生的大规模问题答案对(question-answer pair,QA pair),从中统计出高频的问题答案对,形成常问问题集(frequent asked questions,FAQ),并将常问问题及相关答案存储到问题库,每一个问题对应一个标准答案,即为问题与答案的映射,以此构建FAQ问题库;
2)对问题进行解析,具体步骤为:
2.1对问题进行命名实体识别操作,将问句与知识图谱中的实体进行字符串匹配,得到问题的实体指称部分;
2.2对问题进行实体链接操作,将实体指称链接到知识图谱中的某个实体;
2.3问题的实体指称部分以通配符替代,并对问题的剩余部分进行分词,即将问句分割为一系列分词词组,并对所述分词词组进行词性标注;
2.4用标注词性的分词词组,进行句法分析,建立句法树;
2.5用句法树的词性拓扑结构,与步骤1.2.2中得到的问题模板库中的问题模板进行检索,判断问题对应的句法树拓扑结构,是否与某个问题模板中的结构相同,若是则视为匹配到模板,进入步骤3.1;否则进入步骤3.2;例如问题“翠菊的颜色是什么?”,经过命名实体识别后,实体指称“翠菊”被通配符“ENTITY”替代,问题转化为“ENTITY 的颜色是什么?”,再进行分词和词性标注,问题被分词为{"ENTITY","的","颜色"," 是","什么"},对应的词性标注为{"en","uj","n","v","r"},生成的句法树为“[IP[NP[DNP [NP[NN ENTITY]][DEG的]][NP[NN颜色]]][VP[VC是][NP[PN什么]]]]”,匹配到的拓扑结构为“NP->DNP+NP”;
3)检索答案,具体步骤为:
3.1从农业领域知识库中检索答案,具体步骤为:
3.1.1根据步骤2.5检索匹配到的模板,得到问题的句法树拓扑结构中对应的谓词指称部分;
3.1.2根据谓词指称部分对应的词性,从步骤2.3标注词性的分词词组中,取出问题中谓词指称部分的词组;如前所述的例子,拓扑结构为“NP->DNP+NP”,其中的谓词指称部分为叶节点的“NP”,即问句中的“[NP[NN颜色]]”部分,所以这个问题的谓词指称部分词组为“颜色”;
3.1.3将问题中谓词指称部分的词组,与步骤1.2.1得到的同义词集合,进行相似度计算,对于相似度最大的同义词集合,其对应于知识图谱的关系或属性,即为问题映射到知识图谱的关系或属性;如前所述的例子,谓词指称部分词组“颜色”,根据计算,相似度最大的同义词集合为“颜色、花色、色彩、色”,而这个同义词集合对应知识图谱的属性为“花色”,即得到问题所映射到知识图谱的谓词为“花色”;
3.1.4将步骤2.2得到的实体视为主语或宾语,与步骤3.1.3得到的谓词相结合,生成SPARQL查询,从知识图谱中检索并找到对应的三元组,若将步骤2.2得到的实体视为主语,则以该三元组中的宾语作为问题的答案;若将步骤2.2得到的实体视为宾语,则以该三元组中的主语作为问题的答案,若没有检索到对应的三元组,则进入步骤3.3;
3.2从FAQ问题库中检索答案,具体步骤为:
3.2.1基于编辑距离,计算原始问题与FAQ问题库常问问题的相似度;
3.2.2取相似度最大的常问问题为候选问题,若原始问题与候选问题的相似度大于问句相似度阈值,则视为原始问题匹配到该常问问题,进入步骤3.2.3;否则进入步骤3.3;本***中,基于问题样本集,设置不同的问句相似度阈值,评估正确回答样本问题的召回率(recall)、精确率(precision)和综合评价指标F1-Measure,取使得F1-Measure 最大时设置的阈值参数,为***中使用的问句相似度阈值;在本***中,问句相似度阈值为0.60。
3.2.3根据匹配得到的常问问题,以及FAQ问题库中常问问题与答案的映射关系,得到常问问题对应的答案,即作为原始问题的答案;
3.3给出提示,无法回答问题。
本发明方法的优选实施例中,步骤3.1.3中计算谓词指称部分词组与同义词集合的相似度的具体过程为:
令X=(x1,x2,…,xn,xn+1,…)为自然问句谓词指称部分的词组,其中xn表示问句谓词指称部分中的一个词;令Yi=(yi1,yi2,…,yim,yim+1,…)表示第i个同义词集合,共有L 个同义词集合;yim表示第i个同义词集合中的一个词;xn与yim的相似度计算是基于词向量的语义相似度,即将xn与yim都以k维词向量表示,有xn=(xn1,xn2,…,xnk), yim=(yim1,yim2,…,yimk),根据下式计算xn与yim的相似度:
Figure BDA0001643857720000071
Figure BDA0001643857720000072
其中T为同义词相似度阈值,为一个超参数,表示当两个词的相似度超过这个阈值,则视为两个词是同义词或近义词,否则就将相似度置为0;本***中,基于问题样本集,设置不同的同义词相似度阈值,评估正确回答样本问题的召回率(recall)、精确率(precision)和综合评价指标F1-Measure,取使得F1-Measure最大时设置的阈值参数,为***中使用的同义词相似度阈值;在本***中,同义词相似度阈值为0.55。
谓词指称部分的词组与同义词集合的相似度为:
Figure BDA0001643857720000081
其中|X|表示谓词指称部分词组的词个数,|Yi|表示一个同义词集合Yi的词个数,sim(xj,yim)为问句谓词指称部分中的一个词xj与第i个同义词集合中的一个词yim的词向量相似度。
本发明方法的优选实施例中,步骤3.2.1中计算原始问题与FAQ问题库常问问题的相似度的具体过程为:
对原始问题q与FAQ问题库中第i个常问问题xi进行预处理,去除问题中的非中文字符;使用基于编辑距离的相似度计算公式,计算原始问题与FAQ问题库中第i个常问问题的相似度:
Figure BDA0001643857720000082
其中|q|、|xi|分别表示两个问题的字符串长度,EditDistance(q,xi)是使用编辑距离计算得到的两个问题相互转换的最小操作次数。
如图2所示,本发明的农业百科问答***,是基于上述知识图谱问答方法,包括离线模块和在线模块,所述离线模块用以利用事先得到的问题-答案对,生成拓扑结构 -谓词指称的映射关系以及生成谓词-同义词集合的映射关系,形成问题模板库和同义词集合,建立农业百科知识相关的知识图谱;所述的在线模块用以对用户输入的问句进行预处理和解析,根据解析结果匹配问题模板,根据模板找到问句中谓词指称部分,匹配与谓词指称最相近的同义词集合,得到谓词指称对应于知识图谱中的某个关系或属性,将问句映射为知识图谱中的实体-关系/属性组合,生成结构化查询语句。
本发明***的优选实施例中,离线模块包括知识图谱建立单元、问题样本处理单元、问题模板训练单元和同义词集合生成单元;所述的知识图谱建立单元用以结合百度百科、***、或互动百科中已有的农业概念分类体系,进行人工建立农业分类树,并从百度百科、***、或互动百科的网页中通过网络爬虫抽取农业分类树相关的农业百科知识,且通过三大百科网页的信息框数据和网页文本自动生成表达农业实体关系或属性的三元组,形成农业知识图谱;所述的问题样本处理单元用以通过网络爬虫挖掘农业问答社区网站、农业百科垂直网站、百科知道类网站的农业相关问题,形成问题样本集,并通过众包形式的分析与审核,找到可以映射为知识图谱中关系或属性的问题,形成问题样本集;所述的问题模板训练单元用以对问题样本进行命名实体识别、实体链接、替换命名实体指称、去除停用词、分词、词性标注和句法树构建等的预处理,并借助机器学习或审核的方法找到句法树中的特定句法子树以及句法子树的谓词指称部分,形成拓扑结构与结构中谓词指称部分的映射关系,这种映射关系即为一种问题模板,形成问题模板集合,所述特定句法子树被称为一种拓扑结构;所述的同义词集合生成单元用以分析问题样本处理单元形成的问题样本集,找到知识图谱中某个属性或关系所对应的一类问题样本,并对这类问题样本进行命名实体识别后,去除实体指称,再将剩余部分进行分词、去除停用词操作,得到仅含有关键字的精简问题样例,并把属于这些精简问题样例的关键字合并为一个集合,从而得到一个同义词集合,每一个同义词集合对应知识图谱中的一个关系或属性。
本发明***的优选实施例中,在线模块包括I/O单元、命名实体识别单元、问句预处理单元、问题模板匹配单元、答案检索单元、FAQ问题库答案获取单元和答案处理单元,所述的I/O单元用于接受用户输入的问题并展示检索答案给用户,所述的命名实体识别单元用于识别问句中的实体指称部分、并将实体指称与知识图谱的实体进行链接,所述的问句预处理单元用以将问句中的实体指称以通配符替换、并对问句进行分词和去除停用词,所述的问题模板匹配单元用以对预处理后的问句进行词性标注并生成句法树、根据句法树在问题模板库中检索匹配的问题模板并确定问句的谓词指称部分、根据问句的谓词指称词组检索匹配的同义词集合并确定同义词集合映射的知识图谱关系或属性,所述的答案检索单元用以根据识别出的问题实体和属性/关系组成结构化查询语句、并根据结构化查询语句在知识图谱中检索对应的三元组后返回答案实体,所述的FAQ问题库答案获取单元用于从FAQ问题库获取问题的答案,所述的答案处理单元用以根据问句的谓词指称与同义词集合的相似度计算答案可信度、计算问句与FAQ问题库中常问问题的相似度作为答案可信度。
虽然本发明的一些实施方式已经在本申请文件中予以了描述,但是对本领域技术人员显而易见的是,这些实施方式仅仅是作为示例示出的。本领域技术人员可以想到众多的变型方案、替代方案和改进方案而不超出本发明的范围。所附权利要求书旨在限定本发明的范围,并藉此涵盖这些权利要求本身及其等同变换的范围内的方法和结构。

Claims (3)

1.一种基于知识图谱的问答方法,其特征在于,该方法包括以下步骤:
1)构建用于存储农业领域知识的数据库、用于存储同义词集合和问题模板的语法库以及用于存储常问问题集的FAQ问题库,具体为:
1.1构建农业领域知识图谱,并将知识图谱数据存储到结构化的RDF数据库TDB中,利用TDB服务进行知识图谱三元组的检索;
1.2构建用于存储同义词集合和问题模板的语法库,将同义词集合与问题模板存储到语法库,所述的同义词集合包括与知识图谱中关系和属性相关的关键字,并提取问题中的拓扑结构形成问题模板库,存储到语法库,所述同义词集合和问题模板的具体建立步骤为:
1.2.1首先收集领域相关问题的样本,形成样本集,并根据样本所涉及的关系或属性,对所述样本集进行分类,对问题样本进行命名实体识别后,去除实体指称,再将剩余部分进行分词、去除停用词操作,得到仅含有关键字的精简问题样例,并将涉及同一个关系或属性的精简问题样例归为一类,再将属于这些精简问题样例的关键字合并为一个集合,即得到一个同义词集合,而每一个同义词集合对应知识图谱中的一个关系或属性;
1.2.2对每一个问题样本,进行命名实体识别,实体指称以通配符替代,再对问题样本进行分词和词性标注,并根据分词和词性标注结果建立句法树;分析句法树的结构,对问题样本进行分类,分类的依据为:归为一类的问题样本,其句法树中都有相同的子树,即这些子树的结构相同,且子树中相同位置的树节点,其词性也相同,这些相同的子树表示一种拓扑结构;对于每一类问题样本,记录下句法树拓扑结构中谓词指称所对应的部分,以此得到拓扑结构与谓词指称的对应关系,该对应关系即为问题模板,并形成问题模板库;
1.3通过网络收集社区问答所提供的、用户交互衍生的大规模问题答案对,从中统计出高频的问题答案对,形成常问问题集,并将常问问题及相关答案存储到问题库,每一个问题对应一个标准答案,即为问题与答案的映射,以此构建FAQ问题库;
2)对问题进行解析,具体步骤为:
2.1对问题进行命名实体识别操作,将问句与知识图谱中的实体进行字符串匹配,得到问题的实体指称部分;
2.2对问题进行实体链接操作,将实体指称链接到知识图谱中的某个实体;
2.3问题的实体指称部分以通配符替代,并对问题的剩余部分进行分词,即将问句分割为一系列分词词组,并对所述分词词组进行词性标注;
2.4用标注词性的分词词组,进行句法分析,建立句法树;
2.5用句法树的词性拓扑结构,与步骤1.2.2中得到的问题模板库中的问题模板进行检索,判断问题对应的句法树拓扑结构,是否与某个问题模板中的结构相同,若是则视为匹配到模板,进入步骤3.1;否则进入步骤3.2;
3)检索答案,具体步骤为:
3.1从农业领域知识库中检索答案,具体步骤为:
3.1.1根据步骤2.5检索匹配到的模板,得到问题的句法树拓扑结构中对应的谓词指称部分;
3.1.2根据所述谓词指称部分对应的词性,从步骤2.3标注词性的分词词组中,取出问题中谓词指称部分的词组;
3.1.3将问题中谓词指称部分的词组,与步骤1.2.1得到的同义词集合,进行相似度计算,对于相似度最大的同义词集合,其对应于知识图谱的关系或属性,即为问题映射到知识图谱的关系或属性;
3.1.4将步骤2.2得到的实体视为主语或宾语,与步骤3.1.3得到的谓词相结合,生成SPARQL查询,从知识图谱中检索并找到对应的三元组,若将步骤2.2得到的实体视为主语,则以该三元组中的宾语作为问题的答案;若将步骤2.2得到的实体视为宾语,则以该三元组中的主语作为问题的答案,若没有检索到对应的三元组,则进入步骤3.3;
3.2从FAQ问题库中检索答案,具体步骤为:
3.2.1基于编辑距离,计算原始问题与FAQ问题库常问问题的相似度;
3.2.2取相似度最大的常问问题为候选问题,若原始问题与候选问题的相似度大于问句相似度阈值,则视为原始问题匹配到该常问问题,进入步骤3.2.3;否则进入步骤3.3;
3.2.3根据匹配得到的常问问题,以及FAQ问题库中常问问题与答案的映射关系,得到常问问题对应的答案,即作为原始问题的答案;
3.3给出提示,无法回答问题。
2.如权利要求1所述的一种基于知识图谱的问答方法,其特征在于,所述步骤3.1.3中计算谓词指称部分的词组与同义词集合的相似度的具体过程为:
X=(x1,x2,...,xn,xn+1,...)为自然问句谓词指称部分的词组,其中xn表示问句谓词指称部分中的一个词;令Yi=(yi1,yi2,...,yim,yim+1,...)表示第i个同义词集合,共有L个同义词集合;yim表示第i个同义词集合中的一个词;xn与yim的词相似度计算是基于词向量的语义相似度,即xn与yim都以k维词向量表示,有xn=(xn1,xn2,...,xnk),yim=(yim1,yim2,...,yimk),根据下式计算xn与yim的相似度:
Figure FDA0003009488110000021
Figure FDA0003009488110000022
Figure FDA0003009488110000023
其中T为同义词相似度阈值,为一个超参数,表示当两个词的相似度超过这个阈值时,则视为两个词是同义词或近义词,否则就将相似度置为0;
谓词指称部分的词组与同义词集合的相似度为:
Figure FDA0003009488110000031
其中|X|表示谓词指称部分词组的词个数,|Yi|表示一个同义词集合Yi的词个数,sim(xj,yim)为问句谓词指称部分中的一个词xj与第i个同义词集合中的一个词yim的词向量相似度。
3.如权利要求1所述的一种基于知识图谱的问答方法,其特征在于,所述步骤3.2.1中计算原始问题与FAQ问题库常问问题的相似度的具体过程为:
对原始问题q与FAQ问题库中第i个常问问题xi进行预处理,去除问题中的非中文字符;使用基于编辑距离的相似度计算公式,计算原始问题与FAQ问题库中第i个常问问题的相似度:
Figure FDA0003009488110000032
其中|q|、|xi|分别表示两个问题的字符串长度,EditDistance(q,xi)是使用编辑距离计算得到的两个问题相互转换的最小操作次数。
CN201810392883.3A 2018-04-27 2018-04-27 一种基于知识图谱的问答方法及农业百科问答*** Active CN108804521B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810392883.3A CN108804521B (zh) 2018-04-27 2018-04-27 一种基于知识图谱的问答方法及农业百科问答***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810392883.3A CN108804521B (zh) 2018-04-27 2018-04-27 一种基于知识图谱的问答方法及农业百科问答***

Publications (2)

Publication Number Publication Date
CN108804521A CN108804521A (zh) 2018-11-13
CN108804521B true CN108804521B (zh) 2021-05-14

Family

ID=64093054

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810392883.3A Active CN108804521B (zh) 2018-04-27 2018-04-27 一种基于知识图谱的问答方法及农业百科问答***

Country Status (1)

Country Link
CN (1) CN108804521B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115795018A (zh) * 2023-02-13 2023-03-14 广州海昇计算机科技有限公司 一种面向电网领域的多策略智能搜索问答方法及***

Families Citing this family (74)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109284342A (zh) * 2018-11-22 2019-01-29 北京百度网讯科技有限公司 用于输出信息的方法和装置
CN109299289B (zh) * 2018-11-30 2021-04-06 国信优易数据股份有限公司 一种查询图构建方法、装置、电子设备及计算机存储介质
CN109598384A (zh) * 2018-12-06 2019-04-09 同方知网(北京)技术有限公司 一种农业产业创新服务图谱构建***
CN109800291B (zh) * 2018-12-12 2024-03-15 平安科技(深圳)有限公司 问题应答方法及装置、电子设备和存储介质
CN109766551B (zh) * 2019-01-08 2023-07-14 广东小天才科技有限公司 一种多义词语义的确定方法和***
CN109886294B (zh) * 2019-01-11 2024-01-23 平安科技(深圳)有限公司 知识融合方法、装置、计算机设备和存储介质
CN109783775B (zh) * 2019-01-18 2023-07-28 广东小天才科技有限公司 一种标记用户语料的内容的方法及***
CN109766453A (zh) * 2019-01-18 2019-05-17 广东小天才科技有限公司 一种用户语料语义理解的方法及***
CN109670033B (zh) * 2019-02-01 2021-01-12 海信视像科技股份有限公司 内容的检索方法、装置、设备及存储介质
CN110019844A (zh) * 2019-02-20 2019-07-16 众安信息技术服务有限公司 一种保险行业知识图谱问答***构建方法及装置
CN109947916B (zh) * 2019-03-01 2023-08-08 河北尚云信息科技有限公司 基于气象领域知识图谱的问答***装置及问答方法
CN110083690B (zh) * 2019-04-10 2022-05-03 华侨大学 一种基于智能问答的对外汉语口语训练方法及***
CN110134775B (zh) * 2019-05-10 2021-08-24 中国联合网络通信集团有限公司 问答数据生成方法及装置、存储介质
CN111949758A (zh) * 2019-05-16 2020-11-17 北大医疗信息技术有限公司 医疗问答推荐方法、推荐***和计算机可读存储介质
CN112052311A (zh) * 2019-05-20 2020-12-08 天津科技大学 一种基于词向量技术和知识图谱检索的短文本问答方法及装置
TWI759598B (zh) * 2019-05-20 2022-04-01 南一書局企業股份有限公司 綜合學生習題發問頻率以整合回應的智能客服系統
CN110147437B (zh) * 2019-05-23 2022-09-02 北京金山数字娱乐科技有限公司 一种基于知识图谱的搜索方法及装置
CN110334272B (zh) * 2019-05-29 2022-04-12 平安科技(深圳)有限公司 基于知识图谱的智能问答方法、装置及计算机存储介质
CN110222165B (zh) * 2019-06-14 2021-10-26 言图科技有限公司 基于即时聊天实现员工日常管理的方法和***
CN110209839B (zh) * 2019-06-18 2021-07-27 卓尔智联(武汉)研究院有限公司 农业知识图谱构建装置、方法及计算机可读存储介质
CN110489513A (zh) * 2019-06-24 2019-11-22 覃立万 一种智能机器人社交信息处理方法及与人的社交***
CN110399457B (zh) * 2019-07-01 2023-02-03 吉林大学 一种智能问答方法和***
CN110457487B (zh) * 2019-07-10 2022-03-29 北京邮电大学 专利知识图谱的构建方法及装置
CN110309321B (zh) * 2019-07-10 2021-05-18 电子科技大学 一种基于图谱表示学习的知识表示学习方法
CN110413732B (zh) * 2019-07-16 2023-11-24 扬州大学 面向软件缺陷知识的知识搜索方法
CN110347803A (zh) * 2019-07-18 2019-10-18 北京百度网讯科技有限公司 获得阅读理解素材的方法和装置、电子设备、可读介质
CN110413636A (zh) * 2019-08-01 2019-11-05 北京香侬慧语科技有限责任公司 一种数据处理方法和装置
CN110555153A (zh) * 2019-08-20 2019-12-10 暨南大学 一种基于领域知识图谱的问答***及其构建方法
CN110532362B (zh) * 2019-08-20 2022-06-10 北京齐尔布莱特科技有限公司 基于产品使用手册的问答方法、装置及计算设备
CN110489538B (zh) * 2019-08-27 2020-12-25 腾讯科技(深圳)有限公司 基于人工智能的语句应答方法、装置及电子设备
CN112445899B (zh) * 2019-08-29 2024-05-03 南京大学 一种基于神经网络的知识库问答中的属性匹配方法
US11379738B2 (en) 2019-09-18 2022-07-05 International Business Machines Corporation Using higher order actions to annotate a syntax tree with real data for concepts used to generate an answer to a question
CN110674274B (zh) * 2019-09-23 2022-07-01 中国农业大学 一种针对食品安全法规问答***的知识图谱构建方法
CN110727779A (zh) * 2019-10-16 2020-01-24 信雅达***工程股份有限公司 基于多模型融合的问答方法及***
CN110909140B (zh) * 2019-11-13 2022-08-23 国网江苏省电力有限公司电力科学研究院 一种图谱问答与检索问答结合的中枢路由方法及装置
CN110990527A (zh) * 2019-11-26 2020-04-10 泰康保险集团股份有限公司 自动问答方法及装置、存储介质及电子设备
CN110991183B (zh) * 2019-12-06 2023-07-04 北京百度网讯科技有限公司 问题的谓词确定方法、装置、设备及存储介质
CN111177345B (zh) * 2019-12-19 2023-06-20 中国平安财产保险股份有限公司 基于知识图谱的智能问答方法、装置和计算机设备
CN111104504A (zh) * 2019-12-25 2020-05-05 天津中科智能识别产业技术研究院有限公司 一种基于自然语言处理和知识图谱的对话方法
CN111125150B (zh) * 2019-12-26 2023-12-26 成都航天科工大数据研究院有限公司 一种工业领域问答***检索方法
CN111291192B (zh) * 2020-01-15 2023-08-25 北京百度网讯科技有限公司 知识图谱中三元组置信度计算方法和装置
CN111241839B (zh) * 2020-01-16 2022-04-05 腾讯科技(深圳)有限公司 实体识别方法、装置、计算机可读存储介质和计算机设备
CN111309863B (zh) * 2020-02-10 2020-12-18 北京声智科技有限公司 基于知识图谱的自然语言问答方法及装置
CN111339267A (zh) * 2020-02-17 2020-06-26 京东方科技集团股份有限公司 基于知识图谱的问答方法及***、计算机设备及介质
CN111400395B (zh) * 2020-02-17 2023-06-13 浙江大学 一种基于分布式账本的知识图谱众包平台
CN111753063A (zh) * 2020-02-28 2020-10-09 北京沃东天骏信息技术有限公司 一种应答方法、装置、服务器及存储介质
CN111488441B (zh) * 2020-04-08 2023-08-01 北京百度网讯科技有限公司 问题解析方法、装置、知识图谱问答***和电子设备
CN111522910B (zh) * 2020-04-14 2022-05-31 浙江大学 一种基于文物知识图谱的智能语义检索方法
CN111581365B (zh) * 2020-05-07 2023-04-25 北京理工大学 一种谓词抽取方法
CN111708869B (zh) * 2020-05-12 2023-07-14 北京明略软件***有限公司 人机对话的处理方法及装置
CN111708800A (zh) * 2020-05-27 2020-09-25 北京百度网讯科技有限公司 查询方法、装置及电子设备
CN111767334B (zh) * 2020-06-30 2023-07-25 北京百度网讯科技有限公司 信息抽取方法、装置、电子设备及存储介质
CN111831794A (zh) * 2020-07-10 2020-10-27 杭州叙简科技股份有限公司 一种基于知识图谱的综合管廊行业知识问答***构建方法
CN111930959B (zh) * 2020-07-14 2024-02-09 上海明略人工智能(集团)有限公司 用于图谱知识生成文本的方法与装置
CN112199508B (zh) * 2020-08-10 2024-01-19 淮阴工学院 一种基于远程监督的参数自适应农业知识图谱推荐方法
CN111930913A (zh) * 2020-08-14 2020-11-13 上海茂声智能科技有限公司 一种基于知识图谱的问答方法、***、装置、设备及介质
CN112182180A (zh) * 2020-09-27 2021-01-05 京东方科技集团股份有限公司 问答处理的方法、电子设备、计算机可读介质
CN112214590A (zh) * 2020-10-20 2021-01-12 重庆邮电大学 一种基于知识图谱的子图匹配自然问答方法
CN112231460B (zh) * 2020-10-27 2022-07-12 中国科学院合肥物质科学研究院 一种基于农业百科知识图谱的问答***的构建方法
CN112328762B (zh) * 2020-11-04 2023-12-19 平安科技(深圳)有限公司 基于文本生成模型的问答语料生成方法和装置
CN112434200B (zh) * 2020-11-30 2024-06-04 北京思特奇信息技术股份有限公司 一种数据展示方法、***及电子设备
CN112541085B (zh) * 2020-12-07 2021-08-24 北京左医科技有限公司 问卷的结构化方法、问卷的结构化装置及存储介质
CN112685434A (zh) * 2020-12-21 2021-04-20 福建新大陆软件工程有限公司 一种基于知识图谱的运维问答方法
CN112287669B (zh) * 2020-12-28 2021-05-25 深圳追一科技有限公司 文本处理方法、装置、计算机设备和存储介质
CN112966087B (zh) * 2021-03-15 2023-10-13 中国美术学院 一种灵感素材的智能问答***及方法
CN113590783B (zh) * 2021-07-28 2023-10-03 复旦大学 基于nlp自然语言处理的中医养生智能问答***
CN114090759A (zh) * 2022-01-19 2022-02-25 北京中科深智科技有限公司 一种基于知识库的电商直播实时问答***和方法
CN114417387B (zh) * 2022-01-24 2023-09-22 中国电子科技集团公司第五十四研究所 基于语义内涵的消息加密方法
CN114153993B (zh) * 2022-02-07 2022-05-06 杭州远传新业科技有限公司 一种用于智能问答的知识图谱自动化构建方法及***
CN114579710B (zh) * 2022-03-15 2023-04-25 西南交通大学 一种高速列车问题查询模板生成方法
CN114860917B (zh) * 2022-07-06 2022-10-18 中化现代农业有限公司 农业知识问答方法、装置、电子设备和存储介质
CN116028597B (zh) * 2023-03-27 2023-07-21 南京燧坤智能科技有限公司 对象检索方法、装置、非易失性存储介质及计算机设备
CN116167605B (zh) * 2023-04-26 2023-07-25 北京中关村科金技术有限公司 业务流程生成方法、装置、设备及介质
CN117194647B (zh) * 2023-11-03 2024-02-20 深圳墨影科技有限公司 一种用于离线环境的智能问答***、方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104050256A (zh) * 2014-06-13 2014-09-17 西安蒜泥电子科技有限责任公司 基于主动学习的问答方法及采用该方法的问答***
CN105868313A (zh) * 2016-03-25 2016-08-17 浙江大学 一种基于模板匹配技术的知识图谱问答***及方法
CN106909662A (zh) * 2017-02-27 2017-06-30 腾讯科技(上海)有限公司 知识图谱构建方法及装置
CN107451276A (zh) * 2017-08-05 2017-12-08 龙飞 一种基于深度学习的智能自助导游***及其方法
CN107766483A (zh) * 2017-10-13 2018-03-06 华中科技大学 一种基于知识图谱的交互式问答方法及***
CN107885842A (zh) * 2017-11-10 2018-04-06 上海智臻智能网络科技股份有限公司 智能问答的方法、装置、服务器及存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20010034015A1 (en) * 2000-02-11 2001-10-25 Raichur Arvind A. Network based anonymous question and answer system

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104050256A (zh) * 2014-06-13 2014-09-17 西安蒜泥电子科技有限责任公司 基于主动学习的问答方法及采用该方法的问答***
CN105868313A (zh) * 2016-03-25 2016-08-17 浙江大学 一种基于模板匹配技术的知识图谱问答***及方法
CN106909662A (zh) * 2017-02-27 2017-06-30 腾讯科技(上海)有限公司 知识图谱构建方法及装置
CN107451276A (zh) * 2017-08-05 2017-12-08 龙飞 一种基于深度学习的智能自助导游***及其方法
CN107766483A (zh) * 2017-10-13 2018-03-06 华中科技大学 一种基于知识图谱的交互式问答方法及***
CN107885842A (zh) * 2017-11-10 2018-04-06 上海智臻智能网络科技股份有限公司 智能问答的方法、装置、服务器及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Expert Finding for Question Answering via GraphRegularized Matrix Completion;Zhou Zhao.etc;《TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERIN》;20151231;第27卷(第4期);第7-11页 *
基于知识图谱的生物学科知识问答***;康准等;《软件》;20180215;第39卷(第2期);第993-1004页 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115795018A (zh) * 2023-02-13 2023-03-14 广州海昇计算机科技有限公司 一种面向电网领域的多策略智能搜索问答方法及***

Also Published As

Publication number Publication date
CN108804521A (zh) 2018-11-13

Similar Documents

Publication Publication Date Title
CN108804521B (zh) 一种基于知识图谱的问答方法及农业百科问答***
CN110399457B (zh) 一种智能问答方法和***
CN110413732B (zh) 面向软件缺陷知识的知识搜索方法
CN110765257B (zh) 一种知识图谱驱动型的法律智能咨询***
CN106649260B (zh) 基于评论文本挖掘的产品特征结构树构建方法
CN112069298B (zh) 基于语义网和意图识别的人机交互方法、设备及介质
CN110222045B (zh) 一种数据报表获取方法、装置及计算机设备、存储介质
CN112163077B (zh) 一种面向领域问答的知识图谱构建方法
CN109460459B (zh) 一种基于日志学习的对话***自动优化方法
CN112035599B (zh) 基于垂直搜索的查询方法、装置、计算机设备及存储介质
CN111881290A (zh) 一种基于加权语义相似度的配网多源网架实体融合方法
CN109408578B (zh) 一种针对异构环境监测数据融合方法
CN110175585B (zh) 一种简答题自动批改***及方法
CN113569023A (zh) 一种基于知识图谱的中文医药问答***及方法
CN115599899B (zh) 基于飞行器知识图谱的智能问答方法、***、设备及介质
CN110275949A (zh) 用于贷款应用的自动应答方法及***
CN112445894A (zh) 基于人工智能的商务智能***及其分析方法
CN113434418A (zh) 知识驱动的软件缺陷检测与分析方法及***
US11487795B2 (en) Template-based automatic software bug question and answer method
CN112685440B (zh) 标记搜索语义角色的结构化查询信息表达方法
CN116628173B (zh) 一种基于关键字提取的智能客服信息生成***及生成方法
CN113610626A (zh) 银行信贷风险识别知识图谱构建方法、装置、计算机设备及计算机可读存储介质
CN116049376B (zh) 一种信创知识检索回复的方法、装置和***
CN115630357B (zh) 一种应用程序越界收集个人信息行为的判定方法
CN114238735B (zh) 一种互联网数据智能采集方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant