CN110413735B - 一种问答检索方法及其***、计算机设备、可读存储介质 - Google Patents

一种问答检索方法及其***、计算机设备、可读存储介质 Download PDF

Info

Publication number
CN110413735B
CN110413735B CN201910678236.3A CN201910678236A CN110413735B CN 110413735 B CN110413735 B CN 110413735B CN 201910678236 A CN201910678236 A CN 201910678236A CN 110413735 B CN110413735 B CN 110413735B
Authority
CN
China
Prior art keywords
retrieved
morpheme
text
retrieval
morpheme set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910678236.3A
Other languages
English (en)
Other versions
CN110413735A (zh
Inventor
饶竹一
张云翔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Power Supply Co ltd
Original Assignee
Shenzhen Power Supply Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Power Supply Co ltd filed Critical Shenzhen Power Supply Co ltd
Priority to CN201910678236.3A priority Critical patent/CN110413735B/zh
Publication of CN110413735A publication Critical patent/CN110413735A/zh
Application granted granted Critical
Publication of CN110413735B publication Critical patent/CN110413735B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9532Query formulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种问答检索方法及其***、计算机设备、可读存储介质,该方法包括:接收待检索文本;对待检索文本进行语素解析得到待检索语素集,所述待检索语素集包括一个或多个语素;根据待检索语素集进行检索得到与待检索语素集对应的检索结果;根据检索结果及待检索语素集确定检索结果与待检索语素集的相关性;根据检索结果与待检索语素集的相关性判断是否检索到对应文档,若是,则输出检索结果,若否,则进一步判断是否接收到文本修改信息,若未接收到文本修改信息,则输出待检索文本,若接收到文本修改信息,则根据文本修改信息更新待检索文本并根据更新后待检索文本进行检索。本发明至少能够避免相同文本的重复计算,减少检索计算量。

Description

一种问答检索方法及其***、计算机设备、可读存储介质
技术领域
本发明涉及问答检索技术领域,特别涉及一种问答检索方法及其***、计算机设备、可读存储介质。
背景技术
随着互联网的发展和网络信息的不断增长,通过搜索引擎可以从互联网中检索到越来越多的信息,搜索结果呈现出数据海量化,形态多样化,覆盖全面化等特点,一方面提升了用户搜索到结果的可能性,另一方面却使得用户很难快速准确地定位到所需的信息,其中问答检索是信息检索***的一种高级形式,它能用准确、简洁的自然语言回答用户用自然语言提出的问题,是集自然语言处理技术和信息检索技术于一身的新一代搜索引擎,它的出现旨在提供更有力的信息获取工具,现有的问答检索方法通过对整个检索文本进行分析,提取关键词进行问答检索,随着检索到越来越多的信息,检索精确度低,且当操作者修改检索文本内容时,需要对修改的检索文本进行再次计算处理,容易造成相同文本的重复计算,从而增加计算量,增加处理时间。
发明内容
本发明旨在提供一种问答检索方法及其***、计算机设备、可读存储介质,以避免相同文本的重复计算,提高检索精确度、减少检索计算量以及节约处理时间。
为了实现本发明目的,本发明第一方面提供一种问答检索方法,包括如下步骤:
S1、接收待检索文本;
S2、对待检索文本进行语素解析得到待检索语素集,所述待检索语素集包括一个或多个语素;
S3、根据待检索语素集进行检索得到与待检索语素集对应的检索结果;
S4、根据检索结果及待检索语素集确定检索结果与待检索语素集的相关性;
S5、根据检索结果与待检索语素集的相关性判断是否检索到对应文档,若是,则输出检索结果,若否,则进一步判断是否接收到文本修改信息,若未接收到文本修改信息,则输出待检索文本,若接收到文本修改信息,则根据文本修改信息更新待检索文本并根据更新后待检索文本进行检索。
优选地,所述步骤S3包括:
根据待检索语素集中语素确定检索集中与该待检索语素集中语素对应的文档,其中,所述检索集中包括多个文档。
优选地,所述根据文本修改信息更新待检索文本并根据更新后待检索文本进行检索包括:
根据所述文本修改信息对待检索文本进行更新得到更新后待检索文本;
对所述更新后待检索文本进行语素解析得到更新后待检索语素集,所述更新后待检索语素集包括一个或多个语素;
根据更新前待检索语素集和更新后待检索语素集的集合关系对所述更新后待检索语素集进行检索,所述集合关系包括包含、相交以及相离。
优选地,所述根据更新前待检索语素集和更新后待检索语素集的集合关系对所述更新后待检索语素集进行检索包括:
若更新前待检索语素集包含更新后待检索语素集,则返回步骤S4,根据更新前检索结果及更新后待检索语素集确定检索结果与更新后待检索语素集的相关性;
若更新前待检索语素集与更新后待检索语素集相交,则确定更新后待检索语素集中与更新前待检索语素集不同的语素,根据所述与更新前待检索语素集不同的语素进行检索得到二次检索结果,并合并所述二次检索结果和语速集更新前所对应的检索结果作为更新后待检索语素集所对应的检索结果,并将其返回至步骤S4中进一步确定更新后待检索语素集所对应的检索结果与更新后待检索语素集的相关性;
若更新前待检索语素集与更新后待检索语素集相离,则返回步骤S3,对更新后待检索语素集进行检索得到与待检索语素集对应的检索结果。
优选地,所述步骤S2包括:
采用word2vec训练词向量算法对待检索语素集中的一个或多个语素进行词向量预处理。
优选地,所述步骤S4具体根据如下公式计算检索结果与待检索语素集的相关性:
Figure BDA0002143986200000031
Figure BDA0002143986200000032
Figure BDA0002143986200000033
其中,Score(qi,d)表示检索结果与待检索语素集的相关性,qi表示解析的语素,d表示单个检索文档,Wi表示语素qi的权重,R(qi,d)表示语素qi对文档d的相关性得分,N为检索集中文档总数,n(qi)为包含语素qi的文档数;b和k1为调节因子,fi为语素qi在检索文档d中出线的频率,dl为检索文档d的长度,avgdl为检索集中所有文档的平均长度。
优选地,所述根据检索结果与待检索语素集的相关性判断是否检索到对应文档包括:
若没有与语素对应相关的文档,则没有检索到该语素的对应文档;
若存在与语素对应相关的若干文档,则选取相关性最高的文档作为其检索结果。
本发明第二方面提供一种问答检索***,其用于实施本发明第一方面所述的问答检索方法,所述***包括:
文本接收单元,被配置为接收待检索文本;
语素解析单元,被配置为对待检索文本进行语素解析得到待检索语素集,所述待检索语素集包括一个或多个语素;
检索单元,被配置为根据待检索语素集进行检索得到与待检索语素集对应的检索结果;
确定单元,被配置为根据检索结果及待检索语素集确定检索结果与待检索语素集的相关性;
判断及输出单元,被配置为根据检索结果与待检索语素集的相关性判断是否检索到对应文档,若是,则输出检索结果,若否,则进一步判断是否接收到文本修改信息,若未接收到文本修改信息,则输出待检索文本,若接收到文本修改信息,则根据文本修改信息更新待检索文本并根据更新后待检索文本进行检索。
本发明第三方面提供提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行第一方面实施例所述问答检索方法的步骤。
本发明第四方面提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时,以实现如本发明第一方面所述问答检索方法的步骤。
在以上技术方案中,通过语素解析的作用,便于将检索文本进行切分,从而方便后期加权操作,通过词向量预处理的作用,便于将文本数据转换成计算机能识别的数据,方便计算机识别,然后更新表示来预测其上下文,共享相似上下文的文本在向量空间中彼此接近,提高多个语素词组的词义之间的关联性;再通过BM25算法加权的作用,对检索文本的语素进行加权,从文本中识别出最重要的单词,并在将单词组合成文本表示时赋予它们更大的权重,利用其相关性的高低,提高检索结果的精准性。此外,通过对修改部分进行处理的作用,便于根据操作人员需求针对修改检索文本,实时对操作人员的检索文本进行答复,且通过改变量与待检索文本的对比,避免重复量继续进行计算操作,减少计算量,降低检索时间,提高问答检索的效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本发明实施例一所述一种问答检索方法流程图。
图2为本发明实施例二所述一种问答检索***示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚完整地描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其它实施例,都属于本发明保护的范围。
在此,还需要说明的是,为了避免因不必要的细节而模糊了本发明,在附图中仅仅示出了与根据本发明的方案密切相关的结构和/或处理步骤,而省略了与本发明关系不大的其他细节。
如图1所示,本发明实施例一提供一种问答检索方法,包括如下步骤:
S1、接收待检索文本。
S2、对待检索文本进行语素解析得到待检索语素集,所述待检索语素集包括一个或多个语素。
S3、根据待检索语素集进行检索得到与待检索语素集对应的检索结果;具体而言,所述检索结果为检索集中与所述待检索语素集对应的文本数据。
S4、根据检索结果及待检索语素集确定检索结果与待检索语素集的相关性。
S5、根据检索结果与待检索语素集的相关性判断是否检索到对应文档,若是,则输出检索结果,若否,则进一步判断是否接收到文本修改信息,若未接收到文本修改信息,则输出待检索文本,若接收到文本修改信息,则根据文本修改信息更新待检索文本并根据更新后待检索文本进行检索。
具体而言,对所述待检索文本进行语素解析是指对检索文本进行切分,根据语素定义要求切分成独立存在的语素集合,其中,语素是指最小语音语义的结合体,是语言最小的单位,包括单音节语素、双音节语素和多音节语素。
举例而言,本实施例方法用于进行问答检索,例如输入待检索文本为“广州在中国的什么位置”,则对待检索文本进行语素分析后得到语素:广州、中国、位置;根据语素“广州、中国、位置”查询检索集中文本数据,获取与语素“广州、中国、位置”相关的文本数据,其中,可能会查询得到多个文本数据,因此需进行步骤S4进一步判断检索结果是否可靠准确。
在一实施例中,所述步骤S3包括:
根据待检索语素集中语素确定检索集中与该待检索语素集中语素对应的文档,其中,所述检索集中包括多个文档。
在一实施例中,步骤S5中根据文本修改信息更新待检索文本并根据更新后待检索文本进行检索包括:
根据所述文本修改信息对待检索文本进行更新得到更新后待检索文本;
对所述更新后待检索文本进行语素解析得到更新后待检索语素集,所述更新后待检索语素集包括一个或多个语素;
根据更新前待检索语素集和更新后待检索语素集的集合关系对所述更新后待检索语素集进行检索,所述集合关系包括包含、相交以及相离。
具体而言,所述文本修改信息为对所述待检索文本进行修改更新的内容,本实施例中根据所述文本修改信息对待检索文本进行修改更新得到更新后检索文本,对所述更新后检索文本进行语素解析可以得到更新后待检索语素集更新后。
可以理解的是,更新前待检索语素集和更新后待检索语素集两者之间可能存在包含、相交以及相离的集合关系。其中,当文本修改信息为对待检索文本的内容进行删减,则所述更新前待检索语素集包含所述更新后待检索语素集;当文本修改信息为对待检索文本的部分内容进行修改,则会减少部分旧的语素,同时产生新的语素,则所述更新前待检索语素集与所述更新后待检索语素集之间关系为相交,既有相同的语素,也有不同的语素。当文本修改信息为将待检索文本替换为其他检索文本时,也就是说整个待检索文本都被修改了,更新前待检索文本与更新后检索文本不存在相同的语素内容时,则所述更新前待检索语素集与所述更新后待检索语素集之间关系为相离。
在一实施例中,所述根据更新前待检索语素集和更新后待检索语素集的集合关系对所述更新后待检索语素集进行检索包括:
若更新前待检索语素集包含更新后待检索语素集,则返回步骤S4,根据更新前检索结果及更新后待检索语素集确定检索结果与更新后待检索语素集的相关性;具体而言,由于修改只是删减待检索文本内容,因此更新后的待检索文本实际上都已经检索过了,因此本实施例中对于删减待检索文本中内容的情况,直接重新确定检索结果与更新后待检索语素集的相关性,减少了重新检索,避免重复处理带来的计算耗损。
若更新前待检索语素集与更新后待检索语素集相交,则确定更新后待检索语素集中与更新前待检索语素集不同的语素,根据所述与更新前待检索语素集不同的语素进行检索得到二次检索结果,并合并所述二次检索结果和语速集更新前所对应的检索结果作为更新后待检索语素集所对应的检索结果,并将其返回至步骤S4中进一步确定更新后待检索语素集所对应的检索结果与更新后待检索语素集的相关性;具体而言,由于对待检索文本内容中的部分内容进行了修改,因此,更新后的待检索文本中有部分语素已经检索处理过了,有部分语素没有检索处理,因此本实施例中只对未检索处理的部分语素进行检索得到二次检索结果,然后将更新前待检索文本所对应的检索结果与所述二次检索结果合并作为更新后待检索语素集所对应的检索结果,并返回步骤S4进行相关性确定,因此减少了重新检索,避免重复处理带来的计算耗损。
若更新前待检索语素集与更新后待检索语素集相离,则返回步骤S3,对更新后待检索语素集进行检索得到与待检索语素集对应的检索结果。
在一实施例中,所述步骤S2包括:
采用word2vec训练词向量算法对待检索语素集中的一个或多个语素进行词向量预处理。
具体而言,本实施例中word2vec训练词向量算法包括:先对处理好的语素词组进行词向量编码,将文本数据转换成计算机能识别的数据,便于计算,本实施例中将其转换成数值型数据,然后更新表示来预测其上下文,共享相似上下文的文本在向量空间中彼此接近,根据特定的任务来定制文本表示,并且被训练以最大化模型的性能。
在一实施例中,所述步骤S4具体根据如下公式计算检索结果与待检索语素集的相关性:
Figure BDA0002143986200000091
Figure BDA0002143986200000092
Figure BDA0002143986200000093
其中,qi表示解析的语素,d表示单个检索文档,Wi表示语素qi的权重,R(qi,d)表示语素qi对文档d的相关性得分,N为检索文档的总数,n(qi)为包含语素qi的文档数;b和k1为调节因子,fi为语素qi在检索文档d中出线的频率,dl为检索文档d的长度,avgdl为检索集中所有文档的平均长度。
其中,Score(qi,d)为检索结果与待检索语素集的相关性,Score(qi,d)得分越高,则相关性越强。
在一实施例中,所述根据所述检索结果与待检索语素集的相关性判断是否检索到对应文档包括:
若没有与语素对应相关的文档,则没有检索到该语素的对应文档;
若存在与语素对应相关的若干文档,则选取相关性最高的文档作为其检索结果。
如图2所示,本发明实施例二还提供一种问答检索***,其用于实施实施例一所述的问答检索方法,所述***包括:
文本接收单元1,被配置为接收待检索文本;
语素解析单元2,被配置为对待检索文本进行语素解析得到待检索语素集,所述待检索语素集包括一个或多个语素;
检索单元3,被配置为根据待检索语素集进行检索得到与待检索语素集对应的检索结果;
确定单元4,被配置为根据检索结果及待检索语素集确定检索结果与待检索语素集的相关性;
判断及输出单元5,被配置为根据检索结果与待检索语素集的相关性判断是否检索到对应文档,若是,则输出检索结果,若否,则进一步判断是否接收到文本修改信息,若未接收到文本修改信息,则输出待检索文本,若接收到文本修改信息,则根据文本修改信息更新待检索文本并根据更新后待检索文本进行检索。
需说明的是,本实施例二所述***用于实现实施例一所述方法,因此,关于本实施例二所述***的相关部分可以参阅实施例一所述方法的内容得到,此处不再赘述。
此外,本发明实施例三还提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行实施例一所述问答检索方法的步骤。
此外,本发明实施例四还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时,以实现实施例一所述问答检索方法的步骤。
通过以上实施例的描述可知,首先,通过语素解析的作用,便于将检索文本进行切分,从而方便后期加权操作,通过词向量预处理的作用,便于将文本数据转换成计算机能识别的数据,方便计算机识别,然后更新表示来预测其上下文,共享相似上下文的文本在向量空间中彼此接近,提高多个语素词组的词义之间的关联性,再通过BM25算法加权的作用,对检索文本的语素进行加权,从文本中识别出最重要的单词,并在将单词组合成文本表示时赋予它们更大的权重,利用其相关性的高低,提高检索结果的精准性;其次,通过对修改部分进行处理的作用,便于根据操作人员需求针对修改检索文本,实时对操作人员的检索文本进行答复,且通过改变量与待检索文本的对比,避免重复量继续进行计算操作,减少计算量,降低检索时间,提高问答检索的效率。
以上所述仅是本申请的具体实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

Claims (8)

1.一种问答检索方法,其特征在于,包括如下步骤:
S1、接收待检索文本;
S2、对待检索文本进行语素解析得到待检索语素集,所述待检索语素集包括一个或多个语素;
S3、根据待检索语素集进行检索得到与待检索语素集对应的检索结果;
S4、根据检索结果及待检索语素集确定检索结果与待检索语素集的相关性;
S5、根据检索结果与待检索语素集的相关性判断是否检索到对应文档,若是,则输出检索结果,若否,则进一步判断是否接收到文本修改信息,若未接收到文本修改信息,则输出待检索文本,若接收到文本修改信息,则根据文本修改信息更新待检索文本并根据更新后待检索文本进行检索;
其中,所述根据文本修改信息更新待检索文本并根据更新后待检索文本进行检索包括:
根据所述文本修改信息对待检索文本进行更新得到更新后待检索文本;
对所述更新后待检索文本进行语素解析得到更新后待检索语素集,所述更新后待检索语素集包括一个或多个语素;
若更新前待检索语素集包含更新后待检索语素集,则返回步骤S4,根据更新前检索结果及更新后待检索语素集确定检索结果与更新后待检索语素集的相关性;
若更新前待检索语素集与更新后待检索语素集相交,则确定更新后待检索语素集中与更新前待检索语素集不同的语素,根据所述与更新前待检索语素集不同的语素进行检索得到二次检索结果,并合并所述二次检索结果和语素集更新前所对应的检索结果作为更新后待检索语素集所对应的检索结果,并将其返回至步骤S4中进一步确定更新后待检索语素集所对应的检索结果与更新后待检索语素集的相关性;
若更新前待检索语素集与更新后待检索语素集相离,则返回步骤S3,对更新后待检索语素集进行检索得到与待检索语素集对应的检索结果。
2.如权利要求1所述的问答检索方法,其特征在于,所述步骤S3包括:
根据待检索语素集中语素确定检索集中与该待检索语素集中语素对应的文档,其中,所述检索集中包括多个文档。
3.如权利要求1所述的问答检索方法,其特征在于,所述步骤S2包括:
采用word2vec训练词向量算法对待检索语素集中的一个或多个语素进行词向量预处理。
4.如权利要求1所述的问答检索方法,其特征在于,所述步骤S4具体根据如下公式计算检索结果与待检索语素集的相关性:
Figure FDA0003372087800000021
Figure FDA0003372087800000022
Figure FDA0003372087800000023
其中,Score(qi,d)表示检索结果与待检索语素集的相关性,qi表示解析的语素,d表示单个检索文档,Wi表示语素qi的权重,R(qi,d)表示语素qi对文档d的相关性得分,N为检索集中文档总数,n(qi)为包含语素qi的文档数;b和k1为调节因子,fi为语素qi在检索文档d中出现的频率,dl为检索文档d的长度,avgdl为检索集中所有文档的平均长度。
5.如权利要求1所述的问答检索方法,其特征在于,所述根据检索结果与待检索语素集的相关性判断是否检索到对应文档包括:
若没有与语素对应相关的文档,则没有检索到该语素的对应文档;
若存在与语素对应相关的若干文档,则选取相关性最高的文档作为其检索结果。
6.一种问答检索***,其用于实现权利要求1-5中任一项所述的问答检索方法,其特征在于,所述***包括:
文本接收单元,被配置为接收待检索文本;
语素解析单元,被配置为对待检索文本进行语素解析得到待检索语素集,所述待检索语素集包括一个或多个语素;
检索单元,被配置为根据待检索语素集进行检索得到与待检索语素集对应的检索结果;
确定单元,被配置为根据检索结果及待检索语素集确定检索结果与待检索语素集的相关性;
判断及输出单元,被配置为根据检索结果与待检索语素集的相关性判断是否检索到对应文档,若是,则输出检索结果,若否,则进一步判断是否接收到文本修改信息,若未接收到文本修改信息,则输出待检索文本,若接收到文本修改信息,则根据文本修改信息更新待检索文本并根据更新后待检索文本进行检索。
7.一种计算机设备,其特征在于,包括存储器和处理器,所述存储器中存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行权利要求1至5中任一项所述问答检索方法的步骤。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时,以实现如权利要求1至5中任一项所述问答检索方法的步骤。
CN201910678236.3A 2019-07-25 2019-07-25 一种问答检索方法及其***、计算机设备、可读存储介质 Active CN110413735B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910678236.3A CN110413735B (zh) 2019-07-25 2019-07-25 一种问答检索方法及其***、计算机设备、可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910678236.3A CN110413735B (zh) 2019-07-25 2019-07-25 一种问答检索方法及其***、计算机设备、可读存储介质

Publications (2)

Publication Number Publication Date
CN110413735A CN110413735A (zh) 2019-11-05
CN110413735B true CN110413735B (zh) 2022-04-29

Family

ID=68363133

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910678236.3A Active CN110413735B (zh) 2019-07-25 2019-07-25 一种问答检索方法及其***、计算机设备、可读存储介质

Country Status (1)

Country Link
CN (1) CN110413735B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117708309A (zh) * 2024-02-18 2024-03-15 粤港澳大湾区数字经济研究院(福田) 检索问答方法、***、设备及介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03172966A (ja) * 1989-12-01 1991-07-26 Nippon Telegr & Teleph Corp <Ntt> 類似文書検索装置
CN101251854A (zh) * 2008-03-19 2008-08-27 深圳先进技术研究院 一种生成检索词条的方法及数据检索方法和***
CN101377777A (zh) * 2007-09-03 2009-03-04 北京百问百答网络技术有限公司 一种自动问答方法和***
JP2012084094A (ja) * 2010-10-14 2012-04-26 Jvc Kenwood Corp 番組検索装置および番組検索方法
CN104598445A (zh) * 2013-11-01 2015-05-06 腾讯科技(深圳)有限公司 自动问答***和方法
CN106372087A (zh) * 2015-07-23 2017-02-01 北京大学 一种面向信息检索的信息地图生成方法及其动态更新方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101075252A (zh) * 2007-06-21 2007-11-21 腾讯科技(深圳)有限公司 一种网络搜索方法及***
CN101599078B (zh) * 2009-07-10 2011-04-20 腾讯科技(深圳)有限公司 一种文本检索的方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03172966A (ja) * 1989-12-01 1991-07-26 Nippon Telegr & Teleph Corp <Ntt> 類似文書検索装置
CN101377777A (zh) * 2007-09-03 2009-03-04 北京百问百答网络技术有限公司 一种自动问答方法和***
CN101251854A (zh) * 2008-03-19 2008-08-27 深圳先进技术研究院 一种生成检索词条的方法及数据检索方法和***
JP2012084094A (ja) * 2010-10-14 2012-04-26 Jvc Kenwood Corp 番組検索装置および番組検索方法
CN104598445A (zh) * 2013-11-01 2015-05-06 腾讯科技(深圳)有限公司 自动问答***和方法
CN106372087A (zh) * 2015-07-23 2017-02-01 北京大学 一种面向信息检索的信息地图生成方法及其动态更新方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"基于Web信息获取的新闻数据分析研究";王晶;《中国优秀硕士学位论文全文数据库 信息科技辑》;20100715(第2010年07期);I139-204 *

Also Published As

Publication number Publication date
CN110413735A (zh) 2019-11-05

Similar Documents

Publication Publication Date Title
CN109086303B (zh) 基于机器阅读理解的智能对话方法、装置、终端
CN110929038B (zh) 基于知识图谱的实体链接方法、装置、设备和存储介质
CN101878476B (zh) 用于查询扩展的机器翻译
US8463593B2 (en) Natural language hypernym weighting for word sense disambiguation
US20130173610A1 (en) Extracting Search-Focused Key N-Grams and/or Phrases for Relevance Rankings in Searches
CN106649768A (zh) 基于深度问答的问答澄清方法和装置
CN111753167B (zh) 搜索处理方法、装置、计算机设备和介质
CN106874441A (zh) 智能问答方法和装置
CN110909539A (zh) 语料库的词语生成方法、***、计算机设备和存储介质
KR102090237B1 (ko) 시맨틱 트리플 기반의 지식 확장 시스템, 방법 및 컴퓨터 프로그램
CN103646112A (zh) 利用了网络搜索的依存句法的领域自适应方法
CN111881264B (zh) 一种开放领域问答任务中长文本检索的方法和电子设备
CN111611452A (zh) 搜索文本的歧义识别方法、***、设备及存储介质
CN113761890A (zh) 一种基于bert上下文感知的多层级语义信息检索方法
CN112905768A (zh) 一种数据交互方法、装置及存储介质
CN113821646A (zh) 基于语义检索的智能化专利相似度搜索方法及装置
CN114880447A (zh) 信息检索方法、装置、设备及存储介质
JP2000200281A (ja) 情報検索装置および情報検索方法ならびに情報検索プログラムを記録した記録媒体
CN108388556A (zh) 同类实体的挖掘方法及***
CN110020024B (zh) 一种科技文献中链接资源的分类方法、***、设备
CN110413735B (zh) 一种问答检索方法及其***、计算机设备、可读存储介质
CN113609847A (zh) 信息抽取方法、装置、电子设备及存储介质
CN111125299B (zh) 一种基于用户行为分析的动态词库更新方法
CN111737413A (zh) 基于概念网语义的反馈模型信息检索方法、***及介质
KR20210032253A (ko) 자연어 질의를 통한 문서 검색 및 응답 제공 시스템 및 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant