CN106649868A - 问答匹配方法及装置 - Google Patents

问答匹配方法及装置 Download PDF

Info

Publication number
CN106649868A
CN106649868A CN201611271173.2A CN201611271173A CN106649868A CN 106649868 A CN106649868 A CN 106649868A CN 201611271173 A CN201611271173 A CN 201611271173A CN 106649868 A CN106649868 A CN 106649868A
Authority
CN
China
Prior art keywords
question sentence
text
sentence text
matching
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201611271173.2A
Other languages
English (en)
Other versions
CN106649868B (zh
Inventor
周建设
袁家政
刘宏哲
刘琴
史金生
刘杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Capital Normal University
Original Assignee
Capital Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Capital Normal University filed Critical Capital Normal University
Priority to CN201611271173.2A priority Critical patent/CN106649868B/zh
Publication of CN106649868A publication Critical patent/CN106649868A/zh
Application granted granted Critical
Publication of CN106649868B publication Critical patent/CN106649868B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种问答匹配方法及装置,涉及智能问答技术领域,包括一种问答匹配方法,包括:提取输入问句文本中的关键词;根据关键词,采用索引过滤的方式从预先建立的问题库中确定目标匹配问句文本;基于莱温斯坦距离算法,从目标匹配问句文本中确定与输入问句文本的相似度最高的最佳匹配问句文本;根据最佳匹配问句文本,输出与输入问句文本对应的答案文本。本发明可以在较短的时间内输出与输入问句相应的答案,既可缩短问答匹配时长,又可提升准确率。

Description

问答匹配方法及装置
技术领域
本发明涉及智能问答技术领域,尤其是涉及一种问答匹配方法及装置。
背景技术
随着科技的发展,方便快捷的问答***也逐渐出现在人们的日常生活中,问答***可以根据用户的问题自动给出相应的答案,进而实现人机交互。
问答***的实质为一种在已有的“问题—答案”集合中找到与用户提问相匹配的问题文本,并将其对应的答案呈现给用户。该***的核心思想为将用户提出的问句与问题库中记录的问题进行相似度计算。现有的问答***中大多采用基于空间模型的TF-IDF问句相似度计算方法,然而,人机交互中用户所提问句大多较短,而该方法在问句较短时进行关键词提取的准确率不高,并且匹配时间长,在用户提出问题后,需要较长时间才可收到匹配答案,用户体验度不高。
针对上述现有技术中采用的问答匹配的方式准确率较低且用时较长的问题,目前尚未提出有效的解决方案。
发明内容
有鉴于此,本发明的目的在于提供一种问答匹配方法及装置,以缓解现有技术中的问答匹配的方式存在的准确率较低且用时较长的问题。
为了实现上述目的,本发明实施例采用的技术方案如下:
第一方面,本发明实施例提供了一种问答匹配方法,包括:提取输入问句文本中的关键词;根据该关键词,采用索引过滤的方式从预先建立的问题库中确定目标匹配问句文本;基于莱温斯坦距离算法,从目标匹配问句文本中确定与输入问句文本的相似度最高的最佳匹配问句文本;根据该最佳匹配问句文本,输出与输入问句文本对应的答案文本。
结合第一方面,本发明实施例提供了第一方面的第一种可能的实施方式,其中,上述提取输入问句文本中的关键词包括:对输入问句文本进行分词,生成词序列;去除词序列中的停用词,得到词条;利用改进后的信息熵公式,计算得到各个词条对应的权重;改进后的信息熵公式为:
其中,H(t)为词条t对应的权重;ftk为词条t出现在文本k中的频率,nt为词条t出现在所有的文本集合当中的频率,N为文本集合中文本的总数;将所有词条按照计算后得到的权重的大小进行排序,得到权重排序表;根据预先设置的提取比例,从权重排序表中提取关键词。
结合第一方面,本发明实施例提供了第一方面的第二种可能的实施方式,其中,上述根据关键词,采用索引过滤的方式从预先建立的问题库中确定目标匹配问句文本包括:根据输入问句文本中的关键词,以及预先建立的问题库中的预设关键词与预设问句文本之间的索引关系,得到预设问句文本与输入问句文本对应的匹配值;将匹配值大于预设匹配阈值的预设问句文本确定为目标匹配问句文本。
结合第一方面的第二种可能的实施方式,本发明实施例提供了第一方面的第三种可能的实施方式,其中,上述根据输入问句文本中的关键词,以及预先建立的问题库中的预设关键词与预设问句文本之间的索引关系,得到预设问句文本与输入问句文本对应的匹配值包括:将预先建立的问题库中与输入问句文本中的关键词相同的预设关键词作为匹配关键词;根据问题库中的预设关键词与预设问句文本之间的索引关系,遍历问题库中的预设问句文本,以确定预设问句文本中包含的匹配关键词的个数;将预设问句文本中包含的匹配关键词的个数作为预设问句文本与输入问句文本对应的匹配值。
结合第一方面的第二种或第三种可能的实施方式,本发明实施例提供了第一方面的第四种可能的实施方式,其中,上述问题库的建立包括:预先设置预设问句文本,以及与预设问句文本对应的标准答案文本,并将预设问句文本和标准答案文本存储于问题库中;为各个预设问句文本建立编号标识;提取各个预设问句文本对应的预设关键词;建立预设关键词与预设问句文本之间的索引关系;其中,在索引关系中,预设关键词与包含预设关键词的一个或多个预设问句文本的编号标识相对应。
结合第一方面,本发明实施例提供了第一方面的第五种可能的实施方式,其中,上述根据最佳匹配问句文本,输出与输入问句文本对应的答案文本包括:判断最佳匹配问句文本的相似度是否达到预设相似度阈值;如果是,从问题库中查找最佳匹配问句文本对应的标准答案文本,将标准答案文本作为输入问句文本对应的答案文本输出;如果否,从互联网查找输入问句文本对应的网络答案文本,将网络答案文本作为输入问句文本对应的答案文本输出。
第二方面,本发明实施例还提供一种问答匹配装置,包括:提取模块,用于提取输入问句文本中的关键词;第一确定模块,用于根据关键词,采用索引过滤的方式从预先建立的问题库中确定目标匹配问句文本;第二确定模块,用于基于莱温斯坦距离算法,从目标匹配问句文本中确定与输入问句文本的相似度最高的最佳匹配问句文本;答案输出模块,用于根据最佳匹配问句文本,输出与输入问句文本对应的答案文本。
结合第二方面,本发明实施例提供了第二方面的第一种可能的实施方式,其中,上述提取模块包括:分词单元,用于对输入问句文本进行分词,生成词序列;停用词去除单元,用于去除词序列中的停用词,得到词条;权重计算单元,用于利用改进后的信息熵公式,计算得到各个词条对应的权重;改进后的信息熵公式为:
其中,H(t)为词条t对应的权重;ftk为词条t出现在文本k中的频率,nt为词条t出现在所有的文本集合当中的频率,N为文本集合中文本的总数;排序单元,用于将所有词条按照计算后得到的权重的大小进行排序,得到权重排序表;关键词提取单元,用于根据预先设置的提取比例,从权重排序表中提取关键词。
结合第二方面,本发明实施例提供了第二方面的第二种可能的实施方式,其中,上述第一确定模块包括:匹配值获取单元,用于根据输入问句文本中的关键词,以及预先建立的问题库中的预设关键词与预设问句文本之间的索引关系,得到预设问句文本与输入问句文本对应的匹配值;第一确定单元,用于将匹配值大于预设匹配阈值的预设问句文本确定为目标匹配问句文本。
结合第二方面,本发明实施例提供了第二方面的第三种可能的实施方式,其中,上述答案输出模块包括:判断单元,用于判断最佳匹配问句文本的相似度是否达到预设相似度阈值;标准答案输出单元,用于在判断最佳匹配问句文本的相似度达到预设相似度阈值时,从问题库中查找最佳匹配问句文本对应的标准答案文本,将标准答案文本作为输入问句文本对应的答案文本输出;网络答案输出单元,用于在判断最佳匹配问句文本的相似度未达到预设相似度阈值时,从互联网查找输入问句文本对应的网络答案文本,将网络答案文本作为输入问句文本对应的答案文本输出。
本发明实施例提供了一种问答匹配方法及装置,在提取输入问句文本中的关键词后,通过索引过滤的方式从问题库中确定目标匹配问句文本,以缩小问题库中与输入问句文本相匹配的问句范围,再基于莱温斯坦距离算法确定与输入问句文本的相似度最高的最佳匹配问句文本,最后输出与输入问句文本对应的答案文本。与现有技术中采用的问答匹配的方式准确率较低且用时较长的问题相比,本发明实施例提供的方法及装置可以在较短的时间内输出与问句相应的答案,既可缩短问答匹配时长,又可提升准确率。
本发明的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本发明实施例所提供的一种问答匹配方法流程图;
图2示出了本发明实施例所提供的一种问答匹配方法的具体流程图;
图3示出了本发明实施例所提供的一种问题库的建立方法流程图;
图4示出了本发明实施例所提供的一种问答匹配装置的结构框图;
图5示出了本发明实施例所提供的一种问答匹配装置的具体结构框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
目前人机交互已逐渐融入人们的生活,能够针对用户的问题自主应答的设备或应用软件已屡见不鲜,基本均通过记录有“问题—答案”集合的问答***来实现问答匹配;然而现有技术中的问答匹配方式大多采用基于空间模型的TF-IDF问句相似度计算方法来获取用户,该方式的准确率较低且用时较长,基于此,本发明实施例提供的一种问答匹配方法及装置,可以提高问答匹配的准确率,同时缩短匹配时长。以下对本发明实施例进行详细介绍。
实施例一:
参见图1所示的一种问答匹配方法流程图,包括以下步骤:
步骤S102,提取输入问句文本中的关键词;该输入问句文本为用户通过人机交互方式输入的问句文本;当用户采用语音输入方式时,则需将用户的语音问题转换为文字文本,再将该文字文本作为输入问句文本;
步骤S104,根据关键词,采用索引过滤的方式从预先建立的问题库中确定目标匹配问句文本;该目标匹配问句文本包括多个文本,目的在于可以预先缩小问题库中与用户的输入问句文本相匹配的预设文本范围,有利于提升后续的问答匹配速度;
步骤S106,基于莱温斯坦距离算法,从目标匹配问句文本中确定与输入问句文本的相似度最高的最佳匹配问句文本;莱温斯坦距离算法为:通过***、删除、替换等编辑操作,计算从一个字符串转换到另一个字符串所需要的最小编辑次数,从而衡量两个字符串之间的相似度;基于该算法,可以快速准确的从预先筛选的目标匹配问句文本中查找到与输入问句文本的相似度最高的匹配问句,将该匹配问句作为最佳匹配问句文本;
步骤S108,根据最佳匹配问句文本,输出与输入问句文本对应的答案文本。
本实施例的上述方法中,在提取输入问句文本中的关键词后,通过索引过滤的方式从问题库中确定目标匹配问句文本,以缩小问题库中与输入问句文本相匹配的问句范围,再基于莱温斯坦距离算法确定与输入问句文本的相似度最高的最佳匹配问句文本,最后输出与输入问句文本对应的答案文本。该方法可以在较短的时间内输出与问句相应的答案,既可缩短问答匹配时长,又可提升准确率。
具体的,现有技术中大多采用的是基于空间模型的TF-IDF问句相似度计算方法,该方法主要适用于计算较长句子或文档的相似度,而针对短问句进行关键词提取的准确率并不高;但是人机交互中用户所提的问句通常较短,因此现有技术所采用的基于空间模型的TF-IDF问句相似度计算方法不能较好的达到用户的预期回答;此外,基于空间模型的TF-IDF问句相似度计算方法还需要建立空间向量模型,过程较为复杂且用时较长,因此最终从问题库(或问答***)中查找到与用户的输入问句相匹配的答案时间较长,结合语音识别与人机对答的特殊性,问答匹配速度也是关联用户体验度的重要因素,综上所述,现有技术致使用户体验度不高,而本发明实施例提供的上述方法获得输入问句文本的过程简单,匹配用时较短,且不受问句长短的限制,适用于短句,可以有效提高问答匹配的准确率,给用户带来良好的体验。
为了便于理解与实施,可参见图2所示的一种问答匹配方法的具体流程图,包括以下步骤:
步骤S202,对输入问句文本进行分词,生成词序列;即将输入问句文本切分为一个一个单独的词,可将切分后的输入问句文本称为词序列;
步骤S204,去除词序列中的停用词,得到词条;为节省存储空间和提高搜索效率,搜索引擎在索引页面或处理搜索请求时会自动忽略某些字或词,这些字或词即被称为停用词,例如语气助词等通常自身并无明确意义的词,可以根据预先建立的停用词表而去除词序列中的停用词。
步骤S206,利用改进后的信息熵公式,计算得到各个词条对应的权重;其中,改进后的信息熵公式为:
其中,H(t)为词条t对应的权重;ftk为词条t出现在文本k中的频率,nt为词条t出现在所有的文本集合当中的频率,N为文本集合中文本的总数;
通过上述改进后的信息熵公式来计算各个词条对应的权重,有助于后续基于各个词条对应的权重判别关键词,可以较好地提升提取关键词的准确率,而且采用信息熵公式的计算过程较为简便,得到结果的用时较短,有助于提高问答匹配速度。
步骤S208,将所有词条按照计算后得到的权重的大小进行排序,得到权重排序表;可以由大至小排序,也可以由小至大排序,根据实际情况灵活设定。
步骤S210,根据预先设置的提取比例,从权重排序表中提取关键词;例如,设置提取比例为百分之三十,则从权重排序表中提取权重最高的前百分之三十的关键词,如权重排序表为按照权重由大至小排名,共记录有100个关键词,则提取前30个关键词。这种方式可以有效缩小范围,有助于提升后续的问答匹配效率。
为了便于理解,本发明实施例提供了一种应用步骤S202至步骤S210的具体事例,例如,输入问句文本为“中国四大名著”,经过分词后得到“中国/四/大/名著”的词序列,然后去除停用词,并使用平均信息熵(即上述改进后的信息熵公式)计算各个词条的权重,最终得到关键词为{中国,名著}。
步骤S212,根据输入问句文本中的关键词,以及预先建立的问题库中的预设关键词与预设问句文本之间的索引关系,得到预设问句文本与输入问句文本对应的匹配值。
以下给出了一种具体的实现方式:
(1)将预先建立的问题库中与输入问句文本中的关键词相同的预设关键词作为匹配关键词;
(2)根据问题库中的预设关键词与预设问句文本之间的索引关系,遍历问题库中的预设问句文本,以确定预设问句文本中包含的匹配关键词的个数;将预设问句文本中包含的匹配关键词的个数作为预设问句文本与输入问句文本对应的匹配值。
此外,为了便于理解,本实施例还给出了应用上述实现方式的一种实例:假设输入问句文本有m个关键词,然后可用初始化为0,长度为N的一维数组来记录问题库中每个文本包含的指定关键词的个数k值,然后遍历输入问句中包含的m个关键词的索引链,每出现一个文本就把数组对应的位置加1,遍历完成后,就得到全部文本的k值,该k值即为匹配值。
步骤S214,将匹配值大于预设匹配阈值的预设问句文本确定为目标匹配问句文本;
通过上述匹配值来衡量预设问句文本与输入问句文本之间的相似度,结果更加准确可靠,而且根据匹配值预先筛选问题库中的预设问句文本,可以有效的缩小问题库中能够与输入问句匹配的问句范围,有助于提升后续确定匹配文本的效率,缩短匹配时间。
步骤S216,基于莱温斯坦距离算法,从目标匹配问句文本中确定与输入问句文本的相似度最高的最佳匹配问句文本;基于该算法,可以快速准确的从预先筛选的目标匹配问句文本中查找到与输入问句文本的相似度最高的匹配问句(即包含的相同关键词最多),将该匹配问句作为最佳匹配问句文本。
步骤S218,判断最佳匹配问句文本的相似度是否达到预设相似度阈值;如果是,执行步骤S220;如果否,执行步骤S222;在从问题库中确定最佳匹配问句文本后,本步骤可以在最后检验该最佳文本是否适合作为匹配结果,而不会像现有技术那样在最终查找到最适合的匹配结果后盲目输出答案,造成答非所问,致使用户体验度不高。
步骤S220,从问题库中查找最佳匹配问句文本对应的标准答案文本,将标准答案文本作为输入问句文本对应的答案文本输出;其中,问题库中预先存储有各个预设问句文本以及对应的标准答案文本。
步骤S222,从互联网查找输入问句文本对应的网络答案文本,将网络答案文本作为输入问句文本对应的答案文本输出。可以通过索索引擎等方式直接将用户的输入问句输入至互联网中以查找网络答案文本,在问题库中没有查找到与用户问句相匹配的文本时,通过网络答案文本来满足用户需求,提升用户体验度。
其中,图2中的步骤S202至步骤S210对应的是图1中的步骤S102;图2中的步骤S212和步骤S214对应的是图1中的步骤S104;图2中的步骤S216与图1中的步骤S106相对应;图2中的步骤S218至步骤S222对应的是图1中的步骤S108。
通过执行图2中的上述步骤,能够快速准确的获得与用户的输入问句文本相对应的答案文本,进而提升用户体验度。
进一步,在本实施例中还给出了一种问题库的建立过程,具体的,参见图3所示的一种问题库的建立方法流程图,问题库的建立可以参照下述步骤:
步骤S302,预先设置预设问句文本,以及与预设问句文本对应的标准答案文本,并将预设问句文本和标准答案文本存储于问题库中;
步骤S304,为各个预设问句文本建立编号标识;
步骤S306,提取各个预设问句文本对应的预设关键词;其中,提取预设关键词的具体实现方式可以参照图2中的步骤S202至步骤S210。
步骤S308,建立预设关键词与预设问句文本之间的索引关系;其中,在索引关系中,预设关键词与包含预设关键词的一个或多个预设问句文本的编号标识相对应。
本发明实施例所提供的问题库,不仅仅为现有技术的问答***“问题-答案”的合集,而且还对“问题-答案”的合集进行了深层次处理,例如对各个问句预先提取关键词,并将关键词与包含该关键词的问句建立了索引,而且通过编号的方式有助于缩小存储空间,同时提高查找速度,进一步缩短了问答匹配过程中应用该问题库查找文本的用时。
综上所述,本发明实施例提供的上述问答匹配方法,可以在较短的时间内输出与用户的输入问句相应的答案,可以达到1s内输出答案,较好地缩短了问答匹配时长,而且还提升了准确率,综合提升了用户体验度。
实施例二:
对于实施例一中所提供的问答匹配方法,本发明实施例提供了一种问答匹配装置,参见图4所示,该装置包括以下模块:
提取模块402,用于提取输入问句文本中的关键词;
第一确定模块404,用于根据关键词,采用索引过滤的方式从预先建立的问题库中确定目标匹配问句文本;
第二确定模块406,用于基于莱温斯坦距离算法,从目标匹配问句文本中确定与输入问句文本的相似度最高的最佳匹配问句文本;
答案输出模块408,用于根据最佳匹配问句文本,输出与输入问句文本对应的答案文本。
本实施例的上述装置中,通过提取模块402提取输入问句文本的关键词后,通过第一确定模块404采用索引过滤的方式从问题库中确定目标匹配问句文本,以缩小问题库中与输入问句文本相匹配的问句范围,再通过第二确定模块406基于莱温斯坦距离算法确定与输入问句文本的相似度最高的最佳匹配问句文本,最后由答案输出模块408输出与输入问句文本对应的答案文本。该装置可以在较短的时间内输出与问句相应的答案,既可缩短问答匹配时长,又可提升准确率。
为了便于理解与实施,在图4的基础上,可参见图5所示的一种问答匹配装置的具体结构框图,其中:
提取模块402包括:分词单元4021,用于对输入问句文本进行分词,生成词序列;停用词去除单元4022,用于去除词序列中的停用词,得到词条;权重计算单元4023,用于利用改进后的信息熵公式,计算得到各个词条对应的权重;改进后的信息熵公式为:
其中,H(t)为词条t对应的权重;ftk为词条t出现在文本k中的频率,nt为词条t出现在所有的文本集合当中的频率,N为文本集合中文本的总数;
还包括排序单元4024,用于将所有词条按照计算后得到的权重的大小进行排序,得到权重排序表;关键词提取单元4025,用于根据预先设置的提取比例,从权重排序表中提取关键词。
第一确定模块404包括:匹配值获取单元4041,用于根据输入问句文本中的关键词,以及预先建立的问题库中的预设关键词与预设问句文本之间的索引关系,得到预设问句文本与输入问句文本对应的匹配值;具体的,匹配值获取单元4041可以包括匹配关键词确定子单元,用于将预先建立的问题库中与所述输入问句文本中的关键词相同的预设关键词作为匹配关键词;以及匹配值确定子单元,用于根据所述问题库中的预设关键词与预设问句文本之间的索引关系,遍历所述问题库中的预设问句文本,以确定所述预设问句文本中包含的所述匹配关键词的个数;将所述预设问句文本中包含的所述匹配关键词的个数作为所述预设问句文本与所述输入问句文本对应的匹配值。以上子单元均未在图5中示出。
第一确定模块404还包括第一确定单元4042,用于将匹配值大于预设匹配阈值的预设问句文本确定为目标匹配问句文本。
答案输出模块408包括:判断单元4081,用于判断最佳匹配问句文本的相似度是否达到预设相似度阈值;标准答案输出单元4082,用于在判断最佳匹配问句文本的相似度达到预设相似度阈值时,从问题库中查找最佳匹配问句文本对应的标准答案文本,将标准答案文本作为输入问句文本对应的答案文本输出;网络答案输出单元4083,用于在判断最佳匹配问句文本的相似度未达到预设相似度阈值时,从互联网查找输入问句文本对应的网络答案文本,将网络答案文本作为输入问句文本对应的答案文本输出。
本实施例所提供的装置,其实现原理及产生的技术效果和前述实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。
综上所述,本发明实施例提供的问答匹配方法及装置,在提取输入问句文本中的关键词后,通过索引过滤的方式从问题库中确定目标匹配问句文本,以缩小问题库中与输入问句文本相匹配的问句范围,再基于莱温斯坦距离算法确定与输入问句文本的相似度最高的最佳匹配问句文本,最后输出与输入问句文本对应的答案文本。与现有技术中采用的问答匹配的方式准确率较低且用时较长的问题相比,本发明实施例提供的方法及装置可以在较短的时间内输出与问句相应的答案,既可缩短问答匹配时长,又可提升准确率。
本发明实施例所提供的问答匹配方法及装置的计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。
另外,在本发明实施例的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (10)

1.一种问答匹配方法,其特征在于,包括:
提取输入问句文本中的关键词;
根据所述关键词,采用索引过滤的方式从预先建立的问题库中确定目标匹配问句文本;
基于莱温斯坦距离算法,从所述目标匹配问句文本中确定与所述输入问句文本的相似度最高的最佳匹配问句文本;
根据所述最佳匹配问句文本,输出与所述输入问句文本对应的答案文本。
2.根据权利要求1所述的方法,其特征在于,提取输入问句文本中的关键词包括:
对输入问句文本进行分词,生成词序列;
去除所述词序列中的停用词,得到词条;
利用改进后的信息熵公式,计算得到各个词条对应的权重;所述改进后的信息熵公式为:
H ( t ) = 1 + 1 log N [ f t k n t l o g ( f t k n t ) ]
其中,H(t)为词条t对应的权重;ftk为词条t出现在文本k中的频率,nt为词条t出现在所有的文本集合当中的频率,N为文本集合中文本的总数;
将所有词条按照计算后得到的所述权重的大小进行排序,得到权重排序表;
根据预先设置的提取比例,从所述权重排序表中提取关键词。
3.根据权利要求1所述的方法,其特征在于,根据所述关键词,采用索引过滤的方式从预先建立的问题库中确定目标匹配问句文本包括:
根据所述输入问句文本中的关键词,以及预先建立的问题库中的预设关键词与预设问句文本之间的索引关系,得到所述预设问句文本与所述输入问句文本对应的匹配值;
将所述匹配值大于预设匹配阈值的所述预设问句文本确定为目标匹配问句文本。
4.根据权利要求3所述的方法,其特征在于,根据所述输入问句文本中的关键词,以及预先建立的问题库中的预设关键词与预设问句文本之间的索引关系,得到所述预设问句文本与所述输入问句文本对应的匹配值包括:
将预先建立的问题库中与所述输入问句文本中的关键词相同的预设关键词作为匹配关键词;
根据所述问题库中的预设关键词与预设问句文本之间的索引关系,遍历所述问题库中的预设问句文本,以确定所述预设问句文本中包含的所述匹配关键词的个数;将所述预设问句文本中包含的所述匹配关键词的个数作为所述预设问句文本与所述输入问句文本对应的匹配值。
5.根据权利要求3或4所述的方法,其特征在于,所述问题库的建立包括:
预先设置预设问句文本,以及与所述预设问句文本对应的标准答案文本,并将所述预设问句文本和所述标准答案文本存储于所述问题库中;
为各个所述预设问句文本建立编号标识;
提取各个所述预设问句文本对应的预设关键词;
建立所述预设关键词与所述预设问句文本之间的索引关系;其中,在所述索引关系中,所述预设关键词与包含所述预设关键词的一个或多个预设问句文本的编号标识相对应。
6.根据权利要求1所述的方法,其特征在于,根据最佳匹配问句文本,输出与所述输入问句文本对应的答案文本包括:
判断所述最佳匹配问句文本的相似度是否达到预设相似度阈值;
如果是,从所述问题库中查找所述最佳匹配问句文本对应的标准答案文本,将所述标准答案文本作为所述输入问句文本对应的答案文本输出;
如果否,从互联网查找所述输入问句文本对应的网络答案文本,将所述网络答案文本作为所述输入问句文本对应的答案文本输出。
7.一种问答匹配装置,其特征在于,包括:
提取模块,用于提取输入问句文本中的关键词;
第一确定模块,用于根据所述关键词,采用索引过滤的方式从预先建立的问题库中确定目标匹配问句文本;
第二确定模块,用于基于莱温斯坦距离算法,从所述目标匹配问句文本中确定与所述输入问句文本的相似度最高的最佳匹配问句文本;
答案输出模块,用于根据所述最佳匹配问句文本,输出与所述输入问句文本对应的答案文本。
8.根据权利要求7所述的装置,其特征在于,所述提取模块包括:
分词单元,用于对输入问句文本进行分词,生成词序列;
停用词去除单元,用于去除所述词序列中的停用词,得到词条;
权重计算单元,用于利用改进后的信息熵公式,计算得到各个词条对应的权重;所述改进后的信息熵公式为:
H ( t ) = 1 + 1 log N [ f t k n t l o g ( f t k n t ) ]
其中,H(t)为词条t对应的权重;ftk为词条t出现在文本k中的频率,nt为词条t出现在所有的文本集合当中的频率,N为文本集合中文本的总数;
排序单元,用于将所有词条按照计算后得到的所述权重的大小进行排序,得到权重排序表;
关键词提取单元,用于根据预先设置的提取比例,从所述权重排序表中提取关键词。
9.根据权利要求7所述的装置,其特征在于,所述第一确定模块包括:
匹配值获取单元,用于根据所述输入问句文本中的关键词,以及预先建立的问题库中的预设关键词与预设问句文本之间的索引关系,得到所述预设问句文本与所述输入问句文本对应的匹配值;
第一确定单元,用于将所述匹配值大于预设匹配阈值的所述预设问句文本确定为目标匹配问句文本。
10.根据权利要求7所述的装置,其特征在于,所述答案输出模块包括:
判断单元,用于判断所述最佳匹配问句文本的相似度是否达到预设相似度阈值;
标准答案输出单元,用于在判断所述最佳匹配问句文本的相似度达到预设相似度阈值时,从所述问题库中查找所述最佳匹配问句文本对应的标准答案文本,将所述标准答案文本作为所述输入问句文本对应的答案文本输出;
网络答案输出单元,用于在判断所述最佳匹配问句文本的相似度未达到预设相似度阈值时,从互联网查找所述输入问句文本对应的网络答案文本,将所述网络答案文本作为所述输入问句文本对应的答案文本输出。
CN201611271173.2A 2016-12-30 2016-12-30 问答匹配方法及装置 Active CN106649868B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611271173.2A CN106649868B (zh) 2016-12-30 2016-12-30 问答匹配方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611271173.2A CN106649868B (zh) 2016-12-30 2016-12-30 问答匹配方法及装置

Publications (2)

Publication Number Publication Date
CN106649868A true CN106649868A (zh) 2017-05-10
CN106649868B CN106649868B (zh) 2019-03-26

Family

ID=58839104

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611271173.2A Active CN106649868B (zh) 2016-12-30 2016-12-30 问答匹配方法及装置

Country Status (1)

Country Link
CN (1) CN106649868B (zh)

Cited By (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107273350A (zh) * 2017-05-16 2017-10-20 广东电网有限责任公司江门供电局 一种实现智能问答的信息处理方法及其装置
CN107590192A (zh) * 2017-08-11 2018-01-16 深圳市腾讯计算机***有限公司 文本问题的数学化处理方法、装置、设备和存储介质
CN107862058A (zh) * 2017-11-10 2018-03-30 北京百度网讯科技有限公司 用于生成信息的方法和装置
CN108345644A (zh) * 2018-01-15 2018-07-31 阿里巴巴集团控股有限公司 一种数据处理的方法及装置
CN108415980A (zh) * 2018-02-09 2018-08-17 平安科技(深圳)有限公司 问答数据处理方法、电子装置及存储介质
CN108509482A (zh) * 2018-01-23 2018-09-07 深圳市阿西莫夫科技有限公司 问题分类方法、装置、计算机设备和存储介质
CN108595629A (zh) * 2018-04-24 2018-09-28 北京慧闻科技发展有限公司 用于答案选择***的数据处理方法及应用
CN108595619A (zh) * 2018-04-23 2018-09-28 海信集团有限公司 一种问答方法及设备
CN108763529A (zh) * 2018-05-31 2018-11-06 苏州大学 一种智能检索方法、装置和计算机可读存储介质
CN108897771A (zh) * 2018-05-30 2018-11-27 东软集团股份有限公司 自动问答方法、装置、计算机可读存储介质及电子设备
CN109190115A (zh) * 2018-08-14 2019-01-11 重庆邂智科技有限公司 一种文本匹配方法、装置、服务器及存储介质
CN109582966A (zh) * 2018-12-03 2019-04-05 北京容联易通信息技术有限公司 一种信息匹配方法及装置
CN109597994A (zh) * 2018-12-04 2019-04-09 挖财网络技术有限公司 短文本问题语义匹配方法和***
CN109684442A (zh) * 2018-12-21 2019-04-26 东软集团股份有限公司 一种文本检索方法、装置、设备及程序产品
CN109783516A (zh) * 2019-02-19 2019-05-21 北京奇艺世纪科技有限公司 一种查询语句检索回复方法及装置
CN109800416A (zh) * 2018-12-14 2019-05-24 天津大学 一种电力设备名称识别方法
CN110110049A (zh) * 2017-12-29 2019-08-09 深圳市优必选科技有限公司 服务咨询方法、装置、***、服务机器人及存储介质
WO2019223362A1 (zh) * 2018-05-23 2019-11-28 北京国双科技有限公司 自动问答方法及装置
CN110555093A (zh) * 2018-03-30 2019-12-10 华为技术有限公司 文本匹配方法、装置及设备
CN110727764A (zh) * 2019-10-10 2020-01-24 珠海格力电器股份有限公司 一种话术生成方法、装置及话术生成设备
CN110737751A (zh) * 2019-09-06 2020-01-31 平安科技(深圳)有限公司 基于相似度值的搜索方法、装置、计算机设备和存储介质
CN111241378A (zh) * 2020-01-07 2020-06-05 郇延强 教学信息查询方法及装置
WO2020133360A1 (zh) * 2018-12-29 2020-07-02 深圳市优必选科技有限公司 问句文本的匹配方法、装置、计算机设备和存储介质
CN111611356A (zh) * 2019-02-25 2020-09-01 北京嘀嘀无限科技发展有限公司 信息查找方法、装置、电子设备及可读存储介质
CN111782776A (zh) * 2019-09-26 2020-10-16 北京沃东天骏信息技术有限公司 一种通过填槽实现意图识别的方法和装置
CN111858863A (zh) * 2019-04-29 2020-10-30 深圳市优必选科技有限公司 一种答复推荐方法、答复推荐装置及电子设备
CN111984763A (zh) * 2020-08-28 2020-11-24 海信电子科技(武汉)有限公司 一种答问处理方法及智能设备
CN112905760A (zh) * 2021-02-02 2021-06-04 天津弈博益商信息科技有限公司 一种即时通讯智能问答、质检及防作弊***
CN113807148A (zh) * 2020-06-16 2021-12-17 阿里巴巴集团控股有限公司 文本识别匹配方法和装置、终端设备
WO2022016995A1 (zh) * 2020-07-23 2022-01-27 平安科技(深圳)有限公司 问答库构建方法、装置、电子设备及存储介质
CN114936272A (zh) * 2021-04-27 2022-08-23 华为技术有限公司 一种问答方法及***
CN116244418A (zh) * 2023-05-11 2023-06-09 腾讯科技(深圳)有限公司 问题解答方法、装置、电子设备及计算机可读存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101630312A (zh) * 2009-08-19 2010-01-20 腾讯科技(深圳)有限公司 一种用于问答平台中问句的聚类方法及***
CN102193929A (zh) * 2010-03-08 2011-09-21 阿里巴巴集团控股有限公司 确定词信息熵及利用词信息熵的搜索方法及其设备
US20140164303A1 (en) * 2012-12-11 2014-06-12 International Business Machines Corporation Method of answering questions and scoring answers using structured knowledge mined from a corpus of data
WO2014125947A1 (ja) * 2013-02-12 2014-08-21 ソニー株式会社 情報処理装置および情報処理方法、並びに情報処理システム
CN105955976A (zh) * 2016-04-15 2016-09-21 中国工商银行股份有限公司 一种自动应答***及方法
CN105975460A (zh) * 2016-05-30 2016-09-28 上海智臻智能网络科技股份有限公司 问句信息处理方法及装置
CN105989040A (zh) * 2015-02-03 2016-10-05 阿里巴巴集团控股有限公司 智能问答的方法、装置及***

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101630312A (zh) * 2009-08-19 2010-01-20 腾讯科技(深圳)有限公司 一种用于问答平台中问句的聚类方法及***
CN102193929A (zh) * 2010-03-08 2011-09-21 阿里巴巴集团控股有限公司 确定词信息熵及利用词信息熵的搜索方法及其设备
US20140164303A1 (en) * 2012-12-11 2014-06-12 International Business Machines Corporation Method of answering questions and scoring answers using structured knowledge mined from a corpus of data
WO2014125947A1 (ja) * 2013-02-12 2014-08-21 ソニー株式会社 情報処理装置および情報処理方法、並びに情報処理システム
CN105989040A (zh) * 2015-02-03 2016-10-05 阿里巴巴集团控股有限公司 智能问答的方法、装置及***
CN105955976A (zh) * 2016-04-15 2016-09-21 中国工商银行股份有限公司 一种自动应答***及方法
CN105975460A (zh) * 2016-05-30 2016-09-28 上海智臻智能网络科技股份有限公司 问句信息处理方法及装置

Cited By (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107273350A (zh) * 2017-05-16 2017-10-20 广东电网有限责任公司江门供电局 一种实现智能问答的信息处理方法及其装置
CN107590192A (zh) * 2017-08-11 2018-01-16 深圳市腾讯计算机***有限公司 文本问题的数学化处理方法、装置、设备和存储介质
CN107590192B (zh) * 2017-08-11 2023-05-05 深圳市腾讯计算机***有限公司 文本问题的数学化处理方法、装置、设备和存储介质
CN107862058A (zh) * 2017-11-10 2018-03-30 北京百度网讯科技有限公司 用于生成信息的方法和装置
CN107862058B (zh) * 2017-11-10 2021-10-22 北京百度网讯科技有限公司 用于生成信息的方法和装置
CN110110049A (zh) * 2017-12-29 2019-08-09 深圳市优必选科技有限公司 服务咨询方法、装置、***、服务机器人及存储介质
CN108345644A (zh) * 2018-01-15 2018-07-31 阿里巴巴集团控股有限公司 一种数据处理的方法及装置
CN108509482A (zh) * 2018-01-23 2018-09-07 深圳市阿西莫夫科技有限公司 问题分类方法、装置、计算机设备和存储介质
CN108509482B (zh) * 2018-01-23 2020-12-08 深圳市阿西莫夫科技有限公司 问题分类方法、装置、计算机设备和存储介质
CN108415980A (zh) * 2018-02-09 2018-08-17 平安科技(深圳)有限公司 问答数据处理方法、电子装置及存储介质
CN110555093B (zh) * 2018-03-30 2024-02-13 华为技术有限公司 文本匹配方法、装置及设备
CN110555093A (zh) * 2018-03-30 2019-12-10 华为技术有限公司 文本匹配方法、装置及设备
CN108595619A (zh) * 2018-04-23 2018-09-28 海信集团有限公司 一种问答方法及设备
CN108595629B (zh) * 2018-04-24 2021-08-06 北京慧闻科技发展有限公司 用于答案选择***的数据处理方法及应用
CN108595629A (zh) * 2018-04-24 2018-09-28 北京慧闻科技发展有限公司 用于答案选择***的数据处理方法及应用
WO2019223362A1 (zh) * 2018-05-23 2019-11-28 北京国双科技有限公司 自动问答方法及装置
CN110597966A (zh) * 2018-05-23 2019-12-20 北京国双科技有限公司 自动问答方法及装置
CN108897771A (zh) * 2018-05-30 2018-11-27 东软集团股份有限公司 自动问答方法、装置、计算机可读存储介质及电子设备
CN108763529A (zh) * 2018-05-31 2018-11-06 苏州大学 一种智能检索方法、装置和计算机可读存储介质
CN109190115A (zh) * 2018-08-14 2019-01-11 重庆邂智科技有限公司 一种文本匹配方法、装置、服务器及存储介质
CN109190115B (zh) * 2018-08-14 2023-05-26 重庆邂智科技有限公司 一种文本匹配方法、装置、服务器及存储介质
CN109582966A (zh) * 2018-12-03 2019-04-05 北京容联易通信息技术有限公司 一种信息匹配方法及装置
CN109597994B (zh) * 2018-12-04 2023-06-06 挖财网络技术有限公司 短文本问题语义匹配方法和***
CN109597994A (zh) * 2018-12-04 2019-04-09 挖财网络技术有限公司 短文本问题语义匹配方法和***
CN109800416A (zh) * 2018-12-14 2019-05-24 天津大学 一种电力设备名称识别方法
CN109684442A (zh) * 2018-12-21 2019-04-26 东软集团股份有限公司 一种文本检索方法、装置、设备及程序产品
WO2020133360A1 (zh) * 2018-12-29 2020-07-02 深圳市优必选科技有限公司 问句文本的匹配方法、装置、计算机设备和存储介质
CN109783516A (zh) * 2019-02-19 2019-05-21 北京奇艺世纪科技有限公司 一种查询语句检索回复方法及装置
CN111611356A (zh) * 2019-02-25 2020-09-01 北京嘀嘀无限科技发展有限公司 信息查找方法、装置、电子设备及可读存储介质
CN111611356B (zh) * 2019-02-25 2023-06-16 北京嘀嘀无限科技发展有限公司 信息查找方法、装置、电子设备及可读存储介质
CN111858863A (zh) * 2019-04-29 2020-10-30 深圳市优必选科技有限公司 一种答复推荐方法、答复推荐装置及电子设备
CN111858863B (zh) * 2019-04-29 2023-07-14 深圳市优必选科技有限公司 一种答复推荐方法、答复推荐装置及电子设备
CN110737751B (zh) * 2019-09-06 2023-10-20 平安科技(深圳)有限公司 基于相似度值的搜索方法、装置、计算机设备和存储介质
CN110737751A (zh) * 2019-09-06 2020-01-31 平安科技(深圳)有限公司 基于相似度值的搜索方法、装置、计算机设备和存储介质
CN111782776A (zh) * 2019-09-26 2020-10-16 北京沃东天骏信息技术有限公司 一种通过填槽实现意图识别的方法和装置
CN110727764A (zh) * 2019-10-10 2020-01-24 珠海格力电器股份有限公司 一种话术生成方法、装置及话术生成设备
CN111241378A (zh) * 2020-01-07 2020-06-05 郇延强 教学信息查询方法及装置
CN113807148A (zh) * 2020-06-16 2021-12-17 阿里巴巴集团控股有限公司 文本识别匹配方法和装置、终端设备
WO2022016995A1 (zh) * 2020-07-23 2022-01-27 平安科技(深圳)有限公司 问答库构建方法、装置、电子设备及存储介质
CN111984763B (zh) * 2020-08-28 2023-09-19 海信电子科技(武汉)有限公司 一种答问处理方法及智能设备
CN111984763A (zh) * 2020-08-28 2020-11-24 海信电子科技(武汉)有限公司 一种答问处理方法及智能设备
CN112905760A (zh) * 2021-02-02 2021-06-04 天津弈博益商信息科技有限公司 一种即时通讯智能问答、质检及防作弊***
CN114936272A (zh) * 2021-04-27 2022-08-23 华为技术有限公司 一种问答方法及***
CN116244418A (zh) * 2023-05-11 2023-06-09 腾讯科技(深圳)有限公司 问题解答方法、装置、电子设备及计算机可读存储介质
CN116244418B (zh) * 2023-05-11 2023-09-01 腾讯科技(深圳)有限公司 问题解答方法、装置、电子设备及计算机可读存储介质

Also Published As

Publication number Publication date
CN106649868B (zh) 2019-03-26

Similar Documents

Publication Publication Date Title
CN106649868A (zh) 问答匹配方法及装置
CN106844658B (zh) 一种中文文本知识图谱自动构建方法及***
US20180181573A1 (en) Search method and device for asking type query based on deep question and answer
CN103218436B (zh) 一种融合用户类别标签的相似问题检索方法及装置
CN110427463A (zh) 搜索语句响应方法、装置及服务器和存储介质
CN109947952B (zh) 基于英语知识图谱的检索方法、装置、设备及存储介质
KR20160026892A (ko) 논팩토이드형 질의 응답 시스템 및 방법
WO2024131111A1 (zh) 一种智能写作方法、装置、设备及非易失性可读存储介质
JP2017511922A (ja) スマート質問回答の実現方法、システム、および記憶媒体
CN103544255A (zh) 基于文本语义相关的网络舆情信息分析方法
CN103136352A (zh) 基于双层语义分析的全文检索***
CN104636466A (zh) 一种面向开放网页的实体属性抽取方法和***
CN108984661A (zh) 一种知识图谱中实体对齐方法和装置
CN116805001A (zh) 适用于垂直领域的智能问答***、方法及其应用
CN105389344A (zh) 一种自助式查新方法及***
CN105608232A (zh) 一种基于图形数据库的bug知识建模方法
CN101968801A (zh) 一种单篇文本关键词的提取方法
JP3918374B2 (ja) 文書検索装置および方法
CN109213998A (zh) 中文错字检测方法及***
CN112883182A (zh) 一种基于机器阅读的问答匹配方法及装置
CN111159361A (zh) 获取文章的方法和装置及电子设备
CN114756663A (zh) 一种智能问答方法、***、设备及计算机可读存储介质
CN114817556A (zh) 一种变电站工程选址知识图谱构建方法
CN114202443A (zh) 政策分类方法、装置、设备及存储介质
CN104572720A (zh) 一种网页信息排重的方法、装置及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant