CN109947903B - 一种成语查询方法及装置 - Google Patents

一种成语查询方法及装置 Download PDF

Info

Publication number
CN109947903B
CN109947903B CN201910199456.8A CN201910199456A CN109947903B CN 109947903 B CN109947903 B CN 109947903B CN 201910199456 A CN201910199456 A CN 201910199456A CN 109947903 B CN109947903 B CN 109947903B
Authority
CN
China
Prior art keywords
idiom
information
query
labels
acquired
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910199456.8A
Other languages
English (en)
Other versions
CN109947903A (zh
Inventor
李长亮
汪美玲
刘晓楠
唐剑波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Kingsoft Interactive Entertainment Technology Co ltd
Beijing Kingsoft Digital Entertainment Co Ltd
Original Assignee
Chengdu Kingsoft Interactive Entertainment Technology Co ltd
Beijing Kingsoft Digital Entertainment Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Kingsoft Interactive Entertainment Technology Co ltd, Beijing Kingsoft Digital Entertainment Co Ltd filed Critical Chengdu Kingsoft Interactive Entertainment Technology Co ltd
Priority to CN201910199456.8A priority Critical patent/CN109947903B/zh
Publication of CN109947903A publication Critical patent/CN109947903A/zh
Application granted granted Critical
Publication of CN109947903B publication Critical patent/CN109947903B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供了一种成语查询方法,该方法包括:获取查询信息;判断预先获取的成语知识图谱中是否存在与所述查询信息相匹配的成语标签,其中,所述预先获取的成语知识图谱为基于多个成语及多个成语标签之间的关联关系生成的;若存在,则将相匹配的成语标签作为目标标签,根据目标标签及预先获取的成语知识图谱,确定所述目标标签对应的成语,生成查询结果。这样,可以根据成语知识图谱中各个成语的成语标签,确定与查询信息相匹配的成语,即使某一成语的描述信息中不包含查询信息,也可以根据该成语的成语标签被查询到,使得成语查询的结果更全面,从而可以提升用户的使用体验。

Description

一种成语查询方法及装置
技术领域
本发明涉及数据查询技术领域,特别是涉及一种成语查询方法及装置。
背景技术
一些场景中,用户需要从大量的成语中查询具有特定含义的成语,从而便于对成语的引用和学习。
相关技术中,对具有特定含义的成语进行查询的方式,通常为:首先,获取用户输入的查询信息,然后,根据查询信息,对各个成语的描述信息进行查询,如果某一成语的描述信息中包含查询信息,则将该成语作为查询结果。
但是,上述成语查询方式是基于成语的描述信息,如果某一成语的描述信息中不包含查询信息,那么,即使该成语是与查询信息相关的,也无法被查询到,比如,“古稀之年”的描述信息为“人能活到七十岁,自古以来很稀少”,“耄耋之年”的描述信息为“年纪十分大的时候”,如果用户输入的查询信息为“年龄”,那么,由于在“古稀之年”和“耄耋之年”的描述信息中均不包含“年龄”,就会导致这两个成语无法被查询到。
因此,上述成语查询方式不够完善,导致成语查询的结果不够全面,从而影响用户的使用体验。
发明内容
本发明实施例的目的在于提供一种成语查询方法及装置,以使得成语查询的结果更全面,提升用户的使用体验。具体技术方案如下:
本发明实施例提供了一种成语查询方法,所述方法包括:
获取查询信息;
判断预先获取的成语知识图谱中是否存在与所述查询信息相匹配的成语标签,其中,所述预先获取的成语知识图谱为基于多个成语及多个成语标签之间的关联关系生成的;
若存在,则将相匹配的成语标签作为目标标签,根据所述目标标签及所述预先获取的成语知识图谱,确定所述目标标签对应的成语,生成查询结果。
可选的,所述判断预先获取的成语知识图谱中是否存在与所述查询信息相匹配的成语标签,包括:
提取所述查询信息中的词语信息;
获取所述预先获取的成语知识图谱中的所有成语标签,判断是否存在与所述词语信息相匹配的成语标签。
可选的,所述获取所述预先获取的成语知识图谱中的所有成语标签,判断是否存在与所述词语信息相匹配的成语标签,包括:
根据所述预先获取的成语知识图谱中的所有成语标签,构建包含所有成语标签的字典树;
利用多模式匹配算法,从所述词语信息中抽取与所述字典树相匹配的成语标签,生成标签列表;
判断所述标签列表是否为空,若否,则判定存在与所述词语信息相匹配的成语标签,若是,则判定不存在与所述词语信息相匹配的成语标签。
可选的,所述预先获取的成语知识图谱中还包括每个成语的属性信息;在所述预先获取的成语知识图谱中不存在与所述查询信息相匹配的成语标签的情况下,所述方法还包括:
计算所述预先获取的成语知识图谱中每个成语的属性信息与所述查询信息的相似度;
确定所述相似度满足预设条件的成语,生成查询结果。
可选的,所述属性信息包括以下一项或多项:每个成语的读音、释义及出处。
本发明实施例还提供了一种成语查询装置,所述装置包括:
获取模块,用于获取查询信息;
判断模块,用于判断预先获取的成语知识图谱中是否存在与所述查询信息相匹配的成语标签,其中,所述预先获取的成语知识图谱为基于多个成语及多个成语标签之间的关联关系生成的;若存在,则触发第一生成模块;
所述第一生成模块,用于将相匹配的成语标签作为目标标签,根据所述目标标签及所述预先获取的成语知识图谱,确定所述目标标签对应的成语,生成查询结果。
可选的,所述判断模块,具体用于:
提取所述查询信息中的词语信息;
根据所述预先获取的成语知识图谱中的所有成语标签,判断是否存在与所述词语信息相匹配的成语标签。
可选的,所述判断模块,具体用于:
获取所述预先获取的成语知识图谱中的所有成语标签,构建包含所有成语标签的字典树;
利用多模式匹配算法,从所述词语信息中抽取与所述字典树相匹配的成语标签,生成标签列表;
判断所述标签列表是否为空,若否,则判定存在与所述词语信息相匹配的成语标签,若是,则判定不存在与所述词语信息相匹配的成语标签。
可选的,所述预先获取的成语知识图谱中还包括每个成语的属性信息;所述装置还包括:第二生成模块;
所述判断模块,还用于在判定所述预先获取的成语知识图谱中不存在与所述查询信息相匹配的成语标签的情况下,触发所述第二生成模块;
所述第二生成模块,用于计算所述预先获取的成语知识图谱中每个成语的属性信息与所述查询信息的相似度;确定所述相似度满足预设条件的成语,生成查询结果。
可选的,所述属性信息包括以下一项或多项:每个成语的读音、释义及出处。
本发明实施例还提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现上述任一所述的成语查询方法。
本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一所述的成语查询方法。
本发明实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一所述的成语查询方法。
本发明实施例提供的成语查询方法及装置,在获取查询信息之后,判断预先获取的成语知识图谱中是否存在与查询信息相匹配的成语标签,其中,预先获取的成语知识图谱为基于多个成语及多个成语标签之间的关联关系生成的,若存在,则将相匹配的成语标签作为目标标签,确定目标标签对应的成语,生成查询结果。这样,可以根据成语知识图谱中各个成语的成语标签,确定与查询信息相匹配的成语,即使某一成语的描述信息中不包含查询信息,也可以根据该成语的成语标签被查询到,使得成语查询的结果更全面,从而可以提升用户的使用体验。当然,实施本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种成语查询方法的流程示意图;
图2为本发明实施例提供的另一种成语查询方法的流程示意图;
图3为本发明实施例提供的一种成语查询装置的结构示意图;
图4为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
相关技术中,对具有特定含义的成语进行查询的方式,通常为:首先,获取用户输入的查询信息,然后,根据查询信息,对各个成语的描述信息进行查询,如果某一成语的描述信息中包含查询信息,则将该成语作为查询结果。
但是,上述成语查询方式是基于成语的描述信息,如果某一成语的描述信息中不包含查询信息,那么,即使该成语是与查询信息相关的,也无法被查询到,也就是说,上述成语查询方式不够完善,成语查询的结果不够全面,从而影响用户的使用体验。
举例而言,“古稀之年”的描述信息为“人能活到七十岁,自古以来很稀少”,“耄耋之年”的描述信息为“年纪十分大的时候”,如果用户输入的查询信息为“年龄”,那么,由于在“古稀之年”和“耄耋之年”的描述信息中均不包含“年龄”,就会导致这两个成语无法被查询到。
为了解决上述技术问题,本发明实施例提供了一种成语查询方法,计算机、服务器或其他电子设备可以利用该方法对所需要的成语进行查询。
下面从总体上对本发明实施例提供的成语查询方法进行说明。
获取查询信息;
判断预先获取的成语知识图谱中是否存在与查询信息相匹配的成语标签,其中,预先获取的成语知识图谱为基于多个成语及多个成语标签之间的关联关系生成的;
若存在,则将相匹配的成语标签作为目标标签,根据目标标签及预先获取的成语知识图谱,确定目标标签对应的成语,生成查询结果。
由以上可见,本发明实施例提供的成语查询方法,可以根据成语知识图谱中各个成语的成语标签,确定与查询信息相匹配的成语,即使某一成语的描述信息中不包含查询信息,也可以根据该成语的成语标签被查询到,使得成语查询的结果更全面,从而可以提升用户的使用体验。
下面将通过具体的实施例,对本发明实施例提供的成语查询方法进行详细描述。
如图1所示,为本发明实施例提供的一种成语查询方法的流程示意图,包括如下步骤:
S101:获取查询信息。
一些场景中,用户需要从大量的成语中查询某些成语,比如,在进行写作时需要引用某一含义的成语,这时,用户可能需要查询具有该含义的成语有哪些。
在本步骤中,查询信息是指用户进行成语查询时输入的信息,可以为关键词,如“勤奋”,也可以是问句,如“形容勤奋的成语”,等等。查询信息中包含了用户想要得到的成语的信息,可以是成语的读音、释义及出处等,具体不做限定。
S102:判断预先获取的成语知识图谱中是否存在与查询信息相匹配的成语标签,若存在,则执行S103,其中,预先获取的成语知识图谱为基于多个成语及多个成语标签之间的关联关系生成的。
获取查询信息之后,可以将预先获取的成语知识图谱中的成语标签与查询信息进行匹配,判断是否存在与查询信息相匹配的成语标签。在预先获取的成语知识图谱中,包含多个成语及多个成语标签,其中,成语和成语标签之间具有一定的关联关系,每个成语可以对应唯一的一个成语标签,也可以对应多个成语标签,不同的成语可能对应同一成语标签,也可能对应不同的成语标签,具体不做限定。
其中,与查询信息相匹配的成语标签可以包括一个或多个,判断预先获取的成语知识图谱中的成语标签与查询信息是否匹配的方式,可以是判断成语标签与查询信息之间的相似度,比如,可以采用杰卡德相似系数算法或余弦相似度算法,当某一成语标签与查询信息之间的相似度大于预设阈值时,则判定该成语标签与查询信息是匹配的。
在查询信息为一个或多个关键词的情况下,可以直接在成语知识图谱中查找与关键词相匹配的成语标签,比如,若查询信息为“勤奋”,那么,可以直接在成语知识图谱中查找是否存在与“勤奋”相匹配的成语标签。
另外,在查询信息为问句的情况下,则需要先对问句进行分词处理、去停用词处理,得到词语列表,比如,若查询信息为“形容勤奋的成语”,那么,首先,可以对“形容勤奋的成语”进行分词处理,得到“形容/勤奋/的/成语”,然后,可以对分词结果进行去停用词处理,得到词语列表“形容/勤奋/成语”。
进而,可以直接将词语列表中的所有词语作为查询信息中的词语信息,或者,也可以采用关键词提取算法,从词语列表中提取出问句中的关键词,作为词语信息,比如,在上述例子中,从词语列表“形容/勤奋/成语”中,可以提取出关键词“勤奋”作为词语信息,其中,所采用的关键词提取算法可以为基于语义的统计语言模型算法、基于分离模型的中文关键词提取算法、基于高维聚类技术的关键词提取算法或基于朴素贝叶斯模型的关键词提取算法等,具体不做限定。
举例而言,一种实现方式中,判断预先获取的成语知识图谱中是否存在与查询信息相匹配的成语标签的方式,可以为:首先,获取预先获取的成语知识图谱中的所有成语标签,然后,提取查询信息中的词语信息,进而,判断是否存在与词语信息相匹配的成语标签。
其中,查询信息中的词语信息可以通过对查询信息进行分词处理、去停用词处理等步骤得到,词语信息可以包括一个词语,也可以包括多个词语,具体不做限定。
在判断是否存在与词语信息相匹配的成语标签时,可以构建包含所有成语标签的字典树,然后,利用多模式匹配算法,从词语信息中抽取与字典树相匹配的词语,生成标签列表,判断标签列表是否为空,若标签列表不为空,则判定存在与词语信息相匹配的成语标签,若标签列表为空,则判定不存在与词语信息相匹配的成语标签。
在本步骤中,预先获取的成语知识图谱可以是本电子设备(执行主体)从网络或其他设备中获取的,比如,手机终端可以通过网络与服务器建立连接,获取服务器中存储的成语知识图谱,或者,成语知识图谱也可以是在本电子设备(执行主体)中存储的,比如,计算机客户端可以将成语知识图谱存储在本地存储器中,具体不做限定。
一种实现方式中,可以采用如下方式,生成成语知识图谱:首先,获取多个成语及每个成语的描述信息,然后,针对每个成语,对该成语的描述信息进行上位分析,生成该成语对应的成语标签,进而,基于多个成语及每个成语对应的成语标签之间的关联关系,生成成语知识图谱。
其中,描述信息中可以包括待处理成语的读音、释义及出处等信息中的一种或多种,对每个成语的描述信息进行上位分析,可以通过对描述信息进行分词处理、去停用词处理、上位词查询处理实现,具体不做限定。也就是说,在成语知识图谱中,每个成语的成语标签都是对该成语的描述信息的概括性的描述。
S103:将相匹配的成语标签作为目标标签,根据目标标签及预先获取的成语知识图谱,确定目标标签对应的成语,生成查询结果。
若预先获取的成语知识图谱中存在与查询信息相匹配的成语标签,那么,可以将相匹配的成语标签作为目标标签,然后,从成语知识图谱中确定目标标签对应的成语,生成查询结果。
其中,查询结果中可以仅包括目标标签对应的成语,也可以根据目标标签对应的成语,确定更多的相关成语,生成查询结果,比如,目标标签对应的成语可能有10个,其中,有8个成语均与另一个成语标签对应,这时,可以将另一个成语标签对应的所有成语也作为查询结果中的一部分。
另外,在预先获取的成语知识图谱中不存在与查询信息相匹配的成语标签的情况下,可以向用户反馈查询结果为空的信息,或者,也可以从所有成语标签中选择与查询信息的相似度最高的一个,作为目标标签,确定目标标签对应的成语,生成查询结果。
在一种实现方式中,预先获取的成语知识图谱中,每个成语还具有对应的属性信息,其中,属性信息可以包括该成语的读音、释义及出处等一项或多项内容。在这种情况下,如果预先获取的成语知识图谱中不存在与查询信息相匹配的成语标签,那么,可以计算成语知识图谱中每个成语的属性信息与查询信息的相似度,确定相似度满足预设条件的成语,生成查询结果。
其中,可以采用杰卡德相似系数算法或余弦相似度算法计算每个成语的属性信息与查询信息之间的相似度,进而,可以将相似度最高的一个或多个成语确定为满足预设条件的成语,或者,将相似度达到预设阈值的成语确定为满足预设条件的成语,具体不做限定。
由以上可见,本发明实施例提供的成语查询方法,可以根据成语知识图谱中各个成语的成语标签,确定与查询信息相匹配的成语,即使某一成语的描述信息中不包含查询信息,也可以根据该成语的成语标签被查询到,使得成语查询的结果更全面,从而可以提升用户的使用体验。
如图2所示,为本发明实施例提供的另一种成语查询方法的流程示意图,包括如下步骤:
S201:获取查询信息。
一些场景中,用户需要从大量的成语中查询某些成语,比如,在进行写作时需要引用某一含义的成语,这时,用户可能需要查询具有该含义的成语有哪些。
在本步骤中,查询信息是指用户进行成语查询时输入的信息,可以为关键词,如“勤奋”,也可以是问句,如“形容勤奋的成语”,等等。查询信息中包含了用户想要得到的成语的信息,可以是成语的读音、释义及出处等,具体不做限定。
S202:提取查询信息中的词语信息。
其中,词语信息可以包括一个词语,也可以包括多个词语,具体不做限定。
在查询信息为一个或多个关键词的情况下,可以直接将查询信息作为词语信息,比如,若查询信息为“勤奋”,那么,可以直接将“勤奋”作为词语信息。
另外,在查询信息为问句的情况下,则需要先对问句进行分词处理、去停用词处理,得到词语列表,比如,若查询信息为“形容勤奋的成语”,那么,首先,可以对“形容勤奋的成语”进行分词处理,得到“形容/勤奋/的/成语”,然后,可以对分词结果进行去停用词处理,得到词语列表“形容/勤奋/成语”。
进而,可以直接将词语列表中的所有词语作为查询信息中的词语信息,或者,也可以采用关键词提取算法,从词语列表中提取出问句中的关键词,作为词语信息,比如,在上述例子中,从词语列表“形容/勤奋/成语”中,可以提取出关键词“勤奋”作为词语信息,其中,所采用的关键词提取算法可以为基于语义的统计语言模型算法、基于分离模型的中文关键词提取算法、基于高维聚类技术的关键词提取算法或基于朴素贝叶斯模型的关键词提取算法等,具体不做限定。
S203:根据预先获取的成语知识图谱中的所有成语标签,构建包含所有成语标签的字典树,其中,预先获取的成语知识图谱为基于多个成语及多个成语标签之间的关联关系生成的,所述预先获取的成语知识图谱中还包括每个成语的属性信息。
在预先获取的成语知识图谱中,包含多个成语及多个成语标签,其中,成语和成语标签之间具有一定的关联关系,每个成语可以对应唯一的一个成语标签,也可以对应多个成语标签,不同的成语可能对应同一成语标签,也可能对应不同的成语标签,具体不做限定。
其中,每个成语还具有对应的属性信息,属性信息可以包括该成语的读音、释义及出处等一项或多项内容。
在本步骤中,预先获取的成语知识图谱可以是本电子设备(执行主体)从网络或其他设备中获取的,也可以是本电子设备(执行主体)生成的,具体不做限定。
一种实现方式中,可以采用如下方式,生成成语知识图谱:首先,获取多个成语及每个成语的描述信息,然后,针对每个成语,对该成语的描述信息进行上位分析,生成该成语对应的成语标签,进而,基于多个成语及每个成语对应的成语标签之间的关联关系,生成成语知识图谱。
其中,描述信息中可以包括待处理成语的读音、释义及出处等信息中的一种或多种,对每个成语的描述信息进行上位分析,可以通过对描述信息进行分词处理、去停用词处理、上位词查询处理实现,具体不做限定。也就是说,在成语知识图谱中,每个成语的成语标签都是对该成语的描述信息的概括性的描述。
S204:利用多模式匹配算法,从词语信息中抽取与字典树相匹配的词语,生成标签列表。
其中,多模式匹配算法可以在词语信息中找出与成语标签相匹配的词语,进而根据匹配结果生成标签列表,举例而言,多模式匹配算法可以为AC(Aho-Corasickautomaton,AC自动机)算法,也可以为Boyer-Moore算法,等等,具体不做限定。
S205:判断标签列表是否为空,若否,则执行S206,若是,则执行S207。
若标签列表不是空集,则表明词语信息中存在与字典树相匹配的词语,也就是说,成语知识图谱中存在与词语信息相匹配的成语标签,那么,可以执行S206,若标签列表是空集,则表明词语信息中不存在与字典树相匹配的词语,也就是说,成语知识图谱中不存在与词语信息相匹配的成语标签,那么,可以执行S207。
S206:将相匹配的成语标签作为目标标签,根据目标标签及预先获取的成语知识图谱,确定目标标签对应的成语,生成查询结果。
若预先获取的成语知识图谱中存在与查询信息相匹配的成语标签,那么,可以将相匹配的成语标签作为目标标签,然后,从成语知识图谱中确定目标标签对应的成语,生成查询结果。
其中,查询结果中可以仅包括目标标签对应的成语,也可以根据目标标签对应的成语,确定更多的相关成语,生成查询结果,比如,目标标签对应的成语可能有10个,其中,有8个成语均与另一个成语标签对应,这时,可以将另一个成语标签对应的所有成语也作为查询结果中的一部分。
S207:计算预先获取的成语知识图谱中每个成语的属性信息与查询信息的相似度,确定相似度满足预设条件的成语,生成查询结果。
其中,可以采用杰卡德相似系数算法或余弦相似度算法计算每个成语的属性信息与查询信息之间的相似度,进而,可以将相似度最高的一个或多个成语确定为满足预设条件的成语,或者,将相似度达到预设阈值的成语确定为满足预设条件的成语,具体不做限定。
由以上可见,本发明实施例提供的成语查询方法,可以根据成语知识图谱中各个成语的成语标签,确定与查询信息相匹配的成语,即使某一成语的描述信息中不包含查询信息,也可以根据该成语的成语标签被查询到,使得成语查询的结果更全面,从而可以提升用户的使用体验。
本发明实施例还提供了一种成语查询装置,如图3所示,为本发明实施例提供的一种成语查询装置的结构示意图,该装置包括:
获取模块301,用于获取查询信息;
判断模块302,用于判断预先获取的成语知识图谱中是否存在与查询信息相匹配的成语标签,其中,预先获取的成语知识图谱为基于多个成语及多个成语标签之间的关联关系生成的;若存在,则触发第一生成模块;
第一生成模块303,用于将相匹配的成语标签作为目标标签,根据目标标签及预先获取的成语知识图谱,确定目标标签对应的成语,生成查询结果。
一种实现方式中,判断模块302,具体用于:
获取预先获取的成语知识图谱中的所有成语标签;
提取查询信息中的词语信息;
判断是否存在与词语信息相匹配的成语标签。
一种实现方式中,判断模块302,具体用于:
构建包含所有成语标签的字典树,利用多模式匹配算法,从词语信息中抽取与字典树相匹配的词语,生成标签列表;
判断标签列表是否为空,若否,则判定存在与词语信息相匹配的成语标签,若是,则判定不存在与词语信息相匹配的成语标签。
一种实现方式中,预先获取的成语知识图谱中还包括每个成语的属性信息,该装置还包括第二生成模块304;
判断模块302,还用于在判定预先获取的成语知识图谱中不存在与查询信息相匹配的成语标签的情况下,触发第二生成模块;
第二生成模块304,用于计算预先获取的成语知识图谱中每个成语的属性信息与查询信息的相似度;确定相似度满足预设条件的成语,生成查询结果。
一种实现方式中,属性信息包括以下一项或多项:每个成语的读音、释义及出处。
一种实现方式中,该装置还包括:
构建模块(图中未示出),用于获取多个成语及每个成语的描述信息;针对每个成语,对该成语的描述信息进行上位分析,生成该成语对应的成语标签;基于多个成语及每个成语对应的成语标签之间的关联关系,生成成语知识图谱。
由以上可见,本发明实施例提供的成语查询装置,可以根据成语知识图谱中各个成语的成语标签,确定与查询信息相匹配的成语,即使某一成语的描述信息中不包含查询信息,也可以根据该成语的成语标签被查询到,使得成语查询的结果更全面,从而可以提升用户的使用体验。
本发明实施例还提供了一种电子设备,如图4所示,包括处理器401、通信接口402、存储器403和通信总线404,其中,处理器401,通信接口402,存储器403通过通信总线404完成相互间的通信,
存储器403,用于存放计算机程序;
处理器401,用于执行存储器403上所存放的程序时,实现如下步骤:
获取查询信息;
判断预先获取的成语知识图谱中是否存在与查询信息相匹配的成语标签,其中,预先获取的成语知识图谱为基于多个成语及多个成语标签之间的关联关系生成的;
若存在,则将相匹配的成语标签作为目标标签,根据目标标签及预先获取的成语知识图谱,确定目标标签对应的成语,生成查询结果。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
由以上可见,本发明实施例提供的成语查询方法,可以根据成语知识图谱中各个成语的成语标签,确定与查询信息相匹配的成语,即使某一成语的描述信息中不包含查询信息,也可以根据该成语的成语标签被查询到,使得成语查询的结果更全面,从而可以提升用户的使用体验
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的成语查询方法。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的成语查询方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例、电子设备实施例、存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (10)

1.一种成语查询方法,其特征在于,所述方法包括:
获取查询信息;
判断预先获取的成语知识图谱中是否存在与所述查询信息相匹配的成语标签,其中,所述预先获取的成语知识图谱为基于多个成语及多个成语标签之间的关联关系生成的;所述成语标签是对成语的描述信息进行上位分析处理得到的,是对所述描述信息的概括性描述;所述描述信息包括成语的读音、释义及出处信息;
若存在,则将相匹配的成语标签作为目标标签,根据所述目标标签及所述预先获取的成语知识图谱,确定所述目标标签对应的成语,生成查询结果;
所述预先获取的成语知识图谱中还包括每个成语的属性信息;在所述预先获取的成语知识图谱中不存在与所述查询信息相匹配的成语标签的情况下,所述方法还包括:
计算所述预先获取的成语知识图谱中每个成语的属性信息与所述查询信息的相似度;
确定所述相似度满足预设条件的成语,生成查询结果。
2.根据权利要求1所述的方法,其特征在于,所述判断预先获取的成语知识图谱中是否存在与所述查询信息相匹配的成语标签,包括:
提取所述查询信息中的词语信息;
获取所述预先获取的成语知识图谱中的所有成语标签,判断是否存在与所述词语信息相匹配的成语标签。
3.根据权利要求2所述的方法,其特征在于,所述获取所述预先获取的成语知识图谱中的所有成语标签,判断是否存在与所述词语信息相匹配的成语标签,包括:
根据所述预先获取的成语知识图谱中的所有成语标签,构建包含所有成语标签的字典树;
利用多模式匹配算法,从所述词语信息中抽取与所述字典树相匹配的成语标签,生成标签列表;
判断所述标签列表是否为空,若否,则判定存在与所述词语信息相匹配的成语标签,若是,则判定不存在与所述词语信息相匹配的成语标签。
4.根据权利要求1所述的方法,其特征在于,所述属性信息包括以下一项或多项:每个成语的读音、释义及出处。
5.一种成语查询装置,其特征在于,所述装置包括:
获取模块,用于获取查询信息;
判断模块,用于判断预先获取的成语知识图谱中是否存在与所述查询信息相匹配的成语标签,其中,所述预先获取的成语知识图谱为基于多个成语及多个成语标签之间的关联关系生成的;所述成语标签是对成语的描述信息进行上位分析处理得到的,是对所述描述信息的概括性描述;所述描述信息包括成语的读音、释义及出处信息;若存在,则触发第一生成模块;
所述第一生成模块,用于将相匹配的成语标签作为目标标签,根据所述目标标签及所述预先获取的成语知识图谱,确定所述目标标签对应的成语,生成查询结果;
所述预先获取的成语知识图谱中还包括每个成语的属性信息;所述装置还包括:第二生成模块;
所述判断模块,还用于在判定所述预先获取的成语知识图谱中不存在与所述查询信息相匹配的成语标签的情况下,触发所述第二生成模块;
所述第二生成模块,用于计算所述预先获取的成语知识图谱中每个成语的属性信息与所述查询信息的相似度;确定所述相似度满足预设条件的成语,生成查询结果。
6.根据权利要求5所述的装置,其特征在于,所述判断模块,具体用于:
提取所述查询信息中的词语信息;
根据所述预先获取的成语知识图谱中的所有成语标签,判断是否存在与所述词语信息相匹配的成语标签。
7.根据权利要求6所述的装置,其特征在于,所述判断模块,具体用于:
获取所述预先获取的成语知识图谱中的所有成语标签,构建包含所有成语标签的字典树;
利用多模式匹配算法,从所述词语信息中抽取与所述字典树相匹配的成语标签,生成标签列表;
判断所述标签列表是否为空,若否,则判定存在与所述词语信息相匹配的成语标签,若是,则判定不存在与所述词语信息相匹配的成语标签。
8.根据权利要求5所述的装置,其特征在于,所述属性信息包括以下一项或多项:每个成语的读音、释义及出处。
9.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-4任一所述的方法步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-4任一所述的方法步骤。
CN201910199456.8A 2019-03-15 2019-03-15 一种成语查询方法及装置 Active CN109947903B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910199456.8A CN109947903B (zh) 2019-03-15 2019-03-15 一种成语查询方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910199456.8A CN109947903B (zh) 2019-03-15 2019-03-15 一种成语查询方法及装置

Publications (2)

Publication Number Publication Date
CN109947903A CN109947903A (zh) 2019-06-28
CN109947903B true CN109947903B (zh) 2023-02-07

Family

ID=67010170

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910199456.8A Active CN109947903B (zh) 2019-03-15 2019-03-15 一种成语查询方法及装置

Country Status (1)

Country Link
CN (1) CN109947903B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110442735B (zh) * 2019-08-13 2022-05-13 北京金山数字娱乐科技有限公司 一种成语近义词推荐方法及装置
CN110688838B (zh) * 2019-10-08 2023-07-18 北京金山数字娱乐科技有限公司 一种成语同义词列表的生成方法及装置
CN112905369A (zh) * 2019-12-03 2021-06-04 中国电信股份有限公司 信息关联方法和装置
CN111522927B (zh) * 2020-04-15 2023-07-14 北京百度网讯科技有限公司 基于知识图谱的实体查询方法和装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016119874A1 (en) * 2015-01-30 2016-08-04 Longsand Limited Selecting an entity from a knowledge graph when a level of connectivity between its neighbors is above a certain level
CN106815293A (zh) * 2016-12-08 2017-06-09 中国电子科技集团公司第三十二研究所 一种面向情报分析的构建知识图谱的***及方法
CN107526812A (zh) * 2017-08-24 2017-12-29 北京奇艺世纪科技有限公司 一种搜索方法、装置及电子设备
CN106919689B (zh) * 2017-03-03 2018-05-11 中国科学技术信息研究所 基于术语释义知识单元的专业领域知识图谱动态构建方法
CN109213844A (zh) * 2018-08-13 2019-01-15 腾讯科技(深圳)有限公司 一种文本处理方法、装置以及相关设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016119874A1 (en) * 2015-01-30 2016-08-04 Longsand Limited Selecting an entity from a knowledge graph when a level of connectivity between its neighbors is above a certain level
CN106815293A (zh) * 2016-12-08 2017-06-09 中国电子科技集团公司第三十二研究所 一种面向情报分析的构建知识图谱的***及方法
CN106919689B (zh) * 2017-03-03 2018-05-11 中国科学技术信息研究所 基于术语释义知识单元的专业领域知识图谱动态构建方法
CN107526812A (zh) * 2017-08-24 2017-12-29 北京奇艺世纪科技有限公司 一种搜索方法、装置及电子设备
CN109213844A (zh) * 2018-08-13 2019-01-15 腾讯科技(深圳)有限公司 一种文本处理方法、装置以及相关设备

Also Published As

Publication number Publication date
CN109947903A (zh) 2019-06-28

Similar Documents

Publication Publication Date Title
US11227118B2 (en) Methods, devices, and systems for constructing intelligent knowledge base
CN109947903B (zh) 一种成语查询方法及装置
CN111581976B (zh) 医学术语的标准化方法、装置、计算机设备及存储介质
WO2021174717A1 (zh) 文本意图识别方法、装置、计算机设备和存储介质
CN110263248B (zh) 一种信息推送方法、装置、存储介质和服务器
US20130060769A1 (en) System and method for identifying social media interactions
CN109977233B (zh) 一种成语知识图谱构建方法及装置
CN110188357B (zh) 对象的行业识别方法及装置
CN108427702B (zh) 目标文档获取方法及应用服务器
CN110427453B (zh) 数据的相似度计算方法、装置、计算机设备及存储介质
CN111767713A (zh) 关键词的提取方法、装置、电子设备及存储介质
CN110765760A (zh) 一种法律案件分配方法、装置、存储介质和服务器
CN114416998A (zh) 文本标签的识别方法、装置、电子设备及存储介质
CN110795942B (zh) 基于语义识别的关键词确定方法、装置和存储介质
CN113191145B (zh) 关键词的处理方法、装置、电子设备和介质
CN110489740B (zh) 语义解析方法及相关产品
CN109145261B (zh) 一种生成标签的方法和装置
CN111737607A (zh) 数据处理方法、装置、电子设备以及存储介质
CN110888940A (zh) 文本信息提取方法、装置、计算机设备及存储介质
CN113095073B (zh) 语料标签生成方法、装置、计算机设备和存储介质
CN112015773B (zh) 知识库的检索方法、装置、电子设备以及存储介质
CN114780678A (zh) 文本检索方法、装置、设备及存储介质
CN114528378A (zh) 文本分类方法、装置、电子设备及存储介质
CN112579774A (zh) 模型训练方法、模型训练装置及终端设备
CN116089459B (zh) 数据检索方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant