CN113297438A - 信息检索方法、电子设备及相关产品 - Google Patents
信息检索方法、电子设备及相关产品 Download PDFInfo
- Publication number
- CN113297438A CN113297438A CN202110555667.8A CN202110555667A CN113297438A CN 113297438 A CN113297438 A CN 113297438A CN 202110555667 A CN202110555667 A CN 202110555667A CN 113297438 A CN113297438 A CN 113297438A
- Authority
- CN
- China
- Prior art keywords
- target
- determining
- keywords
- complexity
- retrieval
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及大数据技术领域,尤其涉及一种信息检索方法、电子设备及相关产品,方法包括:获取目标关键字集,所述目标关键字集包括至少一个关键字;确定所述目标关键字集对应的目标复杂度;确定所述目标复杂度对应的目标检索控制参数;根据所述目标检索控制参数进行检索,得到目标检索结果。采用本申请实施例能够提升信息检索效率。
Description
技术领域
本申请涉及大数据以及数据处理技术领域,具体涉及一种信息检索方法、电子设备及相关产品。
背景技术
信息检索(Information Retrieval)是用户进行信息查询和获取的主要方式,是查找信息的方法和手段,即用户根据需要,采用一定的方法,借助检索工具,从信息集合中找出所需要信息的查找过程,如何提升信息检索效率的问题亟待解决。
发明内容
本申请实施例提供了一种信息检索方法、电子设备及相关产品,能够提升信息检索效率。
第一方面,本申请实施例提供一种信息检索方法,所述方法包括:
获取目标关键字集,所述目标关键字集包括至少一个关键字;
确定所述目标关键字集对应的目标复杂度;
确定所述目标复杂度对应的目标检索控制参数;
根据所述目标检索控制参数进行检索,得到目标检索结果。
第二方面,本申请实施例提供一种信息检索装置,所述装置包括:获取单元、第一确定单元、第二确定单元和检索单元,其中,
所述获取单元,用于获取目标关键字集,所述目标关键字集包括至少一个关键字;
所述第一确定单元,用于确定所述目标关键字集对应的目标复杂度;
所述第二确定单元,用于确定所述目标复杂度对应的目标检索控制参数;
所述检索单元,用于根据所述目标检索控制参数进行检索,得到目标检索结果。
第三方面,本申请实施例提供了一种电子设备,包括处理器、存储器、通信接口以及一个或多个程序,其中,上述一个或多个程序被存储在上述存储器中,并且被配置由上述处理器执行,上述程序包括用于执行本申请实施例第一方面中的步骤的指令。
第四方面,本申请实施例提供了一种计算机可读存储介质,其中,上述计算机可读存储介质存储用于电子数据交换的计算机程序,其中,上述计算机程序使得计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。
第五方面,本申请实施例提供了一种计算机程序产品,其中,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。
实施本申请实施例,具备如下有益效果:
可以看出,本申请实施例中所描述的信息检索方法、电子设备及相关产品,获取目标关键字集,目标关键字集包括至少一个关键字,确定目标关键字集对应的目标复杂度,确定目标复杂度对应的目标检索控制参数,根据目标检索控制参数进行检索,得到目标检索结果,进而,能够基于关键字的复杂度,决策相应的检索控制算法,有助于提升检索效率。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种信息检索方法的流程示意图;
图2是本申请实施例提供的另一种信息检索方法的流程示意图;
图3是本申请实施例提供的一种电子设备的结构示意图;
图4是本申请实施例提供的一种信息检索装置的功能单元组成框图。
具体实施方式
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、***、产品或设备没有限定于已列出的步骤或单元,而是在一个可能地示例中还包括没有列出的步骤或单元,或在一个可能地示例中还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例所涉及到的电子设备可以包括但不仅限于:智能手机、平板电脑、智能机器人、车载设备、可穿戴设备、计算设备或连接到无线调制解调器的其他处理设备,以及各种形式的用户设备(UserEquipment,UE),移动台(MobileStation,MS),终端设备(terminal device)等等,在此不做限定,电子设备还可以为服务器。
请参阅图1,图1是本申请实施例提供的一种信息检索方法的流程示意图,如图所示,应用于电子设备,本信息检索方法包括:
101、获取目标关键字集,所述目标关键字集包括至少一个关键字。
其中,本申请实施例中,目标关键字集可以包括至少一个关键字,关键字可以为以下至少一种:文字、图标、字符串、标点符号、计算公式等等,在此不做限定。文字可以为至少一个国家或者一个民族的文字,例如,文字可以为以下至少一种:汉字、英文词语、法语词语、国语词语、西班牙语词语、意大利语词语、俄罗斯语词语、印度词语、藏族词语等等,在此不做限定。本申请实施例可以应用在各种需要检索的***,例如,专利检索***、网页搜索***、公司内部搜索***等等,在此不作限定。
具体实现中,目标关键字集可以由用户进行输入,例如,目标关键字集可以存在于excel表格中,当加载excel表格时,则可以自动获取目标关键字集;又例如,目标关键字集可以存在于至少一张图像中,对该至少一张图像进行关键字提取,将提取的关键字作为该目标关键字集,又例如,目标关键字集可以存在于视频中,可以对视频进行关键字提取,再将提取的关键字作为目标关键字集;又例如,目标关键字集可以存在于一段语音中,可以对该语音进行关键字提取,将提取的关键字作为目标关键字集。
可选的,上述步骤101,获取目标关键字集,可以包括如下步骤:
11、获取目标图像;
12、对所述目标图像进行字符识别,得到目标文本;
13、对所述目标文本进行关键字提取,得到x个第一关键字,所述x为大于1的整数;
14、对所述目标图像进行图标识别,得到Q个图标,所述Q为自然数;
15、按照预设的图标与关键字之间的映射关系,确定所述Q个图标中每一图标对应的关键字,得到y个第二关键字;
16、将所述x个第一关键字和所述y个第二关键字作为所述目标关键字集。
其中,目标图像可以为一张图像或者多张图像,目标图像可以为截图或者预先存储的图片,电子设备中可以预先存储预设的图标与关键字之间的映射关系。具体实现中,电子设备可以获取目标图像,还可以对目标图像进行字符识别,得到目标文本,进而,可以对目标文本进行关键字提取,得到x个第一关键字,x为大于1的整数,另外,还可以对目标图像进行图标识别,得到Q个图标,Q为自然数,再按照预设的图标与关键字之间的映射关系,确定Q个图标中每一图标对应的关键字,得到y个第二关键字,再将x个第一关键字和y个第二关键字作为目标关键字集,如此,可以通过字符识别或者图标识别,快速得到关键字。
102、确定所述目标关键字集对应的目标复杂度。
具体实现中,不同的复杂度,则需要采用不通的检索算法。检索算法可以为以下至少一种:向量空间模型、概率检索模型、语言模型、布尔模型、推理网络、扩展布尔检索算法、潜在语义标引算法、神经网络算法、遗传算法、模糊集算法等等,在此不做限定。
可选的,上述步骤102,确定所述目标关键字集对应的目标复杂度,可以包括如下步骤:
21、将所述目标关键字集中的关键字进行分类,得到P类关键字,所述P为正整数;
22、按照预设的类别与复杂度评价值之间的映射关系,确定所述P类关键字中每一类关键字对应的复杂度评价值,得到P个复杂度评价值;
23、确定所述目标关键字集中的关键字数量;
24、根据所述关键字数量以及所述P类关键字确定所述P类关键字中每一类关键字的数量占比,得到P个数量占比;
25、根据所述P个复杂度评价值和所述P个数量占比确定所述目标复杂度。
具体实现中,电子设备中可以预先存储预设的类别与复杂度评价值之间的映射关系。具体地,电子设备可以将目标关键字集中的关键字进行分类,得到P类关键字,P为正整数,进而,可以按照预设的类别与复杂度评价值之间的映射关系,确定P类关键字中每一类关键字对应的复杂度评价值,得到P个复杂度评价值,还可以确定目标关键字集中的关键字数量,根据关键字数量以及P类关键字确定P类关键字中每一类关键字的数量占比,得到P个数量占比,根据P个复杂度评价值和P个数量占比确定所述目标复杂度,具体地可以通过P个复杂度评价值和P个数量占比进行加权运算,得到目标复杂度。
103、确定所述目标复杂度对应的目标检索控制参数。
其中,本申请实施例中,检索控制参数用于控制检索算法的速度、精度。不同的复杂度,可以对应不同的复杂度等级,不同的复杂度等级可以对应不通的检索控制参数。
可选的,上述步骤103,确定所述目标复杂度对应的目标检索控制参数,可以包括如下步骤:
31、按照预设的复杂度与算法类型标识之间的映射关系,确定所述目标复杂度对应的目标算法类型标识;
32、根据所述目标算法类型标识获取对应的参考算法控制参数;
33、确定所述目标关键字集中每一关键字对应的热度值,得到多个热度值;
34、根据所述多个热度值确定热度均值;
35、确定所述P类关键字中的每一类关键字对应的热度值,得到P个热度值;
36、根据所述P个热度值确定目标均方差;
37、按照预设的均方差与优化系数之间的映射关系,确定所述目标均方差对应的目标优化系数;
38、根据所述目标优化系数对所述热度均值进行优化处理,得到参考热度均值;
39、按照预设的热度均值与调节系数之间的映射关系,确定所述参考热度均值对应的目标调节系数;
40、依据所述目标调节系数对所述参考算法控制参数进行调节,得到目标算法控制参数;
41、将所述目标算法类型标识以及所述目标算法控制参数作为所述目标检索控制参数。
具体实现中,电子设备中可以预先存储预设的复杂度与算法类型标识之间的映射关系,不同的算法类型标识可以对应不同的算法。电子设备中还可以预先存储预设的均方差与优化系数之间的映射关系,以及预设的热度均值与调节系数。
具体地,电子设备可以按照预设的复杂度与算法类型标识之间的映射关系,确定目标复杂度对应的目标算法类型标识,再根据目标算法类型标识获取对应的参考算法控制参数。
进一步地,电子设备可以确定目标关键字集中每一关键字对应的热度值,得到多个热度值,不同的关键字可以对应不同的热度,热度可以理解用关键字被检索的次数或者频率。电子设备还可以根据多个热度值确定热度均值,以及确定P类关键字中的每一类关键字对应的热度值,得到P个热度值,再根据P个热度值确定目标均方差,再按照预设的均方差与优化系数之间的映射关系,确定目标均方差对应的目标优化系数,由于关键字集中不同的关键字本身具备一定的关联性,而均方差可以反映关键字之间的波动情况,根据目标优化系数对热度均值进行优化处理,得到参考热度均值,再按照预设的热度均值与调节系数之间的映射关系,确定参考热度均值对应的目标调节系数,则可以依据目标调节系数对参考算法控制参数中的一个或者多个参数进行调节,得到目标算法控制参数,最后,再将目标算法类型标识以及目标算法控制参数作为目标检索控制参数,如此,可以依据关键字之间的特性,对检索算法控制算法的控制参数进行调节,得到检索控制参数更加适宜关键字集,有助于提升检索精度或者效率。
104、根据所述目标检索控制参数进行检索,得到目标检索结果。
具体实现中,电子设备可以通过目标检索控制参数进行检索,进而,可以得到目标检索结果,还可以展示目标检索结果,例如,可以按照检索结果的时间先后顺序展示检索结果,又例如,可以按照检索结果的相关性由高到低的顺序展示检索结果。
可选的,上述步骤104,根据所述目标检索控制参数进行检索,得到目标检索结果,可以包括如下步骤:
A41、获取用户的目标身份等级;
A42、按照预设的身份等级与数据库标识之间的映射关系,确定所述目标身份等级对应的目标数据库标识;
A43、根据所述目标检索控制参数对所述目标数据库标识对应的数据库进行检索,得到所述目标检索结果。
其中,本申请实施例中,不同的用户身份,可以对应不同的身份等级,电子设备中可以预先存储预设的身份等级与数据库标识之间的映射关系,
具体地,电子设备可以获取用户的目标身份等级,按照预设的身份等级与数据库标识之间的映射关系,确定目标身份等级对应的目标数据库标识,还可以根据目标检索控制参数对目标数据库标识对应的数据库进行检索,得到目标检索结果,即能够依据用户身份,确定相应的数据库,进而,对该数据库进行检索,例如,会员与非会员可以对应不同的数据库,会员对应的数据库可以比非会员的数据库丰富。
可选的,上述步骤104,根据所述目标检索控制参数进行检索,得到目标检索结果,可以包括如下步骤:
B41、将所述目标关键字集进行分组,得到多个第一分组;
B42、对所述多个分组中每一组进行衍生拓展,得到多个第二分组;
B43、为所述多个第二分组中每一分组配置一个进程,得到多个进程;
B44、根据所述多个进程、所述多个第二分组以及所述目标检索控制参数进行检索,得到多个检索结果集;
B45、确定所述多个检索结果集中每一检索结果与其他检索结果存在交集的交集次数,得到多个交集次数;
B46、对所述多个检索结果集进行去重处理,得到多个检索结果;
B47、按照交集次数多优先排序原则,根据所述多个交集次数对所述多个检索结果进行排序,并将靠前的X个检索结果作为所述目标检索结果,所述X为大于1的整数。
具体实现中,电子设备可以将目标关键字集进行分组,得到多个第一分组,还可以对多个分组中每一组进行衍生拓展,得到多个第二分组,例如,可以将一个词语的近义词、同义词、反义词、网络用语、其他国家语言的同义词进行衍生拓展,还可以为多个第二分组中每一分组配置一个进程,得到多个进程,再根据多个进程、多个第二分组以及目标检索控制参数进行检索,得到多个检索结果集,即每一个第二分组均可以对应一个检索结果集。
进一步地,电子设备还可以确定多个检索结果集中每一检索结果与其他检索结果存在交集的交集次数,得到多个交集次数,再对多个检索结果集进行去重处理,得到多个检索结果,并按照交集次数多优先排序原则,根据多个交集次数对多个检索结果进行排序,并将靠前的X个检索结果作为目标检索结果,X为大于1的整数,其一,将关键字进行分组以及拓展,可以丰富关键字,以检索到更多的相关信息;其二,采用多个进程,能够让多个进程并行进行检索,可以提升检索效率;其三,能够依据不同集合之间的相交属性,确定检索结果的展示顺序,进而,可以将强相关性的检索结果优先进行展示,有助于提升检索效率。
可以看出,本申请实施例中所描述的信息检索方法,获取目标关键字集,目标关键字集包括至少一个关键字,确定目标关键字集对应的目标复杂度,确定目标复杂度对应的目标检索控制参数,根据目标检索控制参数进行检索,得到目标检索结果,进而,能够基于关键字的复杂度,决策相应的检索控制算法,有助于提升检索效率。
与上述图1所示的实施例一致地,请参阅图2,图2是本申请实施例提供的一种信息检索方法的流程示意图,应用于电子设备,本信息检索方法包括:
201、获取目标关键字集,所述目标关键字集包括至少一个关键。
202、确定所述目标关键字集的关键字数量是否大于预设数量。
其中,预设数量可以由用户自行设置或者***默认。
203、在所述目标关键字集的关键字数量大于所述预设数量时,检测所述目标关键字集包含的关键字类别数量是否大于预设类别数量。
其中,预设类别数量可以由用户自行设置或者***默认。当然,电子设备可以在确定目标关键字集的关键字数量小于或等于预设数量,直接采用默认的检索算法,并根据目标关键字集进行检索操作。
204、在所述目标关键字集包含的关键字类别数量大于所述预设类别数量时,确定所述目标关键字集对应的目标复杂度。
其中,电子设备可以在目标关键字集包含的关键字类别数量小于或等于预设类别数量时,直接采用默认的检索算法,并根据目标关键字集进行检索操作。
205、确定所述目标复杂度对应的目标检索控制参数。
206、根据所述目标检索控制参数进行检索,得到目标检索结果。
其中,上述步骤201、步骤204-步骤206的具体描述可以参照上述图1所描述的信息检索方法的相应步骤,在此不再赘述。
可以看出,本申请实施例中所描述的信息检索方法,获取目标关键字集,目标关键字集包括至少一个关键字,确定目标关键字集的关键字数量是否大于预设数量,在目标关键字集的关键字数量大于预设数量时,检测目标关键字集包含的关键字类别数量是否大于预设类别数量,在目标关键字集包含的关键字类别数量大于预设类别数量时,确定目标关键字集对应的目标复杂度,确定目标复杂度对应的目标检索控制参数,根据目标检索控制参数进行检索,得到目标检索结果,进而,能够基于关键字的复杂度,决策相应的检索控制算法,有助于提升检索效率。
与上述实施例一致地,请参阅图3,图3是本申请实施例提供的一种电子设备的结构示意图,如图所示,该包括处理器、存储器、通信接口以及一个或多个程序,其中,上述一个或多个程序被存储在上述存储器中,并且被配置由上述处理器执行,本申请实施例中,上述程序包括用于执行以下步骤的指令:
获取目标关键字集,所述目标关键字集包括至少一个关键字;
确定所述目标关键字集对应的目标复杂度;
确定所述目标复杂度对应的目标检索控制参数;
根据所述目标检索控制参数进行检索,得到目标检索结果。
可以看出,本申请实施例中所描述的电子设备,获取目标关键字集,目标关键字集包括至少一个关键字,确定目标关键字集对应的目标复杂度,确定目标复杂度对应的目标检索控制参数,根据目标检索控制参数进行检索,得到目标检索结果,进而,能够基于关键字的复杂度,决策相应的检索控制算法,有助于提升检索效率。
可选的,在所述确定所述目标关键字集对应的目标复杂度方面,上述程序包括用于执行以下步骤的指令:
将所述目标关键字集中的关键字进行分类,得到P类关键字,所述P为正整数;
按照预设的类别与复杂度评价值之间的映射关系,确定所述P类关键字中每一类关键字对应的复杂度评价值,得到P个复杂度评价值;
确定所述目标关键字集中的关键字数量;
根据所述关键字数量以及所述P类关键字确定所述P类关键字中每一类关键字的数量占比,得到P个数量占比;
根据所述P个复杂度评价值和所述P个数量占比确定所述目标复杂度。
可选的,在所述确定所述目标复杂度对应的目标检索控制参数方面,上述程序包括用于执行以下步骤的指令:
按照预设的复杂度与算法类型标识之间的映射关系,确定所述目标复杂度对应的目标算法类型标识;
根据所述目标算法类型标识获取对应的参考算法控制参数;
确定所述目标关键字集中每一关键字对应的热度值,得到多个热度值;
根据所述多个热度值确定热度均值;
确定所述P类关键字中的每一类关键字对应的热度值,得到P个热度值;
根据所述P个热度值确定目标均方差;
按照预设的均方差与优化系数之间的映射关系,确定所述目标均方差对应的目标优化系数;
根据所述目标优化系数对所述热度均值进行优化处理,得到参考热度均值;
按照预设的热度均值与调节系数之间的映射关系,确定所述参考热度均值对应的目标调节系数;
依据所述目标调节系数对所述参考算法控制参数进行调节,得到目标算法控制参数;
将所述目标算法类型标识以及所述目标算法控制参数作为所述目标检索控制参数。
可选的,在所述获取目标关键字集方面,上述程序包括用于执行以下步骤的指令:
获取目标图像;
对所述目标图像进行字符识别,得到目标文本;
对所述目标文本进行关键字提取,得到x个第一关键字,所述x为大于1的整数;
对所述目标图像进行图标识别,得到Q个图标,所述Q为自然数;
按照预设的图标与关键字之间的映射关系,确定所述Q个图标中每一图标对应的关键字,得到y个第二关键字;
将所述x个第一关键字和所述y个第二关键字作为所述目标关键字集。
可选的,在所述根据所述目标检索控制参数进行检索,得到目标检索结果方面,上述程序包括用于执行以下步骤的指令:
获取用户的目标身份等级;
按照预设的身份等级与数据库标识之间的映射关系,确定所述目标身份等级对应的目标数据库标识;
根据所述目标检索控制参数对所述目标数据库标识对应的数据库进行检索,得到所述目标检索结果。
上述主要从方法侧执行过程的角度对本申请实施例的方案进行了介绍。可以理解的是,为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所提供的实施例描述的各示例的单元及算法步骤,本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
本申请实施例可以根据上述方法示例对进行功能单元的划分,例如,可以对应各个功能划分各个功能单元,也可以将两个或两个以上的功能集成在一个处理单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。需要说明的是,本申请实施例中对单元的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
图4是本申请实施例中所涉及的信息检索装置400的功能单元组成框图,该装置400,所述装置400包括:获取单元401、第一确定单元402、第二确定单元403和检索单元404,其中,
所述获取单元401,用于获取目标关键字集,所述目标关键字集包括至少一个关键字;
所述第一确定单元402,用于确定所述目标关键字集对应的目标复杂度;
所述第二确定单元403,用于确定所述目标复杂度对应的目标检索控制参数;
所述检索单元404,用于根据所述目标检索控制参数进行检索,得到目标检索结果。
可以看出,本申请实施例中所描述的信息检索装置,获取目标关键字集,目标关键字集包括至少一个关键字,确定目标关键字集对应的目标复杂度,确定目标复杂度对应的目标检索控制参数,根据目标检索控制参数进行检索,得到目标检索结果,进而,能够基于关键字的复杂度,决策相应的检索控制算法,有助于提升检索效率。
可选的,在所述确定所述目标关键字集对应的目标复杂度方面,所述第一确定单元402具体用于:
将所述目标关键字集中的关键字进行分类,得到P类关键字,所述P为正整数;
按照预设的类别与复杂度评价值之间的映射关系,确定所述P类关键字中每一类关键字对应的复杂度评价值,得到P个复杂度评价值;
确定所述目标关键字集中的关键字数量;
根据所述关键字数量以及所述P类关键字确定所述P类关键字中每一类关键字的数量占比,得到P个数量占比;
根据所述P个复杂度评价值和所述P个数量占比确定所述目标复杂度。
可选的,在所述确定所述目标复杂度对应的目标检索控制参数方面,所述第二确定单元403具体用于:
按照预设的复杂度与算法类型标识之间的映射关系,确定所述目标复杂度对应的目标算法类型标识;
根据所述目标算法类型标识获取对应的参考算法控制参数;
确定所述目标关键字集中每一关键字对应的热度值,得到多个热度值;
根据所述多个热度值确定热度均值;
确定所述P类关键字中的每一类关键字对应的热度值,得到P个热度值;
根据所述P个热度值确定目标均方差;
按照预设的均方差与优化系数之间的映射关系,确定所述目标均方差对应的目标优化系数;
根据所述目标优化系数对所述热度均值进行优化处理,得到参考热度均值;
按照预设的热度均值与调节系数之间的映射关系,确定所述参考热度均值对应的目标调节系数;
依据所述目标调节系数对所述参考算法控制参数进行调节,得到目标算法控制参数;
将所述目标算法类型标识以及所述目标算法控制参数作为所述目标检索控制参数。
可选的,在所述获取目标关键字集方面,所述获取单元401具体用于:
获取目标图像;
对所述目标图像进行字符识别,得到目标文本;
对所述目标文本进行关键字提取,得到x个第一关键字,所述x为大于1的整数;
对所述目标图像进行图标识别,得到Q个图标,所述Q为自然数;
按照预设的图标与关键字之间的映射关系,确定所述Q个图标中每一图标对应的关键字,得到y个第二关键字;
将所述x个第一关键字和所述y个第二关键字作为所述目标关键字集。
可选的,在所述根据所述目标检索控制参数进行检索,得到目标检索结果方面,所述检索单元404具体用于:
获取用户的目标身份等级;
按照预设的身份等级与数据库标识之间的映射关系,确定所述目标身份等级对应的目标数据库标识;
根据所述目标检索控制参数对所述目标数据库标识对应的数据库进行检索,得到所述目标检索结果。
可以理解的是,本实施例的信息检索装置的各程序模块的功能可根据上述方法实施例中的方法具体实现,其具体实现过程可以参照上述方法实施例的相关描述,此处不再赘述。
本申请实施例还提供一种计算机存储介质,其中,该计算机存储介质存储用于电子数据交换的计算机程序,该计算机程序使得计算机执行如上述方法实施例中记载的任一方法的部分或全部步骤,上述计算机包括电子设备。
本申请实施例还提供一种计算机程序产品,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如上述方法实施例中记载的任一方法的部分或全部步骤。该计算机程序产品可以为一个软件安装包,上述计算机包括电子设备。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如上述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
上述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例上述方法的全部或部分步骤。而前述的存储器包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、只读存储器(英文:Read-Only Memory,简称:ROM)、随机存取器(英文:Random Access Memory,简称:RAM)、磁盘或光盘等。
以上对本申请实施例进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (10)
1.一种信息检索方法,其特征在于,所述方法包括:
获取目标关键字集,所述目标关键字集包括至少一个关键字;
确定所述目标关键字集对应的目标复杂度;
确定所述目标复杂度对应的目标检索控制参数;
根据所述目标检索控制参数进行检索,得到目标检索结果。
2.根据权利要求1所述的方法,其特征在于,所述确定所述目标关键字集对应的目标复杂度,包括:
将所述目标关键字集中的关键字进行分类,得到P类关键字,所述P为正整数;
按照预设的类别与复杂度评价值之间的映射关系,确定所述P类关键字中每一类关键字对应的复杂度评价值,得到P个复杂度评价值;
确定所述目标关键字集中的关键字数量;
根据所述关键字数量以及所述P类关键字确定所述P类关键字中每一类关键字的数量占比,得到P个数量占比;
根据所述P个复杂度评价值和所述P个数量占比确定所述目标复杂度。
3.根据权利要求2所述的方法,其特征在于,所述确定所述目标复杂度对应的目标检索控制参数,包括:
按照预设的复杂度与算法类型标识之间的映射关系,确定所述目标复杂度对应的目标算法类型标识;
根据所述目标算法类型标识获取对应的参考算法控制参数;
确定所述目标关键字集中每一关键字对应的热度值,得到多个热度值;
根据所述多个热度值确定热度均值;
确定所述P类关键字中的每一类关键字对应的热度值,得到P个热度值;
根据所述P个热度值确定目标均方差;
按照预设的均方差与优化系数之间的映射关系,确定所述目标均方差对应的目标优化系数;
根据所述目标优化系数对所述热度均值进行优化处理,得到参考热度均值;
按照预设的热度均值与调节系数之间的映射关系,确定所述参考热度均值对应的目标调节系数;
依据所述目标调节系数对所述参考算法控制参数进行调节,得到目标算法控制参数;
将所述目标算法类型标识以及所述目标算法控制参数作为所述目标检索控制参数。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述获取目标关键字集,包括:
获取目标图像;
对所述目标图像进行字符识别,得到目标文本;
对所述目标文本进行关键字提取,得到x个第一关键字,所述x为大于1的整数;
对所述目标图像进行图标识别,得到Q个图标,所述Q为自然数;
按照预设的图标与关键字之间的映射关系,确定所述Q个图标中每一图标对应的关键字,得到y个第二关键字;
将所述x个第一关键字和所述y个第二关键字作为所述目标关键字集。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述根据所述目标检索控制参数进行检索,得到目标检索结果,包括:
获取用户的目标身份等级;
按照预设的身份等级与数据库标识之间的映射关系,确定所述目标身份等级对应的目标数据库标识;
根据所述目标检索控制参数对所述目标数据库标识对应的数据库进行检索,得到所述目标检索结果。
6.一种信息检索装置,其特征在于,所述装置包括:获取单元、第一确定单元、第二确定单元和检索单元,其中,
所述获取单元,用于获取目标关键字集,所述目标关键字集包括至少一个关键字;
所述第一确定单元,用于确定所述目标关键字集对应的目标复杂度;
所述第二确定单元,用于确定所述目标复杂度对应的目标检索控制参数;
所述检索单元,用于根据所述目标检索控制参数进行检索,得到目标检索结果。
7.根据权利要求6所述的装置,其特征在于,在所述确定所述目标关键字集对应的目标复杂度方面,所述第一确定单元具体用于:
将所述目标关键字集中的关键字进行分类,得到P类关键字,所述P为正整数;
按照预设的类别与复杂度评价值之间的映射关系,确定所述P类关键字中每一类关键字对应的复杂度评价值,得到P个复杂度评价值;
确定所述目标关键字集中的关键字数量;
根据所述关键字数量以及所述P类关键字确定所述P类关键字中每一类关键字的数量占比,得到P个数量占比;
根据所述P个复杂度评价值和所述P个数量占比确定所述目标复杂度。
8.根据权利要求7所述的装置,其特征在于,在所述确定所述目标复杂度对应的目标检索控制参数方面,所述第二确定单元具体用于:
按照预设的复杂度与算法类型标识之间的映射关系,确定所述目标复杂度对应的目标算法类型标识;
根据所述目标算法类型标识获取对应的参考算法控制参数;
确定所述目标关键字集中每一关键字对应的热度值,得到多个热度值;
根据所述多个热度值确定热度均值;
确定所述P类关键字中的每一类关键字对应的热度值,得到P个热度值;
根据所述P个热度值确定目标均方差;
按照预设的均方差与优化系数之间的映射关系,确定所述目标均方差对应的目标优化系数;
根据所述目标优化系数对所述热度均值进行优化处理,得到参考热度均值;
按照预设的热度均值与调节系数之间的映射关系,确定所述参考热度均值对应的目标调节系数;
依据所述目标调节系数对所述参考算法控制参数进行调节,得到目标算法控制参数;
将所述目标算法类型标识以及所述目标算法控制参数作为所述目标检索控制参数。
9.一种电子设备,其特征在于,包括处理器、存储器,所述存储器用于存储一个或多个程序,并且被配置由所述处理器执行,所述程序包括用于执行如权利要求1-5任一项所述的方法中的步骤的指令。
10.一种计算机可读存储介质,其特征在于,存储用于电子数据交换的计算机程序,其中,所述计算机程序使得计算机执行如权利要求1-5任一项所述的方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110555667.8A CN113297438B (zh) | 2021-05-21 | 2021-05-21 | 信息检索方法、电子设备及相关产品 |
CN202210073361.3A CN114417084A (zh) | 2021-05-21 | 2021-05-21 | 信息检索方法及相关装置和介质和程序产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110555667.8A CN113297438B (zh) | 2021-05-21 | 2021-05-21 | 信息检索方法、电子设备及相关产品 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210073361.3A Division CN114417084A (zh) | 2021-05-21 | 2021-05-21 | 信息检索方法及相关装置和介质和程序产品 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113297438A true CN113297438A (zh) | 2021-08-24 |
CN113297438B CN113297438B (zh) | 2022-02-22 |
Family
ID=77323332
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110555667.8A Active CN113297438B (zh) | 2021-05-21 | 2021-05-21 | 信息检索方法、电子设备及相关产品 |
CN202210073361.3A Pending CN114417084A (zh) | 2021-05-21 | 2021-05-21 | 信息检索方法及相关装置和介质和程序产品 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210073361.3A Pending CN114417084A (zh) | 2021-05-21 | 2021-05-21 | 信息检索方法及相关装置和介质和程序产品 |
Country Status (1)
Country | Link |
---|---|
CN (2) | CN113297438B (zh) |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050259817A1 (en) * | 2004-05-20 | 2005-11-24 | Ramzan Zulfikar A | Method and apparatus for communication efficient private information retrieval and oblivious transfer |
CN101799805A (zh) * | 2009-02-11 | 2010-08-11 | 三星电子株式会社 | 文件检索方法及其*** |
CN103745008A (zh) * | 2014-01-28 | 2014-04-23 | 河海大学 | 一种大数据索引的排序方法 |
US8862602B1 (en) * | 2011-10-25 | 2014-10-14 | Google Inc. | Systems and methods for improved readability of URLs |
CN104572717A (zh) * | 2013-10-18 | 2015-04-29 | 腾讯科技(深圳)有限公司 | 信息搜索方法和装置 |
US20150378582A1 (en) * | 2013-02-15 | 2015-12-31 | Quick Eye Technologies Inc., | An organizer for data that is subject to multiple criteria |
CN105718463A (zh) * | 2014-12-02 | 2016-06-29 | 杭州迪普科技有限公司 | 关键字模糊匹配方法及装置 |
CN106649616A (zh) * | 2016-11-30 | 2017-05-10 | 四川用联信息技术有限公司 | 一种聚类算法实现搜索引擎关键词优化 |
CN106776923A (zh) * | 2016-11-30 | 2017-05-31 | 四川用联信息技术有限公司 | 改进的聚类算法实现搜索引擎关键词优化 |
CN106815266A (zh) * | 2015-12-01 | 2017-06-09 | 北京国双科技有限公司 | 裁判文书检索方法和装置 |
CN109344278A (zh) * | 2018-09-25 | 2019-02-15 | 北京邮电大学 | 一种视觉搜索方法、装置及设备 |
CN110597952A (zh) * | 2019-08-20 | 2019-12-20 | 深圳壹账通智能科技有限公司 | 信息处理方法、服务器及计算机存储介质 |
CN111506596A (zh) * | 2020-04-21 | 2020-08-07 | 腾讯科技(深圳)有限公司 | 信息检索方法、装置、计算机设备和存储介质 |
CN111813744A (zh) * | 2020-07-08 | 2020-10-23 | 平安科技(深圳)有限公司 | 文件的搜索方法、装置、设备及存储介质 |
-
2021
- 2021-05-21 CN CN202110555667.8A patent/CN113297438B/zh active Active
- 2021-05-21 CN CN202210073361.3A patent/CN114417084A/zh active Pending
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050259817A1 (en) * | 2004-05-20 | 2005-11-24 | Ramzan Zulfikar A | Method and apparatus for communication efficient private information retrieval and oblivious transfer |
CN101799805A (zh) * | 2009-02-11 | 2010-08-11 | 三星电子株式会社 | 文件检索方法及其*** |
US8862602B1 (en) * | 2011-10-25 | 2014-10-14 | Google Inc. | Systems and methods for improved readability of URLs |
US20150378582A1 (en) * | 2013-02-15 | 2015-12-31 | Quick Eye Technologies Inc., | An organizer for data that is subject to multiple criteria |
CN104572717A (zh) * | 2013-10-18 | 2015-04-29 | 腾讯科技(深圳)有限公司 | 信息搜索方法和装置 |
CN103745008A (zh) * | 2014-01-28 | 2014-04-23 | 河海大学 | 一种大数据索引的排序方法 |
CN105718463A (zh) * | 2014-12-02 | 2016-06-29 | 杭州迪普科技有限公司 | 关键字模糊匹配方法及装置 |
CN106815266A (zh) * | 2015-12-01 | 2017-06-09 | 北京国双科技有限公司 | 裁判文书检索方法和装置 |
CN106649616A (zh) * | 2016-11-30 | 2017-05-10 | 四川用联信息技术有限公司 | 一种聚类算法实现搜索引擎关键词优化 |
CN106776923A (zh) * | 2016-11-30 | 2017-05-31 | 四川用联信息技术有限公司 | 改进的聚类算法实现搜索引擎关键词优化 |
CN109344278A (zh) * | 2018-09-25 | 2019-02-15 | 北京邮电大学 | 一种视觉搜索方法、装置及设备 |
CN110597952A (zh) * | 2019-08-20 | 2019-12-20 | 深圳壹账通智能科技有限公司 | 信息处理方法、服务器及计算机存储介质 |
CN111506596A (zh) * | 2020-04-21 | 2020-08-07 | 腾讯科技(深圳)有限公司 | 信息检索方法、装置、计算机设备和存储介质 |
CN111813744A (zh) * | 2020-07-08 | 2020-10-23 | 平安科技(深圳)有限公司 | 文件的搜索方法、装置、设备及存储介质 |
Non-Patent Citations (2)
Title |
---|
SANCHIZ MYLENE ET AL.: "Searching for information on the Web: Impact of cognitive aging, prior domain knowledge and complexity of the search problems", 《INFORMATION PROCESSING & MANAGEMEN》 * |
金鹏飞 等: "高效的多关键词匹配最优路径查询算法KSRG", 《计算机应用》 * |
Also Published As
Publication number | Publication date |
---|---|
CN114417084A (zh) | 2022-04-29 |
CN113297438B (zh) | 2022-02-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112632385B (zh) | 课程推荐方法、装置、计算机设备及介质 | |
US10963637B2 (en) | Keyword extraction method, computer equipment and storage medium | |
US10482146B2 (en) | Systems and methods for automatic customization of content filtering | |
KR20180077261A (ko) | 자동질문응답시스템 질문 클러스터링 처리방법 및 장치 | |
CN110147425B (zh) | 一种关键词提取方法、装置、计算机设备及存储介质 | |
US11017019B1 (en) | Style classification for authentic content search | |
EP4113329A1 (en) | Method, apparatus and device used to search for content, and computer-readable storage medium | |
CN109933708A (zh) | 信息检索方法、装置、存储介质及计算机设备 | |
WO2023029356A1 (zh) | 基于句向量模型的句向量生成方法、装置及计算机设备 | |
CN101477563A (zh) | 一种短文本聚类的方法、***及其数据处理装置 | |
CN109885651B (zh) | 一种问题推送方法和装置 | |
CN114880447A (zh) | 信息检索方法、装置、设备及存储介质 | |
CN114780746A (zh) | 基于知识图谱的文档检索方法及其相关设备 | |
CN112632261A (zh) | 智能问答方法、装置、设备及存储介质 | |
CN110569419A (zh) | 问答***优化方法、装置、计算机设备及存储介质 | |
CN112740202A (zh) | 使用内容标签执行图像搜索 | |
CN114330329A (zh) | 一种业务内容搜索方法、装置、电子设备及存储介质 | |
CN104933099B (zh) | 一种为用户提供目标搜索结果的方法与装置 | |
CN106919593B (zh) | 一种搜索的方法和装置 | |
CN105677664B (zh) | 基于网络搜索的紧密度确定方法及装置 | |
CN117951270A (zh) | 一种文档检索方法、装置及相关设备 | |
CN111723179B (zh) | 基于概念图谱的反馈模型信息检索方法、***及介质 | |
CN111241811B (zh) | 确定搜索词权重的方法、装置、计算机设备和存储介质 | |
CN113297438B (zh) | 信息检索方法、电子设备及相关产品 | |
CN112527985A (zh) | 未知问题处理方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |